본문 바로가기

추천 검색어

실시간 인기 검색어

대규모 데이터 세트를 위한 알고리즘과 데이터 구조

Dzejla Medjedovic 지음 | 김정선 옮김
다이피아

2023년 08월 30일 출간

(개의 리뷰)
( 0% 의 구매자)
eBook 상품 정보
파일 정보 ePUB (44.64MB)
ISBN 9791160700152
지원기기 교보eBook App, PC e서재, 리더기, 웹뷰어
교보eBook App 듣기(TTS) 가능
TTS 란?
텍스트를 음성으로 읽어주는 기술입니다.
  • 전자책의 편집 상태에 따라 본문의 흐름과 다르게 텍스트를​ 읽을 수 있습니다.
  • 전자책 화면에 표기된 주석 등을 모두 읽어 줍니다.
  • 이미지 형태로 제작된 전자책 (예 : ZIP 파일)은 TTS 기능을 지원하지 않습니다.
  • '교보 ebook' 앱을 최신 버전으로 설치해야 이용 가능합니다. (Android v3. 0.26, iOS v3.0.09,PC v1.2 버전 이상)

소득공제
소장
정가 : 34,000원

쿠폰적용가 30,600

10% 할인 | 5%P 적립

이 상품은 배송되지 않는 디지털 상품이며,
교보eBook앱이나 웹뷰어에서 바로 이용가능합니다.

카드&결제 혜택

  • 5만원 이상 구매 시 추가 2,000P
  • 3만원 이상 구매 시, 등급별 2~4% 추가 최대 416P
  • 리뷰 작성 시, e교환권 추가 최대 300원

작품소개

이 상품이 속한 분야

확률 및 디스크 기반 데이터 구조 및 알고리즘에 대한 액세스 가능하고 아름답게 설명된 소개입니다.

Marcus Young, Prosper Marketplace

최신 데이터 세트가 방대해지면서 기존의 데이터 구조와 알고리즘은 한계에 도달했습니다. 이 재미있고 실용적인 가이드에서는 대규모 분산 데이터 집합도 안정적으로 처리할 수 있는 최신 기술을 소개합니다.

대규모 데이터 세트를 위한 알고리즘 및 데이터 구조에서는 다음에 대해 안내합니다.

실제 문제에 대한 확률론적 스케치 데이터 구조
애플리케이션에 적합한 데이터베이스 엔진 선택
효율적인 온디스크 데이터 구조 및 알고리즘 평가 및 설계
대규모 시스템과 관련된 알고리즘 트레이드 오프 이해하기
스트리밍 데이터에서 기본 통계 도출
스트리밍 데이터를 올바르게 샘플링
제한된 공간 리소스로 백분위수 계산

대규모 데이터 세트를 위한 알고리즘 및 데이터 구조는 최신 빅 데이터 애플리케이션을 처리하는 데 완벽한 새로운 방법의 도구 상자를 보여줍니다. Google, Facebook 및 진정으로 방대한 양의 데이터로 작동하는 기타 엔터프라이즈 애플리케이션을 뒷받침하는 새로운 데이터 구조 및 알고리즘을 탐색합니다. 이러한 효과적인 기술은 금융에서 텍스트 분석에 이르기까지 모든 분야에 적용할 수 있습니다. 그래픽, 일러스트레이션 및 실습 업계 사례를 통해 복잡한 아이디어를 프로젝트에 실용적으로 구현할 수 있으며 수수께끼로 풀 수 있는 수학적 증명이 없습니다. 이 독특한 가이드를 따라 작업하면 데이터의 정확성을 유지하면서 공간을 절약할 수 있는 최적의 지점을 찾을 수 있습니다.

기술에 대해

표준 알고리즘 및 데이터 구조는 대규모 분산 데이터 세트에 적용될 때 느려지거나 완전히 실패할 수 있습니다. 빅 데이터용으로 설계된 알고리즘을 선택하면 시간을 절약하고 정확도를 높이며 처리 비용을 줄일 수 있습니다. 이 독특한 책은 최첨단 연구 논문을 디스크와 클라우드에서 스케치, 스트리밍 및 대규모 데이터 세트 구성을 위한 실용적인 기술로 추출합니다.

책에 대해

대규모 데이터 세트를 위한 알고리즘 및 데이터 구조에서는 대규모 분산 데이터에 대한 처리 및 분석 기술을 소개합니다. 업계 이야기와 재미있는 삽화로 가득한 이 친근한 가이드는 복잡한 개념도 쉽게 이해할 수 있도록 합니다. Bloom 필터, Count-min 스케치, HyperLogLog 및 LSM-트리와 같은 강력한 알고리즘을 자신의 사용 사례에 매핑하는 방법을 배우면서 실제 사례를 탐색하게 됩니다.
머리말
감사의 말
이 책에 대하여
저자 소개
역자 서문

1장. 소개
1.1 예제
1.2 이 책의 구성
1.3 다른 책과의 차이점과 그 대상
1.4 대규모 데이터가 오늘날의 시스템에서 어려운 문제인 이유
1.5 하드웨어를 염두에 둔 알고리즘 설계

Part 1. 해시 기반 스케치

2장. 해시 테이블 및 최신 해싱 검토
2.1 유비쿼터스 해싱
2.2 데이터 구조 집중 강좌
2.3 최신 시스템의 사용 시나리오
2.4 O(1) - 무엇이 중요한 문제인가?
2.5 충돌 해결: 이론 대 실제
2.6 사용 시나리오: Python의 dict의 작동 방식
2.7 MurmurHash
2.8 분산 시스템용 해시 테이블: 일관된 해싱

3장. 근사 멤버십: Bloom 및 Quotient Filter
3.1 작동 방식
3.2 사용 사례
3.3 간단한 구현
3.4 Bloom Filter 구성
3.5 약간의 이론
3.6 Bloom Filter 적용 및 대안
3.7 Quotient filter
3.8 Bloom filter와 Quotient filter의 비교

4장. 빈도 추정 및 Count-Min Sketch
4.1 다수(과반수) 요소(Majority element)
4.2 Count-Min Sketch: 작동 방식
4.3 사용 사례
4.4 Count-Min Sketch의 오차 vs. 공간
4.5 Count-Min Sketch의 간단한 구현
4.6 Count-Min Sketch를 사용한 Range queries

5장. 카디널리티 추정 및 HyperLogLog
5.1 데이터베이스의 개별 항목 계산
5.2 HyperLogLog 증분 설계
5.3 사용 사례: HLL로 worm 잡기
5.4 하지만 어떻게 작동할까요? - 작은 실험
5.5 사용 사례: HyperLogLog를 사용한 집계

Part 2. 실시간 분석
6장. 스트리밍 데이터: 모든 것을 하나로 모으기
6.1 스트리밍 데이터 시스템: 메타 예시
6.2 데이터 스트림의 실제 제약 및 개념
6.3 수학 비트: 샘플링 및 추정

7장. 데이터 스트림에서 샘플링
7.1 랜드마크 스트림의 샘플링
7.2 슬라이딩 윈도우에서의 샘플링
7.3 샘플링 알고리즘 비교

8장. 데이터 스트림의 근사 분위수
8.1 정확한 분위수
8.2 근사 분위수
8.3 t-digest 작동 방식
8.4 Q-digest
8.5 시뮬레이션 코드 및 결과

Part 3. 데이터베이스 및 외부 메모리 알고리즘의 데이터 구조
9장. 외부 메모리 모델 소개
9.1 외부 메모리 모델: 서두
9.2 예제 1: 최소값 찾기
9.3 예제 2: 이진 검색
9.4 최적의 검색
9.5 예제 3: K 정렬 목록 병합
9.6 다음 단계

10장. 데이터베이스용 데이터 구조: B-트리, Bε-트리, LSM-트리
10.1 인덱싱 작동 방식
10.2 이 장에서 다루는 데이터 구조
10.3 B-트리
10.4 수학 비트: B-트리 조회가 외부 메모리에서 최적인 이유는 ?
10.5 Bε-트리
10.6 로그 구조 병합 트리 (LSM-trees)

11장. 외부 메모리 정렬
11.1 정렬의 사용 사례
11.2 외부 메모리에서 정렬할 때의 문제: 예시
11.3 외부 메모리 병합 정렬(M/B-way 병합 정렬)
11.4 외부 퀵-정렬은 어떨까요?
11.5 수학 비트: 외부 메모리 병합 정렬이 최적인 이유
11.6 마무리

참고 문헌

작가정보

Dzejla Medjedovic 박사는 2014년에 뉴욕 Stony Brook University의 컴퓨터 과학과 응용 알고리즘 연구실에서 박사 학위를 받았습니다. 또한 Microsoft에서 시간을 보냈습니다. Dzejla는 교육, 컴퓨터 과학 교육 촉진 및 기술 이전에 열정적입니다. 현재 그녀는 Social Explorer, Inc.에서 데이터 부사장으로 일하고 있습니다.

이 상품의 총서

Klover리뷰 (0)

Klover리뷰 안내
Klover(Kyobo-lover)는 교보를 애용해 주시는 고객님들이 남겨주신 평점과 감상을 바탕으로, 다양한 정보를 전달하는 교보문고의 리뷰 서비스입니다.
1. 리워드 안내
구매 후 90일 이내에 평점 작성 시 e교환권 100원을 적립해 드립니다.
  • - e교환권은 적립일로부터 180일 동안 사용 가능합니다.
  • - 리워드는 1,000원 이상 eBook, 오디오북, 동영상에 한해 다운로드 완료 후 리뷰 작성 시 익일 제공됩니다.
  • - 리워드는 한 상품에 최초 1회만 제공됩니다.
  • - sam 이용권 구매 상품 / 선물받은 eBook은 리워드 대상에서 제외됩니다.
2. 운영 원칙 안내
Klover리뷰를 통한 리뷰를 작성해 주셔서 감사합니다. 자유로운 의사 표현의 공간인 만큼 타인에 대한 배려를 부탁합니다. 일부 타인의 권리를 침해하거나 불편을 끼치는 것을 방지하기 위해 아래에 해당하는 Klover 리뷰는 별도의 통보 없이 삭제될 수 있습니다.
  • 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
  • 도서와 무관한 내용의 리뷰
  • 인신공격이나 욕설, 비속어, 혐오 발언이 개재된 리뷰
  • 의성어나 의태어 등 내용의 의미가 없는 리뷰

구매 후 리뷰 작성 시, e교환권 100원 적립

문장수집

문장수집 안내
문장수집은 고객님들이 직접 선정한 책의 좋은 문장을 보여 주는 교보문고의 새로운 서비스 입니다. 교보eBook 앱에서 도서 열람 후 문장 하이라이트 하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다. 마음을 두드린 문장들을 기록하고 좋은 글귀들은 ‘좋아요’ 하여 모아보세요. 도서 문장과 무관한 내용 등록 시 별도 통보없이 삭제될 수 있습니다.
리워드 안내
  • 구매 후 90일 이내에 문장 수집 등록 시 e교환권 100원을 적립해 드립니다.
  • e교환권은 적립일로부터 180일 동안 사용 가능합니다.
  • 리워드는 1,000원 이상 eBook에 한해 다운로드 완료 후 문장수집 등록 시 제공됩니다.
  • 리워드는 한 상품에 최초 1회만 제공됩니다.
  • sam 이용권 구매 상품/오디오북·동영상 상품/주문취소/환불 시 리워드 대상에서 제외됩니다.

구매 후 문장수집 작성 시, e교환권 100원 적립

    교보eBook 첫 방문을 환영 합니다!

    신규가입 혜택 지급이 완료 되었습니다.

    바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
    지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

    교보e캐시 1,000원
    TOP
    신간 알림 안내
    대규모 데이터 세트를 위한 알고리즘과 데이터 구조 웹툰 신간 알림이 신청되었습니다.
    신간 알림 안내
    대규모 데이터 세트를 위한 알고리즘과 데이터 구조 웹툰 신간 알림이 취소되었습니다.
    리뷰작성
    • 구매 후 90일 이내 작성 시, e교환권 100원 (최초1회)
    • 리워드 제외 상품 : 마이 > 라이브러리 > Klover리뷰 > 리워드 안내 참고
    • 콘텐츠 다운로드 또는 바로보기 완료 후 리뷰 작성 시 익일 제공
    감성 태그

    가장 와 닿는 하나의 키워드를 선택해주세요.

    사진 첨부(선택) 0 / 5

    총 5MB 이하로 jpg,jpeg,png 파일만 업로드 가능합니다.

    신고/차단

    신고 사유를 선택해주세요.
    신고 내용은 이용약관 및 정책에 의해 처리됩니다.

    허위 신고일 경우, 신고자의 서비스 활동이 제한될 수
    있으니 유의하시어 신중하게 신고해주세요.


    이 글을 작성한 작성자의 모든 글은 블라인드 처리 됩니다.

    문장수집 작성

    구매 후 90일 이내 작성 시, e교환권 100원 적립

    eBook 문장수집은 웹에서 직접 타이핑 가능하나, 모바일 앱에서 도서를 열람하여 문장을 드래그하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다.

    P.
    대규모 데이터 세트를 위한 알고리즘과 데이터 구조
    저자 모두보기
    낭독자 모두보기
    sam 이용권 선택
    님이 보유하신 이용권입니다.
    차감하실 sam이용권을 선택하세요.
    sam 이용권 선택
    님이 보유하신 이용권입니다.
    차감하실 sam이용권을 선택하세요.
    sam 이용권 선택
    님이 보유하신 프리미엄 이용권입니다.
    선물하실 sam이용권을 선택하세요.
    결제완료
    e캐시 원 결제 계속 하시겠습니까?
    교보 e캐시 간편 결제
    sam 열람권 선물하기
    • 보유 권수 / 선물할 권수
      0권 / 1
    • 받는사람 이름
      받는사람 휴대전화
    • 구매한 이용권의 대한 잔여권수를 선물할 수 있습니다.
    • 열람권은 1인당 1권씩 선물 가능합니다.
    • 선물한 열람권이 ‘미등록’ 상태일 경우에만 ‘열람권 선물내역’화면에서 선물취소 가능합니다.
    • 선물한 열람권의 등록유효기간은 14일 입니다.
      (상대방이 기한내에 등록하지 않을 경우 소멸됩니다.)
    • 무제한 이용권일 경우 열람권 선물이 불가합니다.
    이 상품의 총서 전체보기
    네이버 책을 통해서 교보eBook 첫 구매 시
    교보e캐시 지급해 드립니다.
    교보e캐시 1,000원
    • 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
    • 한 ID당 최초 1회 지급 / sam 이용권 제외
    • 네이버 책을 통해 교보eBook 구매 이력이 없는 회원 대상
    • 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)
    구글북액션을 통해서 교보eBook
    첫 구매 시 교보e캐시 지급해 드립니다.
    교보e캐시 1,000원
    • 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
    • 한 ID당 최초 1회 지급 / sam 이용권 제외
    • 구글북액션을 통해 교보eBook 구매 이력이 없는 회원 대상
    • 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)