대규모 머신러닝 시스템 디자인 패턴
2024년 12월 02일 출간
국내도서 : 2024년 11월 29일 출간
- eBook 상품 정보
- 파일 정보 PDF (5.61MB) | 305 쪽
- ISBN 9791169218832
- 지원기기 교보eBook App, PC e서재, 리더기, 웹뷰어
-
교보eBook App
듣기(TTS) 가능
TTS 란?텍스트를 음성으로 읽어주는 기술입니다.
- 전자책의 편집 상태에 따라 본문의 흐름과 다르게 텍스트를 읽을 수 있습니다.
- 이미지 형태로 제작된 전자책 (예 : ZIP 파일)은 TTS 기능을 지원하지 않습니다.
PDF 필기가능 (Android, iOS)
쿠폰적용가 21,600원
10% 할인 | 5%P 적립이 상품은 배송되지 않는 디지털 상품이며,
교보eBook앱이나 웹뷰어에서 바로 이용가능합니다.
카드&결제 혜택
- 5만원 이상 구매 시 추가 2,000P
- 3만원 이상 구매 시, 등급별 2~4% 추가 최대 416P
- 리뷰 작성 시, e교환권 추가 최대 200원
작품소개
이 상품이 속한 분야
14가지 패턴
● 데이터 수집 패턴: 배치 처리, 샤딩, 캐싱
● 분산 학습 패턴: 파라미터 서버, 집합 통신, 탄력성 및 내결함성
● 모델 서빙 패턴: 레플리카 서버, 서비스 샤딩, 이벤트 기반 처리
● 워크플로 패턴: 팬인 및 팬아웃, 동기 및 비동기, 스텝 메모이제이션
● 운영 패턴: 스케줄링, 메타데이터
CHAPTER 01 분산 머신러닝 시스템 소개
_1.1 대규모 머신러닝
_1.2 분산 시스템
_1.3 분산 머신러닝 시스템
요약
[PART 2 분산 머신러닝 시스템의 설계 패턴]
CHAPTER 02 데이터 수집 패턴
_2.1 데이터 수집이란?
_2.2 Fashion-MNIST 데이터셋
_2.3 배치 처리 패턴: 제한된 메모리로 무거운 연산 실행하기
_2.4 샤딩 패턴: 매우 큰 데이터셋을 여러 워커에 분산시키기
_2.5 캐싱 패턴: 효율적인 학습을 위해 데이터 재활용하기
요약
CHAPTER 03 분산 학습 패턴
_3.1 분산 학습이란?
_3.2 파라미터 서버 패턴: 8백만 개의 유튜브 영상에 태그 달기
_3.3 집합 통신 패턴: 파라미터 서버가 병목이 되지 않도록 개선하기
_3.4 탄력성 및 내결함성 패턴: 제한된 연산 자원으로 인한 실패 대응하기
요약
CHAPTER 04 모델 서빙 패턴
_4.1 모델 서빙이란?
_4.2 레플리카 서버 패턴: 늘어나는 요청량 처리하기
_4.3 서비스 샤딩 패턴: 고해상도 영상을 처리하는 대규모 모델 서빙 다루기
_4.4 이벤트 기반 처리 패턴: 이벤트 기반으로 모델 서빙하기
요약
CHAPTER 05 워크플로 패턴
_5.1 워크플로란?
_5.2 팬인 및 팬아웃 패턴: 복잡한 머신러닝 워크플로 체계화
_5.3 동기 및 비동기 패턴: 병렬성으로 더 빠르게 처리하기
_5.4 스텝 메모이제이션 패턴: 반복되는 작업 생략하기
요약
CHAPTER 06 운영 패턴
_6.1 머신러닝 시스템 운영하기
_6.2 스케줄링 패턴: 공유 클러스터 자원을 효과적으로 할당하기
_6.3 메타데이터 패턴: 실패를 적절히 처리하는 방법
요약
[PART 03 분산 머신러닝 시스템 구축]
CHAPTER 07 실습 프로젝트 둘러보기
_7.1 프로젝트 개요
_7.2 데이터 수집 단계
_7.3 모델 학습 단계
_7.4 모델 서빙 단계
_7.5 전체 워크플로 구조
요약
CHAPTER 08 실습 관련 기술 둘러보기
_8.1 텐서플로: 머신러닝 프레임워크
_8.2 쿠버네티스: 분산 컨테이너 관리 시스템
_8.3 쿠브플로: 쿠버네티스 머신러닝 워크로드 관리 시스템
_8.4 아르고 워크플로: 컨테이너 기반 워크플로 엔진
요약
CHAPTER 09 실습 프로젝트
_9.1 데이터 수집
_9.2 모델 학습
_9.3 모델 서빙
_9.4 전체 워크플로
요약
대규모 데이터 처리와 분석을 위한 분산 머신러닝 실무 가이드
이 책은 분산 시스템에서 머신러닝을 구현하고 최적화하는 데 필요한 14가지 핵심 패턴과 모범 사례를 소개하는 실무 지침서다. 복잡한 분산 머신러닝 개념을 쉽게 이해할 수 있도록 설명하고, 실무에서 바로 적용할 수 있는 실질적인 방법론을 제시한다. 데이터 분산 처리, 모델 학습의 병렬화, 효율적인 리소스 관리 등 분산 머신러닝의 전반적인 과정에서 발생할 수 있는 다양한 문제를 해결하기 위한 체계적인 패턴을 소개한다. 이를 통해 AI와 데이터 과학 분야의 전문가들뿐만 아니라, 대규모 데이터 처리 및 분석을 다루는 모든 이에게 실용적인 가이드가 될 것이다.
주요 내용
● 데이터 수집, 분산 학습, 모델 서빙 등 다양한 단계로 구성된 ML 파이프라인 구축
● 쿠버네티스, 텐서플로, 쿠브플로, 아르고 워크플로를 사용해 ML 작업 자동화
● 다양한 패턴과 접근 방식 간의 트레이드오프 평가
● 대규모 머신러닝 작업 관리 및 모니터링
인물정보
(Yuan Tang)
Akuity의 창립 엔지니어로, 개발자를 위한 기업용 플랫폼을 구축하고 있다. 이전에 알리바바와 Uptake에서 데이터 과학 및 엔지니어링팀을 이끌며 AI 인프라와 AutoML 플랫폼 개발에 주력했다. 아르고(Argo)와 쿠브플로(Kubeflow)의 프로젝트 리더이자 텐서플로(TensorFlow)와 XGBoost의 메인테이너로 활동 중이며, 이 외에도 다양한 오픈 소스 프로젝트를 만들어 운영 중이다. 세 권의 머신러닝 서적을 집필하고 여러 논문을 발표했다. 다양한 콘퍼런스에서 정기적으로 다양한 발표를 정기적으로 진행하고 있으며, 여러 조직에서 기술 자문과 리더, 멘토 역할을 수행하고 있다.
이 상품의 총서
Klover리뷰 (0)
- - e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- - 리워드는 5,000원 이상 eBook, 오디오북, 동영상에 한해 다운로드 완료 후 리뷰 작성 시 익일 제공됩니다. (2024년 9월 30일부터 적용)
- - 리워드는 한 상품에 최초 1회만 제공됩니다.
- - sam 이용권 구매 상품 / 선물받은 eBook은 리워드 대상에서 제외됩니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오 발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
구매 후 리뷰 작성 시, e교환권 100원 적립
문장수집
- 구매 후 90일 이내에 문장 수집 등록 시 e교환권 100원을 적립해 드립니다.
- e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- 리워드는 5,000원 이상 eBook에 한해 다운로드 완료 후 문장수집 등록 시 제공됩니다. (2024년 9월 30일부터 적용)
- 리워드는 한 상품에 최초 1회만 제공됩니다.
- sam 이용권 구매 상품 / 선물받은 eBook / 오디오북·동영상 상품/주문취소/환불 시 리워드 대상에서 제외됩니다.
구매 후 문장수집 작성 시, e교환권 100원 적립
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!