머신러닝 시스템 구축 실전 가이드
2024년 03월 15일 출간
국내도서 : 2024년 01월 04일 출간
- eBook 상품 정보
- 파일 정보 pdf (21.48MB)
- ISBN 9791193926062
- 지원기기 교보eBook App, PC e서재, 리더기, 웹뷰어
-
교보eBook App
듣기(TTS) 불가능
TTS 란?텍스트를 음성으로 읽어주는 기술입니다.
- 전자책의 편집 상태에 따라 본문의 흐름과 다르게 텍스트를 읽을 수 있습니다.
- 이미지 형태로 제작된 전자책 (예 : ZIP 파일)은 TTS 기능을 지원하지 않습니다.
PDF 필기가능 (Android, iOS)
쿠폰적용가 18,270원
10% 할인 | 5%P 적립이 상품은 배송되지 않는 디지털 상품이며,
교보eBook앱이나 웹뷰어에서 바로 이용가능합니다.
카드&결제 혜택
- 5만원 이상 구매 시 추가 2,000P
- 3만원 이상 구매 시, 등급별 2~4% 추가 최대 416P
- 리뷰 작성 시, e교환권 추가 최대 200원
작품소개
이 상품이 속한 분야
과제 설정, 워크플로 설계, 시스템 구축과 개발 등 머신러닝 제품을 실제 비즈니스로 만들기 위해 알아야 할 모든 것을 다룬다. 머신러닝을 사용해서만 해결할 수 있는 비즈니스 과제인지 여부를 판단하고, 디자인 패턴에 따라 팀과 아키텍처를 설정한 다음, 프런트엔드, 백엔드, 인프라스트럭처, 파이프라인, BI 도구 등 워크플로에 필요한 전반적인 소프트웨어를 직접 구현해본다. 상품 수요 예측, 웹 서비스 위반 감지, 검색 시스템 개선 등 흔히 볼 수 있는 비즈니스 과제를 예로 들어 실습한다. 머신러닝 시스템을 설계하고 운용하려는 엔지니어에게 실질적인 도움이 되는 책.
<p>머신러닝을 사용하지 않고도 객관식 설문 형식의 챗봇을 제공하고, 사용자가 설문의 답을 선택하면서 해결책에 도달하도록 하는 워크플로만 갖춰도 이 과제는 간단하게 해결할 수 있습니다. 설문 형식을 사용하는 편이 머신러닝을 사용하는 것보다 기술적으로 간단하며, 동시에 사용자 경험 측면에서 뛰어난 경우도 있을 것입니다. 개발 공정 측면에서도 객관식 설문 형식의 챗봇을 사용하면, 질문과 선택지를 제공하고 분기 처리를 위한 if-else 구문을 조합하는 것만으로 구현할 수 있습니다. (8쪽)</p><p> </p><p>예를 들어 수요 예측과 같은 회귀 문제에서는 매장에서 식료품의 수요 예측 모델이 수요보다 큰 쪽으로 벗어나면 공급 과다가 되어 재고가 창고를 점유하게 됩니다. 벗어난 양에 따라 창고에 상품을 넣을 수 없는 상황도 발생할 것입니다. 소비 기한까지 팔리지 않는 경우에는 재고를 처분해야 할 수도 있습니다. 반대로 작은 쪽으로 벗어나면 기회 손실로 이어집니다. 기회 손실이 계속되면 고객으로부터 ‘상품 판매가 좋지 않은 매장’이라는 평판이 붙어 고객이 줄어들 리스크가 있습니다(그림 1.9). 이런 경우에는 수요 예측의 추론이 완전한 정답을 찾지는 못하더라도, 다소 큰 쪽으로 벗어나는 것이 기회 손실을 피할 수 있고, 리스크도 작을 것입니다. (23쪽)</p><p> </p><p>전처리에는 사이킷런(scikit-learn)의 ColumnTransformer를 사용합니다. ColumnTransformer는 컬럼에 맞춰 전처리를 개별적으로 사이킷런의 파이프라인(Pipeline)으로 정의하고 이를 모은 클래스입니다. ColumnTransformer를 사용하면 다른 매장, 지역, 상품명, 상품 가격, 판매 연, 판매 월, 판매 주, 과거 판매 실적 데이터의 전처리를 하나의 파이프라인 처리로 모을 수 있습니다. 개별적으로 기술하는 것이 간단하다고 생각할지도 모르지만, ColumnTransformer로 모음으로써 뒤에서 전처리를 사용할 때 하나의 함수만 호출하면 전처리를 완결할 수 있게 됩니다. 전처리 파이프라인 구현은 앞에서 설명한 DataPreprocessPipeline 클래스의 함수로 정의합니다(예제 2.5). (75쪽)</p><p> </p><p>워크플로 자동화에서 중요한 것이 워크플로 엔진 선정과 도입입니다. 워크플로 엔진이란 배치/작업 등의 실행을 관리하는 인프라스트럭처이며 일반적으로 데이터 파이프라인이나 머신러닝 파이프라인은 워크플로 엔진 위에서 구축됩니다. 워크플로 엔진에는 OSS로는 에어플로(AirFlow)나 아르고(Argo), Prefect, Luigi가 있습니다. 클라우드에서 실현된 워크플로우 엔진에는 구글 클라우드 컴포저(Google Cloud Composer), AWS Step Functions, 애저 파이프라인(Azure Pipeline) 등이 있습니다. 머신러닝 파이프라인에 특화한 인프라스트럭처에는 KubeFLow 파이프라인이나 구글 버텍스(Google Vertex) AI 파이프라인, gokart가 있습니다. 소프트웨어나 서비스에 따라 실행 방법은 다르지만, 모두 워크플로로서 하나 이상의 잡을 연결해서 실행하는 기능을 갖고 있습니다. (110~111쪽)</p><p> </p><p>위반 감지는 동물 이미지의 등록과는 비동기로 실행합니다. 즉 동물 이미지가 animals 테이블에 등록된 후, 임의의 시점에 위반 감지가 실행됩니다. 위반 감지가 실시되는 것은 animals 테이블에 등록된 직후일 수 있고, 몇 분이 지난 후일 수도 있습니다. 비동기 처리이므로, 위반 감지 실행은 animals 테이블로의 데이터 등록 후이기만 하면 제한은 없습니다. 또한 위반 감지가 실패해도 animals 테이블의 데이터에는 아무런 영향이 없습니다. (…) 큐에는 RabbitMQ로 기동한 메시징 큐 서비스를 사용합니다. RabbitMQ는 AMQP(Advanced Message Queuing Protocol)를 사용한 메시징 미들웨어입니다. RabbitMQ는 서비스로서 가동하고, 메시지 등록과 전송을 담당합니다. 백엔드 API가 Producer(메시지를 보내는 측)로서 위반 감지 대상 이미지 ID를 RabbitMQ에 등록하고, 위반 감지 시스템이 Consumer(메시지를 받는 측)로서 이미지 ID를 받아 위반 감지를 실시합니다. (203쪽)</p><p> </p><p>이제 순위 학습 모델을 2종류 만들었습니다. A/B 테스트를 통한 비교를 같은 기준으로 하기 위해, 새롭게 만든 LGBMRegressor 모델도 LGBMRanker 모델과 마찬가지로 자동으로 학습하고 릴리스합니다. 여러 모델을 운용할 때의 각 모델의 학습 타이밍은 비교 기준이나 모델의 특성에 따라 결정해야 합니다. 여기에서는 두 모델 모두 같은 데이터를 사용해서 학습, 추론을 실행하므로 같은 시점에 학습하고 릴리스하는 것으로 합니다. 양쪽 모두 정기적으로 업데이트되는 특징량 스토어에 의존하는 모델이므로, 학습은 반드시 특징량 스토어 업데이트 후 실시합니다. (313쪽)</p><p> </p>
<h2><strong>비즈니스 사례와 디자인 패턴으로 마스터하는 머신러닝 실용화의 워크플로</strong></h2><p> </p><p>머신러닝 모델이나 라이브러리 각론을 다룬 책은 많지만, 머신러닝을 실제로 프로덕션 시스템에 적용하는 일은 또 다른 문제다. 저자의 비유를 따르면 그런 책들은 “생선 손질 방법이나 전자레인지 사용 방법에 관해서는 설명하지만, 요리를 만드는 방법은 설명하지 않는 요리책”이다. 하지만 “요리를 만들려는 사람에게 필요한 책은 실제로 요리를 만드는 책”이다. 저자는 이러한 문제의식 아래 머신러닝 ‘실용화’를 다루는 이 책을 썼다.</p><p> </p><p>머신러닝 실용화는 당면 비즈니스 과제가 머신러닝을 사용해서만 해결할 수 있는 과제인지 여부를 판단하는 것부터 시작된다. 머신러닝 도입 결정 후에는, 팀 크기와 역량을 고려해 저자 고유의 디자인 패턴에 따라 머신러닝 아키텍처를 설계하고 팀을 구성하는 노하우를 알려준다. 여기까지가 1장의 내용으로, 현실적인 비즈니스 상황을 가정하고 패턴별 유스케이스를 알려준다는 점이 돋보인다.</p><p> </p><p>2장에서는 식료품 판매점의 수요 예측 시스템을 만들어보며 실습을 시작한다. 개발 팀의 구성 예시를 들고, 과제 설정, 시스템 개발, 워크플로 설계까지 전 과정을 자세히 설명한다. 모델 관련 구현에는 Hydra, MLflow, 사이킷런, LightGBM 등을 사용하고, 비즈니스 의사결정을 위한 BI 도구로는 Streamlit과 Plotly를 활용한다. 구축한 시스템과 워크플로는 MLOps 관점에서 변화하는 상황에 맞춰 개선할 수 있어야 하므로, 쿠버네티스에 배포하고 아르고 워크플로를 사용해 자동화하는 방법까지 살펴본다.</p><p> </p><p>3장에서는 사용자가 동물 이미지를 공유하는 웹 서비스에 위반 감지 시스템을 추가하는 과정을 다룬다. 실습 편의를 위해 저자가 작성해둔 안드로이드용 앱이 제공되며, 특히 FastAPI, PostgreSQL, Redis, RabbitMQ, 일래스틱서치 등으로 구성된 백엔드의 구조를 자세히 설명한다. 이후 2장과 마찬가지로 위반 이미지 감지라는 과제 설정부터 시작해 시스템과 워크플로를 설계하고 구현해나간다. MobileNet v3 및 텐서플로를 사용해 위반을 판단하고 텐서플로 서빙과 MLflow Tracking Server으로 DB에 저장한다. 이 시스템을 프로덕션에 적용하기 위해 추론을 비동기로 실행되게 하고, 모니터링을 위해 Streamlit으로 웹 페이지를 만드는 방법도 간단히 다룬다.</p><p> </p><p>4장에서는 3장의 서비스의 검색 기능을 개선하기 위해 검색 시스템에 머신러닝을 도입하는 과정을 실습한다. 순위 학습과 형태소 분석(일본어)을 설명하고 구현하며, 프로덕션 적용을 위해 CronWorkflow로 특징량 생성 작업을 자동화한다. 끝으로 텍스트뿐 아니라 이미지로도 검색할 수 있도록 ScaNN 인덱스 작성을 구현해 유사 이미지 검색 기능을 앱에 추가하고, 인덱스 업데이트 역시 자동화한다.</p><p> </p><p>각각의 컴포넌트를 조합해 전체적인 파이프라인이 제대로 돌아가게 만드는 법에 초점을 맞춘 책으로서, 이론이나 개별적인 디테일에 매몰되지 않고 큰 그림을 보여준다는 점이 책의 가장 큰 미덕이다. 팀 구성, 백엔드, 인프라스트럭처, BI 도구 등 실제 서비스가 돌아가는 데 중요함에도 간과되어온 요소들까지 살펴본다는 점에서 더욱 의미 있는 실무적인 머신러닝 지침서라고 할 수 있다.</p><p> </p><h3><strong>주요 내용</strong></h3><ul><li>머신러닝 비즈니스 과제를 선정하는 방법, 과제를 해결하기 위한 워크플로와 시스템 구축 방법, 머신러닝을 활용하는 팀 구성 노하우</li><li>가공의 AI 상점에서 식료품 수요 예측을 위한 머신러닝의 활용 및 개발 워크플로</li><li>가공의 동물 이미지 공유 애플리케이션에서 사용자의 위반 행동을 감지하고 제지하기 위한 워크플로, 머신러닝 시스템/평가 시스템의 구현 방법</li><li>검색 시스템에 머신러닝을 활용해 검색 경험을 개선/발전시키는 방법</li></ul>
작가정보
대학 졸업 후 소프트웨어 엔지니어, 소프트웨어 품질 엔지니어, 애자일 코치 등 다양한 부문에서 소프트웨어 개발에 참여했다. 재미있는 일, 나와 조직이 성장하고 성과를 내도록 돕는 일에 보람을 느끼며, 나 자신에게 도전하고 더 나은 사람이 되기 위해 항상 노력하고 있다. 저서로 《코드 품질 시각화의 정석》(지앤선)이 있고, 옮긴 책은 《핵심만 골라 배우는 젯팩 컴포즈》(제이펍), 《모던 자바스크립트로 배우는 리액트 입문》(한빛미디어), 《애자일 소프트웨어 아키텍트의 길》(에이콘출판사) 등 다수다.
이 상품의 총서
Klover리뷰 (0)
- - e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- - 리워드는 1,000원 이상 eBook, 오디오북, 동영상에 한해 다운로드 완료 후 리뷰 작성 시 익일 제공됩니다. (5,000원 이상 상품으로 변경 예정, 2024년 9월 30일부터 적용)
- - 리워드는 한 상품에 최초 1회만 제공됩니다.
- - sam 이용권 구매 상품 / 선물받은 eBook은 리워드 대상에서 제외됩니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오 발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
구매 후 리뷰 작성 시, e교환권 100원 적립
문장수집
- 구매 후 90일 이내에 문장 수집 등록 시 e교환권 100원을 적립해 드립니다.
- e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- 리워드는 1,000원 이상 eBook에 한해 다운로드 완료 후 문장수집 등록 시 제공됩니다. (5,000원 이상 eBook으로 변경 예정, 2024년 9월 30일부터 적용)
- 리워드는 한 상품에 최초 1회만 제공됩니다.
- sam 이용권 구매 상품 / 선물받은 eBook / 오디오북·동영상 상품/주문취소/환불 시 리워드 대상에서 제외됩니다.
구매 후 문장수집 작성 시, e교환권 100원 적립
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
- 구매 후 90일 이내 작성 시, e교환권 100원 (최초1회)
- 리워드 제외 상품 : 마이 > 라이브러리 > Klover리뷰 > 리워드 안내 참고
- 콘텐츠 다운로드 또는 바로보기 완료 후 리뷰 작성 시 익일 제공
가장 와 닿는 하나의 키워드를 선택해주세요.
총 5MB 이하로 jpg,jpeg,png 파일만 업로드 가능합니다.
신고 사유를 선택해주세요.
신고 내용은 이용약관 및 정책에 의해 처리됩니다.
허위 신고일 경우, 신고자의 서비스 활동이 제한될 수
있으니 유의하시어 신중하게 신고해주세요.
이 글을 작성한 작성자의 모든 글은 블라인드 처리 됩니다.
구매 후 90일 이내 작성 시, e교환권 100원 적립
eBook 문장수집은 웹에서 직접 타이핑 가능하나, 모바일 앱에서 도서를 열람하여 문장을 드래그하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다.
차감하실 sam이용권을 선택하세요.
차감하실 sam이용권을 선택하세요.
선물하실 sam이용권을 선택하세요.
-
보유 권수 / 선물할 권수0권 / 1권
-
받는사람 이름받는사람 휴대전화
- 구매한 이용권의 대한 잔여권수를 선물할 수 있습니다.
- 열람권은 1인당 1권씩 선물 가능합니다.
- 선물한 열람권이 ‘미등록’ 상태일 경우에만 ‘열람권 선물내역’화면에서 선물취소 가능합니다.
- 선물한 열람권의 등록유효기간은 14일 입니다.
(상대방이 기한내에 등록하지 않을 경우 소멸됩니다.) - 무제한 이용권일 경우 열람권 선물이 불가합니다.
첫 구매 시 교보e캐시 지급해 드립니다.
- 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
- 한 ID당 최초 1회 지급 / sam 이용권 제외
- 구글바이액션을 통해 교보eBook 구매 이력이 없는 회원 대상
- 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)