본문 바로가기

추천 검색어

실시간 인기 검색어

데이터 과학 레벨 업 with 로드맵

한빛미디어

2023년 05월 01일 출간

종이책 : 2023년 04월 20일 출간

(개의 리뷰)
( 0% 의 구매자)
eBook 상품 정보
파일 정보 pdf (8.01MB)
ISBN 9791169216739
지원기기 교보eBook App, PC e서재, 리더기, 웹뷰어
교보eBook App 듣기(TTS) 가능
TTS 란?
텍스트를 음성으로 읽어주는 기술입니다.
  • 전자책의 편집 상태에 따라 본문의 흐름과 다르게 텍스트를​ 읽을 수 있습니다.
  • 전자책 화면에 표기된 주석 등을 모두 읽어 줍니다.
  • 이미지 형태로 제작된 전자책 (예 : ZIP 파일)은 TTS 기능을 지원하지 않습니다.
  • '교보 ebook' 앱을 최신 버전으로 설치해야 이용 가능합니다. (Android v3. 0.26, iOS v3.0.09,PC v1.2 버전 이상)

PDF 필기 Android 가능 (iOS예정)
소득공제
소장
정가 : 30,400원

쿠폰적용가 27,360

10% 할인 | 5%P 적립

이 상품은 배송되지 않는 디지털 상품이며,
교보eBook앱이나 웹뷰어에서 바로 이용가능합니다.

카드&결제 혜택

  • 5만원 이상 구매 시 추가 2,000P
  • 3만원 이상 구매 시, 등급별 2~4% 추가 최대 416P
  • 리뷰 작성 시, e교환권 추가 최대 300원

작품소개

이 상품이 속한 분야

실력 향상에 가장 좋은 방법은 실습! 데이터 과학 플랫폼 캐글에서는 다양한 대회에 참가하고 데이터 세트와 노트북, 토론을 주고받으며 ‘실습을 통한 학습’ 경험을 쌓을 수 있습니다. 캐글 그랜드마스터인 콘라트 바나헤비치와 루카 마사론이 데이터 과학 대회와 프로젝트에서 성공하는 데 필요한 기술과 비법을 하나로 모았습니다. 다양한 경험을 통해 쌓인 모델링 전략과 각종 지식을 토대로 데이터 과학자로 성장하는 방법을 여러분에게 전수합니다.
그랜드마스터와 마스터 등급에 오른 캐글러 31명의 솔직한 인터뷰도 담았습니다. 이들이 가감 없이 공유하는 초창기에 저지른 실수와 깨달은 교훈을 통해 데이터 과학 세계에서 살아남는 데 필요한 인사이트를 얻어보세요. 그랜드마스터가 대회나 프로젝트를 시작할 때 사용하는 접근법과 서로 협력하는 법, 도구까지 여러분 것으로 만드세요. 길목 곳곳에 숨겨진 보물을 찾다보면 어느새 데이터 과학에 자신감이 붙은 여러분을 발견할 수 있을 겁니다.
PART I 캐글 사용법

CHAPTER 1 캐글과 데이터 과학 대회
_1.1 데이터 과학 대회 플랫폼의 부상
__1.1.1 캐글 대회 플랫폼
__1.1.2 다른 대회 플랫폼
_1.2 캐글 소개
__1.2.1 대회의 스테이지
__1.2.2 대회의 유형과 예시
__1.2.3 제출과 리더보드 역학
__1.2.4 컴퓨팅 리소스
__1.2.5 팀 구성과 네트워킹
__1.2.6 성과 등급과 순위
__1.2.7 비판과 기회
_1.3 요약
인터뷰 | 01 - 코드를 공유하고 토론하는 커뮤니티, 캐글
인터뷰 | 02 - 프레임워크의 중요성

CHAPTER 2 캐글 데이터 세트
_2.1 데이터 세트 준비하기
_2.2 데이터 수집
_2.3 데이터 세트로 작업하기
_2.4 구글 코랩에서 캐글 데이터 세트 사용하기
_2.5 법적 주의 사항
_2.6 요약
인터뷰 | 03 - 좋은 데이터 세트를 만드는 법

CHAPTER 3 캐글 노트북
_3.1 노트북 설정하기
_3.2 노트북 실행하기
_3.3 노트북 깃허브에 저장하기
_3.4 노트북 최대로 활용하기
__3.4.1 구글 클라우드 플랫폼(GCP)으로 업그레이드하기
__3.4.2 한 걸음 더 나아가기
_3.5 캐글 학습 코스
_3.6 요약
인터뷰 | 04 - 경험과 실수는 성장하는 원동력
인터뷰 | 05 - 캐글 입문자를 위한 접근법

CHAPTER 4 토론 포럼
_4.1 포럼이 운영되는 방식
_4.2 토론 접근법
_4.3 네티켓
_4.4 요약
인터뷰 | 06 - 기술에서 벗어나 맥락에서 정보를 찾아라

PART II 대회를 위한 테크닉

CHAPTER 5 대회 과제와 지표
_5.1 평가 지표와 목적 함수
_5.2 과제의 기본 유형
__5.2.1 회귀
__5.2.2 분류
__5.2.3 서수
_5.3 메타 캐글 데이터 세트
_5.4 처음 보는 지표 처리
_5.5 회귀를 위한 지표(표준과 서수)
__5.5.1 평균 제곱 오차(MSE)와 결정계수
__5.5.2 평균 제곱근 오차(RMSE)
__5.5.3 평균 제곱근 로그 오차(RMSLE)
__5.5.4 평균 절대 오차(MAE)
_5.6 분류를 위한 지표(레이블 예측과 확률)
__5.6.1 정확도
__5.6.2 정밀도와 재현율
__5.6.3 F1 점수
__5.6.4 로그 손실과 ROC-AUC
__5.6.5 매튜스 상관계수(MCC)
_5.7 다중 분류를 위한 지표
_5.8 객체 탐지를 위한 지표
__5.8.1 IoU
__5.8.2 다이스
_5.9 다중 레이블 분류와 추천을 위한 지표
__5.9.1 MAP@{K}
_5.10 평가 지표 최적화
__5.10.1 사용자 정의 지표와 사용자 정의 목표 함수
__5.10.2 예측 후처리
_5.11 요약
인터뷰 | 07 - 전분야 그랜드마스터의 문제 접근법
인터뷰 | 08 - 장기적인 목표를 잡아라
인터뷰 | 09 - 핵심은 꾸준함

CHAPTER 6 좋은 검증 설계법
_6.1 리더보드 분석
_6.2 대회에서 검증의 중요성
__6.2.1 편향과 분산
_6.3 다양한 분할 전략 시도
__6.3.1 기본 훈련 세트 분할
__6.3.2 확률적 평가 방법
_6.4 모델 검증 시스템 조정
_6.5 적대적 검증 사용
__6.5.1 구현 예시
__6.5.2 훈련 데이터와 테스트 데이터의 분포 차이 처리
_6.6 누수 처리
_6.7 요약
인터뷰 | 10 - 모든 것을 검증하라
인터뷰 | 11 - 여러 아이디어로 만드는 좋은 검증
인터뷰 | 12 - 캐글은 마라톤이다

CHAPTER 7 태뷸러 데이터 대회를 위한 모델링
_7.1 플레이그라운드 시리즈
_7.2 재현성을 위한 랜덤 상태 설정
_7.3 EDA의 중요성
__7.3.1 t-SNE과 UMAP으로 차원 축소하기
_7.4 데이터 사이즈 축소하기
_7.5 특징 공학 적용하기
__7.5.1 쉽게 파생된 특징
__7.5.2 행과 열에 기반한 메타 특징
__7.5.3 목표 인코딩
__7.5.4 특징의 중요도 활용해서 작업 평가하기
_7.6 의사 레이블링
_7.7 오토인코더로 잡음 제거하기
_7.8 태뷸러 데이터 대회를 위한 신경망
_7.9 요약
인터뷰 | 13 - 게임처럼 접근하라
인터뷰 | 14 - 데이터 과학도 과학이다

CHAPTER 8 하이퍼파라미터 최적화
_8.1 기본 최적화 기법
__8.1.1 그리드 탐색
__8.1.2 랜덤 탐색
__8.1.3 분할 탐색
_8.2 핵심 파라미터와 사용 방법
__8.2.1 선형 모델
__8.2.2 서포트 벡터 머신
__8.2.3 랜덤 포레스트와 극단적 랜덤 트리
__8.2.4 그레이디언트 트리 부스팅
_8.3 베이지언 최적화
__8.3.1 scikit-optimize 사용하기
__8.3.2 베이지언 최적화 탐색 커스터마이징하기
__8.3.3 베이지언 최적화를 신경망 구조 탐색(NAS)으로 확장하기
__8.3.4 KerasTunner로 더 가볍고 빠른 모델 생성하기
__8.3.5 Optuna의 TPE 접근
_8.4 요약
인터뷰 | 15 - 배우는 게 있다면 실패가 아니다
인터뷰 | 16 - 문제와 데이터부터 이해하라
인터뷰 | 17 - 도전하는 용기

CHAPTER 9 블렌딩과 스태킹 설루션을 사용한 앙상블
_9.1 앙상블 알고리듬
_9.2 모델 평균화로 앙상블하기
__9.2.1 다수결 투표 알고리듬
__9.2.2 모델 예측의 평균화
__9.2.3 가중 평균
__9.2.4 교차검증 전략의 평균화
__9.2.5 ROC-AUC 평가를 위한 평균 수정
_9.3 메타 모델을 사용한 모델 블렌딩
__9.3.1 모델 블렌딩의 모범 사례
_9.4 모델 스태킹
__9.4.1 스태킹 변형
_9.5 복잡한 스태킹과 블렌딩 설루션 만들기
_9.6 요약
인터뷰 | 18 - 데이터를 이해하면 프로젝트가 시작된다
인터뷰 | 19 - 새로운 영역에 겁내지 말 것

CHAPTER 10 컴퓨터 비전 모델링
_10.1 증강 전략
__10.1.1 케라스 내장 증강
__10.1.2 Albumentations
_10.2 분류
_10.3 객체 탐지
_10.4 시맨틱 분할
_10.5 요약
인터뷰 | 20 - 배우고 즐겨라
인터뷰 | 21 - 모든 대회는 퍼즐을 해결하는 모험

CHAPTER 11 NLP 모델링
_11.1 감정 분석
_11.2 오픈 도메인 Q&A
_11.3 텍스트 데이터 증강 전략
__11.3.1 기본 테크닉
__11.3.2 nlpaug
_11.4 요약
인터뷰 | 22 - 스스로의 아이디어로 시작하라
인터뷰 | 23 - 신문사 데이터 과학자가 텍스트를 다루는 법

CHAPTER 12 시뮬레이션과 최적화 대회
_12.1 Connect X
_12.2 가위바위보
_12.3 산타 대회 2020
_12.4 Halite
_12.5 요약
인터뷰 | 24 - 성장을 돕는 캐글


PART III 데이터 과학 경력 관리

CHAPTER 13 포트폴리오 준비
_13.1 캐글로 포트폴리오 구축하기
__13.1.1 노트북과 토론 활용하기
_13.2 캐글을 넘어 온라인에 존재감 드러내기
__13.2.1 블로그
__13.2.2 깃허브
_13.3 대회 최신 소식과 뉴스레터 모니터링하기
_13.4 요약
인터뷰 | 25 - 대회에서 얻은 새로운 기회
인터뷰 | 26 - 칭찬은 캐글러를 춤추게 한다

CHAPTER 14 새로운 기회를 찾는 법
_14.1 대회에 참여한 다른 데이터 과학자와 관계 구축하기
_14.2 캐글 데이와 캐글 밋업에 참가하기
_14.3 주목받는 방법과 다른 직업 기회들
__14.3.1 STAR 접근법
_14.4 요약
인터뷰 | 27 - 단기적인 피드백으로 개선하는 장기 연구
인터뷰 | 28 - 비전공자의 데이터 과학 도전기
인터뷰 | 29 - 16세에 그랜드마스터가 된 이야기
인터뷰 | 30 - 캐글이 만든 커리어
인터뷰 | 31 - 대회의 목적은 우승이 아닌 배움
마무리

캐글 그랜드마스터가 안내하는 데이터 과학의 세계

캐글은 직접 연구하며 데이터 과학 능력을 키우는 플랫폼입니다. 흔히 알려진 대회뿐 아니라 데이터 세트와 노트북, 토론 포럼 등 다양한 서비스를 사용해 여러분의 능력을 발휘할 수 있습니다.
이 책은 캐글을 통해 데이터 과학 대회에 참가하는 방법과 대회를 통해 이름을 외부에 이름을 알릴 기회를 최대한 활용하는 방법을 소개합니다. 데이터 과학 대회만이 아니라 실무에서도 사용하는 다양한 분석 기법을 소개하며, 앞으로 어떤 문제를 만나도 당황하지 않도록 유용한 팁을 담았습니다. 이렇게 단련한 실력을 선보이고 새로운 기회를 찾는 방법까지 정리해 여러분 앞에 가이드를 제시합니다. 여기에 31명의 캐글러와 나눈 인터뷰를 담아 그들이 그랜드마스터와 마스터에 오르기까지 어떤 길을 걸어왔는지, 데이터 과학에 임하는 데 무엇이 중요한지 다양한 조언을 전달합니다.
이제 막 데이터 과학을 시작했다면, 앞으로 더 나아가는 데 영감이 필요하다면 이 책이 도움이 될 겁니다. 핵심 전문 지식을 익혀 데이터 과학에서 자신만의 여정을 시작하세요.

대상 독자
● 실전에서 사용하는 데이터 과학 테크닉을 경험하고 싶은 개발자
● 머신러닝/데이터 과학 공부를 시작하고 다음 단계를 고민 중인 학습자
● 데이터 과학 분야에서 진로를 고민하는 예비 개발자

주요 내용
● 데이터 과학 대회와 프로젝트를 시작하는 방법
● 데이터 과학 플랫폼을 활용해 역량을 키우고 경력을 쌓는 방법
● 다양한 형식의 데이터를 분석하는 비기
● 다른 참가자와 소통하며 해법을 찾는 방법
● 자기 능력을 어필하는 포트폴리오를 만드는 방법

작가정보

Konrad Banachewicz
암스테르담 자유 대학교에서 통계학 박사학위를 받았다. 신용 리스크의 극단적 종속성 모델링의 문제를 연구했으며 튜터로서 석사 과정 학생들을 지도하기도 했다. 박사 과정을 마친 후 몇 년 동안 여러 금융 기관에서 일하며 다양한 양적인 데이터 분석 문제를 다뤘다. 이 과정을 통해 데이터 제품 수명 주기의 전문가가 되었고, 금융 분야에서 극과 극에 있는 고빈도 거래와 신용 리스크 등의 주제를 연구했다.

Luca Massaron
10년 이상의 경력을 지닌 데이터 과학자로 데이터를 똑똑한 물건으로 변신시키거나 실제 문제를 해결하며 사업과 이해 관계자들에게 유용한 가치를 창조한다. 데이터 과학 대회에서 전세계 순위 7위에 오른 캐글 그랜드 마스터이자 머신러닝 분야의 구글 디벨로퍼 엑스퍼트(GDE)이다. AI, 머신러닝, 알고리즘 분야 베스트셀러 도서를 쓴 작가로 『실전활용! 텐서플로 딥러닝 프로젝트』(위키북스, 2018), 『파이썬으로 풀어보는 회귀분석』(에이콘, 2018) 등을 집필했다.

동국대학교에서 일본어 교육학을 전공했고 프리랜서 통번역가로 활동했다. 이후 떠올린 아이디어들을 구체화할 수 있는 프로그래밍에 매력을 느껴 프로그래머가 되기로 했고 지금은 일본에서 웹 개발을 하고 있다. 번역한 도서로는 『친절한 딥러닝 수학』(한빛미디어, 2021), 『다양한 그래프, 간단한 수학, R로 배우는 머신러닝』(영진닷컴, 2019), 『프로그래밍 언어도감』(영진닷컴, 2018) 등이 있다

이 상품의 총서

Klover리뷰 (0)

Klover리뷰 안내
Klover(Kyobo-lover)는 교보를 애용해 주시는 고객님들이 남겨주신 평점과 감상을 바탕으로, 다양한 정보를 전달하는 교보문고의 리뷰 서비스입니다.
1. 리워드 안내
구매 후 90일 이내에 평점 작성 시 e교환권 100원을 적립해 드립니다.
  • - e교환권은 적립일로부터 180일 동안 사용 가능합니다.
  • - 리워드는 1,000원 이상 eBook, 오디오북, 동영상에 한해 다운로드 완료 후 리뷰 작성 시 익일 제공됩니다.
  • - 리워드는 한 상품에 최초 1회만 제공됩니다.
  • - sam 이용권 구매 상품 / 선물받은 eBook은 리워드 대상에서 제외됩니다.
2. 운영 원칙 안내
Klover리뷰를 통한 리뷰를 작성해 주셔서 감사합니다. 자유로운 의사 표현의 공간인 만큼 타인에 대한 배려를 부탁합니다. 일부 타인의 권리를 침해하거나 불편을 끼치는 것을 방지하기 위해 아래에 해당하는 Klover 리뷰는 별도의 통보 없이 삭제될 수 있습니다.
  • 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
  • 도서와 무관한 내용의 리뷰
  • 인신공격이나 욕설, 비속어, 혐오 발언이 개재된 리뷰
  • 의성어나 의태어 등 내용의 의미가 없는 리뷰

구매 후 리뷰 작성 시, e교환권 100원 적립

문장수집

문장수집 안내
문장수집은 고객님들이 직접 선정한 책의 좋은 문장을 보여 주는 교보문고의 새로운 서비스 입니다. 교보eBook 앱에서 도서 열람 후 문장 하이라이트 하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다. 마음을 두드린 문장들을 기록하고 좋은 글귀들은 ‘좋아요’ 하여 모아보세요. 도서 문장과 무관한 내용 등록 시 별도 통보없이 삭제될 수 있습니다.
리워드 안내
  • 구매 후 90일 이내에 문장 수집 등록 시 e교환권 100원을 적립해 드립니다.
  • e교환권은 적립일로부터 180일 동안 사용 가능합니다.
  • 리워드는 1,000원 이상 eBook에 한해 다운로드 완료 후 문장수집 등록 시 제공됩니다.
  • 리워드는 한 상품에 최초 1회만 제공됩니다.
  • sam 이용권 구매 상품/오디오북·동영상 상품/주문취소/환불 시 리워드 대상에서 제외됩니다.

구매 후 문장수집 작성 시, e교환권 100원 적립

    교보eBook 첫 방문을 환영 합니다!

    신규가입 혜택 지급이 완료 되었습니다.

    바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
    지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

    교보e캐시 1,000원
    TOP
    신간 알림 안내
    데이터 과학 레벨 업 with 로드맵 웹툰 신간 알림이 신청되었습니다.
    신간 알림 안내
    데이터 과학 레벨 업 with 로드맵 웹툰 신간 알림이 취소되었습니다.
    리뷰작성
    • 구매 후 90일 이내 작성 시, e교환권 100원 (최초1회)
    • 리워드 제외 상품 : 마이 > 라이브러리 > Klover리뷰 > 리워드 안내 참고
    • 콘텐츠 다운로드 또는 바로보기 완료 후 리뷰 작성 시 익일 제공
    감성 태그

    가장 와 닿는 하나의 키워드를 선택해주세요.

    사진 첨부(선택) 0 / 5

    총 5MB 이하로 jpg,jpeg,png 파일만 업로드 가능합니다.

    신고/차단

    신고 사유를 선택해주세요.
    신고 내용은 이용약관 및 정책에 의해 처리됩니다.

    허위 신고일 경우, 신고자의 서비스 활동이 제한될 수
    있으니 유의하시어 신중하게 신고해주세요.


    이 글을 작성한 작성자의 모든 글은 블라인드 처리 됩니다.

    문장수집 작성

    구매 후 90일 이내 작성 시, e교환권 100원 적립

    eBook 문장수집은 웹에서 직접 타이핑 가능하나, 모바일 앱에서 도서를 열람하여 문장을 드래그하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다.

    P.
    데이터 과학 레벨 업 with 로드맵
    저자 모두보기
    낭독자 모두보기
    sam 이용권 선택
    님이 보유하신 이용권입니다.
    차감하실 sam이용권을 선택하세요.
    sam 이용권 선택
    님이 보유하신 이용권입니다.
    차감하실 sam이용권을 선택하세요.
    sam 이용권 선택
    님이 보유하신 프리미엄 이용권입니다.
    선물하실 sam이용권을 선택하세요.
    결제완료
    e캐시 원 결제 계속 하시겠습니까?
    교보 e캐시 간편 결제
    sam 열람권 선물하기
    • 보유 권수 / 선물할 권수
      0권 / 1
    • 받는사람 이름
      받는사람 휴대전화
    • 구매한 이용권의 대한 잔여권수를 선물할 수 있습니다.
    • 열람권은 1인당 1권씩 선물 가능합니다.
    • 선물한 열람권이 ‘미등록’ 상태일 경우에만 ‘열람권 선물내역’화면에서 선물취소 가능합니다.
    • 선물한 열람권의 등록유효기간은 14일 입니다.
      (상대방이 기한내에 등록하지 않을 경우 소멸됩니다.)
    • 무제한 이용권일 경우 열람권 선물이 불가합니다.
    이 상품의 총서 전체보기
    네이버 책을 통해서 교보eBook 첫 구매 시
    교보e캐시 지급해 드립니다.
    교보e캐시 1,000원
    • 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
    • 한 ID당 최초 1회 지급 / sam 이용권 제외
    • 네이버 책을 통해 교보eBook 구매 이력이 없는 회원 대상
    • 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)
    구글북액션을 통해서 교보eBook
    첫 구매 시 교보e캐시 지급해 드립니다.
    교보e캐시 1,000원
    • 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
    • 한 ID당 최초 1회 지급 / sam 이용권 제외
    • 구글북액션을 통해 교보eBook 구매 이력이 없는 회원 대상
    • 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)