본문 바로가기

추천 검색어

실시간 인기 검색어

데싸노트의 실전에서 통하는 머신러닝

피처 엔지니어링 + TOP 10 알고리즘 +
권시현 지음
골든래빗(주)

2022년 07월 06일 출간

종이책 : 2022년 07월 08일 출간

(개의 리뷰)
( 0% 의 구매자)
eBook 상품 정보
파일 정보 pdf (4.84MB)
ISBN 9791191905144
쪽수 465쪽
듣기(TTS) 가능
TTS 란?
텍스트를 음성으로 읽어주는 기술입니다.
  • 전자책의 편집 상태에 따라 본문의 흐름과 다르게 텍스트를​ 읽을 수 있습니다.
  • 전자책 화면에 표기된 주석 등을 모두 읽어 줍니다.
  • 이미지 형태로 제작된 전자책 (예 : ZIP 파일)은 TTS 기능을 지원하지 않습니다.
  • '교보 ebook' 앱을 최신 버전으로 설치해야 이용 가능합니다. (Android v3.0.26, iOS v3.0.09,PC v1.2 버전 이상)
  • sam 무제한 이용가능
  • sam 프리미엄 이용가능

이 상품은 배송되지 않는 디지털 상품이며,
교보eBook앱이나 웹뷰어에서 바로 이용가능합니다.

작품소개

이 상품이 속한 분야

★ 실전은 피처 엔지니어링이다
★ 뉴욕의 데이터 사이언티스트가 알려주는
★ 머신러닝 문제풀이 해법을 익혀라
이 책은 실무와 캐글 챌린지에도 통하는 10가지 각 알고리즘을 엄선해 머신러닝을 알려줍니다. 콜롬비아 대학교 대학원생 튜터로, 패스트캠퍼스 데이터분석 강사와 스터디 리더로 활동한 저자는 데이터 분석을 바탕으로 한 코딩에 집중할 때 학습 능률이 더 오르는 것을 발견했습니다. 그래서 각 알고리즘을 ‘기초 지식 ? 데이터 분석 ? 전처리 ? 모델링 평가 ? 알고리즘 깊이 이해하기’ 순서로 격파해나갑니다. 무엇보다 더 나은 성과를 얻는 핵심 기술인 데이터를 분석하고 처리하는 피처 엔지니어링에 공을 들였습니다. 이 책을 읽고 나면 독자 스스로가 데이터에 알맞은 문제풀이 해법을 고안할 수 있게 될 겁니다.

* 이 책은 객체지향 개념이 있는 프로그래밍 언어를 적어도 하나를 익힌 분을 대상으로 합니다. 파이썬은 1장에서 알려주므로 몰라도 됩니다.
00장 실습 환경 안내(코랩)

1단계 : 배경지식 익히기

01장 한눈에 살펴보는 머신러닝
__1.1 인공지능, 머신러닝, 딥러닝
__1.2 머신러닝 기법 : 지도 학습, 비지도 학습, 강화 학습
__1.3 머신러닝 프로세스
__1.4 TOP 10 알고리즘의 성능 비교
__1.5 머신러닝 핵심 라이브러리
__1.6 데이터 시각화 그래프 종류
__1.7 피처 엔지니어링 기법
__1.8 변수란 무엇인가?
학습 마무리

02장 파이썬 기초 익히기
__2.1 프로그래밍 기본 : 산술 연산, 변수, 출력
__2.2 자료형과 자료구조
__2.3 반복문 : for문, while문
__2.4 조건문 : if문
__2.5 파이썬 내장 함수
__2.6 나만의 함수 만들기 : def
학습 마무리

03장 유용한 라이브러리 : 판다스와 넘파이
__3.1 판다스
__3.2 넘파이
학습 마무리


2단계 : 답을 알려줘야 학습하는 머신러닝 지도학습 알고리즘

04장 선형 회귀 : 보험료 예측하기
__4.1 문제 정의 : 한눈에 보는 예측 목표
__4.2 라이브러리 및 데이터 불러오기
__4.3 데이터 확인하기
__4.4 전처리 : 학습셋과 시험셋 나누기
__4.5 모델링
__4.6 모델을 활용해 예측하기
__4.7 예측 모델 평가하기
__4.8 이해하기 : 선형 회귀
학습 마무리
연습 문제

05장 로지스틱 회귀 : 타이타닉 생존자 예측하기
__5.1 문제 정의 : 한눈에 보는 예측 목표
__5.2 라이브러리 및 데이터 불러오기
__5.3 데이터 확인하기
__5.4 전처리 : 범주형 변수 변환하기(더미 변수와 원-핫 인코딩)
__5.5 모델링 및 예측하기
__5.6 예측 모델 평가하기
__5.7 이해하기 : 피처 엔지니어링
__5.8 이해하기 : 로지스틱 회귀
학습 마무리
연습 문제

06장 K-최근접 이웃(KNN) : 와인 등급 예측하기
__6.1 문제 정의 : 한눈에 보는 예측 목표
__6.2 라이브러리 및 데이터 불러오기
__6.3 데이터 확인하기
__6.4 목푯값에서 고윳값 확인하기
__6.5 전처리 : 결측치 처리하기
__6.6 스케일링
__6.7 모델링 및 예측/평가하기
__6.8 하이퍼파라미터 튜닝하기
__6.9 이해하기 : K-최근접 이웃
학습 마무리
연습 문제

07장 나이브 베이즈 : 스팸 여부 판단하기
__7.1 문제 정의 : 한눈에 보는 예측 목표
__7.2 라이브러리 및 데이터 불러오기 & 데이터 확인
__7.3 전처리 : 특수 기호 제거하기
__7.4 전처리 : 불용어 제거하기
__7.5 전처리 : 목표 컬럼 형태 변경하기
__7.6 전처리 : 카운트 기반으로 벡터화하기
__7.7 모델링 및 예측/평가하기
__7.8 이해하기 : 나이브 베이즈 모델
학습 마무리
연습 문제

08장 결정 트리 : 연봉 예측하기
__8.1 문제 정의 : 한눈에 보는 예측 목표
__8.2 라이브러리 및 데이터 불러오기, 데이터 확인하기
__8.3 전처리 : 범주형 데이터
__8.4 전처리 : 결측치 처리 및 더미 변수 변환
__8.5 모델링 및 평가하기
__8.6 이해하기 : 결정 트리
__8.7 오버피팅 문제
__8.8 매개변수 튜닝
__8.9 트리 그래프
학습 마무리
연습 문제

09장 랜덤 포레스트 : 중고차 가격 예측하기
__9.1 문제 정의 : 한눈에 보는 예측 목표
__9.2 라이브러리 및 데이터 불러오기, 데이터 확인하기
__9.3 전처리 : 텍스트 데이터
__9.4 전처리 : 결측치 처리와 더미 변수 변환
__9.5 모델링 및 평가하기
__9.6 이해하기 : K-폴드 교차검증
__9.7 이해하기 : 랜덤 포레스트
__9.8 하이퍼파라미터 튜닝
학습 마무리
연습 문제

10장 XGBoost : 커플 성사 여부 예측하기
__10.1 문제 정의 : 한눈에 보는 예측 목표
__10.2 라이브러리 및 데이터 불러오기, 데이터 확인하기
__10.3 전처리 : 결측치 처리
__10.4 전처리 : 피처 엔지니어링
__10.5 모델링 및 평가
__10.6 이해하기 : 경사하강법
__10.7 하이퍼파라미터 튜닝 : 그리드 서치
__10.8

★ 뉴욕의 데이터 사이언티스트 데싸노트가 전하는
★ 이 책으로 머신러닝을 익혀야 하는 이유

이 책은 기존 책과 큰 차이가 있습니다. 상세한 이론 설명을 코딩을 마친 후로 미루고, 일단 머신러닝 코드를 작성합니다. 그저 코드를 따라 치는 게 아니라 어떤 관점에서 문제를 풀어나가야 하는지 설명을 보태 실무에도 적용할 수 있게 했습니다. 이렇게 손으로 결과물을 만들어보고 나서 이론을 깊게 살펴봅니다. 전체 과정을 다시금 머리에 상기시키고, 핵심 개념과 용어를 복습합니다.

이런 식으로 TOP 10 알고리즘을 모두 학습하고 나면, 머신러닝 알고리즘에 대한 이해뿐만 아니라, 파이썬 코딩에 대한 기초 지식도 자연스럽게 갖출 수 있습니다. 무엇보다 큰 장점은, 결과물을 바로 확인하고 본인이 무엇을 하고 있는지 직관적으로 알 수 있기 때문에, 의욕을 고취시킨다는 데 있습니다.

★ 현업과 캐글에서 머신러닝을 활용하려면
★ 얼마나 많은 머신러닝 알고리즘을 알아야 하는 걸까요?
시작점으로 TOP 10 알고리즘이면 충분합니다. 알고리즘은 달라도 머신러닝 실행 순서는 학습 → 예측 → 평가로 진행됩니다. 이 부분은 거의 정형화되어 있어 성능에 큰 영향을 미치지 않습니다. 쓰레기가 들어가면 쓰레기가 나온다고 합니다. 머신러닝에 딱맞는 말입니다. 좋은 데이터가 좋은 머신러닝 모델을 만듭니다. 그래서 이 책은 TOP 10 알고리즘을 공략하면서 무엇보다 데이터 분석과 가공에 공을 들입니다. 데이터에 어떤 가공 기법이 필요한지 하나하나 분석하며 클리닝, 피처 엔지니어링, 차원 축소 등의 기법을 사용할 겁니다. 이렇게 데이터 분석 능력을 기르며 알고리즘을 익히면 현업과 캐글에서도 통하는 실력을 갖추게 됩니다.

★ 타깃 독자
__적어도 객체지향 프로그래밍 언어 하나를 아는 머신러닝 입문자
__머신러닝을 협업/캐글에서 더 잘 활용하고 싶은 데이터 사이언티스트와 개발자

★ 톱 10 알고리즘의 선정 기준
이 책은 10가지 머신러닝 알고리즘을 다룹니다. 어떤 알고리즘은 성능면에서 매우 뛰어나서, 어떤 알고리즘은 꼭 이해할 필요가 있어서 선택했습니다. 8가지 알고리즘은 지도 학습, 나머지 2가지 알고리즘은 비지도 학습에 포함됩니다. 정형 데이터라면, 이 10가지 알고리즘만으로 현업과 캐글 컴피티션에서 충분히 좋은 성과를 낼 수 있습니다.

▽ 머신러닝 TOP 알고리즘
__1. 선형 회귀(Linear Regression)
__2. 로지스틱 회귀(Logistic Regression)
__3. K-최근접 이웃(KNN)
__4. 나이브 베이즈(Naive Bayes)
__5. 결정 트리(Decision Tree)
__6. 랜덤 포레스트(Random Forest)
__7. XG부스트(XGBoost)
__8. 라이트GBM(LightGBM)
__9. K-평균 군집화(K Means Clustering)
__10. 주성분 분석(PCA)

★ 이 책의 구성
이 책은 학습 흐름을 끊지 않기 위해 개발 환경(코랩)부터 설명한 후, 다음과 같이 총 3단계에 걸쳐 머신러닝 알고리즘을 공략해나갑니다

[1단계 : 배경지식 익히기]
머신러닝을 본격적으로 다루기 전에 알아야 하는 기초 지식을 다룹니다. 1장에서는 머신러닝 알고리즘, 그래프, 라이브러리를 일목요연하게 소개합니다. 머신러닝 입문자가 큰 그림을 파악하는 데 도움이 될 겁니다. 이어서 프로그래밍에 사용할 파이썬 기본 지식(2장), 데이터 분석에 사용할 데이터 구조인 판다스와 넘파이(3장)도 다룹니다.

[2단계 : 답을 알려줘야 학습하는 지도학습 알고리즘]
지도 학습과 관련된 8가지 알고리즘을 알아봅니다. 지도 학습은 학습 데이터에 답(종속변수)이 포함되어 있습니다. 그 답을 잘 예측할 수 있도록 모델을 훈련시키는 방법을 문제해결 관점에서 알아보겠습니다. 가장 기초 알고리즘인 선형 회귀부터 캐글 컴피티션 및 실무에서도 유용한 최신 기법인 XGBoost와 LightGBM까지 폭넓게 다룹니다.

[3단계 : 답을 스스로 찾는 비지도학습 알고리즘]
비지도 학습 알고리즘 두 개를 다룹니다. 비지도 학습은 답이 주어져 있지 않다 보니, 학습 결과가 좋은지 나쁜지 평가할 만한 답안 또한 가지고 있지 않아서 목적이 모호할 수 있습니다. 그래서 다양한 시도를 할 때 활용될 수 있습니다. 지도 학습과 달리 비지도 학습에서 압도적으로 많이 사용되는 알고리즘이 한정적입니다. 그래서 가장 유명한 두 알고리즘만 다룹니다.

작가정보

저자(글) 권시현

저자 : 권시현
데싸노트
삼성전자에 마케팅 직군으로 입사하여 앱스토어 결제 데이터를 운영 및 관리했습니다. 데이터에 관심이 생겨 미국으로 유학을 떠나 지금은 모바일 서비스 업체 IDT에서 데이터 사이언티스트로 일합니다. 문과 출신이 미국 현지 데이터 사이언티스트가 되기까지 파이썬과 머신러닝을 배우며 많은 시행착오를 겪었습니다. 제가 겪었던 시행착오를 덜어드리고, 머신러닝에 대한 재미를 전달하고자 유튜버로 활동하고 책을 집필합니다.

현) IDT Corporation (미국 모바일 서비스 업체) 데이터 사이언티스트
전) 콜롬비아 대학교, Machine Learning Tutor, 대학원생 대상
전) 콜롬비아 대학교, Big Data Immersion Program Teaching Assistant
전) 콜롬비아 대학교, M.S. in Applied Analytics
전) 삼성전자 무선사업부, 스마트폰 데이터 분석가
전) 삼성전자 무선사업부, 모바일앱 스토어 데이터 관리 및 운영

강의 경력
● 패스트캠퍼스 〈파이썬을 활용한 이커머스 데이터 분석 입문〉

SNS
● www.youtube.com/c/데싸노트

이 상품의 총서

Klover리뷰 (0)

Klover리뷰 안내
Klover(Kyobo-lover)는 교보를 애용해 주시는 고객님들이 남겨주신 평점과 감상을 바탕으로, 다양한 정보를 전달하는 교보문고의 리뷰 서비스입니다.
1. 리워드 안내
구매 후 90일 이내에 평점 작성 시 e교환권 100원을 적립해 드립니다.
  • - e교환권은 적립일로부터 180일 동안 사용 가능합니다.
  • - 리워드는 1,000원 이상 eBook, 오디오북, 동영상에 한해 다운로드 완료 후 리뷰 작성 시 익일 제공됩니다.
  • - 리워드는 한 상품에 최초 1회만 제공됩니다.
  • - sam 이용권 구매 상품 / 선물받은 eBook은 리워드 대상에서 제외됩니다.
2. 운영 원칙 안내
Klover리뷰를 통한 리뷰를 작성해 주셔서 감사합니다. 자유로운 의사 표현의 공간인 만큼 타인에 대한 배려를 부탁합니다. 일부 타인의 권리를 침해하거나 불편을 끼치는 것을 방지하기 위해 아래에 해당하는 Klover 리뷰는 별도의 통보 없이 삭제될 수 있습니다.
  • 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
  • 도서와 무관한 내용의 리뷰
  • 인신공격이나 욕설, 비속어, 혐오 발언이 개재된 리뷰
  • 의성어나 의태어 등 내용의 의미가 없는 리뷰

구매 후 리뷰 작성 시, e교환권 100원 적립

문장수집

문장수집 안내
문장수집은 고객님들이 직접 선정한 책의 좋은 문장을 보여 주는 교보문고의 새로운 서비스 입니다. 교보eBook 앱에서 도서 열람 후 문장 하이라이트 하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다. 마음을 두드린 문장들을 기록하고 좋은 글귀들은 ‘좋아요’ 하여 모아보세요. 도서 문장과 무관한 내용 등록 시 별도 통보없이 삭제될 수 있습니다.
리워드 안내
  • 구매 후 90일 이내에 문장 수집 등록 시 e교환권 100원을 적립해 드립니다.
  • e교환권은 적립일로부터 180일 동안 사용 가능합니다.
  • 리워드는 1,000원 이상 eBook에 한해 다운로드 완료 후 문장수집 등록 시 제공됩니다.
  • 리워드는 한 상품에 최초 1회만 제공됩니다.
  • sam 이용권 구매 상품/오디오북·동영상 상품/주문취소/환불 시 리워드 대상에서 제외됩니다.

구매 후 문장수집 작성 시, e교환권 100원 적립

    교보eBook 첫 방문을 환영 합니다!

    신규가입 혜택 지급이 완료 되었습니다.

    바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
    지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

    교보e캐시 1,000원
    TOP
    신간 알림 안내
    데싸노트의 실전에서 통하는 머신러닝 웹툰 신간 알림이 신청되었습니다.
    신간 알림 안내
    데싸노트의 실전에서 통하는 머신러닝 웹툰 신간 알림이 취소되었습니다.
    리뷰작성
    • 구매 후 90일 이내 작성 시, e교환권 100원 (최초1회)
    • 리워드 제외 상품 : 마이 > 라이브러리 > Klover리뷰 > 리워드 안내 참고
    감성 태그

    가장 와 닿는 하나의 키워드를 선택해주세요.

    사진 첨부(선택) 0 / 5

    총 5MB 이하로 jpg,jpeg,png 파일만 업로드 가능합니다.

    신고/차단

    신고 사유를 선택해주세요.
    신고 내용은 이용약관 및 정책에 의해 처리됩니다.

    허위 신고일 경우, 신고자의 서비스 활동이 제한될 수
    있으니 유의하시어 신중하게 신고해주세요.


    이 글을 작성한 작성자의 모든 글은 블라인드 처리 됩니다.

    문장수집 작성

    구매 후 90일 이내 작성 시, e교환권 100원 적립

    eBook 문장수집은 웹에서 직접 타이핑 가능하나, 모바일 앱에서 도서를 열람하여 문장을 드래그하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다.

    P.
    데싸노트의 실전에서 통하는 머신러닝
    피처 엔지니어링 + TOP 10 알고리즘 +
    저자 모두보기
    저자(글)
    낭독자 모두보기
    sam 이용권 선택
    님이 보유하신 이용권입니다.
    차감하실 sam이용권을 선택하세요.
    sam 이용권 선택
    님이 보유하신 이용권입니다.
    차감하실 sam이용권을 선택하세요.
    sam 이용권 선택
    님이 보유하신 프리미엄 이용권입니다.
    선물하실 sam이용권을 선택하세요.
    결제완료
    e캐시 원 결제 계속 하시겠습니까?
    교보 e캐시 간편 결제
    sam 열람권 선물하기
    • 보유 권수 / 선물할 권수
      0권 / 1
    • 받는사람 이름
      받는사람 휴대전화
    • 구매한 이용권의 대한 잔여권수를 선물할 수 있습니다.
    • 열람권은 1인당 1권씩 선물 가능합니다.
    • 선물한 열람권이 ‘미등록’ 상태일 경우에만 ‘열람권 선물내역’화면에서 선물취소 가능합니다.
    • 선물한 열람권의 등록유효기간은 14일 입니다.
      (상대방이 기한내에 등록하지 않을 경우 소멸됩니다.)
    • 무제한 이용권일 경우 열람권 선물이 불가합니다.
    이 상품의 총서 전체보기
    네이버 책을 통해서 교보eBook 첫 구매 시
    교보e캐시 지급해 드립니다.
    교보e캐시 1,000원
    • 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
    • 한 ID당 최초 1회 지급 / sam 이용권 제외
    • 네이버 책을 통해 교보eBook 구매 이력이 없는 회원 대상
    • 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)
    구글북액션을 통해서 교보eBook
    첫 구매 시 교보e캐시 지급해 드립니다.
    교보e캐시 1,000원
    • 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
    • 한 ID당 최초 1회 지급 / sam 이용권 제외
    • 구글북액션을 통해 교보eBook 구매 이력이 없는 회원 대상
    • 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)