비즈니스 애널리틱스를 위한 데이터 마이닝(IT@CookBook)
2023년 02월 03일 출간
국내도서 : 2023년 02월 10일 출간
- eBook 상품 정보
- 파일 정보 pdf (20.86MB)
- ISBN 9791156647140
- 지원기기 교보eBook App, PC e서재, 리더기, 웹뷰어
-
교보eBook App
듣기(TTS) 가능
TTS 란?텍스트를 음성으로 읽어주는 기술입니다.
- 전자책의 편집 상태에 따라 본문의 흐름과 다르게 텍스트를 읽을 수 있습니다.
- 이미지 형태로 제작된 전자책 (예 : ZIP 파일)은 TTS 기능을 지원하지 않습니다.
PDF 필기가능 (Android, iOS)
쿠폰적용가 35,100원
10% 할인 | 5%P 적립이 상품은 배송되지 않는 디지털 상품이며,
교보eBook앱이나 웹뷰어에서 바로 이용가능합니다.
카드&결제 혜택
- 5만원 이상 구매 시 추가 2,000P
- 3만원 이상 구매 시, 등급별 2~4% 추가 최대 416P
- 리뷰 작성 시, e교환권 추가 최대 200원
작품소개
이 상품이 속한 분야
※ 본 도서는 대학 강의용 교재로 개발되었으므로 연습문제 해답은 제공하지 않습니다.
Chapter 01 서문
1.1 비즈니스 애널리틱스 정의
1.2 데이터 마이닝 정의
1.3 데이터 마이닝 관련 용어
1.4 빅데이터
1.5 데이터 사이언스
1.6 다양한 분석 방법이 존재하는 이유
1.7 용어와 표기법
1.8 로드맵
Chapter 02 데이터 마이닝 프로세스 개요
2.1 서론
2.2 데이터 마이닝의 핵심 아이디어
2.3 데이터 마이닝 수행 단계
2.4 데이터 분석 사전 단계
2.5 예측력과 과적합
2.6 모델 구축: 선형 회귀 분석을 이용한 예제
2.7 로컬 컴퓨터에서 파이썬을 이용한 데이터 마이닝
2.8 데이터 마이닝 과정의 자동화
2.9 데이터 마이닝의 윤리 이슈
연습문제
PART 02 데이터 탐색과 차원 축소
Chapter 03 데이터 시각화
3.1 개요
3.2 예제 데이터
3.3 기본 차트: 막대그래프, 선그래프, 산점도
3.4 다차원 시각화
3.5 특수 시각화
3.6 주요 시각화 작업 요약
연습문제
Chapter 04 차원 축소
4.1 서론
4.2 차원의 저주
4.3 실질적인 고려 사항
4.4 데이터 요약
4.5 상관 분석
4.6 범주형 변수의 범주 개수 축소
4.7 범주형 변수에서 수치형 변수로의 변환
4.8 주성분 분석
4.9 회귀 모델을 사용한 차원 축소
4.10 분류 트리와 회귀 트리를 이용한 차원 축소
연습문제
PART 03 성능 평가
Chapter 05 예측 성능 평가
5.1 서론
5.2 예측 성능의 평가
5.3 분류기 성능의 판단
5.4 랭킹 성능의 판단
5.5 오버샘플링
연습문제
PART 04 예측 및 분류
Chapter 06 다중 선형 회귀
6.1 서론
6.2 설명 모델과 예측 모델의 모델링
6.3 회귀식의 추정과 예측
6.4 선형 회귀 분석의 변수 선택
연습문제
Chapter 07 k-NN 알고리즘
7.1 k-NN 분류기(범주형 결과)
7.2 k-NN 예측기(수치형 결과)
7.3 k-NN 알고리즘의 장점과 단점
연습문제
Chapter 08 나이브 베이즈 분류기
8.1 서론
8.2 완전한(정확한) 베이지안 분류기의 적용
8.3 나이브 베이즈 분류기의 장점과 단점
연습문제
Chapter 09 분류 회귀 트리
9.1 서론
9.2 분류 트리
9.3 분류 트리의 성능 평가
9.4 과적합 방지하기
9.5 분류 트리 모델의 분류 규칙
9.6 3개 이상의 클래스 분류하기
9.7 회귀 트리 모델
9.8 예측력 향상: 랜덤 포레스트와 부스트 트리
9.9 트리 모델의 장점과 단점
연습문제
Chapter 10 로지스틱 회귀 분석
10.1 서론
10.2 로지스틱 회귀 모델
10.3 예제: 개인 대출 신청 수락
10.4 분류 성능 평가
10.5 다중 클래스 분류에 대한 로지스틱 회귀
10.6 분석 예제: 연착 항공편 예측
연습문제
Chapter 11 신경망
11.1 서론
11.2 신경망의 개념과 구조
11.3 데이터에 신경망 적합하기
11.4 요구되는 사용자 입력
11.5 예측 변수들과 결과 변수 간의 관계 탐색
11.6 딥러닝
11.7 신경망의 장점과 단점
연습문제
Chapter 12 판별 분석
12.1 서론
12.2 클래스로부터 관측치에 이르는 거리
12.3 피셔의 선형 분류 함수
12.4 판별 분석의 분류 성능
12.5 사전 확률
12.6 서로 다른 오분류 비용
12.7 클래스가 3개 이상일 경우의 분류
12.8 판별 분석의 장점과 단점
연습문제
Chapter 13 방법론 결합: 앙상블과 업리프트 모델링
13.1 앙상블
13.2 업리프트 모델링
13.3 요약
연습문제
PART 05 레코드 간의 마이닝 관계
Chapter 14 연관 규칙과 협업 필터링
14.1 연관 규칙
14.2 협업 필터링
14.3 요약
연습문제
Chapter 15 군집 분석
15.1 서론
15.2 두 레코드 사이의 거리 측정
15.3 두 군집 사이의 거리 측정
15.4 계층적 응집 군집화
15.5 비계층적 군집화: k -평균 군집화 방법
연습문제
PART 06 시계열 예측
Chapter 16 시계열 데이터 분석
16.1 서론
16.2 탐색 모델 vs. 예측 모델
16.3 비즈니스에서 주로 사용되는 예측 기법
16.4 시계열 요소
16.5 데이터 분할 및 성능 평가
연습문제
Chapter 17 회귀 분석을 기반으로 한 예측
17.1 추세를 반영한 모델
17.2 계절성을 반영한 모델
17.3 추세와 계절성을 반영한 모델
17.4 자기상관과 아리마 모델
연습문제
Chapter 18 평활법
18.1 서론
18.2 이동 평균법
18.3 단순 지수 평활법
18.4 고급 지수 평활법
연습문제
PART 07 데이터 분석
Chapter 19 소셜 네트워크 애널리틱스
19.1 서론
19.2 방향/무방향 네트워크
19.3 네트워크 분석과 시각화
19.4 소셜 데이터의 측정 측도와 분류
19.5 네트워크 측도를 이용한 예측과 분류
19.6 파이썬을 이용한 소셜 네트워크 데이터 수집
19.7 소셜 네트워크 애널리틱스의 장점과 단점
연습문제
Chapter 20 텍스트 마이닝
20.1 서론
20.2 텍스트의 표 형식: 용어-문서 행렬과 ‘단어 주머니’
20.3 단어 주머니 vs. 문서 수준의 의미 추출
20.4 텍스트의 전처리
20.5 데이터 마이닝 방법의 구현
20.6 예제: 자동차와 전자 제품에 대한 온라인 논의
20.7 요약
연습문제
PART 08 사례
Chapter 21 사례
21.1 찰스 북클럽
21.2 독일 신용 평가 자료
21.3 테이코 소프트웨어 카탈로그 판매 회사
21.4 유권자
21.5 택시 예약 취소
21.6 목욕 비누 구매자 세분화
21.7 직접 우편 기금 조성
21.8 카탈로그 교차 판매
21.9 시계열 사례: 대중교통 수요 예측
이 책에 사용된 데이터 파일 목록
부록: 파이썬 유틸리티 함수
참고문헌
찾아보기
관련 도서
『IT CookBook, 데이터 과학을 위한 파이썬 머신러닝』(한빛아카데미, 2022)
『비즈니스 애널리틱스』(한빛아카데미, 2021)
『기계 학습』(한빛아카데미, 2017)
작가정보
저자(글) Galit Shmueli
대만 국립칭화대학교의 서비스사이언스대학원 특임 교수다. 정보 시스템 분야와 헬스케어 분야에서 통계, 데이터 마이닝 방법론을 활용한 비즈니스 애널리틱스 분야를 연구하고, 도서와 논문 100여 편 이상을 출판하였다.
저자(글) Peter C. Bruce
통계 교육 기관인 Statistics.com의 설립자다. Resampling Stats 소프트웨어의 개발자로서 다수의 저널 논문을 출판하였고 ≪Practical Statistics for Data Scientists≫(한국어판: ≪데이터 과학을 위한 통계≫(한빛미디어, 2021)의 공동 저자로 참여하였다.
저자(글) Peter Gedeck
Collaborative Drug Discovery의 수석 데이터 사이언티스트다. 약물 발견 과정에서 대용량의 데이터를 관리하는 클라우드 기반의 소프트웨어를 개발하고 있다. 또한 통계 교육 기관인 Statistics.com에서 데이터 마이닝을 가르치고 있다.
저자(글) Nitin R. Patel
메사추세츠주 케임브리지에 소재한 싸이텔(Cytel) 주식회사의 공동 창업자로, 현재 이사로 재직 중이다. 미국 통계학회의 펠로우로서 MIT와 하버드대학교의 방문 교수를 역임하였다.
번역 조성준
서울대학교 산업공학과 교수. 현재 서울대학교 Big Data AI 센터를 맡고 있다. 국가데이터정책위원회 위원이며, 공공데이터 전략위원회 공동위원장, 정부3.0 추진위원회 빅데이터전문위원장, 한국BI데이터마이닝학회장을 역임했다. 저서로 ≪세상을 읽는 새로운 언어, 빅데이터≫(2019)가 있고, 공저로 ≪데이터 천재들은 어떻게 기획하고 분석할까?≫(2022), ≪빅데이터 커리어 가이드북≫(2021), 역서로 ≪빅데이터 기초(개념, 동인, 기법)≫(2017)이 있다.
번역 조재희
광운대학교 정보융합학부 교수. 광운대학교에서 창업지원센터장, 입학처장, 국제처장을 역임했다. 한국BI데이터마이닝학회장과 정부3.0 추진위원회 빅데이터분과 전문위원을 지냈으며, 관련 논문을 다수 발표하는 등 국내 데이터 발전을 위해 활발히 활동하고 있다. 공저로 ≪데이터 천재들은 어떻게 기획하고 분석할까?≫(2022)가 있다.
번역 조성배
연세대학교 컴퓨터과학과 교수. 현재 연세대학교에서 인공지능대학원 원장을 맡고 있다. 2022년 대한민국정부 근정포장, 2021년 연세대학교 언더우드 특훈교수, 2017년 가헌학술상, 2005년 한국정보과학회 학술상 등을 수상했다. 저서로 ≪우리는 인공지능과 함께 할 수 있을까?≫(2021), ≪왜 인공지능이 문제일까?≫(2017)가 있고, 공저로 ≪데이터 천재들은 어떻게 기획하고 분석할까?≫(2022), ≪혁신의 목격자들≫(2019), ≪미래과학≫(2018) 등이 있다.
번역 이성임
단국대학교 정보통계학과 교수. 서울대학교 지질과학과에서 학사, 통계학과에서 석사를 마치고 연세대학교 환경공해연구소에서 근무했다. 이후 서울대학교 통계학과에서 박사를 마치고, 2004년부터 단국대학교에 재직 중이다. 데이터 마이닝과 범주형 자료 분석, 생존 분석, 통계적 품질 관리 등을 강의하고 있다. 공저로 ≪고급회귀분석≫(2023), ≪데이터 천재들은 어떻게 기획하고 분석할까?≫(2022)가 있다.
번역 김성범
고려대학교 산업경영공학부 교수. 조지아공과대학교에서 산업시스템공학 석사?박사 학위를 받았고, 텍사스주립대학교 산업공학과에서 교수를 지냈다. 고려대학교 공과대학 부학장, 인공지능공학연구소장, 기업산학연협력센터장을 역임하였다. 공저로 ≪데이터 천재들은 어떻게 기획하고 분석할까?≫(2022), ≪첨단유산≫(2021), ≪4차 산업혁명의 미래를 설계한다≫(2018) 등이 있다.
이 상품의 총서
Klover리뷰 (0)
- - e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- - 리워드는 1,000원 이상 eBook, 오디오북, 동영상에 한해 다운로드 완료 후 리뷰 작성 시 익일 제공됩니다. (5,000원 이상 상품으로 변경 예정, 2024년 9월 30일부터 적용)
- - 리워드는 한 상품에 최초 1회만 제공됩니다.
- - sam 이용권 구매 상품 / 선물받은 eBook은 리워드 대상에서 제외됩니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오 발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
구매 후 리뷰 작성 시, e교환권 100원 적립
문장수집
- 구매 후 90일 이내에 문장 수집 등록 시 e교환권 100원을 적립해 드립니다.
- e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- 리워드는 1,000원 이상 eBook에 한해 다운로드 완료 후 문장수집 등록 시 제공됩니다. (5,000원 이상 eBook으로 변경 예정, 2024년 9월 30일부터 적용)
- 리워드는 한 상품에 최초 1회만 제공됩니다.
- sam 이용권 구매 상품 / 선물받은 eBook / 오디오북·동영상 상품/주문취소/환불 시 리워드 대상에서 제외됩니다.
구매 후 문장수집 작성 시, e교환권 100원 적립
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
- 구매 후 90일 이내 작성 시, e교환권 100원 (최초1회)
- 리워드 제외 상품 : 마이 > 라이브러리 > Klover리뷰 > 리워드 안내 참고
- 콘텐츠 다운로드 또는 바로보기 완료 후 리뷰 작성 시 익일 제공
가장 와 닿는 하나의 키워드를 선택해주세요.
총 5MB 이하로 jpg,jpeg,png 파일만 업로드 가능합니다.
신고 사유를 선택해주세요.
신고 내용은 이용약관 및 정책에 의해 처리됩니다.
허위 신고일 경우, 신고자의 서비스 활동이 제한될 수
있으니 유의하시어 신중하게 신고해주세요.
이 글을 작성한 작성자의 모든 글은 블라인드 처리 됩니다.
구매 후 90일 이내 작성 시, e교환권 100원 적립
eBook 문장수집은 웹에서 직접 타이핑 가능하나, 모바일 앱에서 도서를 열람하여 문장을 드래그하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다.
차감하실 sam이용권을 선택하세요.
차감하실 sam이용권을 선택하세요.
선물하실 sam이용권을 선택하세요.
-
보유 권수 / 선물할 권수0권 / 1권
-
받는사람 이름받는사람 휴대전화
- 구매한 이용권의 대한 잔여권수를 선물할 수 있습니다.
- 열람권은 1인당 1권씩 선물 가능합니다.
- 선물한 열람권이 ‘미등록’ 상태일 경우에만 ‘열람권 선물내역’화면에서 선물취소 가능합니다.
- 선물한 열람권의 등록유효기간은 14일 입니다.
(상대방이 기한내에 등록하지 않을 경우 소멸됩니다.) - 무제한 이용권일 경우 열람권 선물이 불가합니다.
첫 구매 시 교보e캐시 지급해 드립니다.
- 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
- 한 ID당 최초 1회 지급 / sam 이용권 제외
- 구글바이액션을 통해 교보eBook 구매 이력이 없는 회원 대상
- 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)