본문 바로가기

추천 검색어

실시간 인기 검색어

파이썬으로 배우는 자연어 처리 인 액션

제이펍

2020년 12월 17일 출간

종이책 : 2020년 03월 04일 출간

(개의 리뷰)
( 0% 의 구매자)
eBook 상품 정보
파일 정보 pdf (79.74MB)
ISBN 9791190665728
쪽수 656쪽
지원기기 교보eBook App, PC e서재, 리더기, 웹뷰어
교보eBook App 듣기(TTS) 가능
TTS 란?
텍스트를 음성으로 읽어주는 기술입니다.
  • 전자책의 편집 상태에 따라 본문의 흐름과 다르게 텍스트를​ 읽을 수 있습니다.
  • 전자책 화면에 표기된 주석 등을 모두 읽어 줍니다.
  • 이미지 형태로 제작된 전자책 (예 : ZIP 파일)은 TTS 기능을 지원하지 않습니다.
  • '교보 ebook' 앱을 최신 버전으로 설치해야 이용 가능합니다. (Android v3. 0.26, iOS v3.0.09,PC v1.2 버전 이상)

PDF 필기 Android 가능 (iOS예정)
소득공제
소장
정가 : 24,500원

쿠폰적용가 22,050

10% 할인 | 5%P 적립

이 상품은 배송되지 않는 디지털 상품이며,
교보eBook앱이나 웹뷰어에서 바로 이용가능합니다.

카드&결제 혜택

  • 5만원 이상 구매 시 추가 2,000P
  • 3만원 이상 구매 시, 등급별 2~4% 추가 최대 416P
  • 리뷰 작성 시, e교환권 추가 최대 300원

작품소개

이 상품이 속한 분야

파이썬과 다양한 AI 패키지로 만드는 수준 높은 예제!
최신 NLP 제품과 서비스 개발을 위한 실용주의적 안내서!

최근 심층 학습(딥러닝) 기술이 발전하면서 응용 프로그램들이 대단히 정확하게 텍스트와 음성을 인식하게 되었다. 또한, 새로운 기술과 Keras나 TensorFlow 같은 사용하기 쉬운 도구들 덕분에 이제는 고품질 NLP(자연어 처리) 응용 프로그램을 예전보다 쉽게 만들어낼 수 있다.

이 책은 사람의 언어를 읽고 해석할 수 있는 프로그램을 만들려는 모든 개발자를 위한 지침서다. 이 책에서는 바로 사용할 수 있는 파이썬 패키지들을 이용해서 텍스트의 의미를 포착하고 그에 따라 반응하는 챗봇을 구축한다. 또한, 전통적인 NLP 접근 방식들은 물론이고, 좀 더 최근의 심층 학습 알고리즘과 텍스트 생성 기법들을 동원해서 날짜와 이름 추출, 텍스트 작성, 비정형 질문에 대한 응답 같은 여러 실질적인 NLP 문제들을 해결한다.
PART I 말 많은 컴퓨터: NLP의 기초 1
CHAPTER 1 사고의 단위: NLP의 개요 3
1.1 자연어 대 프로그래밍 언어 4
1.2 마법 5
1.2.1 대화하는 기계 6
1.2.2 수학 7
1.3 실제 응용들 9
1.4 컴퓨터의 ‘눈’으로 본 언어 11
1.4.1 자물쇠 언어 12
1.4.2 정규 표현식 13
1.4.3 간단한 챗봇 14
1.4.4 또 다른 방법 19
1.5 짧은 초공간 탐험 23
1.6 단어의 순서와 문법 25
1.7 챗봇의 자연어 처리 파이프라인 27
1.8 더 깊은 처리 30
1.9 자연어 IQ 32
요약 35

CHAPTER 2 나만의 어휘 구축: 단어 토큰화 37
2.1 어려운 문제: 어간 추출의 개요 39
2.2 토큰 생성기를 이용한 어휘 구축 40
2.2.1 내적 50
2.2.2 두 단어 모음의 중복 측정 51
2.2.3 토큰 개선 52
2.2.4 n-그램을 이용한 어휘 확장 58
2.2.5 어휘 정규화 66
2.3 감정 분석 76
2.3.1 VADER-규칙 기반 감정 분석기 78
2.3.2 단순 베이즈 모형 80
요약 84

CHAPTER 3 말 잘하는 수학: TF-IDF 벡터 85
3.1 단어 모음 86
3.2 벡터화 92
3.2.1 벡터 공간 95
3.3 지프의 법칙 101
3.4 주제 모형화 104
3.4.1 돌아온 지프 108
3.4.2 관련성 순위 110
3.4.3 주요 도구: scikit-learn 112
3.4.4 여러 TF-IDF 정규화 방법 113
3.4.5 Okapi BM25 115
3.4.6 다음 단계 116
요약 116

CHAPTER 4 단어 빈도에서 의미 찾기: 의미 분석 117
4.1 단어 빈도에서 주제 점수로 119
4.1.1 TF-IDF 벡터와 표제어 추출 119
4.1.2 주제 벡터 120
4.1.3 사고 실험 122
4.1.4 주제 점수를 매기는 알고리즘 127
4.1.5 LDA 분류기 129
4.2 잠재 의미 분석(LSA) 134
4.2.1 사고 실험의 실현 137
4.3 특잇값 분해 140
4.3.1 왼쪽 특이 벡터 행렬 U 142
4.3.2 특잇값 행렬 S 143
4.3.3 오른쪽 특이 벡터 행렬 VT 145
4.3.4 SVD 행렬의 방향 145
4.3.5 주제 절단 146
4.4 주성분 분석(PCA) 148
4.4.1 3차원 벡터에 대한 PCA 150
4.4.2 말을 떠나 다시 NLP로 돌아가서 152
4.4.3 PCA를 이용한 문자 메시지 잠재 의미 분석 154
4.4.4 절단된 SVD를 이용한 문자 메시지 잠재 의미 분석 157
4.4.5 스팸 분류에 대한 LSA의 정확도 158
4.5 잠재 디리클레 할당(LDiA) 161
4.5.1 LDiA의 기초 162
4.5.2 문자 메시지 말뭉치에 대한 LDiA 주제 모형 165
4.5.3 LDiA + LDA = 스팸 분류기 168
4.5.4 좀 더 공정한 비교: 주제가 32개인 LDiA 171
4.6 거리와 유사도 173
4.7 피드백에 기초한 방향 조정 176
4.7.1 선형 판별 분석(LDA) 177
4.8 주제 벡터의 위력 179
4.8.1 의미 기반 검색 181
4.8.2 개선안 184
요약 184

PART II 더 깊은 학습: 신경망 적용 185
CHAPTER 5 신경망 첫걸음: 퍼셉트론과 역전파 187
5.1 신경망의 구성요소 188
5.1.1 퍼셉트론 189
5.1.2 디지털 퍼셉트론 190
5.1.3 치우침 단위 191
5.1.4 오차 곡면을 누비며 207
5.1.5 경사로를 따라 활강 208
5.1.6 흔들어서 탈출 210
5.1.7 케라스: 신경망 파이썬 구현 211
5.1.8 더 깊게 배우고 싶다면 215
5.1.9 정규화: 스타일 있는 입력 215
요약 216

CHAPTER 6 단어 벡터를 이용한 추론: word2vec 활용 217
6.1 의미 기반 질의와 비유 218
6.1.1 비유 질문 219
6.2 단어 벡터 221
6.2.1 벡터 지향적 추론 225
6.2.2 word2vec의 단어 표현 계산 228
6.2.3 gensim.word2vec 모듈 사용법 238
6.2.4 나만의 단어 벡터 모형 만들기 241
6.2.5 word2vec 대 GloVe 244
6.2.6 fastText 245
6.2.7 word2vec 대 LSA 246
6.2.8 단어 관계의 시각화 247
6.2.9 인위적인 단어들 254
6.2.10 doc2vec을 이용한 문서 유사도 추정 256
요약 258

CHAPTER 7 단어 순서를 고려한 의미 분석: 합성곱 신경망 259
7.1 의미의 학습 261
7.2 도구 모음 262
7.3 합성곱 신경망 264
7.3.1 합성곱 신경망의 구조 264
7.3.2 단계 크기(보폭) 266
7.3.3 필터의 구성 266
7.3.4 여백 채우기 268
7.3.5 훈련(학습) 270
7.4 다시 텍스트로 271
7.4.1 케라스로 합성곱 신경망 구현: 자료 준비 273
7.4.2 합성곱 신경망의 구조 279
7.4.3 풀링 280
7.4.4 드롭아웃 283
7.4.5 마지막 층 추가 284
7.4.6 모형의 저장 및 시험 286
7.4.7 모형을 NLP 파이프라인에 도입 289
7.4.8 나머지 이야기 290
요약 292

CHAPTER 8 돌고 도는 신경망: 순환 신경망 293
8.1 과거를 아는 순환 신경망 296
8.1.1 시간에 대한 역전파 301
8.1.2 무엇을 언제 갱신하는가? 303
8.1.3 정리 306
8.1.4 항상 그렇듯이 함정이 있다 307
8.1.5 케라스를 이용한 순환 신경망 구

작가정보

저자(글) 홉슨 레인

저자 : 홉슨 레인
홉슨은 사람 대신 중요한 결정을 내리는 자율 시스템을 구축하는 분야에서 20년의 경험을 쌓았다. 그는 Keras, scikit-learn, PyBrain 같은 여러 오픈소스 프로젝트에 적극적으로 기여하며, 현재 Total Good에서 오픈소스 인지 조교(cognitive assistant) 구축을 비롯한 개방형 과학 연구 및 교육 프로젝트에 힘쓰고 있다. 또한, AIAA, PyCon, IEEE 등에 논문을 게재하거나
강연했으며, 로봇공학과 자동화에 관련된 여러 특허도 가지고 있다.

저자 : 하네스 막스 하프케
하네스는 전기 공학자가 기계 학습 공학자로 변신한 사례다. 대학교에서는 신경망 개념을 재생 가능 에너지 발전소를 효과적으로 제어하는 데 적용했다. 구인·구직, 보건 응용 프로그램을 위한 심층 학습 모형과 기계 학습 파이프라인을 개발하는 프로젝트에 참여했으며, OSCON, Open Source Bridge, Hack University 같은 여러 콘퍼런스에서 기계 학습을 주제로 강연했다.

저자 : 콜 하워드
콜은 기계 학습 공학자이자 NLP 실무자이자 작가다. 대규모 전자상거래 추천 엔진들과 고차원 기계 지능 시스템을 위한 최신 심층 학습 신경망들을 개발했으며, 그의 모형들은 Kaggle 공모전에서 상위에 랭크되었다. 또한, Open Source Bridge Conference와 Hack University에서 합성곱 신경망과 순환 신경망에 관해, 그리고 그런 신경망들이 자연어 처리에서 차지하는 역할에 관해 강연했다.

역자 : 류광
커누스 교수의 《컴퓨터 프로그래밍의 예술》 시리즈를 포함하여 60여 종의 다양한 IT 전문서를 번역한 전문 번역가다. 인공지능 관련 번역서로는 《신경망과 심층 학습》(2019)과 《심층 학습》(2018), 《인공지능: 현대적 접근방식 제3판》(2016)이 있다. 번역과 프로그래밍 외에 소프트웨어 문서화에도 관심이 있으며, 수많은 오픈소스 프로젝트의 표준 문서 형식으로 쓰이는 DocBook의 국내 사용자 모임인 닥북 한국(http://docbook.kr)의 일원이다. 홈페이지 occam’s Razor(http://occamsrazr.net)와 게임 개발 사이트 GpgStudy(http://www.gpgstudy.com)를 운영하고 있다.

이 상품의 총서

Klover리뷰 (0)

Klover리뷰 안내
Klover(Kyobo-lover)는 교보를 애용해 주시는 고객님들이 남겨주신 평점과 감상을 바탕으로, 다양한 정보를 전달하는 교보문고의 리뷰 서비스입니다.
1. 리워드 안내
구매 후 90일 이내에 평점 작성 시 e교환권 100원을 적립해 드립니다.
  • - e교환권은 적립일로부터 180일 동안 사용 가능합니다.
  • - 리워드는 1,000원 이상 eBook, 오디오북, 동영상에 한해 다운로드 완료 후 리뷰 작성 시 익일 제공됩니다.
  • - 리워드는 한 상품에 최초 1회만 제공됩니다.
  • - sam 이용권 구매 상품 / 선물받은 eBook은 리워드 대상에서 제외됩니다.
2. 운영 원칙 안내
Klover리뷰를 통한 리뷰를 작성해 주셔서 감사합니다. 자유로운 의사 표현의 공간인 만큼 타인에 대한 배려를 부탁합니다. 일부 타인의 권리를 침해하거나 불편을 끼치는 것을 방지하기 위해 아래에 해당하는 Klover 리뷰는 별도의 통보 없이 삭제될 수 있습니다.
  • 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
  • 도서와 무관한 내용의 리뷰
  • 인신공격이나 욕설, 비속어, 혐오 발언이 개재된 리뷰
  • 의성어나 의태어 등 내용의 의미가 없는 리뷰

구매 후 리뷰 작성 시, e교환권 100원 적립

문장수집

문장수집 안내
문장수집은 고객님들이 직접 선정한 책의 좋은 문장을 보여 주는 교보문고의 새로운 서비스 입니다. 교보eBook 앱에서 도서 열람 후 문장 하이라이트 하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다. 마음을 두드린 문장들을 기록하고 좋은 글귀들은 ‘좋아요’ 하여 모아보세요. 도서 문장과 무관한 내용 등록 시 별도 통보없이 삭제될 수 있습니다.
리워드 안내
  • 구매 후 90일 이내에 문장 수집 등록 시 e교환권 100원을 적립해 드립니다.
  • e교환권은 적립일로부터 180일 동안 사용 가능합니다.
  • 리워드는 1,000원 이상 eBook에 한해 다운로드 완료 후 문장수집 등록 시 제공됩니다.
  • 리워드는 한 상품에 최초 1회만 제공됩니다.
  • sam 이용권 구매 상품/오디오북·동영상 상품/주문취소/환불 시 리워드 대상에서 제외됩니다.

구매 후 문장수집 작성 시, e교환권 100원 적립

    교보eBook 첫 방문을 환영 합니다!

    신규가입 혜택 지급이 완료 되었습니다.

    바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
    지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

    교보e캐시 1,000원
    TOP
    신간 알림 안내
    파이썬으로 배우는 자연어 처리 인 액션 웹툰 신간 알림이 신청되었습니다.
    신간 알림 안내
    파이썬으로 배우는 자연어 처리 인 액션 웹툰 신간 알림이 취소되었습니다.
    리뷰작성
    • 구매 후 90일 이내 작성 시, e교환권 100원 (최초1회)
    • 리워드 제외 상품 : 마이 > 라이브러리 > Klover리뷰 > 리워드 안내 참고
    • 콘텐츠 다운로드 또는 바로보기 완료 후 리뷰 작성 시 익일 제공
    감성 태그

    가장 와 닿는 하나의 키워드를 선택해주세요.

    사진 첨부(선택) 0 / 5

    총 5MB 이하로 jpg,jpeg,png 파일만 업로드 가능합니다.

    신고/차단

    신고 사유를 선택해주세요.
    신고 내용은 이용약관 및 정책에 의해 처리됩니다.

    허위 신고일 경우, 신고자의 서비스 활동이 제한될 수
    있으니 유의하시어 신중하게 신고해주세요.


    이 글을 작성한 작성자의 모든 글은 블라인드 처리 됩니다.

    문장수집 작성

    구매 후 90일 이내 작성 시, e교환권 100원 적립

    eBook 문장수집은 웹에서 직접 타이핑 가능하나, 모바일 앱에서 도서를 열람하여 문장을 드래그하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다.

    P.
    파이썬으로 배우는 자연어 처리 인 액션
    저자 모두보기
    낭독자 모두보기
    sam 이용권 선택
    님이 보유하신 이용권입니다.
    차감하실 sam이용권을 선택하세요.
    sam 이용권 선택
    님이 보유하신 이용권입니다.
    차감하실 sam이용권을 선택하세요.
    sam 이용권 선택
    님이 보유하신 프리미엄 이용권입니다.
    선물하실 sam이용권을 선택하세요.
    결제완료
    e캐시 원 결제 계속 하시겠습니까?
    교보 e캐시 간편 결제
    sam 열람권 선물하기
    • 보유 권수 / 선물할 권수
      0권 / 1
    • 받는사람 이름
      받는사람 휴대전화
    • 구매한 이용권의 대한 잔여권수를 선물할 수 있습니다.
    • 열람권은 1인당 1권씩 선물 가능합니다.
    • 선물한 열람권이 ‘미등록’ 상태일 경우에만 ‘열람권 선물내역’화면에서 선물취소 가능합니다.
    • 선물한 열람권의 등록유효기간은 14일 입니다.
      (상대방이 기한내에 등록하지 않을 경우 소멸됩니다.)
    • 무제한 이용권일 경우 열람권 선물이 불가합니다.
    이 상품의 총서 전체보기
    네이버 책을 통해서 교보eBook 첫 구매 시
    교보e캐시 지급해 드립니다.
    교보e캐시 1,000원
    • 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
    • 한 ID당 최초 1회 지급 / sam 이용권 제외
    • 네이버 책을 통해 교보eBook 구매 이력이 없는 회원 대상
    • 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)
    구글북액션을 통해서 교보eBook
    첫 구매 시 교보e캐시 지급해 드립니다.
    교보e캐시 1,000원
    • 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
    • 한 ID당 최초 1회 지급 / sam 이용권 제외
    • 구글북액션을 통해 교보eBook 구매 이력이 없는 회원 대상
    • 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)