본문 바로가기

추천 검색어

실시간 인기 검색어

Do it! 쉽게 배우는 R 텍스트 마이닝

김영우 지음
이지스퍼블리싱

2021년 01월 29일 출간

종이책 : 2021년 01월 29일 출간

(개의 리뷰)
( 0% 의 구매자)
eBook 상품 정보
파일 정보 pdf (30.00MB)
ISBN 9791163032328
지원기기 교보eBook App, PC e서재, 리더기, 웹뷰어
교보eBook App 듣기(TTS) 가능
TTS 란?
텍스트를 음성으로 읽어주는 기술입니다.
  • 전자책의 편집 상태에 따라 본문의 흐름과 다르게 텍스트를​ 읽을 수 있습니다.
  • 전자책 화면에 표기된 주석 등을 모두 읽어 줍니다.
  • 이미지 형태로 제작된 전자책 (예 : ZIP 파일)은 TTS 기능을 지원하지 않습니다.
  • '교보 ebook' 앱을 최신 버전으로 설치해야 이용 가능합니다. (Android v3. 0.26, iOS v3.0.09,PC v1.2 버전 이상)

PDF 필기 Android 가능 (iOS예정)
소득공제
소장
정가 : 13,000원

쿠폰적용가 11,700

10% 할인 | 5%P 적립

이 상품은 배송되지 않는 디지털 상품이며,
교보eBook앱이나 웹뷰어에서 바로 이용가능합니다.

카드&결제 혜택

  • 5만원 이상 구매 시 추가 2,000P
  • 3만원 이상 구매 시, 등급별 2~4% 추가 최대 416P
  • 리뷰 작성 시, e교환권 추가 최대 300원

작품소개

이 상품이 속한 분야

4년간 R 데이터 분야 1위 도서 저자의 후속작 ‘텍스트 마이닝’ 도서 출간!
형태소 분석, 긍정·부정 분위기 분석, 연관 단어 분석, 시각화 모두 내 손으로!

봉준호 감독의 영화 〈기생충〉이 오스카상 4관왕을 수상한 사실은 이제 모두가 알고 있다! 그런데 온라인 댓글 분위기는 천차만별이었네? 이 영화가 대체 어땠길래? 당시 분위기를 분석하고 돌아볼 수는 없을까? 영화 평가가 긍정·부정적이었는지, 영화 자체의 평이 많은지 아니면 영화 외적 요소의 평이 많은지 궁금하다. 이제 김영우 선생님과 함께 R로 텍스트 마이닝을 해보자! 이 책은 직장인, 대학생, 연구자 누구나 쉽게 텍스트 분석을 할 수 있다. 한글 텍스트 분석은 물론 30종 넘는 다양한 그래프까지! 보고서에 바로 사용할 수 있는 다양한 결과물을 내 손으로 직접 만들 수 있다.
__1장 단어 빈도 분석: 무엇을 강조했을까?
_01-1 텍스트 전처리
_01-2 토큰화하기
_01-3 단어 빈도 분석하기

__2장 형태소 분석기를 이용한 단어 빈도 분석
_02-1 형태소 분석
_02-2 명사 빈도 분석하기
_02-3 특정 단어가 사용된 문장 살펴보기

__3장 비교 분석: 무엇이 다를까?
_03-1 단어 빈도 비교하기
_03-2 오즈비 - 상대적으로 중요한 단어 비교하기
_03-3 로그 오즈비로 단어 비교하기
_03-4 TF-IDF - 여러 텍스트의 단어 비교하기

__4장 감정 분석: 어떤 마음으로 글을 썼을까?
_04-1 감정 사전 활용하기
_04-2 댓글 감정 분석하기
_04-3 감정 범주별 주요 단어 살펴보기
_04-4 감정 사전 수정하기

__5장 의미망 분석: 어떤 맥락에서 단어를 썼을까?
_05-1 동시 출현 단어 분석 - Co-occurrence analysis
_05-2 동시 출현 네트워크 - Co-occurrence network
_05-3 단어 간 상관 분석 - Phi coefficient
_05-4 연이어 사용된 단어쌍 분석 - n-gram

__6장 토픽 모델링: 어떤 주제로 글을 썼을까?
_06-1 토픽 모델링 개념 알아보기
_06-2 LDA 모델 만들기
_06-3 토픽별 주요 단어 살펴보기
_06-4 문서를 토픽별로 분류하기
_06-5 토픽 이름 짓기
_06-6 최적의 토픽 수 정하기

__7장 텍스트 마이닝 프로젝트: 타다 금지법 기사 댓글 분석
_07-1 주요 단어 살펴보기
_07-2 공감, 비공감 댓글 비교하기
_07-3 관심 댓글 비교하기
_07-4 단어 간 관계 살펴보기
_07-5 토픽 모델링

__8장 텍스트 마이닝 프로젝트: 차기 대선 주자 SNS 여론 분석
_08-1 SNS 언급량 추이 살펴보기
_08-2 SNS 이슈 살펴보기
_08-3 감정 단어 살펴보기
_08-4 감정 경향 살펴보기
_08-5 감정 추이 살펴보기
_08-6 긍정, 부정 트윗 단어 비교하기

__9장 텍스트를 효율적으로 분석하는 방법
_09-1 텍스트 데이터 수집하기
_09-2 텍스트 분석 품질 높이기
_09-3 완전 유용한 꿀팁

R을 배웠는데 어떻게 써먹어야 할지 모르는 사람 모두 모여라!
실전에 주제별로 응용할 수 있는 학습·실습 구성으로 알차다!
텍스트 마이닝을 진짜 내가 할 수 있을까? 이 책과 함께라면 당연히 할 수 있다! 저자는 R에 입문한 사람이라면 누구나 따라 할 수 있는 구성으로 ‘완벽한 텍스트 마이닝 실습 매뉴얼’을 준비했다. 이 책은 텍스트 마이닝 실전 연습을 충분히 할 수 있도록 현재 우리 사회에서 이슈가 되고 있는 4가지 주제를 중심으로 데이터를 엄선하여 텍스트 마이닝 실습을 진행한다. ‘대통령 연설문’, ‘영화 〈기생충〉 오스카상 수상 댓글’, ‘타다 금지법 댓글’, ‘내년 대선 후보 댓글’의 4가지 실제 사례를 분석하며 개념을 이해하는 과정으로 구성해서 처음에는 복잡해 보이는 개념도 실습을 진행하다 보면 술술 이해될 것이다.
정말로, 진짜로, 어디까지 내 손으로 할 수 있을까?
형태소 분석부터 단어 분석, 감정 분석 등 ‘고급 데이터 분석 과정’ 모두 수록!
이제는 데이터 분석 기초 능력만 향상할 것이 아니라 실제 사례를 분석할 줄 아는 능력을 키워야 하는 시대가 되었다. 개발자, 마케터, 프로젝트 관리자 등 모두가 알아야 할 기초 소양이 된 것이다. 이 책은 문장을 구성하는 명사, 동사, 형용사 등과 같은 품사를 분류하는 작업인 형태소 분석부터 상대적으로 중요한 단어를 짚어 주는 ‘오즈비’, ‘로그 오즈비’ 활용, 감정 사전을 활용한 문장의 감정 분석, 동시 출현 네트워크를 활용한 단어 맥락 분석, 단어가 사용된 문단의 주제를 찾아 주는 ‘토픽 모델링’까지! ‘텍스트 데이터 분석 고급 과정’을 직접 해낸 사람으로 만들어 준다. 게다가 텍스트 데이터 분석이 편해지는 ‘꿀팁’부터 코드를 실행하다 함정에 빠지기 쉬운 부분까지 짚어 주니 그야말로 ‘텍스트 마이닝 꿀단지’이다.
내일 ‘사용자 선호도 분석’ 보고서를 제출해야 하는데 어떻게 하지?
보고서, 기사, 프레젠테이션에 바로 사용해도 손색없는 결과물을 이 책으로 만들어 보자!
저자는 “이 책을 집필할 때 바로 실무에 사용해도 될 수준의 텍스트 분석 과정과 시각화 과정을 포함하기 위해 노력했다.”고 강조한다. 현장에서 일하고 강의하면서 만난 후배와 수강자가 꼽은 국내 텍스트 마이닝 학습 콘텐츠의 가장 아쉬운 점이 ‘학습과 실제 업무의 괴리가 크다’였기 때문이다. 이 책은 그런 지점을 완벽하게 해소하고 있다. 한글 데이터를 다루는 텍스트 분석 과정은 실무에 가까운 수준이고, 분석 결과로 만드는 시각화 자료는 내일 당장 보고서, 신문 기사, 프레젠테이션 등에 사용해도 손색없는 수준이다.
저자는 당신이 어디에서 어떻게 어려워할지 다 알고 있다!
저자가 옆에 앉아 친절하게 설명해 주는 문장으로 감동받으며 공부하자!
텍스트 분석 과정은 가시밭길이다. 어디에서 어떤 문제가 벌어질지 모르기 때문이다. 하지만 저자는 이런 과정을 학습자ㆍ강의자 입장에서 모두 겪어 본 베테랑 중의 베테랑이다. 본문을 읽다 보면 저자가 옆에 앉아서 “여기는 아마 헷갈릴 텐데 이렇게 하면 쉽게 이해할 수 있을 겁니다.”라고 말해 주는 느낌을 받을 것이다. 또한 본문을 읽다가 궁금해할 만한 내용이나, 지금 당장 몰라도 되지만 결국은 알아야 할 내용은 본문 중간중간에 ‘꿀팁’, ‘알아두면 좋아요’로 풍부하게 배치했다.
베타테스터 후기
한국어 텍스트 분석, 이 책 한 권만 보면 됩니다!
텍스트 분석에 관심이 많아 출간 도서와 온라인 콘텐츠를 대부분 학습했고, 값비싼 교육 프로그램도 수강했습니다. 그런데도 늘 아쉬움이 많았습니다. 기존의 텍스트 분석 콘텐츠는 대부분 영어로 된 자료를 바탕으로 만들어진 것이었고, 코드 설명이 상세하지 않았기 때문입니다. 코드를 활용하려고 해도 이론 설명이 부족하여 항상 아쉬었습니다. 그런데 이 책의 알파테스터로 참여하면서 ‘앞으로 이 책의 독자는 이런 아쉬움은 없겠구나’ 하는 확신이 생겼습니다. 감히 ‘텍스트 분석 최고의 책’이라고 추천합니다. 여러분은 그저 편안한 마음으로 차근차근 따라가기만 하면 됩니다. 한국어 텍스트 분석은 이제 이 책으로 시작하고, 끝내세요.
- 기업에서 인공지능과 데이터 교육을 담당하는 분석 꿈나무_조영찬
R을 1도 모르는 R린이도 할 수 있어요!
내년 대선 댓글 분위기 분석은 제 손으로 직접 해봐야겠어요!
R을 1도 모르던 R린이가 바로 저였는데요. 저자 선생님의 《Do it! 쉽게 배우는 R 데이터 분석》으로 R 입문을 마친 다음 데이터 마이닝에 겁 없이 도전해 봤습니다. 그리고 책을 읽고 나서 데이터 분석으로 정말 많을 것을 할 수 있다는 점을 알고 무척 놀랐습니다. 평소에 접했던 뉴스나 기사 내용을 분석하니 오즈비, 로그 오즈비와 같은 개념도 이해하는 데 크게 어렵지 않았어요. 이 책 덕분에 정말 재미있고 즐겁게 공

작가정보

저자(글) 김영우

저자 : 김영우
데이터로 세상을 이해하는 일을 하는 데이터 분석가. 기업, 대학, 연구 기관, 시민 단체 등 다양한 조직의 데이터 분석 프로젝트를 진행하고 있다. 측정, 실험, 데이터를 좋아하고 혈액형 성격론, 타로 카드, 자기 계발서를 싫어한다. 데이터에 기반을 둔 대화를 추구하므로 지인들로부터 신뢰할 만하다는 평을 듣지만 친구는 별로 없다. 초보자도 어깨춤을 추며 데이터를 분석하게 만드는 강의를 진행하고 있다. SKT, KT, 엔씨소프트, 삼성금융연수원, LG 인화원, 멀티캠퍼스, 패스트캠퍼스 등에서 강의했다. 데이터 저널리스트로 활동하며 데이터 저널(datajournal.kr)을 운영하고 있으며, 데이터 전문 팟캐스트 〈데이터 홀릭〉을 진행하고 있다. 현재 레어템을 좋아하는 여인에게 수집돼 함께 살고 있으며, 가장 효율적으로 아무것도 안 하는 고양이 두 마리를 모시고 있다.

이 상품의 총서

Klover리뷰 (0)

Klover리뷰 안내
Klover(Kyobo-lover)는 교보를 애용해 주시는 고객님들이 남겨주신 평점과 감상을 바탕으로, 다양한 정보를 전달하는 교보문고의 리뷰 서비스입니다.
1. 리워드 안내
구매 후 90일 이내에 평점 작성 시 e교환권 100원을 적립해 드립니다.
  • - e교환권은 적립일로부터 180일 동안 사용 가능합니다.
  • - 리워드는 1,000원 이상 eBook, 오디오북, 동영상에 한해 다운로드 완료 후 리뷰 작성 시 익일 제공됩니다.
  • - 리워드는 한 상품에 최초 1회만 제공됩니다.
  • - sam 이용권 구매 상품 / 선물받은 eBook은 리워드 대상에서 제외됩니다.
2. 운영 원칙 안내
Klover리뷰를 통한 리뷰를 작성해 주셔서 감사합니다. 자유로운 의사 표현의 공간인 만큼 타인에 대한 배려를 부탁합니다. 일부 타인의 권리를 침해하거나 불편을 끼치는 것을 방지하기 위해 아래에 해당하는 Klover 리뷰는 별도의 통보 없이 삭제될 수 있습니다.
  • 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
  • 도서와 무관한 내용의 리뷰
  • 인신공격이나 욕설, 비속어, 혐오 발언이 개재된 리뷰
  • 의성어나 의태어 등 내용의 의미가 없는 리뷰

구매 후 리뷰 작성 시, e교환권 100원 적립

문장수집

문장수집 안내
문장수집은 고객님들이 직접 선정한 책의 좋은 문장을 보여 주는 교보문고의 새로운 서비스 입니다. 교보eBook 앱에서 도서 열람 후 문장 하이라이트 하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다. 마음을 두드린 문장들을 기록하고 좋은 글귀들은 ‘좋아요’ 하여 모아보세요. 도서 문장과 무관한 내용 등록 시 별도 통보없이 삭제될 수 있습니다.
리워드 안내
  • 구매 후 90일 이내에 문장 수집 등록 시 e교환권 100원을 적립해 드립니다.
  • e교환권은 적립일로부터 180일 동안 사용 가능합니다.
  • 리워드는 1,000원 이상 eBook에 한해 다운로드 완료 후 문장수집 등록 시 제공됩니다.
  • 리워드는 한 상품에 최초 1회만 제공됩니다.
  • sam 이용권 구매 상품/오디오북·동영상 상품/주문취소/환불 시 리워드 대상에서 제외됩니다.

구매 후 문장수집 작성 시, e교환권 100원 적립

    교보eBook 첫 방문을 환영 합니다!

    신규가입 혜택 지급이 완료 되었습니다.

    바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
    지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

    교보e캐시 1,000원
    TOP
    신간 알림 안내
    Do it! 쉽게 배우는 R 텍스트 마이닝 웹툰 신간 알림이 신청되었습니다.
    신간 알림 안내
    Do it! 쉽게 배우는 R 텍스트 마이닝 웹툰 신간 알림이 취소되었습니다.
    리뷰작성
    • 구매 후 90일 이내 작성 시, e교환권 100원 (최초1회)
    • 리워드 제외 상품 : 마이 > 라이브러리 > Klover리뷰 > 리워드 안내 참고
    • 콘텐츠 다운로드 또는 바로보기 완료 후 리뷰 작성 시 익일 제공
    감성 태그

    가장 와 닿는 하나의 키워드를 선택해주세요.

    사진 첨부(선택) 0 / 5

    총 5MB 이하로 jpg,jpeg,png 파일만 업로드 가능합니다.

    신고/차단

    신고 사유를 선택해주세요.
    신고 내용은 이용약관 및 정책에 의해 처리됩니다.

    허위 신고일 경우, 신고자의 서비스 활동이 제한될 수
    있으니 유의하시어 신중하게 신고해주세요.


    이 글을 작성한 작성자의 모든 글은 블라인드 처리 됩니다.

    문장수집 작성

    구매 후 90일 이내 작성 시, e교환권 100원 적립

    eBook 문장수집은 웹에서 직접 타이핑 가능하나, 모바일 앱에서 도서를 열람하여 문장을 드래그하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다.

    P.
    Do it! 쉽게 배우는 R 텍스트 마이닝
    저자 모두보기
    저자(글)
    낭독자 모두보기
    sam 이용권 선택
    님이 보유하신 이용권입니다.
    차감하실 sam이용권을 선택하세요.
    sam 이용권 선택
    님이 보유하신 이용권입니다.
    차감하실 sam이용권을 선택하세요.
    sam 이용권 선택
    님이 보유하신 프리미엄 이용권입니다.
    선물하실 sam이용권을 선택하세요.
    결제완료
    e캐시 원 결제 계속 하시겠습니까?
    교보 e캐시 간편 결제
    sam 열람권 선물하기
    • 보유 권수 / 선물할 권수
      0권 / 1
    • 받는사람 이름
      받는사람 휴대전화
    • 구매한 이용권의 대한 잔여권수를 선물할 수 있습니다.
    • 열람권은 1인당 1권씩 선물 가능합니다.
    • 선물한 열람권이 ‘미등록’ 상태일 경우에만 ‘열람권 선물내역’화면에서 선물취소 가능합니다.
    • 선물한 열람권의 등록유효기간은 14일 입니다.
      (상대방이 기한내에 등록하지 않을 경우 소멸됩니다.)
    • 무제한 이용권일 경우 열람권 선물이 불가합니다.
    이 상품의 총서 전체보기
    네이버 책을 통해서 교보eBook 첫 구매 시
    교보e캐시 지급해 드립니다.
    교보e캐시 1,000원
    • 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
    • 한 ID당 최초 1회 지급 / sam 이용권 제외
    • 네이버 책을 통해 교보eBook 구매 이력이 없는 회원 대상
    • 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)
    구글북액션을 통해서 교보eBook
    첫 구매 시 교보e캐시 지급해 드립니다.
    교보e캐시 1,000원
    • 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
    • 한 ID당 최초 1회 지급 / sam 이용권 제외
    • 구글북액션을 통해 교보eBook 구매 이력이 없는 회원 대상
    • 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)