파이썬으로 배우는 음성인식
2023년 01월 09일 출간
종이책 : 2023년 01월 09일 출간
- eBook 상품 정보
- 파일 정보 pdf (25.25MB)
- ISBN 9791165922009
-
듣기(TTS)
가능
TTS 란?텍스트를 음성으로 읽어주는 기술입니다.
- 전자책의 편집 상태에 따라 본문의 흐름과 다르게 텍스트를 읽을 수 있습니다.
- 전자책 화면에 표기된 주석 등을 모두 읽어 줍니다.
- 이미지 형태로 제작된 전자책 (예 : ZIP 파일)은 TTS 기능을 지원하지 않습니다.
- '교보 ebook' 앱을 최신 버전으로 설치해야 이용 가능합니다. (Android v3.0.26, iOS v3.0.09,PC v1.2 버전 이상)

쿠폰적용가 19,440원
10% 할인 | 5%P 적립이 상품은 배송되지 않는 디지털 상품이며,
교보eBook앱이나 웹뷰어에서 바로 이용가능합니다.
카드&결제 혜택
- 5만원 이상 구매 시 추가 2,000P
- 3만원 이상 구매 시, 등급별 2~4% 추가 최대 416P
- 리뷰 작성 시, e교환권 추가 최대 300원
작품소개
이 상품이 속한 분야
이 책은 지금까지의 음성인식 기술의 역사와 기술 발전 동향을 이해하고, 파이썬과 파이토치를 통해 최신 음성인식 시스템을 실습한다. 음성인식의 목적이나 알고리즘의 개요를 설명하고, 소스 코드를 상세하게 분석하고, 마지막으로 소스 코드를 첨부하여 독자들이 직접 구현할 수 있도록 한다. 특히 인공지능기술이 만들어진 목적이나, 해당 기술로 목적을 달성할 수 있을지에 대해 명확히 제시한다. 이 책은 음성인식을 제대로 구현하고자 하는 개발자 및 학부생에게 꼭 필요한 필독서가 될 것이다.
제1절 음성인식은 무엇이며, 어디에 사용되는가?
제2절 음성을 인식한다는 것은? - 음성인식 원리-
제3절 이 책의 목적과 구성
제 2 장 음성인식 기초 지식
제1절 음성인식과 확률
제2절 음성인식 문제를 수식으로 정의하기
제3절 텍스트 종류와 발음 사전 - 음소ㆍ히라가나ㆍ문자ㆍ단어 -
제4절 음성인식 실험 두 가지
제5절 음성인식 실험 프로세스
제 3 장 음성 처리 기초와 특징 추출
제1절 데이터 준비하기
제2절 음성 파일 읽어보기
제3절 푸리에 변환으로 음성을 주파수 분해하기
제4절 음성을 단시간 푸리에 변환하여 스펙트럼 생성하기
제5절 로그 Mel Filter Bank 특징
제6절 Mel 주파수 켑스트럼 특징
제7절 특징의 평균과 표준편차 계산해보기
제 4 장 음성인식 첫걸음 DP Matching
제1절 음성인식에서 떼어놓을 수 없는 정렬(얼라인먼트) 문제
제2절 DP Matching
제3절 DP Matching 구현해보기
제 5 장 GMM - HMM 기반 음성인식
제1절 템플릿이 아닌, 분포와 빈도 관점
제2절 정규분포와 최빈 추정법을 활용한 매개변수 추정
제3절 혼합 정규분포(GMM)와 EM 알고리즘
제4절 은닉 마코프 모델(HMM)
제5절 GMM - HMM 구현하기
제 6 장 DNN-HMM 기반 음성인식
제1절 ‘분포’에서 ‘Deep Neural Network’로
제2절 Deep Neural Network
제3절 DNN과 HMM을 조합한 DNN - HMM 하이브리드 시스템
제4절 DNN - HMM을 파이썬과 파이토치로 구현해보기
제5절 HMM 기반 대어휘 연속 음성인식
제 7 장 End-to-End 모델 기반 연속 음성인식
제1절 하이브리드 시스템에서 Full Neural Network Model로
제2절 순환 신경망(Recurrent Neural Network)
제3절 Connectionist temporal classification(CTC)
제4절 CTC를 파이썬과 파이토치로 구현해보기
제5절 Attention encoder-decoder 모델
제6절 Attention 모델을 파이썬과 파이토치로 구현해보기
제7절 기타 기법과 음성인식 모델
제8절 참고 문헌
음성인식 머신러닝 모델을 파이썬으로 구현 및 실습하기 위한
'음성인식 기초 이론 및 단계별 실습서'
음성인식 기술은 나날이 발전해가고 있습니다. 중요한 회의나 강의 내용을 필사해야 할 경우 과거에는 녹음기를 사용했지만 최근에는 음성인식 노트 앱을 사용합니다. 또한 핸드폰에 깔려있는 애플 시리, 구글 어시스턴트, 삼성 빅스비 혹은 집에 하나씩 가지고 있는 스마트 스피커, 차량에서 사용하는 내비게이션 앱에서 지원하는 음성인식 등, 음성인식은 이미 우리의 일상에 스며들었습니다. 음성인식은 최근 들어 딥러닝 모델링을 기반으로 급격한 기술적 도약을 경험하며 인식 품질이 개선되었지만, 여전히 완벽한 음성인식에 도달하기 위해서는 더 많은 데이터와 모델이 필요합니다. 잡음이 섞인 음성, 복수의 사람이 동시에 이야기를 할 때의 음성인식 등 현실적으로 풀어야 할 문제들이 많습니다.
이 책은 과거부터 현재까지의 음성인식 기술 발전의 변천사를 다루고 있습니다. 과거의 음성인식 기법이 현재의 음성인식 기술에 미친 영향에 대해 마치 이야기를 들려주듯이 설명하고 있습니다. 또한 음성인식 기술에 많이 사용되는 확률과 신호 처리 이론을 포함한 음성인식의 각 기법에 대한 이론적 지식과 실습 코드를 제공하며, 딥러닝을 이용한 최신 음성인식 시스템을 파이썬과 파이토치를 활용하여 직접 개발해 볼 수 있도록 돕습니다.
이 책의 저자는 처음 음성인식을 접하는 독자분들에게 음성인식 기술의 이해를 넘어서 음성인식 기술의 전체적인 흐름과 특징을 이해할 수 있게끔 집필하였습니다. 향후 음성인식 기술이 어떻게 더 발전해 나갈지 관심 있으신 분과 현업에 빠르게 음성인식기술을 적용해 보고 싶으신 분, 음성 처리 및 기계 학습 전반에 관심이 있는 분, 그리고 앞으로 진지하게 음성인식 기술에 대해서 배우고 싶은 분들에게 이 책을 추천합니다.
작가정보

高島遼一
2013년 고베 대학 대학원 시스템 정보학 연구과 박사 후기 과정 수료(공학박사)
2011년 4월~2013년 3월 일본 학술 진흥회 특별 연구원 [DC2]. 2013년 4월에 ㈜히타치 제작소 연
구개발 그룹에 입사하여 장비 이상 검사와 음성인식을 위한 잡음 제거 등, 음성 및 음향 신호 처
리에 관한 연구 개발에 종사했다. 2016년 10월부터 2018년 9월까지 국립 연구 개발 법인 정보 통
신 연구 기구에 전출하여 음성인식에 관한 연구 개발에 종사했다. 2019년 4월부터 고베 대학 도
시안전 연구 센터 겸 동 대학원 시스템 정보학 연구과 준교수로 부임했고, 현재는 음성인식 기반
의 음성 처리, 기계 학습 기술과 복지 분야 응용 관련 연구에 종사하고 있다.
번역 정권우
카네기멜론 대학교 응용수학과 학부를 졸업했다. 5살부터 유초중고 시절을 일본 도쿄에서 보내
고, 대학교를 미국으로 진학한 덕분에 한국어, 일본어, 영어에 능통하다.
대학 시절에는 금융 수학을 전공하여, UBS Seoul, JP Morgan Tokyo 지사에서 사회생활을 시작
했다. 대학교 2학년 때 처음으로 프로그래밍을 접하면서 관심을 갖게 되어, 휴학 후 한국에서의
병역특례 군복무 시절 머신러닝을 독학하고, 캐글 경진대회에 출전한 이력이 있다.
모바일 콘텐츠 플랫폼 카카오페이지를 운영하는 다음카카오의 자회사 포도트리를 거쳐 P2P 투
자 기업 8퍼센트의 챗봇을 개발한 데이터나다에서 머신러닝 엔지니어로 근무한 경력이 있으며,
현재는 네이버 파파고 팀에서 딥러닝을 통해 더 나은 번역기를 개발하고 있다.
텍스트 번역으로 시작한 기계번역은 어느덧 사진을 번역해주는 이미지 번역으로 발전한 것처
럼, 앞으로 궁극적으로는 음성을 바로 번역하는 것으로 발전할 것이라 생각한다.
음성인식을 공부하는 과정에서 이 책을 만나고, 직접 번역하게 된 것을 영광으로 생각한다.?
이 상품의 총서
Klover리뷰 (0)
- - e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- - 리워드는 1,000원 이상 eBook, 오디오북, 동영상에 한해 다운로드 완료 후 리뷰 작성 시 익일 제공됩니다.
- - 리워드는 한 상품에 최초 1회만 제공됩니다.
- - sam 이용권 구매 상품 / 선물받은 eBook은 리워드 대상에서 제외됩니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오 발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
구매 후 리뷰 작성 시, e교환권 100원 적립
문장수집
- 구매 후 90일 이내에 문장 수집 등록 시 e교환권 100원을 적립해 드립니다.
- e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- 리워드는 1,000원 이상 eBook에 한해 다운로드 완료 후 문장수집 등록 시 제공됩니다.
- 리워드는 한 상품에 최초 1회만 제공됩니다.
- sam 이용권 구매 상품/주문취소/환불 시 리워드 대상에서 제외됩니다.
구매 후 문장수집 작성 시, e교환권 100원 적립
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

-
- 구매 후 90일 이내 작성 시, e교환권 100원 제공(제외조건 유의사항 참조)
가장 와 닿는 하나의 키워드를 선택해주세요.
총 5MB 이하로 jpg,jpeg,png 파일만 업로드 가능합니다.
신고 사유를 선택해주세요.
신고 내용은 이용약관 및 정책에 의해 처리됩니다.
허위 신고일 경우, 신고자의 서비스 활동이 제한될 수
있으니 유의하시어 신중하게 신고해주세요.
이 글을 작성한 작성자의 모든 글은 블라인드 처리 됩니다.
구매 후 90일 이내 작성 시, e교환권 100원 적립
eBook 문장수집은 웹에서 직접 타이핑 가능하나, 모바일 앱에서 도서를 열람하여 문장을 드래그하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다.
차감하실 sam이용권을 선택하세요.
차감하실 sam이용권을 선택하세요.
선물하실 sam이용권을 선택하세요.
-
보유 권수 / 선물할 권수0권 / 1권
-
받는사람 이름받는사람 휴대전화
- 구매한 이용권의 대한 잔여권수를 선물할 수 있습니다.
- 열람권은 1인당 1권씩 선물 가능합니다.
- 선물한 열람권이 ‘미등록’ 상태일 경우에만 ‘열람권 선물내역’화면에서 선물취소 가능합니다.
- 선물한 열람권의 등록유효기간은 14일 입니다.
(상대방이 기한내에 등록하지 않을 경우 소멸됩니다.) - 무제한 이용권일 경우 열람권 선물이 불가합니다.
첫 구매 시 교보e캐시 지급해 드립니다.

- 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
- 한 ID당 최초 1회 지급 / sam 이용권 제외
- 구글북액션을 통해 교보eBook 구매 이력이 없는 회원 대상
- 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)