파이썬 웹 스크레이핑 완벽 가이드
2022년 11월 15일 출간
국내도서 : 2022년 09월 27일 출간
- eBook 상품 정보
- 파일 정보 PDF (13.43MB)
- ISBN 9791158393861
- 지원기기 교보eBook App, PC e서재, 리더기, 웹뷰어
-
교보eBook App
듣기(TTS) 가능
TTS 란?텍스트를 음성으로 읽어주는 기술입니다.
- 전자책의 편집 상태에 따라 본문의 흐름과 다르게 텍스트를 읽을 수 있습니다.
- 이미지 형태로 제작된 전자책 (예 : ZIP 파일)은 TTS 기능을 지원하지 않습니다.
PDF 필기가능 (Android, iOS)

쿠폰적용가 19,800원
10% 할인 | 5%P 적립이 상품은 배송되지 않는 디지털 상품이며,
교보eBook앱이나 웹뷰어에서 바로 이용가능합니다.
카드&결제 혜택
- 5만원 이상 구매 시 추가 2,000P
- 3만원 이상 구매 시, 등급별 2~4% 추가 최대 416P
- 리뷰 작성 시, e교환권 추가 최대 200원
작품소개
이 상품이 속한 분야
이 책은 실제 사용 빈도가 높은 웹 사이트(네이버, 다음, 구글, 유튜브, 스포티파이 등)에서 다양한 데이터(날씨, 주식, 환율, 부동산, 가상 화폐, 노래, 동영상 검색 결과, 뉴스, 웹 문서 및 이미지 검색 결과)를 가져와 활용하는 전체 과정을 알기 쉽게 설명합니다.
★ 이 책에서 다루는 내용 ★
◎ 웹 스크레이핑 기초, requests와 Beautiful Soup를 활용한 웹 데이터 수집 및 처리
◎ 셀레니움(Selenium)을 이용한 웹 브라우저 제어, 로그인 자동화, 동적 웹 페이지 데이터 수집
◎ 웹 API 기초, 웹 API 인증, 응답 데이터 분석 및 관심 데이터 추출, 데이터 시각화
◎ 스트림릿(Streamlit) 기초 사용법, 웹 스크레이핑 웹 앱 제작 및 배포
◎ 카카오 API를 활용한 웹 문서 및 이미지 검색, 웹 스크레이핑 결과를 카카오톡 메시지로 전송
1.1 파이썬 시작하기
___1.1.1 파이썬의 특징
___1.1.2 파이썬 개발 환경 설치
___1.1.3 파이썬 실행하기
1.2 주피터 노트북 활용
___1.2.1 주피터 노트북 실행과 노트북 생성
___1.2.2 주피터 노트북 주요 기능 둘러보기
___1.2.3 주피터 노트북에서 코드 작성
___1.2.4 주피터 노트북에서 문서 작성
___1.2.5 그 밖에 할 수 있는 작업
1.3 정리
▣ 02장: 파이썬 기본 문법
2.1 변수와 자료형
___2.1.1 변수
___2.1.2 숫자(int, float)
___2.1.3 문자열(str)
___2.1.4 불(bool)
___2.1.5 리스트(list)
___2.1.6 튜플(tuple)
___2.1.7 세트(set)
___2.1.8 딕셔너리(dict)
2.2 제어문
___2.2.1 조건문
___2.2.2 반복문
2.3 데이터의 출력
___2.3.1 기본 출력
___2.3.2 형식 지정 출력
2.4 예외 처리
___2.4.1 try ~ except 사용
___2.4.2 try ~ finally 사용
2.5 정리
▣ 03장: 함수, 클래스, 모듈
3.1 함수
___3.1.1 함수의 정의와 호출
___3.1.2 내장 함수
3.2 클래스
___3.2.1 클래스와 객체
___3.2.2 클래스 선언
___3.2.3 객체 생성과 활용
3.3 모듈
___3.3.1 모듈 만들고 불러오기
___3.3.2 내장 모듈
___3.3.3 패키지
___3.3.4 스케줄러 패키지
3.4 정리
▣ 04장: 파일 읽고 쓰기와 문자열 처리
4.1 파일 읽고 쓰기
___4.1.1 파일 읽고 쓰기 위한 기본 구조
___4.1.2 파일 읽기
___4.1.3 파일을 한 줄씩 읽어 처리하기
___4.1.4 파일 쓰기
___4.1.5 with 문으로 파일 읽고 쓰기
4.2 문자열 처리
___4.2.1 문자열 분리하기: split()
___4.2.2 불필요한 문자열 삭제하기: strip()
___4.2.3 문자열 연결하기: join()
___4.2.4 문자열 찾기: find(), count(), startswith(), endswith()
___4.2.5 문자열 바꾸기: replace()
___4.2.6 대소문자 변경하기: lower(), upper()
4.3 정리
▣ 05장: 데이터 처리와 분석을 위한 라이브러리
5.1 배열 데이터 연산에 효율적인 넘파이(NumPy)
___5.1.1 배열 데이터 생성
___5.1.2 배열 데이터 선택
5.2 표 데이터 처리에 강한 판다스(pandas)
___5.2.1 데이터 구조와 생성
___5.2.2 표 형식의 데이터 파일 읽고 쓰기
___5.2.3 표 데이터 선택
___5.2.4 표 데이터 통합
5.3 정리
▣ 06장: 웹 스크레이핑
6.1 웹 스크레이핑을 위한 기본 지식
___6.1.1 웹 스크레이핑의 과정
___6.1.2 웹 스크레이핑 시 주의 사항
___6.1.3 웹 데이터의 요청과 응답 과정
___6.1.4 웹 페이지 언어(HTML) 구조
___6.1.5 웹 페이지의 소스 가져오기
___6.1.6 웹 페이지의 소스 분석하고 처리하기
___6.1.7 웹 사이트 주소에 부가 정보 추가하기
6.2 웹 사이트에서 데이터 가져오기
___6.2.1 날씨 정보 가져오기
___6.2.2 주식 정보 가져오기
___6.2.3 환율 정보 가져오기
___6.2.4 부동산 정보 가져오기
___6.2.5 웹 페이지에서 이미지 가져오기
6.3 정리
▣ 07장: 셀레니움을 이용한 웹 스크레이핑
7.1 셀레니움 소개 및 설치
7.2 셀레니움으로 웹 브라우저 제어
___7.2.1 웹 사이트 접속
___7.2.2 HTML 코드에서 요소 찾기
___7.2.3 검색창에 문자열 입력하기
___7.2.4 웹 사이트 로그인 자동화
___7.2.5 웹 브라우저 스크롤
___7.2.6 웹 브라우저 내용을 이미지 파일로 저장
___7.2.7 헤드리스(Headless) 웹 브라우저 이용하기
7.3 동적 웹 페이지에서 데이터 가져오기
___7.3.1 커피 전문점 음료 메뉴 가져오기
___7.3.2 가상 화폐 거래 정보 가져오기
___7.3.3 유튜브 검색 결과 가져오기
7.4 정리
▣ 08장: 웹 API
8.1 웹 API의 이해
___8.1.1 웹 API의 데이터 획득 과정
___8.1.2 웹 API의 인증 방식
___8.1.3 응답 데이터의 형식 및 처리
8.2 API 키 없이 시간 관련 데이터 가져오기
___8.2.1 시간대 리스트와 현재 시각 데이터 가져오기
___8.2.2 시간대 변환 데이터 가져오기
8.3 RSS 피드 데이터 가져오기
___8.3.1 RSS 문서의 구조 및 데이터 추출
___8.3.2 구글 뉴스의 검색 기사 가져오기
8.4 스포티파이를 이용한 노래 데이터 가져오기
___8.4.1 앱 만들고 액세스 토큰 생성
___8.4.2 아티스트 API로 아티스트 관련 정보 가져오기
___8.4.3 트랙 API로 곡 관련 정보 가져오기
___8.4.4 앨범 API로 앨범 관련 정보 가져오기
8.5 야후 파이낸스에서 주식 데이터 가져오기
___8.5.1 설치 및 기본 사용법
___8.5.2 미국 주식 데이터 가져오기
___8.5.3 국내 주식 데이터 가져오기
___8.5.4 여러 주식 데이터 가져오기
8.6 정리
▣ 09장: 스트림릿으로 웹 앱(Web App) 만들기
9.1 스트림릿 둘러보기
___9.1.1 데모 웹 앱으로 스트림릿 맛보기
___9.1.2 웹 앱을 위한 코드 실행 방법
9.2 스트림릿 기본 사용법
___9.2.1 텍스트 요소
___9.2.2 데이터 표시 요소
___9.2.3 차트 요소
___9.2.4 만능 함수와 마술 명령어
___9.2.5 입력 위젯
___9.2.6 미디어 요소
___9.2.7 레이아웃과 컨테이너
9.3 스트림릿을 활용해 웹 앱 만들기
___9.3.1 주식 데이터 대시보드
___9.3.2 환율 데이터 대시보드
___9.3.3 부동산 데이터 대시보드
___9.3.4 구글 뉴스에서 기사 검색
___9.3.5 멀티페이지 웹 앱
___9.3.6 스트림릿 클라우드에 웹 앱 배포
9.4 정리
▣ 10장: 카카오 API
10.1 카카오 API를 이용한 웹 문서와 이미지 검색
___10.1.1 카카오디벨로퍼스 회원 가입 및 애플리케이션 등록
___10.1.2 웹 문서 검색
___10.1.3 이미지 검색
10.2 카카오 API를 이용한 카카오톡 메시지 전송
___10.2.1 카카오 로그인 관련 설정
___10.2.2 액세스 토큰 생성
___10.2.3 카카오톡 메시지 보내기
10.3 웹 스크레이핑 결과를 카카오톡으로 보내기
___10.3.1 날씨 정보 보내기
___10.3.2 환율 정보 보내기
___10.3.3 가상 화폐 정보 보내기
___10.3.4 주식 정보 보내기
___10.3.5 스케줄에 따라 카카오톡 메시지 보내기
10.4 정리
작가정보
광주과학기술원(GIST)에서 박사학위를 받고 삼성전자에서 센서 기반 인터랙션 설계, 센서 신호 및 영상 처리, 로봇 제어, 임베디드 시스템 소프트웨어 관련 업무를 하고 있다. 항상 좀 더 좋은 방법이 없을까 고민하며 새로운 아이디어를 제시하고 구현하는 과정을 즐긴다. 파이썬을 이용한 업무 자동화, 데이터 처리 및 분석, 마이크로컨트롤러 응용에 관심이 많으며 주변 사람들에게 파이썬의 편리함을 알리고 있다. 저서로 『데이터 분석을 위한 파이썬 철저 입문』과 『일 잘하는 직장인을 위한 엑셀 자동화 with 파이썬』이 있다.
이 상품의 총서
Klover리뷰 (0)
- - e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- - 리워드는 1,000원 이상 eBook, 오디오북, 동영상에 한해 다운로드 완료 후 리뷰 작성 시 익일 제공됩니다. (5,000원 이상 상품으로 변경 예정, 2024년 9월 30일부터 적용)
- - 리워드는 한 상품에 최초 1회만 제공됩니다.
- - sam 이용권 구매 상품 / 선물받은 eBook은 리워드 대상에서 제외됩니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오 발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
구매 후 리뷰 작성 시, e교환권 100원 적립
문장수집
- 구매 후 90일 이내에 문장 수집 등록 시 e교환권 100원을 적립해 드립니다.
- e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- 리워드는 1,000원 이상 eBook에 한해 다운로드 완료 후 문장수집 등록 시 제공됩니다. (5,000원 이상 eBook으로 변경 예정, 2024년 9월 30일부터 적용)
- 리워드는 한 상품에 최초 1회만 제공됩니다.
- sam 이용권 구매 상품 / 선물받은 eBook / 오디오북·동영상 상품/주문취소/환불 시 리워드 대상에서 제외됩니다.
구매 후 문장수집 작성 시, e교환권 100원 적립
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

- 구매 후 90일 이내 작성 시, e교환권 100원 (최초1회)
- 리워드 제외 상품 : 마이 > 라이브러리 > Klover리뷰 > 리워드 안내 참고
- 콘텐츠 다운로드 또는 바로보기 완료 후 리뷰 작성 시 익일 제공
가장 와 닿는 하나의 키워드를 선택해주세요.
총 5MB 이하로 jpg,jpeg,png 파일만 업로드 가능합니다.
신고 사유를 선택해주세요.
신고 내용은 이용약관 및 정책에 의해 처리됩니다.
허위 신고일 경우, 신고자의 서비스 활동이 제한될 수
있으니 유의하시어 신중하게 신고해주세요.
이 글을 작성한 작성자의 모든 글은 블라인드 처리 됩니다.
구매 후 90일 이내 작성 시, e교환권 100원 적립
eBook 문장수집은 웹에서 직접 타이핑 가능하나, 모바일 앱에서 도서를 열람하여 문장을 드래그하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다.
차감하실 sam이용권을 선택하세요.
차감하실 sam이용권을 선택하세요.
선물하실 sam이용권을 선택하세요.
-
보유 권수 / 선물할 권수0권 / 1권
-
받는사람 이름받는사람 휴대전화
- 구매한 이용권의 대한 잔여권수를 선물할 수 있습니다.
- 열람권은 1인당 1권씩 선물 가능합니다.
- 선물한 열람권이 ‘미등록’ 상태일 경우에만 ‘열람권 선물내역’화면에서 선물취소 가능합니다.
- 선물한 열람권의 등록유효기간은 14일 입니다.
(상대방이 기한내에 등록하지 않을 경우 소멸됩니다.) - 무제한 이용권일 경우 열람권 선물이 불가합니다.
첫 구매 시 교보e캐시 지급해 드립니다.

- 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
- 한 ID당 최초 1회 지급 / sam 이용권 제외
- 구글바이액션을 통해 교보eBook 구매 이력이 없는 회원 대상
- 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)