파이썬 언어로 웹크롤러 설계하기
2025년 02월 24일 출간
- eBook 상품 정보
- 파일 정보 PDF (1.46MB)
- ISBN 9791173728860
- 쪽수 176쪽
- 지원기기 교보eBook App, PC e서재, 리더기, 웹뷰어
-
교보eBook App
듣기(TTS) 가능
TTS 란?텍스트를 음성으로 읽어주는 기술입니다.
- 전자책의 편집 상태에 따라 본문의 흐름과 다르게 텍스트를 읽을 수 있습니다.
- 이미지 형태로 제작된 전자책 (예 : ZIP 파일)은 TTS 기능을 지원하지 않습니다.
PDF 필기가능 (Android, iOS)

이 상품은 배송되지 않는 디지털 상품이며,
교보eBook앱이나 웹뷰어에서 바로 이용가능합니다.
작품소개
이 상품이 속한 분야
파이썬 초보자들도 그 과정을 이해할 수 있도록 초반부에서는 파이썬의 변수, 조건문, 반복문 등의 기본 문법을 소개하고 시퀀스 객체, 함수, 클래스 등의 기초 개념과 데이터 수집 과정에서 발생할 수 있는 문자 인코딩 오류와 정규 표현식 등을 처리하는 방법을 설명하였다.
후반부에는 웹크롤링의 기본 방법인 BeautifulSoup, Requests 같은 라이브러리를 활용하여 웹페이지를 요청하는 방법을 다루었다. HTML 웹 페이지의 문서 구조를 분석하여 필요한 정보를 추출하는 과정을 단계적으로 설명하였고, 대량의 웹 데이터를 반복하여 수집하는 방법을 설명하였다. 이를 위해 블록체인 기반 소셜 네트워크인 steemit.com에 게시된 포스트의 구조를 분석하고, 효율적으로 그 포스트를 수집하는 시스템을 설계한다. 그 외 수집된 웹데이터를 CSV 파일, JSON 파일, 엑셀 파일 등으로 저장하는 기법을 다루었다.
1. 파이썬 기초
2. 시퀀스(Sequence) 객체
3. 파이썬 함수와 객체
4. 문자열 인코딩(Character Encoding)
5. RE 모듈
6. 스프레드시트 및 JSON 파일
7. 웹크롤링
8. 포스트 정보 추출
9. 대량의 URL 수집
10. 부록
판권지
작가정보
저자(글) 이성욱
1992~2003년 서강대 컴퓨터공학 학사, 석사, 박사
2003~2005년 서강대 정보통신대학원 대우교수
2004~2005년 LG전자 연구원
2005~2007년 동서대학교
2013~2014년 플로리다 주립대 교환교수
2019~2020년 플로리다 주립대 교환교수
2007~ 현재 한국교통대 AI데이터공학부 교수
이 상품의 총서
Klover리뷰 (0)
- - e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- - 리워드는 1,000원 이상 eBook, 오디오북, 동영상에 한해 다운로드 완료 후 리뷰 작성 시 익일 제공됩니다. (5,000원 이상 상품으로 변경 예정, 2024년 9월 30일부터 적용)
- - 리워드는 한 상품에 최초 1회만 제공됩니다.
- - sam 이용권 구매 상품 / 선물받은 eBook은 리워드 대상에서 제외됩니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오 발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
구매 후 리뷰 작성 시, e교환권 100원 적립
문장수집
- 구매 후 90일 이내에 문장 수집 등록 시 e교환권 100원을 적립해 드립니다.
- e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- 리워드는 1,000원 이상 eBook에 한해 다운로드 완료 후 문장수집 등록 시 제공됩니다. (5,000원 이상 eBook으로 변경 예정, 2024년 9월 30일부터 적용)
- 리워드는 한 상품에 최초 1회만 제공됩니다.
- sam 이용권 구매 상품 / 선물받은 eBook / 오디오북·동영상 상품/주문취소/환불 시 리워드 대상에서 제외됩니다.
구매 후 문장수집 작성 시, e교환권 100원 적립
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
