파이썬(Python) 2학년 스크래핑의 구조
2021년 12월 06일 출간
국내도서 : 2021년 11월 17일 출간
- eBook 상품 정보
- 파일 정보 pdf (36.29MB)
- ISBN 9788931598957
- 쪽수 193쪽
- 지원기기 교보eBook App, PC e서재, 리더기, 웹뷰어
-
교보eBook App
듣기(TTS) 가능
TTS 란?텍스트를 음성으로 읽어주는 기술입니다.
- 전자책의 편집 상태에 따라 본문의 흐름과 다르게 텍스트를 읽을 수 있습니다.
- 이미지 형태로 제작된 전자책 (예 : ZIP 파일)은 TTS 기능을 지원하지 않습니다.
PDF 필기가능 (Android, iOS)
이 상품은 배송되지 않는 디지털 상품이며,
교보eBook앱이나 웹뷰어에서 바로 이용가능합니다.
작품소개
이 상품이 속한 분야
파이썬은 인공지능의 기초 언어로 배우기 쉬우면서 각종 데이터 분석에 사용되는 프로그래밍 언어로 절정의 인기를 누리고 있다. 기존이 파이썬 책이 선뜻 입문하기 어려운 감이 있었다면 이 책은 염소 박사와 강아지 다솜 양의 친근한 일러스트를 도립해 책 전체가 쉬워보이며 실제로도 코드 설명이나 설치법, 버튼 안내가 큼직큼직한 주제의 만화와 대화체 방식으로 구성하여 매우 쉽게 느껴진다.
인터넷에 공개된 데이터를 수집하는 일을 ‘크롤링(Crawling)’, 이 데이터를 해석해 필요한 데이터를 구하는 일을 ‘스크래핑(Scaping)’이라고 하는데, 파이썬은 인터넷에 액세스할 수 있는 라이브러리가 풍부해 이 두가지 모두 쉽고 편하게 할 수 있는 언어로 널리 알려져 있다. 이 책에서는 스크래핑을 하는 라이브러리 ‘Beautiful Soup4’아 데이터를 분석하는 라이브러리 ‘판다스(pandas)’를 사용해 실제로 파이썬의 핵심 기능에 접근할 수 있도록 한다.
1학년 시리즈 중 독보적인 인기를 누렸던『파이썬 1학년』의 인기에 힘입어 『파이썬 2학년 데이터 분석 구조』가 나왔고 이 책이 원서로는 2학년 시리즈중 먼저 나왔으나 번역자 이영란 박사가 국내 사정에 맞게 코드나 사이트를 정리하여 이번에 선보이게 되었다.
이 책의 예제 코드와 함께 홈페이지 회원들에게만 제공하는 회원특전 PDF는 예제와 라이브러리 사용법 간이 매뉴얼로 성안당 홈페이지(www.cyber.co.kr) [도서몰]에 회원가입 후 [자료실]-[자료실] 바로가기에서 도서 검색을 통해 다운로드할 수 있다.
이 책의 예제 테스트 환경 며
이 책의 대상 독자와 2학년 시리즈에 대해
이 책을 보는 법
예제 파일과 회원 특전 PDF의 다운로드에 대해
제1장 파이썬으로 데이터를 다운로드
LESSON 01 스크래핑이 뭘까?
크롤링과 스크래핑
주의해야 할 점도 있다
robots.txt란?
LESSON 02 파이썬을 설치해 보자
윈도에 설치하는 방법
macOS에 설치하는 방법
LESSON 03 requests로 액세스해 보자
라이브러리 설치 방법
HTML 파일을 읽어 들이는 프로그램
IDLE을 시작하자
프로그램을 만들어 보자
텍스트 파일에 쓰기: open, close
텍스트 파일에 쓰기: with문
제2장 HTML을 해석해 보자
LESSON 04 HTML을 해석해 보자
Beautiful Soup 설치하기
Beautiful Soup로 해석하기
태그를 찾아 표시하기
모든 태그를 찾아 표시하기
id나 class로 검색 범위 좁히기
LESSON 05 최신 뉴스 기사 목록을 구해 보자
디벨로퍼 툴을 사용해 범위를 좁히자
LESSON 06 링크 목록을 파일로 출력해 보자
모든 링크 태그의 href 속성 표시하기
모든 링크 태그의 href 속성을 절대 URL로 표시하기
링크 목록 자동 작성 프로그램
LESSON 07 이미지를 한꺼번에 다운로드해 보자
이미지 파일을 읽어 들여 저장하기
다운로드용 폴더를 만들어 저장하기
모든 img 태그의 이미지 파일 URL을 표시한다
페이지 안 이미지를 한꺼번에 다운로드하는 프로그램
제3장 표 데이터를 읽고 쓰자
LESSON 08 pandas를 사용해 보자
pandas 설치하기
표 데이터란?
CSV 파일 읽어 들이기
열, 행 데이터 표시하기
열, 행 데이터 추가하기
열, 행 데이터 삭제하기
LESSON 09 다양한 데이터 가공
필요한 정보 추출하기
데이터 집계하기
데이터 정렬하기
행과 열 바꾸기
CSV 파일로 출력하기
LESSON 10 그래프로 표시해 보자
matplotlib 설치하기
그래프로 표시하기
다양한 종류의 그래프 표시하기
개별 데이터를 그래프로 표시하기
막대 그래프를 이미지 파일로 출력하기
LESSON 11 엑셀 파일을 읽고 써 보자
openpyxl 설치하기
엑셀 파일로 출력하기
엑셀 파일 읽어 들이기
제4장 오픈 데이터를 분석해 보자
LESSON 12 오픈 데이터란?
오픈 데이터는 보물섬
LESSON 13 우체국: 우편번호 데이터
CSV 파일 읽어 들이기
데이터 추출하기
LESSON 14 e-나라지표: 국정모니터링지표
CSV 파일 읽어 들이기
데이터를 그래프로 표시하기
LESSON 15 기상자료개방포털: 기상청 날씨 데이터 서비스
CSV 파일 읽어 들이기
데이터를 그래프로 표시하기
LESSON 16 공공데이터포털: 지방자치단체 데이터
CSV 파일(소방서) 읽어 들이기
folium 설치하기
소방서를 지도에 표시하기
CSV 파일(음식점) 읽어 들이기
가게를 지도에 표시하기
제5장 웹 API로 데이터를 수집하자
LESSON 17 웹 API란?
다른 컴퓨터의 기능 이용하기
LESSON 18 OpenWeatherMap이란?
OpenWeatherMap 사이트 이용 순서
OpenWeatherMap 이용하기
LESSON 19 현재 날씨를 조사하자
도시명을 지정해 날씨 알아보기
JSON이란?
JSON 데이터 형식
JSON 데이터를 읽어 들이는 방법
우편번호를 지정해 날씨 알아보기
LESSON 20 오늘부터 5일 동안(3시간 간격)의 날씨 알아보기
5일 동안의 날씨를 구해 보자
UTC(협정 세계시)를 KST(한국 표준시)로 변환
5일 동안의 기온을 그래프로 표시해 보자
한 걸음 더
찾아보기
머신러닝(기계학습)이나 데이터를 분석하는 데 반드시 필요한 ‘데이터’는 인터넷상에 방대하게 퍼져 있지만 파이썬을 사용하면 효율적으로 수집할 수 있다. 이러한 방법을 ‘스크래핑’이라고 합니다.
파이썬을 대략적으로 알고 계신 분들이 간단한 샘플을 만들어 보며 대화 형식으로 스크래핑의 구조를 배울 수 있습니다.
■ 대상 독자
● 파이썬의 기본 문법을 알고 있는 분(『파이썬 1학년』을 다 읽으신 분)
● 데이터 수집이나 데이터 분석 초보자
■ 2학년 시리즈의 포인트 셋
● 포인트(1) 기초 지식을 알 수 있다
각 장의 첫 부분에 만화나 일러스트를 넣어서 각 장에서 배울 내용을 소개합니다. 그 이후는 일러스트를 섞어가며 기초 지식에 대해 설명합니다.
● 포인트(2) 프로그램의 구조를 배운다
필요한 문법을 최소한으로 선별하여 중간에 포기하지 않도록 주로 대화 형식을 통해 알기 쉽게 설명합니다.
● 포인트(3) 개발 체험을 할 수 있다
프로그래밍 언어(애플리케이션) 초보자들도 재미있게 배울 수 있도록 다양한 예제를 마련했습니다.
■ 이 책의 포인트
염소 박사님, 다솜 양과 함께 인터넷에서 파일을 다운로드하는 방법, HTML을 해석하는 방법, 여러 데이터를 읽고 쓰기, ‘API의 사용법’으로 불리는 데이터 수집, 편리한 라이브러리를 이용한 간단한 가시화 방법을 알아봅니다.
작가정보
저자 : 모리 요시나오
앱 개발, 기술서와 전자공작 매거진 등의 집필 활동 및 간사이학원 대학 강사, 간사이학원 고등부 강사, 세이안 조형대학 강사, 오사카 예술대학 강사, 프로그래밍 스쿨 코프리(コプり, kopuri.com) 강사 등 프로그래밍에 대한 폭넓은 활동을 펼치고 있다. 저서로는 『즐겁게 배우는 Unity 2D 초입 문 강좌』(마이나비 출판), 『움직이고 배우다 Vue.js 개발 입문』, 『Java 1학년』, 『Python 1학년』(이상 쇼에이 사), 『즐겁게 배우는 알고리즘과 프로그래밍 도감』(마이나비출판) 등이 있다.
역자 : 이영란
도쿄대학 총합문화연구과 박사 과정 졸업. 전 시스템 엔지니어. 현재 일본 에서 강의 및 연구 활동과 컴퓨터 도서 전문 번역가로 활동 중이다. 번역 서로는 『Python 1학년』, 『Python이 보이는 그림책』, 『Visual Basic이 보 이는 그림책』, 『성공과 실패를 결정하는 1%의 Java 프로그래밍 원리』, 『10 일에 끝내는 C언어 입문 교실(제3판)』, 『실천 반복형 소프트웨어 개발』, 『HTML5 & CSS 사전』 등이 있다.
도쿄대학 총합문화연구과 박사 과정 졸업. 전 시스템 엔지니어. 도쿄대학 교양학부 특임 부교수. 현재 일본에서 강의 및 연구 활동 과 컴퓨터 및 과학 도서 전문 번역가로 활동 중이다. 번역서로는 『잠 못 들 정도로 재미있는 이야기 사회심리학』, 『잠 못 들 정도로 재미있는 이야기 상대성 이론』, 『해부학의 기본』, 『Python 2학년 스크래핑의 구조』, 『Python 1학년』, 『Python이 보이는 그림책』, 『Visual Basic이 보이는 그림책』, 『성공과 실패를 결정하는 1%의 Java 프로그래밍 원리』, 『10일에 끝내는 C언어 입문 교실(제3판)』, 『실천 반복형 소프트웨어 개발』, 『HTML5 & CSS 사전』 등이 있다.
이 상품의 총서
Klover리뷰 (0)
- - e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- - 리워드는 1,000원 이상 eBook, 오디오북, 동영상에 한해 다운로드 완료 후 리뷰 작성 시 익일 제공됩니다. (5,000원 이상 상품으로 변경 예정, 2024년 9월 30일부터 적용)
- - 리워드는 한 상품에 최초 1회만 제공됩니다.
- - sam 이용권 구매 상품 / 선물받은 eBook은 리워드 대상에서 제외됩니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오 발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
구매 후 리뷰 작성 시, e교환권 100원 적립
문장수집
- 구매 후 90일 이내에 문장 수집 등록 시 e교환권 100원을 적립해 드립니다.
- e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- 리워드는 1,000원 이상 eBook에 한해 다운로드 완료 후 문장수집 등록 시 제공됩니다. (5,000원 이상 eBook으로 변경 예정, 2024년 9월 30일부터 적용)
- 리워드는 한 상품에 최초 1회만 제공됩니다.
- sam 이용권 구매 상품 / 선물받은 eBook / 오디오북·동영상 상품/주문취소/환불 시 리워드 대상에서 제외됩니다.
구매 후 문장수집 작성 시, e교환권 100원 적립
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!