스파크로 배우는 빅데이터 분석
2025년 05월 02일 출간
- eBook 상품 정보
- AI(생성형) 활용 제작 도서
- 파일 정보 ePUB (0.38MB) | 약 8.1만 자
- ISBN 9791174422354
- 지원기기 교보eBook App, PC e서재, 리더기, 웹뷰어
-
교보eBook App
듣기(TTS) 가능
TTS 란?텍스트를 음성으로 읽어주는 기술입니다.
- 전자책의 편집 상태에 따라 본문의 흐름과 다르게 텍스트를 읽을 수 있습니다.
- 이미지 형태로 제작된 전자책 (예 : ZIP 파일)은 TTS 기능을 지원하지 않습니다.

쿠폰적용가 9,900원
10% 할인 | 5%P 적립이 상품은 배송되지 않는 디지털 상품이며,
교보eBook앱이나 웹뷰어에서 바로 이용가능합니다.
카드&결제 혜택
- 5만원 이상 구매 시 추가 2,000P
- 3만원 이상 구매 시, 등급별 2~4% 추가 최대 416P
- 리뷰 작성 시, e교환권 추가 최대 200원
작품소개
이 상품이 속한 분야
또한, 머신러닝과 실시간 데이터 처리에 대한 심층적인 내용을 다루어, 데이터 분석의 폭을 넓히고 실무에서의 적용 가능성을 높입니다. Spark MLlib를 활용한 머신러닝 모델 구축 및 평가 방법을 학습함으로써, 데이터 사이언스의 기초를 탄탄히 할 수 있습니다. 실시간 데이터 처리의 중요성이 커짐에 따라, Spark Streaming을 통해 실시간 데이터 분석을 수행하는 방법도 소개됩니다.
이 책은 초보자부터 중급자까지 모두에게 유용하며, 실제 사례를 통해 이론을 실무에 어떻게 적용할 수 있는지를 보여줍니다. 데이터 시각화 기술 또한 강조되어, 분석 결과를 효과적으로 전달할 수 있는 방법을 배울 수 있습니다. 독자들은 이 책을 통해 빅데이터 분석에 대한 포괄적인 이해를 얻고, 실질적인 기술을 습득하여 자신만의 데이터 분석 프로젝트를 추진할 수 있는 역량을 기르게 될 것입니다.
스파크로 배우는 빅데이터 분석은 데이터 과학의 미래를 선도할 수 있는 기회를 제공하며, 데이터 기반의 의사결정을 내리는 데 필요한 필수적인 지식과 기술을 갖출 수 있도록 돕는 훌륭한 자원이 될 것입니다. 데이터의 힘을 활용하여 혁신적인 솔루션을 창출하고자 하는 모든 이들에게 이 책을 추천합니다.
*생성형 AI를 활용하여 제작되었습니다.
*생성형 AI를 활용하여 제작되었습니다."
2. 대규모 데이터의 정의와 중요성
3. 분산 컴퓨팅의 원리
4. RDD(Resilient Distributed Dataset)의 구조
5. 데이터프레임과 RDD의 차이점
6. 스파크 설치 및 환경 설정
7. 스파크의 아키텍처 개요
8. 데이터 로딩과 저장 방법
9. 스파크의 변환과 액션 연산
10. 필터링과 변환: 데이터 처리 기초
11. 머신러닝 개요 및 스파크 MLlib
12. 실시간 데이터 처리: 스트리밍의 이해
13. 스파크 스트리밍으로 실시간 분석하기
14. 데이터 시각화의 중요성
15. 스파크로 데이터 시각화하기
16. 데이터 탐색과 전처리 기법
17. 스파크 SQL을 이용한 쿼리 작성
18. 대규모 데이터의 샘플링 기법
19. 파이프라인 구축을 통한 데이터 분석
20. 클러스터 관리와 스케일링 전략
21. 성능 최적화를 위한 튜닝 기법
22. 스파크와 Hadoop의 차이점
23. 데이터 마이닝 기법 소개
24. 예측 모델링을 위한 기초 통계
25. 데이터 품질 관리 및 검증
26. 비정형 데이터 처리와 스파크
27. 스파크의 머신러닝 파이프라인
28. 모델 평가 및 선택 기준
29. 대규모 데이터의 시계열 분석
30. 스파크에서의 그래프 처리
31. 정형, 반정형, 비정형 데이터의 이해
32. 데이터베이스와의 연동: JDBC 활용
33. 스파크에서의 데이터 캐싱 전략
34. 배치 처리와 실시간 처리의 차이
35. ETL 프로세스와 스파크 활용
36. 하둡과 스파크의 통합 활용법
37. 스파크와 Python: PySpark 소개
38. 스파크에서의 데이터 시각화 도구
39. 데이터 전송과 통합 기술
40. 스파크에서의 오류 처리 및 디버깅
41. 대규모 데이터의 분산 저장 기술
42. 스파크의 커스터마이징 방법
43. 머신러닝 모델의 배포와 운영
44. 스파크의 최신 기능 및 업데이트
45. 데이터 인사이트 도출을 위한 전략
46. 클라우드 환경에서의 스파크 활용
47. 스파크의 보안 및 데이터 보호
48. 데이터 분석 프로젝트 관리 방법
49. 스파크를 활용한 사례 연구
50. 향후 빅데이터 분석의 트렌드와 전망"
작가정보
저자(글) 씨익북스 편집부 2팀
"세상을 아름다운 지식으로 물들이자" 위 모토를 바탕으로 다양한 지식 서적을 보급하고 있다.
이 상품의 총서
Klover리뷰 (0)
- - e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- - 리워드는 5,000원 이상 eBook, 오디오북, 동영상에 한해 다운로드 완료 후 리뷰 작성 시 익일 제공됩니다. (2024년 9월 30일부터 적용)
- - 리워드는 한 상품에 최초 1회만 제공됩니다.
- - sam 이용권 구매 상품 / 선물받은 eBook은 리워드 대상에서 제외됩니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오 발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
구매 후 리뷰 작성 시, e교환권 100원 적립
문장수집
- 구매 후 90일 이내에 문장 수집 등록 시 e교환권 100원을 적립해 드립니다.
- e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- 리워드는 5,000원 이상 eBook에 한해 다운로드 완료 후 문장수집 등록 시 제공됩니다. (2024년 9월 30일부터 적용)
- 리워드는 한 상품에 최초 1회만 제공됩니다.
- sam 이용권 구매 상품 / 선물받은 eBook / 오디오북·동영상 상품/주문취소/환불 시 리워드 대상에서 제외됩니다.
구매 후 문장수집 작성 시, e교환권 100원 적립
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

- 구매 후 90일 이내 작성 시, e교환권 100원 (최초1회)
- 리워드 제외 상품 : 마이 > 라이브러리 > Klover리뷰 > 리워드 안내 참고
- 콘텐츠 다운로드 또는 바로보기 완료 후 리뷰 작성 시 익일 제공
가장 와 닿는 하나의 키워드를 선택해주세요.
총 5MB 이하로 jpg,jpeg,png 파일만 업로드 가능합니다.
신고 사유를 선택해주세요.
신고 내용은 이용약관 및 정책에 의해 처리됩니다.
허위 신고일 경우, 신고자의 서비스 활동이 제한될 수
있으니 유의하시어 신중하게 신고해주세요.
이 글을 작성한 작성자의 모든 글은 블라인드 처리 됩니다.
구매 후 90일 이내 작성 시, e교환권 100원 적립
eBook 문장수집은 웹에서 직접 타이핑 가능하나, 모바일 앱에서 도서를 열람하여 문장을 드래그하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다.
차감하실 sam이용권을 선택하세요.
차감하실 sam이용권을 선택하세요.
선물하실 sam이용권을 선택하세요.
-
보유 권수 / 선물할 권수0권 / 1권
-
받는사람 이름받는사람 휴대전화
- 구매한 이용권의 대한 잔여권수를 선물할 수 있습니다.
- 열람권은 1인당 1권씩 선물 가능합니다.
- 선물한 열람권이 ‘미등록’ 상태일 경우에만 ‘열람권 선물내역’화면에서 선물취소 가능합니다.
- 선물한 열람권의 등록유효기간은 14일 입니다.
(상대방이 기한내에 등록하지 않을 경우 소멸됩니다.) - 무제한 이용권일 경우 열람권 선물이 불가합니다.
첫 구매 시 교보e캐시 지급해 드립니다.

- 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
- 한 ID당 최초 1회 지급 / sam 이용권 제외
- 구글바이액션을 통해 교보eBook 구매 이력이 없는 회원 대상
- 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)