빅데이터 파이프라인 A to Z: 설계·구현·운영 기초
2026년 01월 15일 출간
- eBook 상품 정보
- AI(생성형) 활용 제작 도서
- 파일 정보 ePUB (0.56MB)
- ISBN 9791175473461
- 지원기기 교보eBook App, PC e서재, 리더기, 웹뷰어
-
교보eBook App
듣기(TTS) 가능
TTS 란?텍스트를 음성으로 읽어주는 기술입니다.
- 전자책의 편집 상태에 따라 본문의 흐름과 다르게 텍스트를 읽을 수 있습니다.
- 이미지 형태로 제작된 전자책 (예 : ZIP 파일)은 TTS 기능을 지원하지 않습니다.
이 상품은 배송되지 않는 디지털 상품이며,
교보eBook앱이나 웹뷰어에서 바로 이용가능합니다.
작품소개
이 상품이 속한 분야
각 장은 파이프라인을 이루는 핵심 요소를 중심으로, 왜 그런 구성과 절차가 필요한지에 초점을 맞춥니다. 데이터 수집, 전송, 저장, 변환, 오케스트레이션, 품질 검증, 모니터링, 보안, 배포와 유지보수까지 이어지는 과정에서 자주 등장하는 개념과 판단 기준을 정리해, 독자가 기술을 나열식으로 외우지 않고 원리와 관계로 이해하도록 돕습니다.
이 책은 특정 기업의 사례나 저자의 개인적 경험에 의존하지 않습니다. 대신 일반적으로 통용되는 원칙과 용어, 파이프라인의 동작 방식, 단계별로 발생할 수 있는 문제 유형과 기본적인 대응 방식에 집중합니다. 또한 고급 응용이나 특정 도구 중심의 깊은 최적화보다는, 기초 구조를 탄탄히 세우는 데 필요한 내용만을 다룹니다.
빅데이터 파이프라인을 구성하는 각 단계의 역할과 연결 지점을 명확히 이해하고, 일관된 관점으로 전체 시스템을 바라볼 수 있게 되는 것이 이 책의 목표입니다. 독자는 이 책을 통해 파이프라인을 설명하고 설계의 근거를 정리하며, 운영 관점에서 무엇을 확인해야 하는지까지 기본 수준에서 말할 수 있는 기반을 갖추게 될 것입니다.
*생성형 인공지능을 활용하여 제작하고 편집 과정을 거쳤습니다. 편집자의 최종 검토를 거쳐 제작되었습니다.
데이터 파이프라인이 해결하는 문제
파이프라인의 입력과 출력 정의
구성 요소 간 책임 분리
배치 처리와 스트리밍 처리의 구분
데이터 흐름과 의존성의 개념
파이프라인 품질의 기준 개요
챕터 2 데이터 수집의 기본 구조
수집 대상과 범위 설정 방법
이벤트 데이터와 로그 데이터의 처리 관점
수집 시점과 지연의 의미
수집 단계의 오류 유형
중복 수집과 누락의 발생 원리
수집 데이터의 최소 보장 조건
수집 메타데이터의 활용 범위
챕터 3 데이터 전송과 메시징의 기초
전송 모델과 버퍼링의 개념
푸시 방식과 풀 방식의 차이
큐 기반 전달의 기본 원리
처리량과 지연의 균형 이해
재시도와 순서 보장의 관계
전송 단계에서의 데이터 손상 방지
백프레셔의 발생 조건
챕터 4 저장소 선택과 데이터 적재
파일 기반 저장과 테이블 기반 저장의 관점
데이터 레이아웃과 파티셔닝의 의미
압축과 인코딩이 주는 영향
적재 단위와 배치 윈도우 설정
스키마와 저장 구조의 관계
변경 데이터의 적재 방식 이해
저장 단계의 일관성 조건
챕터 5 데이터 변환의 기본 원리
정제와 변환의 경계
필터링과 조인의 처리 관점
집계의 의미와 오류 요인
결측값과 이상값 처리의 기본 접근
데이터 확장과 축소의 기준
중복 제거의 조건과 한계
변환 결과의 검증 방식
챕터 6 워크플로 오케스트레이션 기초
작업 단위와 작업 그래프 이해
실행 순서와 의존성 표현
스케줄링과 트리거의 차이
재실행과 멱등성의 필요성
상태 관리의 기본 개념
실패 처리 전략의 종류
파이프라인 구성 변경의 영향
챕터 7 데이터 품질과 검증 체계
품질 규칙을 정의하는 방식
데이터 범위와 허용 오차 설정
레코드 수준 검증과 집합 수준 검증
샘플링 검증의 유효 범위
품질 지표의 측정과 기록
오류 데이터의 격리 방식
검증 결과의 공유와 추적
챕터 8 운영 관측성과 모니터링
관측성의 구성 요소 이해
로그와 메트릭의 역할 구분
지연과 처리량의 기본 지표
경보 조건의 설정 원칙
장애 탐지와 원인 단서 수집
SLA와 SLO의 관계 이해
운영 중 변경이 주는 위험
챕터 9 보안과 접근 제어의 기본
접근 제어가 필요한 이유
인증과 권한 부여의 구분
최소 권한 원칙의 적용
민감 데이터의 분류와 보호
전송 구간 보호의 기본
저장 구간 암호화의 개요
감사 로그와 추적 가능성
챕터 10 배포와 유지보수의 기본 절차
환경 분리의 목적과 방식
설정 관리의 기본 원칙
버전 관리와 변경 이력
테스트의 범위와 최소 구성
릴리스 절차와 롤백의 개념
문서화의 최소 요구사항
운영 중 점검과 정기 검토
인물정보
저자(글) 지식이야기 IT팀
빅데이터 엔지니어에 대한 관심을 바탕으로 독자 니즈와 시장 흐름을 꾸준히 연구하며, 복잡한 내용을 핵심 개념 중심으로 쉽게 정리한 지식콘텐츠를 성실히 제작하고 있습니다.
이 상품의 총서
Klover리뷰 (0)
- - e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- - 리워드는 5,000원 이상 eBook, 오디오북, 동영상에 한해 다운로드 완료 후 리뷰 작성 시 익일 제공됩니다. (2024년 9월 30일부터 적용)
- - 리워드는 한 상품에 최초 1회만 제공됩니다.
- - sam 이용권 구매 상품 / 선물받은 eBook은 리워드 대상에서 제외됩니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오 발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
구매 후 리뷰 작성 시, e교환권 100원 적립
문장수집
- 구매 후 90일 이내에 문장 수집 등록 시 e교환권 100원을 적립해 드립니다.
- e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- 리워드는 5,000원 이상 eBook에 한해 다운로드 완료 후 문장수집 등록 시 제공됩니다. (2024년 9월 30일부터 적용)
- 리워드는 한 상품에 최초 1회만 제공됩니다.
- sam 이용권 구매 상품 / 선물받은 eBook / 오디오북·동영상 상품/주문취소/환불 시 리워드 대상에서 제외됩니다.
구매 후 문장수집 작성 시, e교환권 100원 적립
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!