본문 바로가기

추천 검색어

실시간 인기 검색어

4차 산업혁명 현장 전문가가 알려주는

빅데이터 분석과 활용

제이펍

2020년 03월 28일 출간

종이책 : 2019년 01월 08일 출간

(개의 리뷰)
( 0% 의 구매자)
eBook 상품 정보
파일 정보 pdf (17.79MB)
ISBN 9791190665117
쪽수 300쪽
지원기기 교보eBook App, PC e서재, 리더기, 웹뷰어
교보eBook App 듣기(TTS) 가능
TTS 란?
텍스트를 음성으로 읽어주는 기술입니다.
  • 전자책의 편집 상태에 따라 본문의 흐름과 다르게 텍스트를​ 읽을 수 있습니다.
  • 전자책 화면에 표기된 주석 등을 모두 읽어 줍니다.
  • 이미지 형태로 제작된 전자책 (예 : ZIP 파일)은 TTS 기능을 지원하지 않습니다.
  • '교보 ebook' 앱을 최신 버전으로 설치해야 이용 가능합니다. (Android v3. 0.26, iOS v3.0.09,PC v1.2 버전 이상)

PDF 필기 Android 가능 (iOS예정)
소득공제
소장
정가 : 18,200원

쿠폰적용가 16,380

10% 할인 | 5%P 적립

이 상품은 배송되지 않는 디지털 상품이며,
교보eBook앱이나 웹뷰어에서 바로 이용가능합니다.

카드&결제 혜택

  • 5만원 이상 구매 시 추가 2,000P
  • 3만원 이상 구매 시, 등급별 2~4% 추가 최대 416P
  • 리뷰 작성 시, e교환권 추가 최대 300원

작품소개

이 상품이 속한 분야

현장 전문가가 직접 전하는
4차 산업혁명 시대에 어울리는 빅데이터 구축 노하우!

이 책은 4차 산업혁명 시대에 왜 빅데이터가 중요한가에 대해 말하고, 실제로 빅데이터를 구축하려면 어떠한 기술이 필요한지 설명한다. 특히, 최근까지 다수의 빅데이터 구축 경험을 가진 현장 전문가의 설명은 빅데이터를 구축하는 데 필요한 효율적이고도 현실적인 조언이 되어줄 것이다. 나아가 빅데이터와 인공지능, 블록체인과의 연계 방안과 기술에 관해서도 설명한다. 빅데이터를 도입하거나 구축하려는 기업의 기획자나 실무자에게 유용한 자료가 될 것이다.
PART I 빅데이터가 열어 갈 4차 산업혁명 1
CHAPTER 01 빅데이터와 우리의 미래 3
1.1 2030년 어느 날 3
1.2 빅데이터란? 4
1.3 빅데이터와 4차 산업혁명 6
1.3.1 빅데이터와 자율주행 자동차 14
1.4 기업은 빅데이터를 어떻게 이용하고 있을까? 15
1.5 빅데이터가 열어 갈 미래를 어떻게 준비해야 하는가? 16
1.5.1 미래는 자율형 분산 조직화된다 17
1.5.2 변화의 시간은 점점 짧아진다 18
1.5.3 시장 창조형 혁신이 필요하다 19
1.5.4 결국 인재가 가장 중요하다 21
1.5.5 빅데이터 기반의 온라인 평생 교육 22
CHAPTER 02 빅데이터란 무엇인가? 24
2.1 데이터 분석의 지난날 24
2.1.1 CRM에서 빅데이터 분석으로 24
2.1.2 데이터 마이닝 기술에서 빅데이터 분석 기술로 26
2.2 빅데이터 분석을 위해 우리가 알아야 할 것들 28
2.2.1 빅데이터의 정의 28
2.2.2 빅데이터의 특징 29
2.2.3 데이터 폭증 시대, 진정한 빅데이터 분석 32
2.2.4 빅데이터 분석 4요소 33
2.2.5 데이터 분석가는 무엇을 해야 하는가? 34
2.2.6 빅데이터 기반 기술에는 무엇이 있는가? 35
2.2.7 분석 알고리즘 학습 39
2.2.8 데이터 인사이트를 기르는 방법 42
2.3 빅데이터 기술 섭렵하기 44
2.3.1 빅데이터 수집 45
2.3.2 빅데이터 저장 51
2.3.3 빅데이터 처리 57
2.3.4 빅데이터 분석 60
CHAPTER 03 빅데이터의 비즈니스 활용 사례 66
3.1 기업의 빅데이터 활용 방향 67
3.2 해외 사례 70
3.3 국내 사례 79

PART II 빅데이터 구축 실무 95
CHAPTER 04 빅데이터 구축 97
4.1 빅데이터 플랫폼 구축 개요 97
4.1.1 운영계 시스템(기간계) 97
4.1.2 분석계 시스템(데이터 웨어하우스) 98
4.1.3 데이터 레이크 98
4.2 빅데이터 플랫폼 구축을 위한 프로세스 98
4.3 요구사항 분석 102
4.3.1 개선 방향 작성 104
4.3.2 분석 목표 수립 106
4.3.3 프로젝트 계획 108
4.3.4 보유 데이터 자산 확인 109
4.4 개발 계획 수립 112
4.4.1 일정 계획 수립 112
4.4.2 인력 계획 수립 116
4.5 목표 시스템 정의 119
4.6 기초 설계 126
4.6.1 고가용성 구성 126
4.6.2 개발 표준 정의 130
4.6.3 모델링 표준 정의 136
4.7 데이터 수집 설계 138
4.7.1 데이터 수집 계획 수립 138
4.7.2 빅데이터 수집 시스템 설계 143
4.7.3 내/외부 데이터 수집 150
4.8 데이터 처리 설계 154
4.8.1 데이터 처리 계획 수립 155
4.8.2 데이터 처리 설계 156
4.9 플랫폼 구축 160
4.9.1 PMO 관리사항 161
4.9.2 하드웨어 조달 및 설치 164
4.9.3 소프트웨어 조달 및 설치 165
4.9.4 데이터 수집 166
4.9.5 업무 개발/테스트 167
4.9.6 통합 테스트 168
4.9.7 사용자 인수 테스트 171
4.9.8 오픈 및 완료 보고 171
CHAPTER 05 빅데이터 분석과 활용 172
5.1 왜 데이터 전처리가 중요할까? 172
5.1.1 데이터 전처리란? 173
5.1.2 전송 및 전처리 업무의 문제 175
5.1.3 전송 방법의 구분 176
5.1.4 비실시간 데이터 전송 176
5.1.5 실시간 데이터 전송 180
5.1.6 크롤링과 스크랩핑 181
5.1.7 데이터 전송을 잘 수행하기 위한 준비사항 182
5.1.8 데이터 전송 및 전처리 시스템 구축 182
5.1.9 데이터 전송 포맷 187
5.1.10 로그 수집과 크롤링 189
5.1.11 하둡 연동 192
5.1.12 데이터 스펙 검증 및 관계형 데이터베이스 연동 194
5.1.13 데이터 전처리 구현 195
5.2 머신러닝 기반 분석 프로세스 198
5.2.1 예측 모형 개발 프로세스 198
5.2.2 예측 모형 알고리즘 선정 프로세스 201
5.2.3 예측모형 알고리즘 종류 202
5.2.4 머신러닝 예측 모델 성능 평가 213
CHAPTER 06 빅데이터 운영 218
6.1 빅데이터 운영 기획 218
6.2 빅데이터 운영 228
6.3 운영 평가 235

PART III 빅데이터 활성화 산업혁명 기술 239
CHAPTER 07 빅데이터와 인공지능 241
7.1 인공지능에서의 빅데이터 활용 241
7.2 인공지능의 과거와 현재 241
7.2.1 고정관념의 변화 241
7.2.2 과거의 인공지능 243
7.3 쉬운 인공지능, 어려운 용어 245
7.4 인공지능의 개념 247
7.4.1 인공지능의 분류 249
7.5 인공지능 기초 알고리즘 251
7.5.1 퍼셉트론 251
7.5.2 퍼셉트론 활용 기초 253
7.6 인공지능 기술 분류 255
7.6.1 상황이해 259
7.6.2 언어이해 260
7.7 인공지능의 학습기법과 알고리즘 260
CHAPTER 08 빅데이터와 블록체인 262
8.1 비트코인의 탄생 262
8.2 비트코인에 코인은 없다 264
8.3 비트코인의 보상 265
8.4 블록체인의 구조 267
8.5 공개, 개인, 컨소시엄 블록체인 268
8.6 블록체인 기술의 산업적 활용 전망 272
8.7 빅데이터 활성화를 위한 블록체인 278

참고문헌 281
찾아보기 284

이 책의 시작을 4차 산업혁명으로 시작하는 이유가 여기에 있다. 빅데이터는 하나의 기술이고 트렌드일 뿐 더욱 중요한 것은 이러한 빅데이터를 얼마나 산업에 적용할 것인지를 고민하는 창업가의 의지와 모험심이라고 생각한다. 1부에서는 빅데이터로 인한 4차 산업혁명의 짧은 스냅샷을 보여 준다. 그리고 빅데이터가 무엇인가에 관한 사전적, 경험적 정의를 내려 준다. 아무리 실무가 중요하다고 해도 간단한 정의 정도는 내리고 출발하는 것이 좋겠다. 그리고 빅데이터가 현재 산업에 얼마나 사용되고 있는지 그 활용 사례를 보여 줌으로써 4차 산업혁명의 원유(原油)라고 하는 이유를 설명하고자 한다. 1부는 빅데이터를 그동안 잘 모르고 있었거나 피상적으로만 알고 있었던 분들이 읽으면, 짧지만 강한 여운을 남길 수 있을 것이다. 그럼, 4차 산업혁명의 미래 모습 속으로 잠시 여행을 다녀오자.
_2쪽

통계분석과 데이터 마이닝, 빅데이터의 차이점을 간단히 설명하면 다음과 같다. 통계분석은 모집단에서 집단의 대표성을 가지는 표본집단으로부터 데이터를 분석한다. 그러므로 모집단으로부터 집단의 대표성을 가지는 표본집단을 얼마나 잘 추출하는가에 따라 데이터의 분석 결과가 달라질 수 있다. 표본집단 추출의 한계가 곧 통계분석의 한계로 연결된다. 이러한 통계분석의 한계를 극복한 것이 데이터 마이닝이다. 데이터 마이닝은 모집단 전체를 대상으로 분석하게 된다. 또한, 통계분석은 가설 또는 가정을 검증하는 과정인 데 반해, 데이터 마이닝은 신경망 알고리즘, 연관분석, 회귀분석, K-평균(K-means) 알고리즘 등의 수학적 분석 방법론으로 데이터를 분석하게 된다. 통계에서는 대량의 데이터를 대상으로 했을 때 한계가 있다. 이는 통계가 전체 데이터 중 부분 데이터를 다루기 때문이다. 통계가 전체 데이터를 다룰 때도 있지만, 이는 정말 특별한 경우에만 그렇다.
_26쪽

빅데이터 플랫폼은 빅데이터를 생산?분석?유통시키는 시스템이다. 현대는 플랫폼 시대다. 단순히 하나의 시스템을 구축하는 것이 중요한 것이 아니라 지속적으로 개발?분석?유통할 수 있는 시스템이 필요하다. 빅데이터 역시 플랫폼을 구축하는 것이 중요하다. 빅데이터 플랫폼은 일반적인 전산 시스템 카테고리에 따라 크게 세 가지 유형으로 분류한다. 첫째, 운영계 시스템은 기간계 시스템이라고도 한다. 둘째, 분석계 시스템은 기업에서 데이터 웨어하우스라고 부르는 시스템이다. 분석계 시스템은 운영계 시스템에서 만들어진 빅데이터를 분석하는 시스템이다. 셋째, 데이터 레이크(Data Lake)는 데이터 소스가 제공하는 원시 데이터 그대로를 저장해놓은 시스템이다.
_97쪽

데이터 전처리가 무엇일까? 빅데이터에서 데이터 전처리는 데이터를 특정 플랫폼 또는 시스템에 공급하기 위해 필요한 작업의 전체를 말한다. 좀 더 구체적으로 말하면 이 기종 시스템 간에서 데이터를 전송하고 적재하는 데 필연적으로 필요한 과정이 데이터 전처리다. 또한, 데이터 마이닝 및 분석을 위해 결측치를 처리하고, 데이터를 변환, 가공, 잡음 제거, 손실 데이터 보정, 데이터 형변환하는 과정을 말하기도 한다. 최근에는 비정형 데이터를 정형화(파싱, 자연어 처리)하는 과정을 말하기도 한다. 이렇게 데이터 전처리는 여러 가지 의미로 쓰인다.
_173쪽

빅데이터 운영은 일반 IT 인프라 운영과 마찬가지로 기존의 IT 인프라 운영 인력이 있다면 통상 한 달 전에 인수인계 절차를 거쳐야 하며, 그렇지 않을 경우 운영 기획을 통해 개발 부서로부터의 인수, 운영 자원 및 예산 계획, 표준 지침 및 절차서를 마련하여야 한다. 빅데이터 운영이라고 해서 일반 IT 인프라 운영과 특히 다른 점은 없으나 운영 관리를 위해 필요한 업무 절차 및 산출물, 문서 양식 등은 수행 기관의 규모, 업무 분야, 시스템 종류 및 유형에 따라 다를 수 있으므로 각 기관에 맞게 운영 관리 지침 및 절차서를 반드시 수립하고 적용한다.
_218쪽

현장 전문가가 직접 전하는
4차 산업혁명 시대에 어울리는 빅데이터 구축 노하우!

이 책은 4차 산업혁명 시대에 왜 빅데이터가 중요한가에 대해 말하고, 실제로 빅데이터를 구축하려면 어떠한 기술이 필요한지 설명한다. 특히, 최근까지 다수의 빅데이터 구축 경험을 가진 현장 전문가의 설명은 빅데이터를 구축하는 데 필요한 효율적이고도 현실적인 조언이 되어줄 것이다. 나아가 빅데이터와 인공지능, 블록체인과의 연계 방안과 기술에 관해서도 설명한다. 빅데이터를 도입하거나 구축하려는 기업의 기획자나 실무자에게 유용한 자료가 될 것이다.

대상 독자
● 4차 산업혁명과 빅데이터 관계를 알고 싶은 독자
● 기업의 빅데이터 도입 기획 실무자
● 빅데이터 개발을 담당하는 프로그래머
● 빅데이터에 관심 있는 일반인/학생/교수

작가정보

저자(글) 박인근

정보관리기술사를 취득하였으며 공학박사 학위를 가지고 있다. 현재는 통신회사에 근무하고 있다. 주로 IT 프로젝트 품질 관리와 테스트 업무를 하였으며, OO통신사 차세대 프로젝트 PMO 역할을 수행하기도 했다. 현재는 마케팅 부서에서 IT 신기술(블록체인, AI, 빅데이터 등) 적용에 몰두하고 있다.

저자(글) 홍지후

컴퓨터시스템응용기술사를 취득하였으며 공학석사 학위를 가지고 있다. 현재는 통신회사에 근무하고 있다. 주로 금융, 제조 IT 프로젝트에서 TA, PM 역할을 하였으며, 통신회사에서는 클라우드, 빅데이터, EAI/ESB 프로젝트를 수행하였다. 최근에는 AI, 블록체인, IoT 기술을 탐독하여 변화하는 세상에 빠르게 적용하려고 노력 중이다.

저자(글) 강남규

정보관리기술사를 취득하였으며 공학석사 학위를 가지고 있다. 클라우드 전문가로서 개발자, 컨설턴트, 프로젝트 매니저 등의 업무를 비롯해 다양한 분야(빅데이터, 클라우드, AI)에서 자문과 평가, 강의를 하고 있다. 지은 책으로는 《오픈스택 기반의 프라이빗 클라우드 서비스》가 있다.

저자(글) 김성호

통신회사에 근무하며, 주로 DW 구축, 클라우드 인프라 설계/구축/운용 업무를 수행하였다. 블록체인, IoT, AI, 미디어, 빅데이터 플랫폼 등 다양한 서비스의 클라우드 인프라 설계 경험을 가지고 있다. 현재 클라우드 부서에서 인프라 설계 및 구축 업무를 담당하고 있다.

저자(글) 정구범

현재는 kt NexR에서 근무하고 있으며 카카오에서 일했었다. 소프트웨어 엔지니어, 검색 엔진 R&D, 프로젝트 기획/제안/관리, 소프트웨어 아키텍트, 테크니컬 아키텍트, 솔루션 아키텍트 등 20년간 다양한 역할을 수행하였다. 현재 빅데이터 에반젤리스트 겸 컨설턴트로 일하며, 통신/포탈 등 대용량 빅데이터 플랫폼 기획/설계/구축/운영 등 빅데이터와 관련한 플랫폼의 전반적인 부분을 담당하고 있다.

이 상품의 총서

Klover리뷰 (0)

Klover리뷰 안내
Klover(Kyobo-lover)는 교보를 애용해 주시는 고객님들이 남겨주신 평점과 감상을 바탕으로, 다양한 정보를 전달하는 교보문고의 리뷰 서비스입니다.
1. 리워드 안내
구매 후 90일 이내에 평점 작성 시 e교환권 100원을 적립해 드립니다.
  • - e교환권은 적립일로부터 180일 동안 사용 가능합니다.
  • - 리워드는 1,000원 이상 eBook, 오디오북, 동영상에 한해 다운로드 완료 후 리뷰 작성 시 익일 제공됩니다.
  • - 리워드는 한 상품에 최초 1회만 제공됩니다.
  • - sam 이용권 구매 상품 / 선물받은 eBook은 리워드 대상에서 제외됩니다.
2. 운영 원칙 안내
Klover리뷰를 통한 리뷰를 작성해 주셔서 감사합니다. 자유로운 의사 표현의 공간인 만큼 타인에 대한 배려를 부탁합니다. 일부 타인의 권리를 침해하거나 불편을 끼치는 것을 방지하기 위해 아래에 해당하는 Klover 리뷰는 별도의 통보 없이 삭제될 수 있습니다.
  • 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
  • 도서와 무관한 내용의 리뷰
  • 인신공격이나 욕설, 비속어, 혐오 발언이 개재된 리뷰
  • 의성어나 의태어 등 내용의 의미가 없는 리뷰

구매 후 리뷰 작성 시, e교환권 100원 적립

문장수집

문장수집 안내
문장수집은 고객님들이 직접 선정한 책의 좋은 문장을 보여 주는 교보문고의 새로운 서비스 입니다. 교보eBook 앱에서 도서 열람 후 문장 하이라이트 하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다. 마음을 두드린 문장들을 기록하고 좋은 글귀들은 ‘좋아요’ 하여 모아보세요. 도서 문장과 무관한 내용 등록 시 별도 통보없이 삭제될 수 있습니다.
리워드 안내
  • 구매 후 90일 이내에 문장 수집 등록 시 e교환권 100원을 적립해 드립니다.
  • e교환권은 적립일로부터 180일 동안 사용 가능합니다.
  • 리워드는 1,000원 이상 eBook에 한해 다운로드 완료 후 문장수집 등록 시 제공됩니다.
  • 리워드는 한 상품에 최초 1회만 제공됩니다.
  • sam 이용권 구매 상품/오디오북·동영상 상품/주문취소/환불 시 리워드 대상에서 제외됩니다.

구매 후 문장수집 작성 시, e교환권 100원 적립

    교보eBook 첫 방문을 환영 합니다!

    신규가입 혜택 지급이 완료 되었습니다.

    바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
    지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

    교보e캐시 1,000원
    TOP
    신간 알림 안내
    빅데이터 분석과 활용 웹툰 신간 알림이 신청되었습니다.
    신간 알림 안내
    빅데이터 분석과 활용 웹툰 신간 알림이 취소되었습니다.
    리뷰작성
    • 구매 후 90일 이내 작성 시, e교환권 100원 (최초1회)
    • 리워드 제외 상품 : 마이 > 라이브러리 > Klover리뷰 > 리워드 안내 참고
    • 콘텐츠 다운로드 또는 바로보기 완료 후 리뷰 작성 시 익일 제공
    감성 태그

    가장 와 닿는 하나의 키워드를 선택해주세요.

    사진 첨부(선택) 0 / 5

    총 5MB 이하로 jpg,jpeg,png 파일만 업로드 가능합니다.

    신고/차단

    신고 사유를 선택해주세요.
    신고 내용은 이용약관 및 정책에 의해 처리됩니다.

    허위 신고일 경우, 신고자의 서비스 활동이 제한될 수
    있으니 유의하시어 신중하게 신고해주세요.


    이 글을 작성한 작성자의 모든 글은 블라인드 처리 됩니다.

    문장수집 작성

    구매 후 90일 이내 작성 시, e교환권 100원 적립

    eBook 문장수집은 웹에서 직접 타이핑 가능하나, 모바일 앱에서 도서를 열람하여 문장을 드래그하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다.

    P.
    4차 산업혁명 현장 전문가가 알려주는 빅데이터 분석과 활용
    저자 모두보기
    낭독자 모두보기
    sam 이용권 선택
    님이 보유하신 이용권입니다.
    차감하실 sam이용권을 선택하세요.
    sam 이용권 선택
    님이 보유하신 이용권입니다.
    차감하실 sam이용권을 선택하세요.
    sam 이용권 선택
    님이 보유하신 프리미엄 이용권입니다.
    선물하실 sam이용권을 선택하세요.
    결제완료
    e캐시 원 결제 계속 하시겠습니까?
    교보 e캐시 간편 결제
    sam 열람권 선물하기
    • 보유 권수 / 선물할 권수
      0권 / 1
    • 받는사람 이름
      받는사람 휴대전화
    • 구매한 이용권의 대한 잔여권수를 선물할 수 있습니다.
    • 열람권은 1인당 1권씩 선물 가능합니다.
    • 선물한 열람권이 ‘미등록’ 상태일 경우에만 ‘열람권 선물내역’화면에서 선물취소 가능합니다.
    • 선물한 열람권의 등록유효기간은 14일 입니다.
      (상대방이 기한내에 등록하지 않을 경우 소멸됩니다.)
    • 무제한 이용권일 경우 열람권 선물이 불가합니다.
    이 상품의 총서 전체보기
    네이버 책을 통해서 교보eBook 첫 구매 시
    교보e캐시 지급해 드립니다.
    교보e캐시 1,000원
    • 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
    • 한 ID당 최초 1회 지급 / sam 이용권 제외
    • 네이버 책을 통해 교보eBook 구매 이력이 없는 회원 대상
    • 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)
    구글북액션을 통해서 교보eBook
    첫 구매 시 교보e캐시 지급해 드립니다.
    교보e캐시 1,000원
    • 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
    • 한 ID당 최초 1회 지급 / sam 이용권 제외
    • 구글북액션을 통해 교보eBook 구매 이력이 없는 회원 대상
    • 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)