LLM 파인튜닝-얼라이먼트 쿡북 with Python
2026년 01월 14일 출간
- eBook 상품 정보
- 파일 정보 PDF (15.86MB) | 287 쪽
- ISBN 9791124236024
- 지원기기 교보eBook App, PC e서재, 리더기, 웹뷰어
-
교보eBook App
듣기(TTS) 가능
TTS 란?텍스트를 음성으로 읽어주는 기술입니다.
- 전자책의 편집 상태에 따라 본문의 흐름과 다르게 텍스트를 읽을 수 있습니다.
- 이미지 형태로 제작된 전자책 (예 : ZIP 파일)은 TTS 기능을 지원하지 않습니다.
PDF 필기가능 (Android, iOS)
쿠폰적용가 9,000원
10% 할인 | 5%P 적립이 상품은 배송되지 않는 디지털 상품이며,
교보eBook앱이나 웹뷰어에서 바로 이용가능합니다.
카드&결제 혜택
- 5만원 이상 구매 시 추가 2,000P
- 3만원 이상 구매 시, 등급별 2~4% 추가 최대 416P
- 리뷰 작성 시, e교환권 추가 최대 200원
작품소개
이 상품이 속한 분야
LLM Fine-tuning은 단순한 모델 재학습이 아니라, 범용 언어 지식을 특정 분야의 전문성으로 전환하는 핵심 기술이다. 금융, 의료, 법률, 제조 등 각 산업 도메인은 고유한 용어, 규칙, 지식 체계를 가지고 있다. 일반적인 LLM으로는 이러한 전문 영역에서 요구되는 정확성과 신뢰성을 확보하기 어렵다. Fine-tuning을 통해 모델은 도메인 특화 지식을 습득하고, 기업의 톤 앤 매너를 반영하며, 특정 작업에 최적화된 출력을 생성할 수 있다.
그러나 LLM Fine-tuning을 실제 프로덕션 환경에 적용하는 것은 여전히 많은 도전 과제를 안고 있다. 제한된 GPU 자원, 파멸적 망각(Catastrophic Forgetting) 문제, 데이터 품질 관리, 학습 안정성 확보, 평가 지표 설계 등 수많은 기술적 장벽이 존재한다. 연구 논문 수준의 Fine-tuning과 실제 비즈니스에 적용 가능한 안정적인 Fine-tuning 사이에는 큰 격차가 있다.
이러한 격차를 줄이기 위해 LoRA, QLoRA, DoRA 등의 Parameter-Efficient Fine-Tuning(PEFT) 기법들이 등장했다. PEFT 기법은 전체 파라미터를 학습하지 않고도 효율적으로 모델을 특화할 수 있는 방법론을 제공한다. 또한 DPO(Direct Preference Optimization), GRPO(Group Relative Po.....
Table of Contents (목차)
서문: 들어가며
Chapter 01: LLM Fine-tuning 개요
1.1. LLM Fine-tuning이란?
1.2. 실습을 위한 gpt-oss-20b 모델 준비
Chapter 02: Fine-tuning 유형 및 방법론
2.1. Fine-tuning 유형 분류
2.2. Parameter-Efficient Fine-tuning (PEFT)
2.3. 학습 방법 선택 가이드
Chapter 03: 학습 환경 구축
3.1. GPU 하드웨어
3.2. 필수 라이브러리 설치
3.3. HuggingFace 설정
3.4. 캐시 저장 경로 및 기타 설정
Chapter 04: 데이터셋 준비
4.1. LLM 학습 데이터셋 유형
4.2. 데이터 클리닝 파이프라인 실습
4.3. HuggingFace Datasets 활용
Chapter 05: 모델 로딩
5.1. 4-bit 양자화 설정 (BitsAndBytes)
5.2. 모델 및 토크나이저 로드
5.3. 학습을 위한 모델 준비
5.4. 모델 구조 분석 및 LoRA 타겟 설정
Chapter 06: LoRA를 활용한 SFT
6.1. LoRA 이론
6.2. LoRa Fine-tuning 준비
6.3. 모델 및 토크나이저 로드
6.4. LoRA 어댑터 설정 및 적용
6.5. SFTTrainer 설정 및 학습 실행
Chapter 07: QLoRA를 활용한 SFT
7.1. QLoRA 설정 및 모델 로드
7.2. QLoRA 어댑터 설정
7.3. 도메인 데이터셋 준비 (금융)
Chapter 08: 도메인 적응 SFT
8.1. 도메인 적응 데이터셋 준비
8.2. 시스템 프롬프트 설계 (페르소나 주입)
8.3. 모델 로드 및 학습 설정 (QLoRA)
Chapter 09: Instruction Tuning
9.1. Instruction 포맷 구현
9.2. 데이터셋 혼합 (Data Mixing) 전략
9.3. 프롬프트 생성 함수 .....
인물정보
저자(글) 고우주
AI와 빅데이터 분야에서 두드러진 성과를 이루어낸 저자 고우주는 Swiss School of Management 에서 AI·빅데이터 박사 학위를 취득했으며, 학부에서는 전기공학을 전공하며 기술적 전문성을 다졌으며, 서울종합과학대학원대학교(aSSIST)와 Aalto University에서 각각 AI ·빅데이터 MBA와 Executive MBA 석사 학위를 받았다.
현재 코스닥 상장기업의 CAIO로 혁신적인 인공지능 솔루션 개발을 이끌고 있으며, 2020년부터 2024년까지 명지대학교 응용소프트웨어학부의 겸임교수로 재직하며 인문, 사회학과 학생들을 대상으로 데이터 사이언스 강의로 인재 양성에 기여를 했다. 이전에는 센싸타테크놀러지스와 슈나이더일렉트릭에서 Technical & Product Manager로 활동하며 풍부한 실무 경험을 쌓았다.
저자는 기술과 데이터를 활용하여 인문학적, 사회학적, 공학적 접근으로 다양한 현상을 탐구하고 규명하는 데 깊은 관심을 가지고 연구를 수행해 왔습니다. 석사는 B2B Value Added donation model: Pledge 1% Case와 박사 논문 Developing an Explainable & Causal AI in Manufacturing Industries를 통해 AI와 빅데이터 기술의 실질적 응용과 산업적 기여를 탐구했으며, 이를 통해 학문적 연구와 실제 비즈니스 문제 해결을 연결하는 통찰력을 보여주었다.
저자의 주요 연구 분야는 LLM 및 생성형 AI(에이전트, 프롬프트 엔지니어링, RAG, Agent, SLM, 파인튜닝, GPU 최적화), 에너지/환경/제조 분야의 IoT 데이터 신호처리와 이상치 탐지, 시계열 분석, 설명 가능한 AI(XAI), 인과추론, 그리고 디지털 마케팅(멀티모달 LLM 활용을 통한 CRM 분석)을 포함한다. 이를 통해 기술적 도구를 넘어 데이터와 AI를 사회적 맥락에서 활용하여 인류와 산업이 직면한 복잡한 문제를 해결하고자 노력하고 있다.
저자는 산업계와 학계 모두.....
이 상품의 총서
Klover리뷰 (0)
- - e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- - 리워드는 5,000원 이상 eBook, 오디오북, 동영상에 한해 다운로드 완료 후 리뷰 작성 시 익일 제공됩니다. (2024년 9월 30일부터 적용)
- - 리워드는 한 상품에 최초 1회만 제공됩니다.
- - sam 이용권 구매 상품 / 선물받은 eBook은 리워드 대상에서 제외됩니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오 발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
구매 후 리뷰 작성 시, e교환권 100원 적립
문장수집
- 구매 후 90일 이내에 문장 수집 등록 시 e교환권 100원을 적립해 드립니다.
- e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- 리워드는 5,000원 이상 eBook에 한해 다운로드 완료 후 문장수집 등록 시 제공됩니다. (2024년 9월 30일부터 적용)
- 리워드는 한 상품에 최초 1회만 제공됩니다.
- sam 이용권 구매 상품 / 선물받은 eBook / 오디오북·동영상 상품/주문취소/환불 시 리워드 대상에서 제외됩니다.
구매 후 문장수집 작성 시, e교환권 100원 적립
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!