본문 바로가기

추천 검색어

실시간 인기 검색어

LLM Master: 로컬 LLM Serving with Python

고우주 지음
아티팩트

2025년 12월 02일 출간

(개의 리뷰)
( 0%의 구매자)
eBook 상품 정보
파일 정보 PDF (17.70MB)
ISBN 9791199294394
쪽수 281쪽
지원기기 교보eBook App, PC e서재, 리더기
교보eBook App 듣기(TTS) 가능
TTS 란?
텍스트를 음성으로 읽어주는 기술입니다.
  • 전자책의 편집 상태에 따라 본문의 흐름과 다르게 텍스트를 읽을 수 있습니다.
  • 이미지 형태로 제작된 전자책 (예 : ZIP 파일)은 TTS 기능을 지원하지 않습니다.

PDF 필기가능 (Android, iOS)
  • sam 무제한 이용가능
  • sam 프리미엄 이용가능

이 상품은 배송되지 않는 디지털 상품이며,
교보eBook앱이나 웹뷰어에서 바로 이용가능합니다.

작품소개

이 상품이 속한 분야

인공지능 분야에서 대규모 언어 모델(Large Language Model, LLM)은 가장 혁신적인 기술 중 하나로 자리잡았다. GPT, Claude, Llama와 같은 모델들은 자연어 이해와 생성에서 인간 수준의 성능을 보여주며, 다양한 산업 분야에 적용되고 있다. 그러나 이러한 모델들을 실제 서비스에 활용하려면 단순히 모델을 학습하는 것을 넘어, 효율적으로 추론(inference)을 수행하는 시스템을 구축하는 것이 필수적이다.

초기에는 대부분의 LLM 서비스가 OpenAI, Anthropic, Google과 같은 클라우드 제공자의 API에 의존했다. 이러한 접근은 빠른 시작과 편리함을 제공하지만, 비용, 데이터 프라이버시, 서비스 안정성, 커스터마이징 제약 등의 한계가 명확하다. 특히 대규모 트래픽을 처리하는 기업에게 토큰당 과금 방식은 예측하기 어려운 비용 구조를 만들어낸다. 민감한 데이터를 다루는 의료, 금융, 법률 분야에서는 외부 클라우드로 데이터를 전송하는 것 자체가 규제 위반이 될 수 있다.

이러한 배경에서 로컬 LLM 추론 시스템에 대한 관심이 급증하고 있다. 온프레미스 환경이나 프라이빗 클라우드에서 직접 LLM을 구동하면 데이터 통제권을 완전히 확보할 수 있고, 초기 하드웨어 투자 후에는 한계 비용이 거의 없으며, 자사의 특수한 요구사항에 맞게 모델과 시스템을 커스터마이징할 수 있다. 또한 외부 서비스 장애나 네트워크 문제에 영향받지 않는 안정적인 서비스 제공이 가능하다.

하지만 로컬 LLM 추론 시스템을 구축하는 것은 결코 쉬운 일이 아니다. 대규모 모델은 수십 기가바이트의 메모리를 필요로 하며, 실시간 응답을 제공하려면 복잡한 최적화가 필요하다. 여러 사용자의 요청을 동시에 처리하고, 긴 컨텍스트를 효율적으로 관리하며, 제한된 하드웨어 리소스를 최대한 활용하는 것은 고도의 전문성을 요구한다. 이러한 복잡성을 해결하기 위해 등장한 것이 바로 전문화된 LLM 추론 프레임워크들이다.
본 서는 로컬 LLM 추론 생태계의 세 가지 .....
저자 소개
Table of Contents (목차)
서문: 들어가며
제1장: 로컬 LLM 추론 시스템 아키텍처 개요
1.1. Ollama: 접근성을 극대화한 로컬 LLM 생태계
1.2. vLLM: 대규모 추론 서빙을 위한 고성능 엔진
1.3. SGLang: 구조화된 생성과 복잡한 워크플로우의 최적화
1.4. 종합 비교 분석과 선택 가이드
1.5. 하이브리드 아키텍처와 미래 전망
제2장: Ollama 서버 기본
2.1. Ollama를 위한 환경 설정
2.2. Ollama 서버 연결 확인
2.3. Ollama 채팅 생성
2.4. 대화 히스토리 유지하기
2.5. 스트리밍 응답 받기
2.6. 생성 파라미터 조정하기
2.7. 모델 정보 조회하기
2.8. 실용적인 챗봇 예제
제3장: Ollama를 활용한 Agent Serving
3.1. Ollama Agent 환경 설정
3.2. Agent Workflow 구현
3.3. 통합 에이전트 클래스 구현
3.4. 도구 등록 및 에이전트 초기화
3.5. 에이전트 예제 실행
3.6. 에이전트 최종 테스트
제4장: vLLM 서버 기본
4.1. vLLM 서버 환경 설정
4.2. vLLM 서버 연결을 위한 OpenAI 클라이언트 설정
4.3. vLLM 텍스트 생성
4.4. 대화 컨텍스트 유지하기
4.5. 스트리밍 응답 받기
4.6. 배치 처리로 여러 요청 동시 실행
4.7. 생성 파라미터 조정
4.8. 토큰 사용량 확인
4.9. 실용적인 채팅 클래스 구현
제5장: vLLM을 활용한 Agent Serving
5.1. vLLM 에이전트 환경 설정
5.2. Agent Workflow 구현
5.3. vLLM 에이전트 통합 구현
5.4. 도구 등록 및 에이전트 초기화
5.5. 에이전트 예제 실행
5.6. 성능 모니터링 및 분석
5.7 에이전트 최종 테스트
제6장: SGLang 서버 기본
6.1. SGLang 서버 환경 설정
6.1. 텍스트 생성
6.3. 구조화된 .....

인물정보

저자(글) 고우주

AI와 빅데이터 분야에서 두드러진 성과를 이루어낸 저자 고우주는 Swiss School of Management 에서 AI 및 빅데이터 박사 학위를 취득했으며, 학부에서는 전기공학을 전공하며 기술적 전문성을 다졌으며, 서울종합과학대학원대학교(aSSIST)와 Aalto University에서 각각 AI 및 빅데이터 MBA와 Executive MBA 석사 학위를 받았습니다.

현재 코스닥 상장기업의 CAIO로 혁신적인 인공지능 솔루션 개발을 이끌고 있으며, 2020년부터 2024년까지 명지대학교 응용소프트웨어학부의 겸임교수로 재직하며 인문, 사회학과 학생들을 대상으로 데이터 사이언스 강의로 인재 양성에 기여를 했습니다. 이전에는 센싸타테크놀러지스와 슈나이더일렉트릭에서 Technical & Product Manager로 활동하며 풍부한 실무 경험을 쌓았습니다.

저자는 기술과 데이터를 활용하여 인문학적, 사회학적, 공학적 접근으로 다양한 현상을 탐구하고 규명하는 데 깊은 관심을 가지고 연구를 수행해 왔습니다. 석사는 B2B Value Added donation model: Pledge 1% Case와 박사 논문 Developing an Explainable & Causal AI in Manufacturing Industries를 통해 AI와 빅데이터 기술의 실질적 응용과 산업적 기여를 탐구했으며, 이를 통해 학문적 연구와 실제 비즈니스 문제 해결을 연결하는 통찰력을 보여주었습니다.

저자의 주요 연구 분야는 LLM 및 생성형 AI(에이전트, 프롬프트 엔지니어링, RAG, Agent, SLM, 파인튜닝, 최적화), 에너지/환경/제조 분야의 IoT 데이터 신호처리와 이상치 탐지, 시계열 분석, 설명 가능한 AI(XAI), 인과추론, 그리고 디지털 마케팅(멀티모달 LLM 활용을 통한 CRM 분석)을 포함합니다. 이를 통해 기술적 도구를 넘어 데이터와 AI를 사회적 맥락에서 활용하여 인류와 산업이 직면한 복잡한 문제를 해결하고자 노력하고 있습니다.

저자는 .....

이 상품의 총서

Klover리뷰 (0)

Klover리뷰 안내
Klover(Kyobo-lover)는 교보를 애용해 주시는 고객님들이 남겨주신 평점과 감상을 바탕으로, 다양한 정보를 전달하는 교보문고의 리뷰 서비스입니다.
1. 리워드 안내
구매 후 90일 이내에 평점 작성 시 e교환권 100원을 적립해 드립니다.
  • - e교환권은 적립일로부터 180일 동안 사용 가능합니다.
  • - 리워드는 5,000원 이상 eBook, 오디오북, 동영상에 한해 다운로드 완료 후 리뷰 작성 시 익일 제공됩니다. (2024년 9월 30일부터 적용)
  • - 리워드는 한 상품에 최초 1회만 제공됩니다.
  • - sam 이용권 구매 상품 / 선물받은 eBook은 리워드 대상에서 제외됩니다.
2. 운영 원칙 안내
Klover리뷰를 통한 리뷰를 작성해 주셔서 감사합니다. 자유로운 의사 표현의 공간인 만큼 타인에 대한 배려를 부탁합니다. 일부 타인의 권리를 침해하거나 불편을 끼치는 것을 방지하기 위해 아래에 해당하는 Klover 리뷰는 별도의 통보 없이 삭제될 수 있습니다.
  • 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
  • 도서와 무관한 내용의 리뷰
  • 인신공격이나 욕설, 비속어, 혐오 발언이 개재된 리뷰
  • 의성어나 의태어 등 내용의 의미가 없는 리뷰

구매 후 리뷰 작성 시, e교환권 100원 적립

문장수집

문장수집 안내
문장수집은 고객님들이 직접 선정한 책의 좋은 문장을 보여 주는 교보문고의 새로운 서비스 입니다. 교보eBook 앱에서 도서 열람 후 문장 하이라이트 하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다. 마음을 두드린 문장들을 기록하고 좋은 글귀들은 ‘좋아요’ 하여 모아보세요. 도서 문장과 무관한 내용 등록 시 별도 통보없이 삭제될 수 있습니다.
리워드 안내
  • 구매 후 90일 이내에 문장 수집 등록 시 e교환권 100원을 적립해 드립니다.
  • e교환권은 적립일로부터 180일 동안 사용 가능합니다.
  • 리워드는 5,000원 이상 eBook에 한해 다운로드 완료 후 문장수집 등록 시 제공됩니다. (2024년 9월 30일부터 적용)
  • 리워드는 한 상품에 최초 1회만 제공됩니다.
  • sam 이용권 구매 상품 / 선물받은 eBook / 오디오북·동영상 상품/주문취소/환불 시 리워드 대상에서 제외됩니다.

구매 후 문장수집 작성 시, e교환권 100원 적립

    교보eBook 첫 방문을 환영 합니다!

    신규가입 혜택 지급이 완료 되었습니다.

    바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
    지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

    교보e캐시 1,000원
    TOP
    신간 알림 안내
    LLM Master: 로컬 LLM Serving with Python 웹툰 신간 알림이 신청되었습니다.
    신간 알림 안내
    LLM Master: 로컬 LLM Serving with Python 웹툰 신간 알림이 취소되었습니다.
    리뷰작성
    • 구매 후 90일 이내 작성 시, e교환권 100원 (최초1회)
    • 리워드 제외 상품 : 마이 > 라이브러리 > Klover리뷰 > 리워드 안내 참고
    • 콘텐츠 다운로드 또는 바로보기 완료 후 리뷰 작성 시 익일 제공
    감성 태그

    가장 와 닿는 하나의 키워드를 선택해주세요.

    사진 첨부(선택) 0 / 5

    총 5MB 이하로 jpg,jpeg,png 파일만 업로드 가능합니다.

    신고/차단

    신고 사유를 선택해주세요.
    신고 내용은 이용약관 및 정책에 의해 처리됩니다.

    허위 신고일 경우, 신고자의 서비스 활동이 제한될 수
    있으니 유의하시어 신중하게 신고해주세요.


    이 글을 작성한 작성자의 모든 글은 블라인드 처리 됩니다.

    문장수집 작성

    구매 후 90일 이내 작성 시, e교환권 100원 적립

    eBook 문장수집은 웹에서 직접 타이핑 가능하나, 모바일 앱에서 도서를 열람하여 문장을 드래그하시면 직접 타이핑 하실 필요 없이 보다 편하게 남길 수 있습니다.

    P.
    LLM Master: 로컬 LLM Serving with Python
    저자 모두보기
    저자(글)
    낭독자 모두보기
    sam 이용권 선택
    님이 보유하신 이용권입니다.
    차감하실 sam이용권을 선택하세요.
    sam 이용권 선택
    님이 보유하신 이용권입니다.
    차감하실 sam이용권을 선택하세요.
    sam 이용권 선택
    님이 보유하신 프리미엄 이용권입니다.
    선물하실 sam이용권을 선택하세요.
    결제완료
    e캐시 원 결제 계속 하시겠습니까?
    교보 e캐시 간편 결제
    sam 열람권 선물하기
    • 보유 권수 / 선물할 권수
      0권 / 1
    • 받는사람 이름
      받는사람 휴대전화
    • 구매한 이용권의 대한 잔여권수를 선물할 수 있습니다.
    • 열람권은 1인당 1권씩 선물 가능합니다.
    • 선물한 열람권이 ‘미등록’ 상태일 경우에만 ‘열람권 선물내역’화면에서 선물취소 가능합니다.
    • 선물한 열람권의 등록유효기간은 14일 입니다.
      (상대방이 기한내에 등록하지 않을 경우 소멸됩니다.)
    • 무제한 이용권일 경우 열람권 선물이 불가합니다.
    이 상품의 총서 전체보기
    네이버 책을 통해서 교보eBook 첫 구매 시
    교보e캐시 지급해 드립니다.
    교보e캐시 1,000원
    • 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
    • 한 ID당 최초 1회 지급 / sam 이용권 제외
    • 네이버 책을 통해 교보eBook 구매 이력이 없는 회원 대상
    • 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)
    구글바이액션을 통해서 교보eBook
    첫 구매 시 교보e캐시 지급해 드립니다.
    교보e캐시 1,000원
    • 첫 구매 후 3일 이내 다운로드 시 익일 자동 지급
    • 한 ID당 최초 1회 지급 / sam 이용권 제외
    • 구글바이액션을 통해 교보eBook 구매 이력이 없는 회원 대상
    • 교보e캐시 1,000원 지급 (유효기간 지급일로부터 7일)