이상 탐지 입문: 개념부터 모델까지
2026년 01월 02일 출간
- eBook 상품 정보
- AI(생성형) 활용 제작 도서
- 파일 정보 ePUB (0.43MB)
- ISBN 9791175471832
- 지원기기 교보eBook App, PC e서재, 리더기, 웹뷰어
-
교보eBook App
듣기(TTS) 가능
TTS 란?텍스트를 음성으로 읽어주는 기술입니다.
- 전자책의 편집 상태에 따라 본문의 흐름과 다르게 텍스트를 읽을 수 있습니다.
- 이미지 형태로 제작된 전자책 (예 : ZIP 파일)은 TTS 기능을 지원하지 않습니다.
이 상품은 배송되지 않는 디지털 상품이며,
교보eBook앱이나 웹뷰어에서 바로 이용가능합니다.
작품소개
이 상품이 속한 분야
책의 출발점은 이상 탐지의 문제 정의다. 무엇을 이상이라고 부를지, 탐지 결과가 어떤 형태로 제공되어야 하는지, 오탐과 미탐이 각각 어떤 비용과 의미를 갖는지 등을 정리하며, 독자가 ‘탐지’라는 작업의 목표를 명확히 잡도록 안내한다. 이어서 데이터가 어떤 구조를 가지는지, 결측과 노이즈, 불균형과 편향이 왜 이상 탐지를 어렵게 만드는지 살펴본다. 이를 통해 모델을 다루기 전에 데이터와 문제의 바닥을 먼저 다지는 흐름을 유지한다.
중반부에서는 이상 탐지의 대표적인 접근들을 ‘아이디어 중심’으로 설명한다. 통계적 관점에서는 분포와 변동성, 급격한 변화의 개념을 통해 이상 신호가 어떻게 드러나는지 다룬다. 거리와 밀도 기반 관점에서는 유사성과 희귀성을 이상 점수로 바꾸는 직관을 소개하고, 군집 기반 관점에서는 “어디에도 속하지 못하는 데이터”를 어떻게 해석할 수 있는지 설명한다. 또한 레이블이 있거나 부족한 상황을 가정해 지도 및 반지도 관점에서의 기본적인 학습 틀을 제시하고, 입력을 다시 재구성하는 방식이 왜 이상 탐지에서 유용한지 재구성 관점의 모델들로 정리한다. 각 접근법은 수학적 엄밀함보다는, 무엇을 전제로 하고 어떤 상황에서 흔들리는지를 이해하는 데 집중한다.
후반부는 모델 자체보다 시스템을 구성하는 기본 요소에 시선을 둔다. 학습과 검증을 어떻게 분리할지, 임계값을 어떤 원칙으로 설정할지, 경보가 과도해지거나 무뎌지는 현상을 어떻게 점검할지 같은 운영 이전 단계의 필수 점검 항목을 다룬다. 이를 통해 독자는 “모델만 바꾸면 해결된다”는 오해에서 벗어나, 이상 탐지가 데이터와 기준선, 평가와 임계값의 조합으로 성립한다는 사실을 자연스럽게 이해하게 된다.
이 책은 저자의 체험담이나 특정 산업의 고급 응용을 앞세우지 않는다. 대신 누구나 동일한 출발점에서 따라갈 수 있도록, 개념의 정의와 관계, 접근법의 기본 원리, 그리고 결과를 해석할 때 반드시 짚어야 할 관점을 차근차근 제공한다. 이상 탐지를 처음 배우는 독자에게는 길잡이가 되고, 이미 몇 가지 모델 이름을 들어본 독자에게는 흩어진 지식을 체계로 묶어주는 기준점이 될 것이다.
이상과 정상의 구분이 필요한 이유
이상 탐지 문제의 전형적 형태와 입력·출력
탐지와 분류·예측·품질검사의 차이
이상 탐지에서 오탐과 미탐이 의미하는 것
이상 탐지 파이프라인의 큰 흐름
2장 데이터와 이상 신호의 형태
관측치, 변수, 샘플의 기본 구조 이해
연속형·범주형 데이터에서 나타나는 이상 양상
결측과 이상값의 구분이 어려운 상황
희소 데이터에서 이상이 드러나는 방식
데이터 규모와 차원이 탐지에 주는 영향
데이터 누출과 편향이 생기는 대표적 원인
3장 기준선 만들기와 정상성 가정
정상이라는 개념을 정하는 방법
단일 지표 기준선과 다변량 기준선
고정 임계값과 적응형 임계값의 차이
계절성·추세가 있는 데이터에서 기준선의 의미
정상 분포 가정과 그 한계
기준선이 흔들릴 때 나타나는 오류 유형
4장 탐지 성능을 어떻게 평가하는가
정답 레이블이 있을 때의 평가 관점
정답 레이블이 없을 때의 평가 관점
임계값 변화에 따른 성능 변동 이해
탐지 지연과 탐지 민감도의 균형
불균형 데이터에서 성능이 왜곡되는 이유
평가를 흔드는 대표적 함정과 해석 주의점
실험 분리와 검증 절차의 기본 원칙
5장 통계적 이상 탐지의 핵심 아이디어
분포 기반 관점으로 이상을 정의하기
z-점수와 표준화가 의미하는 것
사분위수·IQR 기반 규칙의 해석
이동평균·이동표준편차로 보는 변동성
변화점 관점에서의 이상과 급변의 구분
다변량에서 공분산 구조가 주는 정보
통계적 접근이 강한 상황과 약한 상황
6장 거리와 밀도 기반 방법의 기초
거리 기반 이상 점수의 직관
최근접 이웃 관점으로 보는 고립 정도
밀도 기반 관점으로 보는 희귀성
고차원에서 거리 개념이 약해지는 이유
특징 스케일링이 결과를 바꾸는 방식
유사도 측정 선택이 주는 영향
이상 점수의 분포를 해석하는 방법
7장 군집 기반 방법의 기초
군집 중심에서 먼 점을 이상으로 보는 관점
군집이 잘 형성되지 않을 때의 문제
군집 수 선택이 탐지에 미치는 영향
군집 경계 근처 데이터의 애매함 다루기
군집 결과를 점수로 바꾸는 방법
군집 기반 방법이 유리한 데이터 조건
군집 기반 방법의 흔한 오해와 주의점
8장 지도·반지도 학습으로 보는 이상 탐지
레이블이 있을 때의 기본 분류 접근
레이블이 부족할 때의 반지도 관점
정상 클래스만 학습하는 문제 설정
학습 데이터의 불완전성이 주는 위험
특성 선택이 성능에 미치는 일반적 원리
과적합을 피하기 위한 기본 규칙
모델 출력 점수를 임계값으로 바꾸는 절차
9장 재구성 관점의 기본 모델들
입력을 다시 만들어보는 관점의 의미
재구성 오차를 이상 점수로 쓰는 이유
차원 축소 모델이 주는 압축 효과
재구성 모델이 실패하는 대표적 패턴
정상 데이터 다양성이 재구성에 미치는 영향
노이즈와 이상을 구분하기 어려운 이유
재구성 오차 분포를 해석하는 방법
10장 이상 탐지 시스템의 기본 구성과 점검
데이터 수집에서 전처리까지의 기본 흐름
학습·검증·테스트 분리의 표준 절차
임계값 설정과 재설정의 기본 원칙
경보 생성과 억제 규칙의 기본 형태
모니터링 지표와 데이터 드리프트의 징후
오류 분석의 기본 질문 목록 만들기
재현 가능한 실험 기록과 모델 버전 관리의 기초
인물정보
저자(글) 지식이야기 제작팀
세상의 모든 궁금증을 명쾌하게 풀어내는 지식 파트너, 지식이야기. 우리는 어렵고 딱딱한 지식을 흥미로운 콘텐츠로 재구성하여 누구나 즐겁게 배움의 기쁨을 누릴 수 있도록 노력합니다. 실용적인 정보부터 깊은 통찰까지, 당신의 어제보다 더 나은 오늘을 만드는 지식 서적을 선보입니다.
이 상품의 총서
Klover리뷰 (0)
- - e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- - 리워드는 5,000원 이상 eBook, 오디오북, 동영상에 한해 다운로드 완료 후 리뷰 작성 시 익일 제공됩니다. (2024년 9월 30일부터 적용)
- - 리워드는 한 상품에 최초 1회만 제공됩니다.
- - sam 이용권 구매 상품 / 선물받은 eBook은 리워드 대상에서 제외됩니다.
- 도서나 타인에 대해 근거 없이 비방을 하거나 타인의 명예를 훼손할 수 있는 리뷰
- 도서와 무관한 내용의 리뷰
- 인신공격이나 욕설, 비속어, 혐오 발언이 개재된 리뷰
- 의성어나 의태어 등 내용의 의미가 없는 리뷰
구매 후 리뷰 작성 시, e교환권 100원 적립
문장수집
- 구매 후 90일 이내에 문장 수집 등록 시 e교환권 100원을 적립해 드립니다.
- e교환권은 적립일로부터 180일 동안 사용 가능합니다.
- 리워드는 5,000원 이상 eBook에 한해 다운로드 완료 후 문장수집 등록 시 제공됩니다. (2024년 9월 30일부터 적용)
- 리워드는 한 상품에 최초 1회만 제공됩니다.
- sam 이용권 구매 상품 / 선물받은 eBook / 오디오북·동영상 상품/주문취소/환불 시 리워드 대상에서 제외됩니다.
구매 후 문장수집 작성 시, e교환권 100원 적립
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!