학술논문
불균형이 있는 다중 클래스 분류 문제에서 오버샘플링 기법 적용에 관한 연구
이용수 0
- 영문명
- A Study on the Application of Oversampling Techniques in Imbalanced Multi-Class Classification
- 발행기관
- 한국자료분석학회
- 저자명
- 차영호(YoungHo Cha) 이동혁(Donghyuk Lee)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.27 No.3, 741~757쪽, 전체 17쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2025.06.30
4,840원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

국문 초록
다중 클래스 분류 문제에서 특정 클래스의 표본 수가 현저히 적을 경우, 모델이 다수 클래스에 편향되어 학습되는 데이터 불균형 문제가 발생한다. 이러한 불균형은 소수 클래스의 패턴을 효과적으로 학습하는 데 어려움을 초래하여 전체 분류 성능이 저하될 수 있다. 이를 완화하기 위해 다양한 오버샘플링 기법이 제안되었으나, 대부분 이진 분류 문제를 대상으로 개발된 방법들이므로 다중 클래스 분류 문제에 직접 적용하기에는 한계가 있다. 이에 본 연구에서는 다중 클래스 데이터에서 소수 클래스 간의 균형을 일정 수준 유지하면서 적용할 수 있도록 오버샘플링 기법을 두 가지 방법 내에서 적용하고, 이를 다중 클래스 분류 분해 방법과 결합하는 프레임워크를 구축하였다. 제안된 프레임워크의 성능을 평가하기 위해 다양한 불균형 비율을 설정한 모의실험을 수행하였으며, 실제 데이터에 대한 적용 가능성을 검토하기 위해 Kaggle에서 제공하는 태아 건강 데이터를 분석하였다. 실험 결과, 제안된 프레임워크는 다양한 불균형 상황에서 기존 방법 대비 우수한 분류 성능을 보였으며, 실제 데이터 분석에서도 효과적인 결과를 보였다. 이러한 결과는 제시된 접근 방법이 불균형 다중 클래스 분류 문제에 일반적으로 활용될 수 있음을 시사하며, 향후 의료 진단과 같은 다양한 응용 분야에서 유용하게 적용될 것으로 기대된다.
영문 초록
In multi-class classification problems, severe class imbalance can cause models to be biased toward the majority class, making it difficult to effectively learn patterns from minority classes and ultimately degrading overall classification performance. Various oversampling techniques have been proposed to mitigate this issue; however, most were originally designed for binary classification and are not directly applicable to multi-class scenarios. To address this limitation, this study applies oversampling techniques within two distinct approaches that maintain a balanced distribution among minority classes and integrates them with multi-class decomposition methods to construct a comprehensive framework. The effectiveness of the proposed framework was evaluated through simulation experiments under different imbalance ratios, and its applicability to real-world data was examined using the Fetal Health Classification dataset from Kaggle. The results demonstrate that the proposed framework outperforms existing methods across various imbalance scenarios and yields promising outcomes in real-world data analysis. These findings suggest that the proposed approach can be broadly applied to multi-class imbalance problems and holds significant potential for practical use in domains such as medical diagnostics.
목차
1. 서론
2. 오버샘플링 및 다중 클래스 분류 분해 방법론
3. 다중 클래스 불균형 데이터의 분류 모델 구축
4. 모의실험
5. 태아 건강 데이터 분석
6. 결론
References
키워드
해당간행물 수록 논문
- 생애주기별 경제문제와 결혼생활 평가가 결혼 만족도와 삶의 질에 미치는 영향
- 시간 흐름에 따른 정서 편향의 변화: 반응시간과 표류 확산 모델을 활용한 분석
- PLAS 기반 커뮤니티 텍스트 분석: 정치적 성향에 따른 언어 및 심리 특성 비교
- 엘리트 학자의 학술적 기여와 지식불균형: ICA 펠로우의 정책 영향력 분석
- The Effects of Elderly Internet Use on Daily Life Satisfaction: Mediating Effects of Social Networks and Moderating Effects of Digital Efficacy
- A Recent Analysis of Markov Regime Shift Behaviors of the Korean Stock Market
- Dynamics of Term Structure and Macroeconomy with Market Uncertainty
- Journal of The Korean Data Analysis Society (JKDAS) Vol.27 No.3 Contents
- 불균형이 있는 다중 클래스 분류 문제에서 오버샘플링 기법 적용에 관한 연구
- 후쿠시마 원자력 발전소 오염수 방류가 수산물 가격에 미치는 단기적 영향
- 다섯수치요약에 근거한 정규성 검정법 제안
- 사이버범죄 데이터에 대한 분석과 판별 모형에 관한 연구
- 자율주행 도메인에서 LoRA 기반 sLLM 파인튜닝 연구
- 한국어 뉴스 데이터의 AI 생성 여부를 판별하기 위한 임베딩 방법과 머신러닝 모형의 적용에 관한 사례연구
- 베이지안 헤도닉 가격 모형: 미술품 가격-제작 시기 연관성 연구에의 응용
- AI 기반 추천 시스템의 전략적 설계와 사용자 경험 변화 분석: MLOps 자동화를 통한 금융 앱 실험
- GMM을 이용한 경제적 자유 하에서 경제성장에 대한 외국인 직접투자 유입과 금융발전의 영향 분석
- 순환신경망 기반 전력 데이터 분석을 활용한제조설비 운영 상태 예측 사례 연구
- 임금근로자의 국민연금 미가입 특성에 관한 실증분석
- 기업의 환경, 사회적 성과가 대규모기업집단 지배주주일가 임원의 보수에 미치는 영향
- 20-30대 한국인 운전자의 운전스타일 분류 연구: MDSI의 문화적 타당성 검증
- 기업 회생 예측 모형에 관한 연구
- 기업의 문화적 자본이 구성원의 혁신행동에 미치는 영향 연구: 부르디외의 문화적 자본 개념의 응용 관점에서
- 영구 장애 산재근로자의 장애 수용이 삶의 질에 미치는 영향: 자기효능감의 매개효과를 중심으로
참고문헌
관련논문
자연과학 > 통계학분야 BEST
- 의사결정나무 분석에 대한 국내 연구 동향 탐색
- 대학 재학생들의 중도탈락 패턴 분석 및 이탈 예측: H 대학교를 중심으로
- 가정 내 아동학대 행위자 특성에 따른 유형분류: 잠재계층분석(Latent Class Analysis)을 중심으로
자연과학 > 통계학분야 NEW
- 생애주기별 경제문제와 결혼생활 평가가 결혼 만족도와 삶의 질에 미치는 영향
- 시간 흐름에 따른 정서 편향의 변화: 반응시간과 표류 확산 모델을 활용한 분석
- PLAS 기반 커뮤니티 텍스트 분석: 정치적 성향에 따른 언어 및 심리 특성 비교
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
