본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

불균형이 있는 다중 클래스 분류 문제에서 오버샘플링 기법 적용에 관한 연구

이용수  0

영문명
A Study on the Application of Oversampling Techniques in Imbalanced Multi-Class Classification
발행기관
한국자료분석학회
저자명
차영호(YoungHo Cha) 이동혁(Donghyuk Lee)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.27 No.3, 741~757쪽, 전체 17쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2025.06.30
4,840

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

다중 클래스 분류 문제에서 특정 클래스의 표본 수가 현저히 적을 경우, 모델이 다수 클래스에 편향되어 학습되는 데이터 불균형 문제가 발생한다. 이러한 불균형은 소수 클래스의 패턴을 효과적으로 학습하는 데 어려움을 초래하여 전체 분류 성능이 저하될 수 있다. 이를 완화하기 위해 다양한 오버샘플링 기법이 제안되었으나, 대부분 이진 분류 문제를 대상으로 개발된 방법들이므로 다중 클래스 분류 문제에 직접 적용하기에는 한계가 있다. 이에 본 연구에서는 다중 클래스 데이터에서 소수 클래스 간의 균형을 일정 수준 유지하면서 적용할 수 있도록 오버샘플링 기법을 두 가지 방법 내에서 적용하고, 이를 다중 클래스 분류 분해 방법과 결합하는 프레임워크를 구축하였다. 제안된 프레임워크의 성능을 평가하기 위해 다양한 불균형 비율을 설정한 모의실험을 수행하였으며, 실제 데이터에 대한 적용 가능성을 검토하기 위해 Kaggle에서 제공하는 태아 건강 데이터를 분석하였다. 실험 결과, 제안된 프레임워크는 다양한 불균형 상황에서 기존 방법 대비 우수한 분류 성능을 보였으며, 실제 데이터 분석에서도 효과적인 결과를 보였다. 이러한 결과는 제시된 접근 방법이 불균형 다중 클래스 분류 문제에 일반적으로 활용될 수 있음을 시사하며, 향후 의료 진단과 같은 다양한 응용 분야에서 유용하게 적용될 것으로 기대된다.

영문 초록

In multi-class classification problems, severe class imbalance can cause models to be biased toward the majority class, making it difficult to effectively learn patterns from minority classes and ultimately degrading overall classification performance. Various oversampling techniques have been proposed to mitigate this issue; however, most were originally designed for binary classification and are not directly applicable to multi-class scenarios. To address this limitation, this study applies oversampling techniques within two distinct approaches that maintain a balanced distribution among minority classes and integrates them with multi-class decomposition methods to construct a comprehensive framework. The effectiveness of the proposed framework was evaluated through simulation experiments under different imbalance ratios, and its applicability to real-world data was examined using the Fetal Health Classification dataset from Kaggle. The results demonstrate that the proposed framework outperforms existing methods across various imbalance scenarios and yields promising outcomes in real-world data analysis. These findings suggest that the proposed approach can be broadly applied to multi-class imbalance problems and holds significant potential for practical use in domains such as medical diagnostics.

목차

1. 서론
2. 오버샘플링 및 다중 클래스 분류 분해 방법론
3. 다중 클래스 불균형 데이터의 분류 모델 구축
4. 모의실험
5. 태아 건강 데이터 분석
6. 결론
References

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

차영호(YoungHo Cha),이동혁(Donghyuk Lee). (2025).불균형이 있는 다중 클래스 분류 문제에서 오버샘플링 기법 적용에 관한 연구. Journal of The Korean Data Analysis Society (JKDAS), 27 (3), 741-757

MLA

차영호(YoungHo Cha),이동혁(Donghyuk Lee). "불균형이 있는 다중 클래스 분류 문제에서 오버샘플링 기법 적용에 관한 연구." Journal of The Korean Data Analysis Society (JKDAS), 27.3(2025): 741-757

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제