- 영문명
- Juvenile Recidivism Risk Prediction: Comparing the Predictive Performance of Random Forest and Logistic Regression
- 발행기관
- 한국공안행정학회
- 저자명
- 윤일홍(Ilhong Yun) 권해수(Haesoo Kweon) 이영면(Youngmyeon Lee)
- 간행물 정보
- 『한국공안행정학회보』제34권 3호, 163~200쪽, 전체 38쪽
- 주제분류
- 사회과학 > 행정학
- 파일형태
- 발행일자
- 2025.09.30
국문 초록
본 연구는 국내 소년범 재범 예측 진단 체계의 한계점을 비판적으로 고찰하고 머신러닝 기반의 랜덤 포레스트(Random Forest) 알고리즘을 적용하여 소년범 재범위험 예측 모형의 개발 및 검증을 시도하였다. 기존 소년범 재범 예측 도구는 주로 요인분석 또는 로지스틱 회귀분석을 기반으로 개발되어 왔으나 변수 간 비선형적 상호작용과 데이터 불균형, 과적합 등 다양한 한계를 지닌다. 본 연구에서는 법무부 소년원 출원생 1,736명의 TEAMS 자료를 분석 대상으로 하여 로지스틱 회귀와 랜덤 포레스트 모형의 예측 성능을 교차검증 및 오버샘플링(SMOTE), 임계값 최적화 등의 절차를 통해 비교ㆍ평가하였다. 그 결과, 랜덤 포레스트 모형은 로지스틱 회귀보다 일관되게 높은 AUC를 보이며 우수한 예측력을 나타냈으나, 민감도-특이도 간 불균형 문제가 존재하였고, 최적 임계값 적용을 통해 일정 부분 개선 가능함을 확인하였다. 또한 변수 중요도 및 부분의존도 분석을 통해 연령, 누적 비행력 등 주요 예측 변수를 도출하였다. 본 연구는 XAI(설명가능 인공지능) 및 SHAP 분석의 필요성을 논의하며 향후 맞춤형 처우와 과학적 사례 관리, 연구 윤리 확립 및 실증적 연구 문화 정착의 정책적ㆍ학문적 함의를 제시하였다.
영문 초록
This study critically examines the limitations of the current risk assessment systems for predicting juvenile recidivism in South Korea and seeks to develop and validate a machine learning-based prediction model using the Random Forest algorithm. Existing tools for juvenile recidivism prediction have been primarily developed using factor analysis or logistic regression, which face various limitations such as inability to capture nonlinear variable interactions, data imbalance, and overfitting. Using TEAMS data from 1,736 juvenile releasees from juvenile correctional institutions, this study compares and evaluates the predictive performance of logistic regression and Random Forest models through cross-validation, oversampling (SMOTE), and optimal cutoff value adjustment. The results show that the Random Forest model consistently outperforms logistic regression in terms of AUC, demonstrating superior predictive power, although issues with sensitivity-specificity imbalance remain. These were partly addressed by applying optimal cut-off points. Variable importance and partial dependence analyses identified age and cumulative delinquency as key predictors. The study discusses the necessity of explainable AI (XAI) and SHAP analyses, and highlights the policy and academic implications for tailored interventions, scientific case management, the establishment of research ethics, and the advancement of empirical research culture.
목차
Ⅰ. 서론
Ⅱ. 이론적 고찰
Ⅲ. 연구 방법
Ⅳ. 연구 결과
Ⅴ. 논의
참고문헌
해당간행물 수록 논문
참고문헌
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!