- 영문명
- Application of Random Survival Forest to Educational Longitudinal Data Analysis: Focusing on Predicting the Timing of University Students’ Private Tutoring Participation
- 발행기관
- 한국교육평가학회
- 저자명
- 김미림(Meereem Kim)
- 간행물 정보
- 『교육평가연구』제38권 제3호, 711~737쪽, 전체 27쪽
- 주제분류
- 사회과학 > 교육학
- 파일형태
- 발행일자
- 2025.09.30
6,040원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

국문 초록
본 연구의 목적은 머신러닝 기반 생존 분석 기법인 랜덤 생존 포레스트(random survival forest, RSF)의 특성과 분석 절차를 소개하고, 교육 종단자료에 적용하여 방법론적 유용성을 탐색하는 것이다. 이를 위해「한국교육종단연구 2005」자료의 대학생 3,656명을 대상으로 취업 관련 사교육 최초 참여를 사건으로 정의하여 RSF와 Cox 모형 및 Kaplan-Meier 방법의 예측 성능을 비교하였다. 분석 결과, RSF는 Cox 모형과 유사한 예측 정확도를 보이면서도 변수 선택 과정 없이 안정적으로 분석되었으며, Kaplan-Meier 방법 대비 전체 추적 기간에 걸쳐 일관되게 우수한 예측 성능을 나타냈다. 변수 중요도 분석을 통해 예측에 기여하는 핵심 변수를 확인하고, 부분 의존성 도표와 누적위험함수 곡선을 통해 각 변수의 예측 기여 양상과 시간에 따른 사건 발생 위험의 누적 패턴을 시각적으로 분석할 수 있었다. 본 연구는 RSF의 교육 종단자료 분석 적용 가능성을 탐색함으로써 교육 종단연구의 방법론적 다양성 확장에 기여하였다.
영문 초록
This study introduces random survival forest (RSF), a machine learning-based survival analysis technique, and validates its utility for educational longitudinal data. RSF is a non-parametric method that handles non-linear relationships and variable interactions without the proportional hazards assumption. Using data from 3,656 university students in the Korean Education Longitudinal Study 2005, we compared RSF with the Cox model and the Kaplan-Meier method for predicting initial participation in employment-related private tutoring. RSF achieved similar predictive accuracy to the Cox model while operating stably without variable selection procedures, and demonstrated superior performance compared to the Kaplan-Meier method throughout the follow-up period. Variable importance analysis identified key predictive factors, and partial dependence plots visualized each variable’s contribution patterns and cumulative risk over time. This study contributes to expanding methodological diversity in educational longitudinal research by demonstrating RSF’s applicability to educational data analysis.
목차
Ⅰ. 서론
Ⅱ. 이론적 배경
Ⅲ. 연구 방법
Ⅳ. 연구 결과
Ⅴ. 결론 및 논의
참고문헌
키워드
해당간행물 수록 논문
- 서·논술형 평가에서 생성형 AI 활용 가능성 탐색: 리젠트 시험 데이터를 중심으로
- 다차원 적응형 검사에서 신규 문항의 잠재 특성 예측 정확도 비교
- 대규모 온라인 학습 로그 데이터 EdNet을 활용한 학습 참여도의 시계열 분석: 동적시간워핑 기법을 중심으로
- 프로세스 데이터를 활용한 수학 학업성취도 예측: 선형회귀와 랜덤 포레스트 비교
- PISA 2022 창의적 사고력 도메인별 예측 변수 구조 분석: 딥러닝 기반 해석 접근
- 오버샘플링과 머신러닝을 활용한 불균형 다중클래스 분류 성능 비교 연구
- 학교의 수학 학업 성취도 편차에 따른 경제·사회·문화적 취약 학생의 수학 성취도 예측 변수 탐색: 랜덤 효과를 반영한 XGBoost 활용
- 사교육 참여가 수학 정의적 태도와 학업성취도의 잠재계층 간 전이에 미치는 영향: 잠재계층 MIMIC 모형과 성장혼합모형을 결합한 잠재전이분석
- 랜덤 생존 포레스트의 교육 종단자료 분석 적용: 대학생의 사교육 참여 시점 예측을 중심으로
- 거주 지역에 따른 대학 진학 유형: 다중규모 지리가중회귀모형을 통한 공간적 영향 분석
- 다국면라쉬모형을 활용한 ChatGPT-4o의 논술형 평가 자동채점 정확도 및 채점자 효과 분석
- 논술형 평가 자동채점을 위한 머신러닝, 임베딩 벡터, 사전학습 언어모델 기반 분류기의 성능 비교 연구
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
