- 영문명
- Predicting mathematics achievement using process data: A comparison of linear regression and random forest
- 발행기관
- 한국교육평가학회
- 저자명
- 우예진(Yejin Woo) 최윤정(Youn-Jeog Choi)
- 간행물 정보
- 『교육평가연구』제38권 제3호, 557~589쪽, 전체 33쪽
- 주제분류
- 사회과학 > 교육학
- 파일형태
- 발행일자
- 2025.09.30
6,760원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

국문 초록
본 연구는 PISA 2022 한국 수학 영역의 컴퓨터 기반 평가 데이터를 활용하여, 문항 특성(인지 수준, 유형, 변별도, 난이도)에 따라 재구성한 프로세스 데이터와 학습자 배경변인을 바탕으로 수학 학업성취 예측모형을 구축하고자 하였다. 총 6개의 모형을 설계하였으며, 모형 1은 학습자 배경변인만을 포함하였고, 모형 2~5는 학습자 배경변인과 문항의 단일 특성 기반 프로세스 데이터를, 모형 6은 학습자 배경변인과 문항의 모든 특성 기반 프로세스 데이터를 포함하였다. 선형회귀와 랜덤 포레스트 기법을 적용해, 모형별 예측 성능과 주요 예측 변인을 비교·분석하였다. 그 결과, 랜덤 포레스트가 전반적으로 더 우수한 성능을 보였고, 모형 2~5가 최종모형으로 선정되었다. 핵심 예측 변수로는 프로세스 데이터, 수학 자기효능감, 사회경제문화적 지위가 공통적으로 도출되었다. 본 연구는 문항 특성에 따른 프로세스 데이터가 수학 성취를 효과적으로 예측함을 보여준다.
영문 초록
This study aimed to construct a predictive model of mathematics achievement using computer-based assessment data from the mathematics domain of PISA 2022 in Korea. The model incorporated process data derived from item characteristics (cognitive level, item type, discrimination, and difficulty) along with learner background variables. Six models were developed: model 1 included only background variables; models 2 to 5 included background variables and process data based on a single item characteristic; and model 6 combined all variables. Linear regression and random forest algorithms were applied to compare predictive performance and identify key predictors. The results showed that random forest outperformed linear regression overall, and models 2 to 5 were selected as final models. The most important predictors included process data, mathematics self-efficacy, and socioeconomic and cultural status, demonstrating the effectiveness of process data in predicting mathematics achievement.
목차
Ⅰ. 서론
Ⅱ. 이론적 배경
Ⅲ. 연구방법
Ⅳ. 연구결과
Ⅴ. 결론 및 논의
참고문헌
키워드
해당간행물 수록 논문
- 서·논술형 평가에서 생성형 AI 활용 가능성 탐색: 리젠트 시험 데이터를 중심으로
- 다차원 적응형 검사에서 신규 문항의 잠재 특성 예측 정확도 비교
- 대규모 온라인 학습 로그 데이터 EdNet을 활용한 학습 참여도의 시계열 분석: 동적시간워핑 기법을 중심으로
- 프로세스 데이터를 활용한 수학 학업성취도 예측: 선형회귀와 랜덤 포레스트 비교
- PISA 2022 창의적 사고력 도메인별 예측 변수 구조 분석: 딥러닝 기반 해석 접근
- 오버샘플링과 머신러닝을 활용한 불균형 다중클래스 분류 성능 비교 연구
- 학교의 수학 학업 성취도 편차에 따른 경제·사회·문화적 취약 학생의 수학 성취도 예측 변수 탐색: 랜덤 효과를 반영한 XGBoost 활용
- 사교육 참여가 수학 정의적 태도와 학업성취도의 잠재계층 간 전이에 미치는 영향: 잠재계층 MIMIC 모형과 성장혼합모형을 결합한 잠재전이분석
- 랜덤 생존 포레스트의 교육 종단자료 분석 적용: 대학생의 사교육 참여 시점 예측을 중심으로
- 거주 지역에 따른 대학 진학 유형: 다중규모 지리가중회귀모형을 통한 공간적 영향 분석
- 다국면라쉬모형을 활용한 ChatGPT-4o의 논술형 평가 자동채점 정확도 및 채점자 효과 분석
- 논술형 평가 자동채점을 위한 머신러닝, 임베딩 벡터, 사전학습 언어모델 기반 분류기의 성능 비교 연구
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
