- 영문명
- Performance Comparison Study of Machine Learning, Embedding Vector, and Pre-trained Language Model for Automated Essay Scoring
- 발행기관
- 한국교육평가학회
- 저자명
- 박종임(Jong-im Park) 김길재(Giljae Kim) 박강윤(Kangyun Park) 최숙기(Sook-ki Choi)
- 간행물 정보
- 『교육평가연구』제38권 제3호, 795~822쪽, 전체 28쪽
- 주제분류
- 사회과학 > 교육학
- 파일형태
- 발행일자
- 2025.09.30
6,160원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

국문 초록
본 연구는 한국어 논술형 평가 자동채점 모델의 성능을 비교하기 위해 채점자질 기반 머신러닝 모델(Extra Trees, Random Forest, LightGBM), 임베딩 벡터 기반 심층신경망 모델(OpenAI Embedding, Sentence-BERT, Universal Sentence Encoder), 사전 학습 모델(KLUE-RoBERTa-base, XLM-RoBERTa-base)을 활용하였다. 중등학생 논술형 응답 데이터셋(9,762편)을 기반으로 모델을 학습 및 평가한 결과, 사전 학습 모델 중 XLM-RoBERTa-base가 최고 성능을 보였고, 임베딩 기반 모델에서는 OpenAI Embedding 모델이 최고 성능을 보였으며, 채점자질 기반 모델에서는 Extra Trees 모델이 가장 우수했다. 결과적으로 정확도를 기준으로 하는 성능 비교에서는 사전 학습 모델이 가장 우수하지만 자동채점의 활용 상황과 모델의 해석 가능성 등을 함께 고려하여 선택될 필요가 있고, 향후에는 한 가지 모델이 아닌 하이브리드 모델 개발의 필요성을 제안한다.
영문 초록
This study utilized scoring feature-based machine learning models(Extra Trees, Random Forest, LightGBM), embedding vector-based deep neural network models(OpenAI Embedding, Sentence-BERT, Universal Sentence Encoder), and pre-trained models(KLUE-RoBERTa-base, XLM-RoBERTa-base) to compare the performance of automated scoring models for Korean essay-type responses. Based on a dataset of 9,762 argumentative writing samples from middle and high school students, the models were trained and evaluated. The results showed that among the pre-trained models, XLM-RoBERTa-base achieved the highest accuracy among the embedding-based models, OpenAI Embedding demonstrated the highest accuracy and among the scoring feature-based models, Extra Trees performed the best with an accuracy. Furthermore, although pre-trained models showed the superior performance in the comparison, model selection should consider interpretability in conjunction with the purpose of automated scoring, and the development of hybrid models rather than single models is proposed for the future.
목차
Ⅰ. 서론
Ⅱ. 이론적 배경
Ⅲ. 연구 방법
Ⅳ. 연구 결과
Ⅴ. 결론 및 논의
참고문헌
키워드
해당간행물 수록 논문
- 서·논술형 평가에서 생성형 AI 활용 가능성 탐색: 리젠트 시험 데이터를 중심으로
- 다차원 적응형 검사에서 신규 문항의 잠재 특성 예측 정확도 비교
- 대규모 온라인 학습 로그 데이터 EdNet을 활용한 학습 참여도의 시계열 분석: 동적시간워핑 기법을 중심으로
- 프로세스 데이터를 활용한 수학 학업성취도 예측: 선형회귀와 랜덤 포레스트 비교
- PISA 2022 창의적 사고력 도메인별 예측 변수 구조 분석: 딥러닝 기반 해석 접근
- 오버샘플링과 머신러닝을 활용한 불균형 다중클래스 분류 성능 비교 연구
- 학교의 수학 학업 성취도 편차에 따른 경제·사회·문화적 취약 학생의 수학 성취도 예측 변수 탐색: 랜덤 효과를 반영한 XGBoost 활용
- 사교육 참여가 수학 정의적 태도와 학업성취도의 잠재계층 간 전이에 미치는 영향: 잠재계층 MIMIC 모형과 성장혼합모형을 결합한 잠재전이분석
- 랜덤 생존 포레스트의 교육 종단자료 분석 적용: 대학생의 사교육 참여 시점 예측을 중심으로
- 거주 지역에 따른 대학 진학 유형: 다중규모 지리가중회귀모형을 통한 공간적 영향 분석
- 다국면라쉬모형을 활용한 ChatGPT-4o의 논술형 평가 자동채점 정확도 및 채점자 효과 분석
- 논술형 평가 자동채점을 위한 머신러닝, 임베딩 벡터, 사전학습 언어모델 기반 분류기의 성능 비교 연구
참고문헌
- 청람어문교육
- 청람어문교육
- 한국정보과학회 언어공학연구회, 제34회 한글 및 한국어 정보처리 학술대회 논문집
- 작문연구
- The Journal of Technology, Learning and Assessment
- Transactions of the Association for Computational Linguistics
- Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics
- TESOL Quarterly
- Scientific Studies of Reading
- Computers in Human Behavior
- Journal of Technology, Learning, and Assessment
- Proceedings of the 21st Conference on Computational Natural Language Learning (CoNLL 2017)
- Educational Researcher
- IEEE Access
- Advances in Neural Information Processing Systems
- Assessing Writing
- Research Methods in Applied Linguistics
- Computational Linguistics
- Phi Delta Kappan
- Journal of Experimental Education
- In M. D. Shermis & J. C. Burstein (Eds.), Automated essay scoring: A cross-disciplinary perspective
- Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP)
- Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)
- ETS Research Report Series
- Journal of Machine Learning Research
- Journal of Educational Technology
- Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing
- Journal of Information Technology Education
- Advances in Neural Information Processing Systems 30: Annual Conference on Neural Information Processing Systems 2017
- Journal of Student Research
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
