학술논문
데이터 증강 방법에 따른 에세이 자동채점 모델의 성능 검증
이용수 8
- 영문명
- Performance Evaluation of Automated Essay Scoring Models According to Data Augmentation Methods
- 발행기관
- 한국교육평가학회
- 저자명
- 홍익현(Ikhyeon Hong) 이용상(Yongsang Lee)
- 간행물 정보
- 『교육평가연구』제38권 제2호, 415~438쪽, 전체 24쪽
- 주제분류
- 사회과학 > 교육학
- 파일형태
- 발행일자
- 2025.06.30
5,680원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

국문 초록
한국어 에세이 자동채점 시스템이 충분한 성능을 보장하기 위해서는 대량의 양질 데이터가 필요하지만 현실적으로 이러한 데이터를 확보하는 것에는 많은 어려움이 따른다. 따라서 부족한 데이터 확보 방안으로 데이터 증강에 대한 관심이 높아지고 있으며 이에 본 연구에서는 대규모 언어 모델 기반 데이터 증강 기법이 자동채점 모델 성능에 미치는 영향을 탐색하였다. 500개의 대학생 에세이 답안을 활용하여 점수대별 150개가 되도록 균형을 맞춰 증강하는 방식과 원데이터를 2배수 증강하는 2가지 방식 간에 자동채점 모델의 성능을 비교하였다. 방식별 10회의 독립적 반복 실험 결과, 점수별로 균등하게 증강한 방식이 2배수 증강 방식보다 더 좋은 성능을 보였으며, 특히 원본 데이터에서 부족했던 점수대의 예측 성능이 크게 향상되었다. 이는 단순히 데이터양을 늘리는 것보다 점수대 간 균형을 맞춰 데이터 불균형 문제를 해소하는 전략이 더 효과적임을 시사한다.
영문 초록
Automated essay scoring systems for Korean essays require large amounts of quality data to ensure adequate performance, but securing such data in reality poses many challenges. Therefore, interest in data augmentation as a solution for insufficient data is growing, and this study explored the impact of large language model-based data augmentation techniques on automated scoring model performance. Using 500 college student essay responses, we compared two augmentation methods: balancing to achieve 150 samples per score level versus doubling the original dataset. After 10 independent repetitions of experiments for each method, the balanced augmentation approach showed better performance than simply doubling the dataset, with significant improvements in prediction accuracy for previously underrepresented score levels. This suggests that strategies addressing data imbalance by equalizing score distributions are more effective than merely increasing data volume.
목차
Ⅰ. 서론
Ⅱ. 선행 연구 분석
Ⅲ. 연구방법
Ⅳ. 연구 결과
Ⅴ. 결론 및 논의
참고문헌
키워드
해당간행물 수록 논문
- IRT 능력 분포 모수 추정량의 표준오차 추정
- 순서형 반응변수 예측을 위한 순서 랜덤 포레스트 적용
- 스태킹 앙상블(Stacking Ensemble) 기법을 활용한 청소년의 인지적 공감과 사회적 행동 간의 불일치 예측
- 혼합척도에서의 표현효과 탐지와 통제 방안: 제약된 요인혼합모형(CFMM)의 적용
- GPT 기반 초등학교 서술형 평가 자동채점 서비스 개발 및 적용
- 고차원적 사고력과 학문 문식성에 기반한 IBDP 역사 교과 평가 분석
- 중등 예비교사의 생성형 AI 활용 평가에 대한 수용성 및 영향요인 간의 관계 분석
- 데이터 증강 방법에 따른 에세이 자동채점 모델의 성능 검증
참고문헌
관련논문
사회과학 > 교육학분야 BEST
- 학업적 자기효능감 척도 개발 및 타당화 연구
- 제4차 산업혁명시대의 인간상과 교육의 방향 및 제언
- 미국 고교학점제의 특징과 한국 고교학점제 시행을 위한 정책적 시사점: 노스캐롤라이나 주의 운용 사례를 중심으로
사회과학 > 교육학분야 NEW
- 스포츠를 중심으로 한 마을공동체 구성원의 학습경험에 대한 연구: 렉섬 사례를 중심으로
- 성인 문해능력 수준 결정요인의 변화 양상: 의사결정나무를 활용한 2014년과 2023년 비교 연구
- 학습도시를 활용한 스마트시티의 디자인 개선
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
