학술논문
사회언어학 연구를 위한 한국어 미세조정 언어모델
이용수 92
- 영문명
- Fine-tuned Korean Language Models for Sociolinguistic Studies
- 발행기관
- 한국사회언어학회
- 저자명
- 노강산(Kangsan Noh) 김수연(Soo-Yeon Kim) 최혜원(Hye-Won Choi) 장하연(Hayeun Jang) 송상헌(Sanghoun Song)
- 간행물 정보
- 『사회언어학』제32권 3호, 41~64쪽, 전체 24쪽
- 주제분류
- 어문학 > 언어학
- 파일형태
- 발행일자
- 2024.09.30
5,680원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

국문 초록
This paper aims to test deep-learning-based Korean language models’ capacity to learn and detect social registers embedded in speech data, specifically age, gender, and regional dialects. A comprehensive understanding of linguistic phenomena requires contextualizing speech based on speakers’ age, gender, and geographic background, along with the processing of syntactic structures. To bridge the gap between human language understanding and model processing, we fine-tuned three representative Korean language models—KR-BERT, KoELECTRA-base, and KLUE-RoBERTa-base—using transcribed data from 4,000 hours of speech by middle-aged and elderly Korean speakers. The findings reveal that KoELECTRA-base outperformed the other two models across all social registers, which is likely attributed to its larger vocabulary and parameters size. Among the dialects, the Jeju dialect showed the highest accuracy in inference, which is attributed to its distinctiveness, making it easier for the models to detect. In addition to the fine-tuning process, we have made our fine-tuned models publicly available to support researchers interested in Korean computational sociolinguistics.
영문 초록
목차
1. 서론
2. 배경
3. 방법
4. 결과
5. 논의
6. 결론
참고문헌
해당간행물 수록 논문
- 아동-양육자 간 상호작용에서 사용되는‘-는데’의 담화 기능
- 종속절의 반(反)사실성 표현들
- 담론의 대상으로서의 ‘조선어’ : 19세기 로마자 표기안의 검토를 바탕으로
- Discursive Representations of Institution-led Global Citizenship Education in South Korean Newspapers : A Critical Discourse Analysis
- 1970~90년대 한국 가요 유튜브 영상의 댓글 언어 분석: 조용필과 혜은이 노래를 중심으로
- 사회언어학 연구를 위한 한국어 미세조정 언어모델
- 언어차별 연구의 관행과 확장성 탐색
- 북한 방언과 북한이탈주민의 정체성 연구: ‘남북 언어의 이질감 극복’을 중심으로
참고문헌
관련논문
어문학 > 언어학분야 BEST
더보기어문학 > 언어학분야 NEW
- Bridging Cultures through Worship: Language Policy, Identity, and the Role of the Church in Times of Crisis
- Navigating Dual Linguistic Challenges: Chinese International Students’ Adaptation to English-Medium Instruction in Korean Higher Education
- 표현론적 관점에서 단어 형성의 한 특성: 남북한 경제 전문용어를 중심으로
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
