Machine-Learning and Corpus-Based Analyses of Korean Nouns from Subjects and Objects: Stimuli Development of Verb Treatment for Neurogenic Communication Disorders
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
1:1 문의
국문 초록
배경 및 목적: 본 연구는 신경언어장애군의 동사 중재 자극으로 쓰이는 동사의 주격 및 목적격 명사의 한국어 특징을 빅데이터 기반으로 분석하였다. 또한 분석한 원자료는 향후 동사 중재 관련 연구에 활용할 수 있도록 클라우드에 배포하여 공유하였다. 방법: 교과서 말뭉치에서 목표 동사와 결합한 주격 및 목적격 명사 간 출현빈도수 및 유형수 차이를 분석하여 주어생략현상을 확인하였다. 또한 목표 동사로부터 주격 및 목적격 명사까지의 의미거리를 기계학습으로 산출하여 의미거리 분포 차이를 분석하였다. 더불어 기계학습으로 산출한 의미거리와 한국어 화자들이 인식하고 있는 의미거리 간 상관관계를 살펴보았다. 결과: 주격 명사는 목적격 명사보다 유의하게 출현빈도수 및 유형수가 낮았으며, 동사와의 기계학습 기반 의미거리가 더 멀었다. 기계학습으로 산출한 의미거리는 행동데이터와 강한 정적 상관관계를 보였다. 논의 및 결론: 본 연구에서 밝힌 한국어의 주어생략현상은 한국어를 사용하는 신경언어장애군의 특징을 설명하는 근거자료로 활용될 수 있다. 주격 명사와 동사 간 기계학습 기반 의미거리가 멀다는 결과는 앞으로 한국어를 사용하는 신경언어장애군을 위한 동사 중재에서 주격 명사의 활용 방안이 재고될 필요가 있음을 시사하였다. 더불어 기계학습으로 산출한 의미거리를 중재 자극 선정에서 하나의 기준으로 사용할 수 있는 가능성을 확인하였으나, 차후 정밀한 추가 검증이 필요하다.
영문 초록
Objectives: Subjects and objects associated with treatment verbs are common stimuli in verb treatment using the argument structure for neurogenic patients. This study investigated Korean nouns from subjects and objects associated with the target verbs in the corpus to suggest the characteristics of subjects and objects for developing Korean-specific verb treatment stimuli. In addition, we shared raw data through cloud so that anyone can use the data for clinical or academic purposes. Methods: We used Korean textbook corpus to investigate the differences between subjects and objects in terms of frequency, number of type, and machine-learning based semantic distance to the target verbs. We also examined how machine-learning based semantic distance is correlated with behavioral rating semantic distance. Results: Subjects significantly showed less frequency, less number of types, and farther machine-learning based distance to the target verbs than objects did. Machine-learning based semantic distance was strongly correlated with behavioral rating. Conclusion: The results demonstrated strong evidence of the subject ellipsis phenomenon in Korean. The weak semantic relation, as proven by the machine-learning based semantic distance, indicated that subjects as verb stimuli for Korean-speaking neurogenic patients need to be reconsidered. We confirmed the possibility of machine-learning based semantic distance as a criterion in selecting the treatment stimuli, but more detailed verification is required for future studies.
박채원(Chaewon Park),임윤섭(Yoonseob Lim),성지은(Jee Eun Sung). (2019).Machine-Learning and Corpus-Based Analyses of Korean Nouns from Subjects and Objects: Stimuli Development of Verb Treatment for Neurogenic Communication Disorders. Communication Sciences & Disorders, 24 (4), 968-985
MLA
박채원(Chaewon Park),임윤섭(Yoonseob Lim),성지은(Jee Eun Sung). "Machine-Learning and Corpus-Based Analyses of Korean Nouns from Subjects and Objects: Stimuli Development of Verb Treatment for Neurogenic Communication Disorders." Communication Sciences & Disorders, 24.4(2019): 968-985