본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

형상점 자료의 변환을 통한 분류모형의 비교

이용수  0

영문명
Classification models using the conversion of shape landmark data
발행기관
한국자료분석학회
저자명
김준홍(Jun Hong Kim) 강창완(Changwan Kang) 최용석(Yong-Seok Choi)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.27 No.2, 451~463쪽, 전체 13쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2025.04.30
4,360

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

Dryden, Mardia(2016)는 형상분석(shape analysis)을 기하적 공간상에서 형상점들(landmarks)에 의해 나타낸 개체들(objects)의 형상(shape)을 측정 및 기술하며 이를 비교하는 분석이라 정의한다. 형상분석에 활용되는 형상점 자료는 배열(array)의 형태를 가지고 있는데, 이는 형상의 분류모형에 적용하기 어려움이 있는 형태이다. 본 연구는 형상점 자료를 분류모형에 적용하기 위한 두가지 방법을 제시한다. 첫 번째 방법은 GPA(Generalized Procrustes Analysis) 적합을 적용한 후 리만거리, 중심크기 및 형상주성분분석을 통한 형상 주성분점수를 얻어내어 이를 변수로 선택하는 방법이고, 두 번째 방법은 각 표본의 형태행렬(configuration matrix)을 벡터화하는 과정을 진행하여 좌푯값들을 모두 변수로써 사용하는 방법이다. 새롭게 얻어진 자료들을 랜덤 포레스트(random forest), 로지스틱 회귀분석(logistic regression analysis), 그리고 서포트벡터머신(support vector machine, SVM) 등 3가지의 분류모형에 투입하여 자료별 오분류율을 비교한다. 이를 위하여 Dryden, Mardia(2016)의 세 군집의 척추뼈 형상자료인 쥐(mice) 자료에 대하여 위의 방법을 적용하였다. 특히, 이 자료는 형상점의 수가 적은 2차원 자료인데 회전 모수가 군집 결정에 영향이 컸으며, 적합과정이 이루어지지 않은 원자료나 중심화 자료의 벡터화가 더 좋은 결과를 보였다.

영문 초록

Dryden, Mardia (2016) define shape analysis as an analysis that measures and describes the shapes of objects represented by landmarks in geometric space and compares them. The shape point data used for shape analysis has the form of an array, which is a form that is difficult to apply to the shape classification model. This study presents two methods for applying shape point data to the classification model. The first method is to apply the Generalized Prospects Analysis (GPA) fit and then obtain Riemannian distance, centroid size, and shape PC scores to select them as variables, and the second method is to vectorize the configuration matrix of each sample to use all coordinate values as variables. The data obtained by these two methods are put into three classification models: Random Forest, Logistic Regression Analysis, and SVM to compare the misclassification rates for each data. To this end, the method above was applied to the mice data from Dryden, Mardia (2016), and the results were examined. The comparison revealed that the mice data of three clusters, which is a 2-dimensional data set with a small number of shape points, showed that the rotation parameter had a significant impact on cluster determination. Additionally, vectorization of the original data or centered data, which had not undergone the fitting process, yielded better results.

목차

1. 서론
2. 이론적 배경
3. 사례분석
4. 결론
References

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

김준홍(Jun Hong Kim),강창완(Changwan Kang),최용석(Yong-Seok Choi). (2025).형상점 자료의 변환을 통한 분류모형의 비교. Journal of The Korean Data Analysis Society (JKDAS), 27 (2), 451-463

MLA

김준홍(Jun Hong Kim),강창완(Changwan Kang),최용석(Yong-Seok Choi). "형상점 자료의 변환을 통한 분류모형의 비교." Journal of The Korean Data Analysis Society (JKDAS), 27.2(2025): 451-463

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제