학술논문
자기조직화지도를 이용한 분류문제에서의 결측자료 대체방법 연구
이용수 28
- 영문명
- Classification Using Self-organizing Maps with Missing Data
- 발행기관
- 한국자료분석학회
- 저자명
- 강동주(Dongjoo Kang) 송주원(Juwon Song)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.19 No.3, 1261~1272쪽, 전체 12쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2017.06.30
4,240원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

국문 초록
Kohonen(1990)에 소개된 자기조직화지도(self-organizing maps, SOM)는 비지도학습(unsupervised learning) 신경망(neural network) 모형의 한 종류로서 고차원 다변량 자료에 대한 군집분석과 저차원 시각화에 사용된다. 학습벡터 양자화(learning vector quantization, LVQ)는 벡터 양자화(vector quantization) 방법을 활용한 지도학습(supervised learning) 모형의 한 종류로서 사전에 정해진 개수의 노드로 구성된 판별경계를 베이즈 판별경계로 미세하게 조정하는 알고리즘이며 비선형 판별경계를 가지는 자료에 대한 판별분석에 유용하게 사용된다. 본 논문에서는 비선형의 판별경계를 구축해야 하는 경우 SOM 방법의 결과노드를 활용하는 것이 K-평균 군집분석의 결과노드를 활용하는 것보다 최적의 판별경계 구성에 유리할 수 있음을 모의실험을 통해 보였다. 또한 결측값이 존재하면서 비선형 판별경계를 가지고 있는 자료에 대해 일반적인 결측값 대체방법인 평균대체, 핫덱대체, 그리고 모형에 근거한 대체 방법으로 대체를 실시하였을 때 SOM을 활용한 LVQ 방법의 성능을 모의실험을 통해 알아보고 유리 판별 자료에 각 결측대체방법을 적용하여 판별결과를 비교하였다
영문 초록
Self-organizing maps (SOM) (Kohonen, 1990), one of the unsupervised learning neural network models, are used to conduct cluster analysis or visualize high dimensional data in a low dimensional space. Learning vector quantization (LVQ), one of the supervised learning models utilizing the vector quantization method, is an algorithm to adjust decision borders based on a chosen number of nodes for producing bayesian decision borders and usefully applied to discriminant analysis for data with nonlinear decision borders. Here, we conduct a simulation to show that initial nodes of LVQ based on the SOL algorithm performs better in finding optimal nonlinear decision borders than the ones based on the K-mean clustering method. When data with nonlinear decision borders include missing values, imputation can be implemented to fill in missing values. A simulation is conducted to compare the performance of the LVQ method utilizing SOM when missing values are imputed by mean imputation, hotdeck imputation, and a model based imputation. These imputation methods are also applied to impute missing values of glass identification data and misclassification rates of them are compared.
목차
1. 서론
2. 자기조직화지도와 벡터양자화
3. 분류문제에서의 결측자료 대체방법
4. 모의실험
5. 유리 판별자료의 분석
6. 토의 및 결론
키워드
해당간행물 수록 논문
- 구조방정식모형을 이용한 청소년의 다문화수용 연구 : 공동체의식과 우울의 매개효과
- K리그 클래식 스플릿 시스템에 따른 경기력 요인 분석
- ARIMA 모형을 사용한 전력 소모량의 단기 예측에 관한 연구
- 중소기업 대출의 경기순응성 해소를 위한 금융규제책의 효과에 관한 실증연구
- 한국 농업인의 고혈압 유병률과 위험요인
- The Impact of the External Information from SMEs’ Customers and Suppliers on Their Product Quality Improvement and Cost Reduction
- 스포츠클럽활동에 참여하는 청소년들의 라이프스타일이 여가만족 및 생활만족에 미치는 영향
- Measuring Public Willingness to Pay for CO2 Reduction by CO2 Capture and Storage in Korea
- 내부회계관리제도의 수준과 기업지배구조가 횡령 규모에 미치는 영향
- A Leave of Absence from College and Labor Market Outcomes
- 담배가격 인상이 흡연율과 담배 소비에 미치는 영향분석: 2015년 가격인상정책의 성과
- 연관성 평가 기준으로서의 균형화된 부호 헬링거 측도의 제안
- 연관성 규칙 관점에서의 상대적 상호정보량의 탐색
- 간호대학생의 완벽주의와 긍정심리자본이 취업스트레스에 미치는 영향
- 간호대학생의 우울 영향요인
- 원·하청기업 간의 임금격차 및 임금결정요인
- 스캔통계량을 활용한 공간자료의 공간상관성 연구
- 기능적 측정오차를 고려한 준모수적 Fay-Herriot 모형
- 간호대학생의 노인 간호의도에 영향을 미치는 요인
- The Asymmetric Impact of Foreigners’ Trading Activities on Volatility: Quantile Regression Analysis
- 축제방문동기에 따른 축제방문객 시장세분화
- 부모의 양육 스트레스와 아동의 언어·수리 학업능력의 관계
- 간호대학생의 임상실습만족도에 영향을 미치는 요인
- 무 소비패턴 및 경영성과 연구
- Area-level Deprivation and Mortality in Subjects with Lung Cancer: A Survival Analysis from Busan, Korea
- 생물학적 동등성을 증명하기 위한 추가시험의 통계적 분석
- 정신과 병원 간호사의 금연중재 의도 영향요인
- 간호대학생의 재난에 대한 인식, 태도 및 준비도가 재난간호 기본수행능력에 미치는 영향
- 상관함수 추정에 대한 연구
- 생태순간평가(EMA) 일기법 기반 자살패턴 분석: 성별차이를 중심으로
- 간호대학생을 위한 국제보건 리더십 프로그램의 효과
- 학교폭력 집단의 종단적 변화 유형과 심리적 특성
- 일반간호사의 근접오류 보고의향과 환자 안전 문화 인식간의 관계
- 2017년 대통령 후보수락 연설 유튜브 동영상의 댓글망과 의미망 분석
- A Study on Point Pattern Analysis of Earthquakes in the Philippines
- Impact of the Global Financial Crisis on Volatility Spillover between U.S. and Asia-Pacific Stock Markets
- Structural Relationship between Safety Climate and Safety Compliance of Labor Union Members in the Garak Market in Korea
- 국내 메타분석 연구에서의 효과크기 계산의 정확도 비교
- 자기조직화지도를 이용한 분류문제에서의 결측자료 대체방법 연구
- 결측자료 분석에서 결측 비율이 결측자료 k-평균 군집분석에 미치는 영향
- 민간기업 배당성향 결정모형을 이용한 우리나라 공공기관의 배당정책 분석
- 기업의 투자가 고용성장에 미치는 영향 : 기술투자 인적투자 설비투자를 중심으로
- 간호대학생의 유전지식과 유전자검사에 대한 태도 및 의도
- Network Analysis of Tourist Destinations : The Case of Daegu City, South Korea
- 한국 미디어 패널자료를 이용한 국내 소셜네트워크서비스 이용자 분석
참고문헌
관련논문
자연과학 > 통계학분야 BEST
- 의사결정나무 분석에 대한 국내 연구 동향 탐색
- 대학 재학생들의 중도탈락 패턴 분석 및 이탈 예측: H 대학교를 중심으로
- 가정 내 아동학대 행위자 특성에 따른 유형분류: 잠재계층분석(Latent Class Analysis)을 중심으로
자연과학 > 통계학분야 NEW
- 생애주기별 경제문제와 결혼생활 평가가 결혼 만족도와 삶의 질에 미치는 영향
- 시간 흐름에 따른 정서 편향의 변화: 반응시간과 표류 확산 모델을 활용한 분석
- PLAS 기반 커뮤니티 텍스트 분석: 정치적 성향에 따른 언어 및 심리 특성 비교
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
