본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

인공지능 기반 단백질-리간드 상호작용 예측을 위한 신약 후보 물질 발굴 프레임 워크

이용수  0

영문명
AI-Driven Prediction of Protein-Ligand Interactions for Accelerated Drug Discover
발행기관
한국산업기술융합학회(구. 산업기술교육훈련학회)
저자명
이경현(Kyoung-Hyun Lee) 백락준(Rack-June Baek) 이윤섭(Yun-Sub Lee) 김우수(Woo-Su Kim)
간행물 정보
『산업기술연구논문지』제30권 3호, 155~172쪽, 전체 18쪽
주제분류
공학 > 산업공학
파일형태
PDF
발행일자
2025.09.30
4,960

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

본 연구는 단백질–리간드 상호작용 예측에서 구조 기반 접근의 한계를 극복하고자, 단백질 서열 기반의 입력만으로도 예측이 가능한 경량 인공지능 기반 결합 친화도 예측 프레임워크를 제안한다. 리간드는 BindingDB에서 수집한 12,309개의 SMILES 데이터를 2048차원의 Morgan Fingerprint로 인코딩하고, 단백질은 AAC(20차원)으로 표현하였다. 입력값으로 XGBoost 회귀모델을 구성하고, 예측값과 실제값의 차이를 보정하는 2단계 회귀모델을 구현하였다. 최종 예측값은 RMSE 0.90, 결정계수(R²) 0.74, 정확도 88%, AUC 0.948의 성능을 보였으며, SHAP 해석을 통해 주요 아미노산 조성과 서브스트럭처가 예측에 영향을 미침을 확인했다. 본 프레임워크는 약물 재창출 및 가상 스크리닝에서 구조 기반 모델을 보완하는 도구로 활용할 수 있다.

영문 초록

This study proposes a lightweight artificial intelligence-based prediction framework to address the limitations of structure-based methods for predicting protein-ligand interactions. Unlike conventional approaches, the model relies exclusively on sequence-based inputs. A total of 12,309 ligand molecules were retrieved from BindingDB and encoded as 2,048-dimensional Morgan fingerprints derived from SMILES notation. Protein sequences were represented as 20-dimensional amino acid composition (AAC) vectors. These embeddings were used as inputs to an XGBoost regression model to predict binding affinity (pKi), followed by a second-stage regression model that calibrated predictions based on residual errors. The final calibrated framework achieved strong predictive performance, with an RMSE of 0.90, R² of 0.74, a binary classification accuracy of 88%, and an AUC of 0.948. Furthermore, shapley additive explanations (SHAP) highlighted the contributions of specific amino acid features —such as tryptophan (AAC_W) and histidine (AAC_H)—as well as ligand substructures, to the predicted binding affinity. By enabling rapid and accurate predictions without requiring 3D protein structures, this framework provides a versatile complement to structure-based methods and offers practical utility for applications such as drug repurposing and virtual screening.

목차

Ⅰ. 서 론
Ⅱ. 연구 방법
Ⅲ. 실험 결과 및 분석
Ⅳ. 논 의
Ⅴ. 결 론
ACKNOWLEDGEMENTS
References

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

이경현(Kyoung-Hyun Lee),백락준(Rack-June Baek),이윤섭(Yun-Sub Lee),김우수(Woo-Su Kim). (2025).인공지능 기반 단백질-리간드 상호작용 예측을 위한 신약 후보 물질 발굴 프레임 워크. 산업기술연구논문지, 30 (3), 155-172

MLA

이경현(Kyoung-Hyun Lee),백락준(Rack-June Baek),이윤섭(Yun-Sub Lee),김우수(Woo-Su Kim). "인공지능 기반 단백질-리간드 상호작용 예측을 위한 신약 후보 물질 발굴 프레임 워크." 산업기술연구논문지, 30.3(2025): 155-172

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제