- 영문명
- Design and Implementation of an AI-Based Document Processing Service Platform
- 발행기관
- 한국구매조달학회
- 저자명
- 이충형(Choong-Hyong Lee)
- 간행물 정보
- 『한국구매조달학회지』제24권 제1호, 59~84쪽, 전체 26쪽
- 주제분류
- 경제경영 > 경제학
- 파일형태
- 발행일자
- 2025.06.30
국문 초록
현재 인공지능 기술은 텍스트와 이미지 이해 능력을 갖춘 멀티모달 AI시대로 접어들었다. 하지만 기업의 복잡한 문서에 대한 추가학습을 통한 문제 해결, 인간의 피트백을 반영해 모델을 조정(RLHF, Reinforcement Learning with Human Feedback)하는 등의 기술적 노력에 많은 시간과 비용을 투자하고 있다. 본 연구는 자연어와 이미지 입력을 모두 처리할 수 있는 인공지능 기술인 비전-언어 모델(Vision-Language Models, VLMs)을 기반으로 한 문서처리 서비스 플랫폼의 프로토타입을 설계하고 구현하는 것을 목표로 한다. 기존 OCR 기술의 한계를 극복하기 위해, 프론트엔드, 서비스, 관리 계층으로 구성된 마이크로서비스 기반 아키텍처(MSA)를 설계하였다. 영수증 처리를 중심으로 한 프로토타입은 Qwen2.5VL 모델을 활용하여 구현되었으며, 평균 정보 추출 정확도는 91.7%를 기록하였다. 향후 연구에서는 멀티모달 트랜스포머의 최적화, 다국어 문서 처리 성능 향상, 도메인 특화 파인튜닝을 통해 다양한 기업의 비즈니스 문서 유형에 대한 표준 플랫폼의 가이드라인을 제공하고, 기업 내부의 전략적 이익도 제고할 수 있을 것이다.
영문 초록
Recent advancements in artificial intelligence have ushered in the era of multimodal AI, which enables machines to understand both text and images. However, addressing complex enterprise documents often requires additional fine-tuning and substantial technical efforts, such as incorporating human feedback through Reinforcement Learning with Human Feedback (RLHF). These approaches demand considerable time and cost.
This study aims to design and implement a prototype of a document processing service platform based on Vision-Language Models (VLMs), a type of AI technology capable of processing both natural language and image inputs. To overcome the limitations of conventional OCR technologies, we developed a microservice-based architecture (MSA) consisting of Frontend, Service, and Management layers.
A prototype focused on receipt processing was implemented using the Qwen2.5VL model and achieved an average information extraction accuracy of 91.7%.
Future research will focus on optimizing multimodal transformers, improving multilingual document handling, and conducting domain-specific fine-tuning. These efforts aim to provide standardized platform guidelines for various types of business documents and enhance the strategic value of AI systems within enterprises.
목차
Ⅰ. 서론
Ⅱ. 연구 배경
Ⅲ. 연구 설계 및 구현
Ⅳ. 결론 및 시사점
References
키워드
해당간행물 수록 논문
참고문헌
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
