- 영문명
- A Study on Hotspot Analysis and Performance Optimization of the RAMSES-HR5 Simulation Code
- 발행기관
- 한국스마트미디어학회
- 저자명
- 정현미(Hyun Mi Jung) 이현조(Hyunjo Lee) 정기문(Kimoon Jeong) 채철주(Cheol-Joo Chae)
- 간행물 정보
- 『스마트미디어저널』제14권 제11호, 143~149쪽, 전체 7쪽
- 주제분류
- 공학 > 컴퓨터학
- 파일형태
- 발행일자
- 2025.11.28
4,000원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
본 연구는 천체물리학 분야에서 광범위하게 활용되는 RAMSES-HR5 시뮬레이션 코드의 성능 병목 현상을 체계적으로 분석하고, 이를 개선하기 위한 최적화 전략을 제안한다. RAMSES-HR5는 AMR 기반의 하이브리드 병렬 구조의 수치 시뮬레이션 코드이다. 그러나 HPC 환경에서 RAMSES-HR5는 스레드 간 부하 불균형, MPI 통신 병목, 반복적인 I/O 연산 등으로 인해 연산 자원의 활용 효율이 저하되고 전체 실행 시간이 지연되는 문제가 발생한다. 이에 본 연구에서는 Intel VTune Profiler를 이용하여 RAMSES-HR5 코드의 핵심 연산 모듈에 대한 프로파일링을 수행하고, CPU 사용률, 메모리 접근 패턴, MPI 통신 대기 시간을 기반으로 핫스팟 분석하였다. 주요 핫스팟을 개선하기 위해 OpenMP parallel loop 구조를 고정 분할에서 동적 스케줄링 방식으로 전환하고, MPI_Waitsome 및 MPI_Reduce+Bcast를 활용하여 통신 병렬성을 확보하였다. 또한 메모리 모니터링 및 출력 루틴의 호출 빈도를 줄여 불필요한 통신과 I/O 오버헤드를 감소시켰다. 최적화된 코드는 8코어 클라우드 환경에서 기존 대비 약 10~15%의 전체 실행 시간 단축 효과를 보였으며, 연산-통신 병렬 중첩, 스레드 부하 분산, 통신량 감소 측면에서 병렬 효율성이 향상되었음을 확인하였다.
영문 초록
This study systematically analyzes the performance bottlenecks of the RAMSES-HR5 simulation code, which is widely used in the field of astrophysics, and proposes optimization strategies to improve its computational efficiency. RAMSES-HR5 is a numerical simulation code capable of accurately modeling galaxy formation and evolution, based on a hybrid parallel structure that incorporates AMR. However, in HPC environments, RAMSES-HR5 experiences issues such as thread-level load imbalance, MPI communication bottlenecks, and frequent I/O operations, which degrade resource utilization and increase overall execution time. To address these issues, we conducted profiling of the core computational modules in RAMSES-HR5 using Intel VTune Profiler, analyzing CPU usage, memory access patterns, and MPI communication wait times to identify performance hotspots. To mitigate the identified hotspots, we replaced the static scheduling in OpenMP parallel loops with dynamic scheduling and introduced MPI_Waitsome and MPI_Reduce+Bcast to enhance communication concurrency. In addition, we reduced unnecessary communication and I/O overhead by lowering the frequency of memory monitoring and output routines. The optimized code demonstrated a 10–15% reduction in total execution time in an 8-core cloud environment, with improved parallel efficiency in terms of computation–communication overlap, thread workload balancing, and reduced MPI traffic.
목차
키워드
해당간행물 수록 논문
- 근적외선 스펙트럼의 복합 특징 학습을 위한 1D CNN-BiLSTM 융합 모델 기반 농산물 품질 예측
- 신고배 병해충 분류를 위한 공용 및 현장 이미지 데이터셋 기반 분류 성능 비교 연구
- 스마트축사 내 MQTT 데이터 통신 검증 방법에 관한 연구
- AI 기반 ESS 진단 보정 및 복원 실증 연구
- [Erratum] 비선형 스토리텔링 전시형 문화콘텐츠 몰입을 위한 비접촉 인터랙션 행위 디자인 모델 제안
- 스마트미디어저널 제14권 제11호 목차
- 수직농장 폐양액 재활용을 위한 EC·pH 자동 보정 알고리즘 설계 및 검증
- 다중모달 기반 생육·환경 데이터 융합을 통한 수직농장 작물 성장 예측 모델 개발
- MQTT 기반 스마트축사 반응형 데이터 수집 시스템 개발
- 작물의 생리적 반응 피드백을 이용한 감각기반 지능형 수직농장 제어에 대한 연구
- 노지 페로몬트랩 기반 해충 포집·인식 및 환경데이터 연계 요인 분석
- 딸기 시비 데이터 기반 생산량 예측 및 생육환경 최적화 연구
- 농업 기상 데이터 상세화를 위한 경량 하이브리드 트랜스포머 기반 일사량 초해상화 모델
- 대추방울토마토의 생육·환경 복합변수를 활용한 AI 기반 생산량 예측 연구
- 상추 재배를 위한 EC·pH 변화율과 환경 변수를 융합한 이상 탐지 모델 연구
- 스마트팜 토마토의 생산량 예측 모델을 위한 최적 환경 변수 선정 연구
- 실내 식물 성장을 위한 자동 회전 기반 스마트 화분 연구
- AI 기반 비정형 물류 팔레타이징 시스템 비교 실증
- 고온기 스마트온실 조건에서 딸기 조기 화아분화를 유도하기 위한 광주기 온도 제어 기술
- AI 기반 농업 데이터 분석 기술을 활용한 생산성 향상 메커니즘 연구
- RAMSES-HR5 시뮬레이션 코드 핫스팟 분석 및 성능 최적화 연구
- 폴더 개폐식 영농형 태양광 발전시스템 연구
- 메타버스 이용자의 농산업 콘텐츠 수용 의도 수준에 따른 집단 특성 분석
참고문헌
관련논문
공학 > 컴퓨터학분야 BEST
- 특허정보를 활용한 국내 반려동물 산업의 기술 융합 동향에 관한 연구: 네트워크 분석과 텍스트 마이닝 기법을 활용하여
- 공서비스 공급 관점에서 살펴본 비의료 건강관리서비스 인증 시범사업과 의료민영화 논쟁
- 자율비행 드론을 활용한 소프트웨어 교육프로그램 개발
공학 > 컴퓨터학분야 NEW
- 근적외선 스펙트럼의 복합 특징 학습을 위한 1D CNN-BiLSTM 융합 모델 기반 농산물 품질 예측
- 신고배 병해충 분류를 위한 공용 및 현장 이미지 데이터셋 기반 분류 성능 비교 연구
- 스마트축사 내 MQTT 데이터 통신 검증 방법에 관한 연구
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!