본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

RAMSES-HR5 시뮬레이션 코드 핫스팟 분석 및 성능 최적화 연구

이용수  0

영문명
A Study on Hotspot Analysis and Performance Optimization of the RAMSES-HR5 Simulation Code
발행기관
한국스마트미디어학회
저자명
정현미(Hyun Mi Jung) 이현조(Hyunjo Lee) 정기문(Kimoon Jeong) 채철주(Cheol-Joo Chae)
간행물 정보
『스마트미디어저널』제14권 제11호, 143~149쪽, 전체 7쪽
주제분류
공학 > 컴퓨터학
파일형태
PDF
발행일자
2025.11.28
4,000

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

본 연구는 천체물리학 분야에서 광범위하게 활용되는 RAMSES-HR5 시뮬레이션 코드의 성능 병목 현상을 체계적으로 분석하고, 이를 개선하기 위한 최적화 전략을 제안한다. RAMSES-HR5는 AMR 기반의 하이브리드 병렬 구조의 수치 시뮬레이션 코드이다. 그러나 HPC 환경에서 RAMSES-HR5는 스레드 간 부하 불균형, MPI 통신 병목, 반복적인 I/O 연산 등으로 인해 연산 자원의 활용 효율이 저하되고 전체 실행 시간이 지연되는 문제가 발생한다. 이에 본 연구에서는 Intel VTune Profiler를 이용하여 RAMSES-HR5 코드의 핵심 연산 모듈에 대한 프로파일링을 수행하고, CPU 사용률, 메모리 접근 패턴, MPI 통신 대기 시간을 기반으로 핫스팟 분석하였다. 주요 핫스팟을 개선하기 위해 OpenMP parallel loop 구조를 고정 분할에서 동적 스케줄링 방식으로 전환하고, MPI_Waitsome 및 MPI_Reduce+Bcast를 활용하여 통신 병렬성을 확보하였다. 또한 메모리 모니터링 및 출력 루틴의 호출 빈도를 줄여 불필요한 통신과 I/O 오버헤드를 감소시켰다. 최적화된 코드는 8코어 클라우드 환경에서 기존 대비 약 10~15%의 전체 실행 시간 단축 효과를 보였으며, 연산-통신 병렬 중첩, 스레드 부하 분산, 통신량 감소 측면에서 병렬 효율성이 향상되었음을 확인하였다.

영문 초록

This study systematically analyzes the performance bottlenecks of the RAMSES-HR5 simulation code, which is widely used in the field of astrophysics, and proposes optimization strategies to improve its computational efficiency. RAMSES-HR5 is a numerical simulation code capable of accurately modeling galaxy formation and evolution, based on a hybrid parallel structure that incorporates AMR. However, in HPC environments, RAMSES-HR5 experiences issues such as thread-level load imbalance, MPI communication bottlenecks, and frequent I/O operations, which degrade resource utilization and increase overall execution time. To address these issues, we conducted profiling of the core computational modules in RAMSES-HR5 using Intel VTune Profiler, analyzing CPU usage, memory access patterns, and MPI communication wait times to identify performance hotspots. To mitigate the identified hotspots, we replaced the static scheduling in OpenMP parallel loops with dynamic scheduling and introduced MPI_Waitsome and MPI_Reduce+Bcast to enhance communication concurrency. In addition, we reduced unnecessary communication and I/O overhead by lowering the frequency of memory monitoring and output routines. The optimized code demonstrated a 10–15% reduction in total execution time in an 8-core cloud environment, with improved parallel efficiency in terms of computation–communication overlap, thread workload balancing, and reduced MPI traffic.

목차

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

정현미(Hyun Mi Jung),이현조(Hyunjo Lee),정기문(Kimoon Jeong),채철주(Cheol-Joo Chae). (2025).RAMSES-HR5 시뮬레이션 코드 핫스팟 분석 및 성능 최적화 연구. 스마트미디어저널, 14 (11), 143-149

MLA

정현미(Hyun Mi Jung),이현조(Hyunjo Lee),정기문(Kimoon Jeong),채철주(Cheol-Joo Chae). "RAMSES-HR5 시뮬레이션 코드 핫스팟 분석 및 성능 최적화 연구." 스마트미디어저널, 14.11(2025): 143-149

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제