학술논문
Bi-LSTM 모델을 이용한 음악 생성 시계열 예측
이용수 44
- 영문명
- Prediction of Music Generation on Time Series Using Bi-LSTM Model
- 발행기관
- 한국스마트미디어학회
- 저자명
- 김광진 이칠우
- 간행물 정보
- 『스마트미디어저널』Vol11, No.10, 65~75쪽, 전체 11쪽
- 주제분류
- 공학 > 컴퓨터학
- 파일형태
- 발행일자
- 2022.11.30
4,120원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

국문 초록
딥러닝은 기존의 분석 모델이 갖는 한계를 극복하고 텍스트, 이미지, 음악 등 다양한 형태의 결과물을 생성할 수 있는 창의적인 도구로 활용되고 있다. 본 고에서는 Niko's MIDI Pack 음원 파일 1,609개를 데이터 셋으로 삼아 전처리 과정을 수행하고, 양방향 장단기 기억 순환 신경망(Bi-LSTM) 모델을 이용하여, 효율적으로 음악을 생성할 수 있는 전처리 방법과 예측 모델을 제시한다. 생성되는 으뜸음을 바탕으로 음악적 조성(調聲)에 적합한 새로운 시계열 데이터를 생성할 수 있도록 은닉층을 다층화하고, 디코더의 출력 게이트에서 인코더의 입력 데이터 중 영향을 주는 요소의 가중치를 적용하는 어텐션(Attention) 메커니즘을 적용한다. LSTM 모델의 인식률 향상을 위한 파라미터로서 손실함수, 최적화 방법 등 설정 변수들을 적용한다. 제안 모델은 MIDI 학습의 효율성 제고 및 예측 향상을 위해 높은음자리표(treble clef)와 낮은음자리표(bass clef)를 구분하여 추출된 음표, 음표의 길이, 쉼표, 쉼표의 길이와 코드(chord) 등을 적용한 다채널 어텐션 적용 양방향 기억 모델( Bi-LSTM with attention)이다. 학습의 결과는 노이즈와 구별되는 음악의 전개에 어울리는 음표와 코드를 생성하며, 화성학적으로 안정된 음악을 생성하는 모델을 지향한다.
영문 초록
Deep learning is used as a creative tool that could overcome the limitations of existing analysis models and generate various types of results such as text, image, and music. In this paper, we propose a method necessary to preprocess audio data using the Niko's MIDI Pack sound source file as a data set and to generate music using Bi-LSTM. Based on the generated root note, the hidden layers are composed of multi-layers to create a new note suitable for the musical composition, and an attention mechanism is applied to the output gate of the decoder to apply the weight of the factors that affect the data input from the encoder. Setting variables such as loss function and optimization method are applied as parameters for improving the LSTM model. The proposed model is a multi-channel Bi-LSTM with attention that applies notes pitch generated from separating treble clef and bass clef, length of notes, rests, length of rests, and chords to improve the efficiency and prediction of MIDI deep learning process. The results of the learning generate a sound that matches the development of music scale distinct from noise, and we are aiming to contribute to generating a harmonistic stable music.
목차
Ⅰ. 서론
Ⅱ. 본론
Ⅲ. 다층 Bi-LSTM에 의한 음원 인식
Ⅳ. 결론
REFERENCES
키워드
해당간행물 수록 논문
- 소셜미디어를 통한 직원의 기업전망 평가와 고용증가와의 상관성
- Bi-LSTM 모델을 이용한 음악 생성 시계열 예측
- 개인정보의 위임 제공 및 데이터 기밀성을 보장하는 블록체인에 제공 정보의 저장
- 스마트미디어저널 Vol11, No.10 목차
- ESG-oriented Governance Work System for Smart Highway Implementation
- 대한소아치과학회 연차총회에서 발표된 구술 및 포스터 초록의 출판률 변화
- InferSent를 활용한 오픈 도메인 기계독해
- 텍스트마이닝을 활용한 빅데이터 기반의 디지털 트랜스포메이션 연구동향 파악
- 다크웹 환경에서 산업기술 유출 탐지 시스템
- 디지털 소외계층을 위한 지능형 IoT 애플리케이션의 공개 API 기반 대화형 음성 상호작용 기법
참고문헌
관련논문
공학 > 컴퓨터학분야 BEST
- 지도서비스를 이용한 위치 기반 관광 빅데이터의 시각화
- 공서비스 공급 관점에서 살펴본 비의료 건강관리서비스 인증 시범사업과 의료민영화 논쟁
- 인적 특성을 반영한 안전 정보디자인의 개념과 특징
공학 > 컴퓨터학분야 NEW
- 스마트미디어저널 제14권 제6호 목차
- ASD 예측을 위한 연합학습 기반 시선 추적 이미지 분류 모델 구축
- A review of the clinical implementation of a transparent orthodontic system utilizing Korean technology
최근 이용한 논문
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!
