반응형 음성 변환2 AUTOVC 논문 정리(2) 안녕하세요, 앞선 포스팅에 이어서 진행하겠습니다. [Information Bottleneck] Bottleneck 이라는 개념이 도입된 이유는 무엇일까요? 아마도, 해당 논문의 auto voice conversion이 autoencoder 구조 기반으로 이루어져 있습니다. 이는 전체 구조를 보았을 때 입력 값->hidden layer->출력 레이어를 거치면서 hidden layer에서 상대적으로 데이터 차원이 줄어들어 "> 2021. 3. 1. AUTOVC 논문 정리(1) 안녕하세요, Candy Lee 입니다. 오늘 리뷰해볼 논문은 AUTOVC:Zero-Shot Voice Style Transfer with Only Autoencoder Loss [Qian,K. et al.,2019] 입니다. 개인적으로 저는 음성 처리 분야에 관련된 논문을 접하는게 이번이 처음이에요.. 부족하더라도 읽어주시면 감사하겠습니다. [사전 정보] 우선, 이 논문을 이해하기 위해서 필요한 두 가지 사전정보가 있습니다. 음성이 무엇인지? 그리고 음성 데이터가 무엇인지에 대해서 알아보도록 하겠습니다. 1. 음성이란? 음성은 크게 2가지 요소로 분리해서 이해할 수 있습니다. 주파수(Frequency)는 소리의 높고 낮음을 결정하는 요소입니다. 진폭(Amplitude)는 소리의 세기 또는 강도를 결정하는.. 2021. 2. 27. 이전 1 다음 반응형