RVC Web UI와 가우디오 스튜디오를 이용해서 AI 커버 만들어보기

사전 준비물

구글 아이디

디스코드 아이디

커버하고 싶은 음원 파일

실행

https://studio.gaudiolab.io/

Gaudio Studio | 가우디오 스튜디오

Instrument Separation & Noraebang

studio.gaudiolab.io

가우디오 스튜디오 접속합니다.

왼쪽 클릭해서 구글 아이디로 로그인합니다.

업로드 누르시고 음원을 업로드 하신 다음에 Vocal과 Other Instruments만 활성화 한 다음 Request 클릭합니다.

그러면 음원 파일이 큐에 등록되고 10분 정 기다리시면 완료됩니다.

분리 완료되면 클릭하셔서 보컬 파일과 MR 파일을 다운로드합니다.

다음은 구글 콜랩 이용해서 RVC 실행하기입니다.

https://colab.research.google.com/drive/1Gj6UTf2gicndUW_tVheVhTXIIYpFTYc7?usp=sharing

Easy GUI (for RVC v2, with crepe) (with improved downloader)

Colaboratory notebook

colab.research.google.com

접속 후 드라이브로 복사 클릭하셔서 자신의 드라이브로 복사합니다.

접속 후 오른쪽 위 연결을 먼저 하시고 Step1. Install을 실행합니다.

Install 하시면 시간이 걸리기 때문에 기달리면서 보이스 모델을 탐색합니다.

https://discord.gg/aihub

Join the AI Hub Discord Server!

AI HUB is a server for fan-created AI songs and the creation of AI voice models. | 389895 members

discord.com

디스코드 접속 후에 보이스 모델에 들어가셔서 원하는 모델 파일을 찾습니다.

원하는 모델을 찾으실 때 에포크가 높을수록 좋습니다.

에포크가 높을수록 학습이 많이 된 모델입니다.

찾은 모델이 링크형태라면 복사하셔서 Step2 url에 입력시킵니다.

만약 찾은 모델이 Zip 형태라면 다운로드 받으신 후에 압축을 해제하여 pth파일을 weights에 등록해야합니다.

Step1을 끝낸 상태에서 왼쪽 파일을 눌러보면 Retrieval... 하위 폴더에 weights가 있습니다.

여기에 pth 파일을 넣어주시면 됩니다.

업로드에 시간이 꽤 오래 걸립니다.

728x90

다운로드 후에 완료하셨으면 Step3 GUI를 실행합니다.

실행하고 나서 나오는 public URL을 클릭합니다.

접속하시면 빨간 부분에 모델이 자동으로 등록되어 있습니다.

안되어 있으면 Refresh 눌러줍니다.

이후에 가우디오 스튜디오에서 다운 받은 보컬 파일을 업로드합니다.

그리고 나서 오른쪽 Optional에서 옥타브를 수정합니다.

여자에서 여자이거나 남자에서 남자는 0 그대로 사용합니다.

남자에서 여자는 +12이고 여자에서 남자는 -12를 주로 사용합니다.

Advanced Settings에서는 crepe와 harvest만 아시면 됩니다.

보통 crepe를 이용하는데, harvest는 최고 품질이지만 학습시키는데 굉장히 오랜 시간이 걸립니다.

아래 추가적인 옵션은 굳이 건드실 필요가 없습니다.

이후에 Convert를 누르시면 Output Audio 부분에 결과물이 나옵니다.

한 번 들어보고 다운받아줍니다.

듣다보면 고음이 깨지거나 진짜 기계음이 나는 경우가 많습니다.

유튜브에서 보던 퀄리티는 보정 및 추가 작업하셔야합니다.

거기까지 다루지는 않겠습니다.

다운로드 받으신 다음에 가우디 스튜디오에서 다운 받으신 MR 파일과 합성합니다.

보유하신 음악 관련 유틸이 있으시다면 사용하시고 없으시다면 아래 링크에 접속하셔서 구글아이디로 로그인합니다.

https://www.bandlab.com/feed/trending

BandLab

www.bandlab.com

로그인 한 다음에 오른쪽 위의 빨간색 Create를 누르시면 New project가 나옵니다.

그 다음에 뜨는 창은 그냥 닫으시고 콜랩에서 다운 받으신 AI보컬 파일과 가우디 스튜디오에서 받은 MR 파일을 불러옵니다.

싱크 맞는지 확인하시고 다운로드합니다.

음질은 아무거나 하셔도 됩니다.

3줄 요약

들어줄만 하지만 퀄리티가 많이 아쉽습니다.

퀄리티 높이고 싶으시다면 음원 파일을 FLAC 같은 무손실 음원 사용하시거나 보정 작업하셔야합니다.

음성 파일 가지고 모델을 직접 학습시켜서 만드는 방법도 있지만 10시간 정도 걸려서 비추천합니다.

저작자표시

'인공지능' 카테고리의 다른 글

메타 이번에는 언어번역 AI, 심리스 M4T 무료로 공개 (31)	2023.08.27
LG에 이어 SKT도 투자한 AI 스타트업 앤트로픽, OpenAI처럼 될 수 있을까? (30)	2023.08.14
LG CNS가 투자한 앤스로픽, 그리고 GhatGPT 대항마 클로드2 (0)	2023.08.07
ChatGPT, 이제 대학생 수준의 유추 추론 가능하다 (0)	2023.08.02
최근 ChatGPT의 성능이 떨어지고 있다? (0)	2023.07.27