1단계: 11랩스(ElevenLabs) 계정 생성 및 설정
11랩스 웹사이트(https://elevenlabs.io/)에 접속하여 계정을 생성합니다. 계정을 생성한 후, 대시보드에서 'My Voices' 섹션으로 이동합니다.
여기에서 자신만의 AI 음성을 만들기 위한 설정을 시작할 수 있습니다.
11랩스는 다양한 요금제를 제공합니다. 무료 플랜부터 시작하여 필요에 따라 유료 플랜으로 업그레이드할 수 있습니다. 유료 플랜은 더 많은 음성 생성 시간과 다양한 기능을 제공합니다.
2단계: 음성 샘플 준비 및 업로드
AI 음성 복제의 품질은 음성 샘플의 품질에 크게 좌우됩니다. 다음과 같은 가이드라인을 따라 음성 샘플을 준비하세요.
- 최소 30분 이상의 고품질 오디오 데이터를 준비합니다. (3시간 권장)
- 배경 소음이나 음악이 없는 깨끗한 녹음 환경에서 녹음합니다.
- 일관된 톤과 속도로 말합니다.
- 다양한 감정과 억양을 담아 녹음합니다.
준비된 음성 샘플을 11랩스에 업로드합니다. 'My Voices' 섹션에서 'Add a new voice' 버튼을 클릭하고 'Professional Voice Cloning'을 선택합니다.
3단계: AI 음성 모델 훈련
음성 샘플을 업로드한 후, AI는 해당 데이터를 분석하고 학습하여 자신만의 음성 모델을 생성합니다. 이 과정은 몇 시간이 소요될 수 있으며, AI 모델의 품질은 데이터 양과 품질에 따라 달라집니다.
AI 모델 훈련이 완료되면, 11랩스는 해당 음성이 자신의 것인지 확인하기 위해 음성 확인 절차를 거칩니다.
음성 확인 절차는 다음과 같습니다.
- 제공되는 텍스트를 읽어 녹음합니다.
- 11랩스는 녹음된 음성과 업로드된 음성 샘플을 비교합니다.
- 일치율이 높으면 음성 확인이 완료됩니다.
참고: 음성 확인에 실패하면, 다른 음성 샘플을 사용하거나 녹음 환경을 개선하여 다시 시도할 수 있습니다.
4단계: 음성 모델 미세 조정 및 사용
AI 음성 모델이 생성되면, 해당 모델을 미세 조정하여 원하는 스타일과 감정을 표현할 수 있습니다. 11랩스는 음성의 안정성, 유사성, 스타일 등을 조절할 수 있는 다양한 옵션을 제공합니다.
미세 조정이 완료된 AI 음성을 사용하여 텍스트를 음성으로 변환하거나, 다양한 프로젝트에 활용할 수 있습니다. 예를 들어, 오디오북을 제작하거나, 게임 캐릭터의 음성을 만들거나, 팟캐스트를 제작하는 데 사용할 수 있습니다.