Paso 1: Preparación del Entorno y los Datos de Audio
La creación de un modelo de voz con RVC comienza con la preparación del entorno.
Esto incluye instalar RVC, ya sea localmente o a través de la versión web. Recopila datos de audio de alta calidad en formato WAV, idealmente varios minutos de la voz que deseas clonar. Organiza los datos en una carpeta sin espacios ni caracteres especiales para facilitar el acceso y evitar errores.
Paso 2: Configuración de los Parámetros de Entrenamiento en la Interfaz de RVC
La configuración de parámetros es crucial para la calidad del modelo de voz.
Asigna un nombre descriptivo a tu experimento, deja la tasa de muestreo en 40k por defecto y elige la versión V2. Ajusta el número de procesos de CPU según tu sistema y asegúrate de indicar la ruta correcta a tu carpeta de datos de audio.
Paso 3: Extracción de Características y Entrenamiento del Modelo
Extraer las características del audio es el siguiente paso.
Haz clic en "Procesar Datos" y elige el algoritmo de extracción de tono "rmvpe". Luego, inicia el entrenamiento del modelo haciendo clic en "Entrenar Modelo". Ajusta la frecuencia de guardado, el número total de épocas de entrenamiento y el tamaño del lote para optimizar el proceso.
Paso 4: Generación de la Voz Clonada y Ajuste de Parámetros
Con el modelo entrenado, Genera la voz clonada en la sección de inferencia.
Selecciona el modelo, carga el archivo de audio a transformar y ajusta parámetros como la transposición, la ruta a la característica y la envolvente de volumen. Haz clic en "Convertir" y ajusta los parámetros según sea necesario para lograr el resultado deseado.