









Miso One es un sistema de texto a voz (TTS) de código abierto y 8 mil millones de parámetros (8B) desarrollado por Miso Labs. Está diseñado específicamente para generar un habla en inglés altamente realista, expresiva y con gran variedad emocional, lo que lo hace ideal para la investigación de agentes de voz y flujos de trabajo de desarrolladores. Basado en una arquitectura de modelo de habla conversacional (CSM) estilo Sesame con códigos de audio Mimi, cuenta con una capacidad de inferencia altamente optimizada que presume de una baja latencia publicada de 110 ms. Además de la generación de texto a voz, el modelo admite la continuación de voz y la clonación de voz instantánea (one-shot) a partir de un contexto de audio, siempre bajo estrictos límites de consentimiento.
Los usuarios pueden evaluar Miso One leyendo su ficha oficial del modelo (model card) en el repositorio o en la página de Hugging Face, probando la demostración web interactiva para comprobar la calidad de la voz, o descargando los pesos públicos de 8B y el código de inferencia para ejecutar pruebas de rendimiento locales dentro de su propio entorno CUDA. Para flujos de trabajo de creadores en la nube, los usuarios pueden registrarse y elegir un plan de suscripción en función de la capacidad de caracteres mensual o anual que necesiten.
Más contacto, visite la página de contacto()
Miso One Nombre de la empresa: .
Miso One Dirección de la empresa: .
Más información sobre Miso One, visite la página acerca de nosotros() .

Nivel gratuito
$0
Incluye créditos gratuitos para pruebas iniciales con un máximo de 120 caracteres por conversión.
Básico (Plan Anual)
$4.95 al mes
Facturado anualmente ($9.90/mes si es mensual). Incluye 960,000 caracteres de TTS al año, 9,600 créditos de voz, hasta 480 clonaciones de voz instantáneas, creación de modelos de voz privados y soporte por correo electrónico.
Pro (Plan Anual)
$14.95 al mes
Facturado anualmente ($29.90/mes si es mensual). Incluye 4,200,000 caracteres de TTS al año, 42,000 créditos de voz, hasta 2,100 clonaciones de voz instantáneas y soporte prioritario para flujos de trabajo de voz.
Enterprise (Plan Anual)
$24.95 al mes
Facturado anualmente ($49.90/mes si es mensual). Incluye 9,600,000 caracteres de TTS al año, 96,000 créditos de voz, hasta 4,800 clonaciones de voz instantáneas y soporte prioritario dedicado para equipos.



Escucha en redes sociales