









O Miso One é um sistema de conversão de texto em voz (TTS) de pesos abertos (open-weights) com 8 mil milhões (8B) de parâmetros, desenvolvido pela Miso Labs. Foi concebido especificamente para produzir fala conversacional em inglês altamente realista, expressiva e emocionalmente variada, tornando-o ideal para a investigação de agentes de voz e fluxos de trabalho de programadores. Construído sobre uma arquitetura de modelo de fala conversacional (CSM) de estilo Sesame com códigos de áudio Mimi, possui uma capacidade de inferência altamente otimizada, apresentando uma latência reduzida anunciada de 110 ms. Além da geração de texto em voz, o modelo suporta a continuação de voz e a clonagem de voz instantânea (one-shot) a partir de contexto de áudio com limites claros de consentimento.
Os utilizadores podem avaliar o Miso One ao lerem o seu cartão de modelo oficial no repositório ou na página do Hugging Face, ao experimentarem a demonstração web alojada para verificar a qualidade da voz, ou ao descarregarem os pesos públicos de 8B e o código de inferência para executar testes de desempenho (benchmarks) locais no seu próprio ambiente CUDA. Para fluxos de trabalho de criadores alojados, os utilizadores podem registar-se e escolher um plano de subscrição com base na capacidade de caracteres anual ou mensal necessária.
Mais contato, visite a página de contato()
Miso One Nome da empresa: .
Miso One Endereço da empresa: .
Mais sobre Miso One, visite a página sobre nós() .

Plano gratuito
$0
Inclui créditos gratuitos para testes iniciais com um máximo de 120 caracteres por conversão.
Básico (Plano Anual)
$4,95 por mês
Faturado anualmente ($9,90/mês se for mensal). Inclui 960 000 caracteres de TTS por ano, 9600 créditos de voz, até 480 clones de voz instantâneos, criação de modelos de voz privados e suporte por e-mail.
Pro (Plano Anual)
$14,95 por mês
Faturado anualmente ($29,90/mês se for mensal). Inclui 4 200 000 caracteres de TTS por ano, 42 000 créditos de voz, até 2100 clones de voz instantâneos e suporte prioritário para fluxos de trabalho de voz.
Enterprise (Plano Anual)
$24,95 por mês
Faturado anualmente ($49,90/mês se for mensal). Inclui 9 600 000 caracteres de TTS por ano, 96 000 créditos de voz, até 4800 clones de voz instantâneos e suporte prioritário dedicado para equipas.



Escuta de mídias sociais