









Miso One 是由 Miso Labs 開發的開源權重(open-weights)、8B 參數文字轉語音(TTS)系統。它專為生成高度逼真、具表現力且富有情感變化的英文對話語音而設計,非常適合語音代理人(voice-agent)研究和開發人員的工作流程。該系統採用 Sesame 風格的對話語音模型(CSM)架構並結合 Mimi 音訊編碼,具備高度優化的推論能力,官方公布的延遲時間僅 110 毫秒。除了文字轉語音生成外,該模型還支援語音接續,以及在明確同意的規範下,利用音訊上下文進行單樣本聲音複製(one-shot voice cloning)。
使用者可以透過閱讀存放庫或 Hugging Face 頁面上的官方模型說明卡來評估 Miso One、試用託管的線上展示(web demo)以檢查語音品質,或是下載公開的 8B 權重與推論程式碼,在自己的 CUDA 環境中執行本地基準測試。至於代管的創作者工作流程,使用者可以註冊並根據所需的年度或月度字數額度來選擇訂閱方案。
更多聯絡資訊,請訪問聯絡我們頁面()
Miso One 公司名稱: 。
Miso One 公司地址:。
有關Miso One 的更多信息,請訪問關於我們頁面() a> 。

免費方案
$0
包含供初始測試使用的免費點數,每次轉換上限為 120 個字。
基礎方案(年繳)
每月 $4.95
按年計費(若按月計費則為每月 $9.90)。每年包含 960,000 個 TTS 字數、9,600 點語音點數、高達 480 次瞬間聲音複製、個人語音模型建立以及電子郵件支援。
專業方案(年繳)
每月 $14.95
按年計費(若按月計費則為每月 $29.90)。每年包含 4,200,000 個 TTS 字數、42,000 點語音點數、高達 2,100 次瞬間聲音複製,以及語音工作流程的優先支援。
企業方案(年繳)
每月 $24.95
按年計費(若按月計費則為每月 $49.90)。每年包含 9,600,000 個 TTS 字數、96,000 點語音點數、高達 4,800 次瞬間聲音複製,以及專屬團隊的優先支援。


社群媒體聆聽