









Miso One là một hệ thống chuyển đổi văn bản thành giọng nói (TTS) mã nguồn mở (open-weights) với 8 tỷ (8B) tham số do Miso Labs phát triển. Hệ thống này được thiết kế chuyên biệt để tạo ra giọng nói tiếng Anh giao tiếp có độ chân thực cao, truyền cảm và đa dạng về cung bậc cảm xúc, cực kỳ lý tưởng cho việc nghiên cứu tác tử giọng nói (voice-agent) và quy trình làm việc của lập trình viên. Được xây dựng trên kiến trúc mô hình lời nói giao tiếp (CSM) kiểu Sesame kết hợp với mã âm thanh Mimi, mô hình sở hữu khả năng suy luận tối ưu vượt trội với độ trễ thấp được công bố là 110 ms. Bên cạnh việc tạo giọng nói từ văn bản, mô hình còn hỗ trợ tính năng tiếp nối giọng nói và nhân bản giọng nói chỉ qua một mẫu thử (one-shot voice cloning) từ ngữ cảnh âm thanh, đi kèm các ranh giới nghiêm ngặt về sự đồng thuận.
Người dùng có thể trải nghiệm Miso One bằng cách đọc thẻ mô hình (model card) chính thức trên kho lưu trữ hoặc trang Hugging Face, dùng thử bản demo trực tuyến để kiểm tra chất lượng giọng nói, hoặc tải về bộ trọng số 8B công khai cùng mã suy luận để chạy thử nghiệm (benchmark) nội bộ trong môi trường CUDA của riêng mình. Đối với quy trình làm việc của các nhà sáng tạo nội dung cần lưu trữ trên hệ thống, người dùng có thể đăng ký tài khoản và chọn gói thuê bao phù hợp dựa trên nhu cầu giới hạn ký tự theo tháng hoặc theo năm.
Thông tin liên hệ khác, hãy truy cập trang liên hệ với chúng tôi()
Miso One Tên công ty: .
Miso One Địa chỉ công ty: .
Tìm hiểu thêm về Miso One, Vui lòng truy cập trang giới thiệu về chúng tôi() .

Gói miễn phí
$0
Bao gồm các phôi ký tự miễn phí để thử nghiệm ban đầu với giới hạn tối đa 120 ký tự cho mỗi lần chuyển đổi.
Gói Cơ bản (Thanh toán theo năm)
$4.95 mỗi tháng
Thanh toán theo năm (hoặc $9.90/tháng nếu thanh toán theo từng tháng). Bao gồm 960.000 ký tự TTS mỗi năm, 9.600 phôi giọng nói, hỗ trợ tối đa 480 lần nhân bản giọng nói tức thì, tạo mô hình giọng nói riêng tư và hỗ trợ qua email.
Gói Chuyên nghiệp (Thanh toán theo năm)
$14.95 mỗi tháng
Thanh toán theo năm (hoặc $29.90/tháng nếu thanh toán theo từng tháng). Bao gồm 4.200.000 ký tự TTS mỗi năm, 42.000 phôi giọng nói, hỗ trợ tối đa 2.100 lần nhân bản giọng nói tức thì và được ưu tiên hỗ trợ cho các quy trình làm việc liên quan đến giọng nói.
Gói Doanh nghiệp (Thanh toán theo năm)
$24.95 mỗi tháng
Thanh toán theo năm (hoặc $49.90/tháng nếu thanh toán theo từng tháng). Bao gồm 9.600.000 ký tự TTS mỗi năm, 96.000 phôi giọng nói, hỗ trợ tối đa 4,800 lần nhân bản giọng nói tức thì và có đội ngũ hỗ trợ ưu tiên riêng cho doanh nghiệp.



Lắng nghe mạng xã hội