1. 多语种语音合成
MyVocal AI语音大模型API文档
  • 文字转语音大模型
    • 多语种语音合成
      • Voices
        • 创建声音
        • 获取声音列表
        • 删除声音
      • Text-to-Speech
        • 多线程全双工通道 (Mutiple-websocket)
        • 单线程全双工通信(WebSocket)
        • 流式文字转语音(Streaming TTS)
        • 非流式文字转语音
      • 查询接口
        • 查询主key用量
        • Request_id客户端查询
        • 发音人用量查询
      • 子密钥管理
        • 创建子 Key
        • 查询子 Key 列表
        • 获取单个子 Key 详情
        • 更新子 Key
        • 查询子 Key 用量
  • 金融行业定制TTS模型
    • 文字转语音 Skyblight
      • 创建声音
      • 获取声音列表
      • 流式文字转语音(Streaming)
      • 文字转语音(非流式返回)
      • 删除声音
      • 用量查询
    • 全双工通信
      • websocket接入说明
  • 语音转文字ASR
    • 语音转文字
      • 实时语音转文字(Realtime ASR)
      • 语音转文字ASR
      • 客户用量查询
  • 企业客户声音定制服务
    • 定制属于你的专属声音
  1. 多语种语音合成

Voices

MyVocal 目前有三种成熟可商用的语音克隆功能:#

Instant-实时克隆#

参考音频时长:10 秒以上
相似度:80%+
应用场景:适合大批量部署音色,并频繁更换音色的使用需求。

Premium-至臻克隆#

参考音频时长:5 分钟以上
相似度:90%+
应用场景:适合 B 端定制专属音色,提供长时稳定输出,适用于客服、热线等对稳定性有要求的场景。

Original-Grade 原声克隆#

参考音频时长:40 分钟起
相似度:99.99%
应用场景:适合专业配音(影视、游戏、直播等),对音质和还原度要求极高的场景。
上一页
多语种语音合成
下一页
创建声音
Built with