1. Text-to-Speech
MyVocal AI语音大模型API文档
  • 文字转语音大模型
    • 多语种语音合成
      • Voices
        • 创建声音
        • 获取声音列表
        • 删除声音
      • Text-to-Speech
        • 多线程全双工通道 (Mutiple-websocket)
        • 单线程全双工通信(WebSocket)
        • 流式文字转语音(Streaming TTS)
          POST
        • 非流式文字转语音
          POST
      • 查询接口
        • 查询主key用量
        • Request_id客户端查询
        • 发音人用量查询
      • 子密钥管理
        • 创建子 Key
        • 查询子 Key 列表
        • 获取单个子 Key 详情
        • 更新子 Key
        • 查询子 Key 用量
  • 金融行业定制TTS模型
    • 文字转语音 Skyblight
      • 创建声音
      • 获取声音列表
      • 流式文字转语音(Streaming)
      • 文字转语音(非流式返回)
      • 删除声音
      • 用量查询
    • 全双工通信
      • websocket接入说明
  • 语音转文字ASR
    • 语音转文字
      • 实时语音转文字(Realtime ASR)
      • 语音转文字ASR
      • 客户用量查询
  • 企业客户声音定制服务
    • 定制属于你的专属声音
  1. Text-to-Speech

多线程全双工通道 (Mutiple-websocket)

wss://api.voicelibrary.co/enterprise/v1/tts/{voice_id}/websocket/multi
Multi-Context WebSocket 官方 SDK
接口说明
常见问题

说明#

为降低接入复杂度,MyVocal 提供官方 SDK,封装:
WebSocket 生命周期
消息编解码
Context 管理
错误处理 / 重连 / 心跳
功能维度简要说明价值定位
多上下文并发单个 WebSocket 内并行管理多个独立 Context支持复杂对话与并行语音
Context 生命周期Context 可创建、生成、结束并释放资源语音过程可控、可管理
Context 保活Context 空闲时可保持存活适合长时间通话与等待
用户打断(Barge-in)支持随时中断当前播报并切换响应实现自然实时对话
Context 级 flush可对单个 Context 独立触发生成精准控制播报节奏
Context 级 close可单独关闭某个 Context提升资源利用效率
Context 错误隔离单个 Context 异常不影响整体连接提高系统稳定性
长连接复用一个连接长期承载多个 Context降低延迟、减少握手
显式并发上限单连接支持固定数量 Context(如 5)并发与成本可控
官方 SDKSDK 封装连接与 Context 管理降低接入复杂度
AI Agent 原生支持面向实时语音 Agent 场景设计电话机器人 / 语音助手

支持语言#

Python | Java | Golang

SDK 核心能力#

1.
自动管理 Context(创建 / 发送 / flush / 关闭)
2.
自动限制最多 5 个并发 Context
3.
兼容 Single-Stream 与 Multi-Context
4.
统一事件回调(音频 / 结束 / 错误)
5.
官方SDK下载

请求参数

Path 参数

Query 参数

Header 参数

上一页
Text-to-Speech
下一页
单线程全双工通信(WebSocket)
Built with