模型简介#
Multilingual_v2#
这是我们最先进的情感感知语音合成模型,能够在多语言环境中生成自然、生动、富有情感的语音。它不仅具备深度的上下文理解能力,还能在不同场景中保持一致的音色与个性特征,让声音更真实、更有感染力。支持37种语言输出。Tubro#
专为实时交互与对话式 AI 打造的超低延迟语音模型,响应速度可低至 100毫秒以内。在确保高速响应的同时,依然保持自然流畅的语音表现与一致的说话人特征,并支持 40 种语言,非常适合应用于智能助手、客服对话、游戏语音等需要高互动性的场景。
数字|日期|货币相关处理方案Myvocal_v3 [最新]#
MyVocal全新的V3模型支持100种输出语言,在延续 V2 强大语音合成能力的基础上,进一步强化了对非语言声音的表现力,支持生成如笑声、咳嗽声、呼吸声等自然人类音效。同时,通过提示词即可精准控制情绪,仅需输入【生气】、【激动】、【呐喊】等关键词,系统便可合成带有相应情感的语音输出,大幅提升语音的感染力与真实感。该能力特别适用于对情绪表达和声音细节要求较高的场景,如游戏配音、影视配音、虚拟角色演绎等应用场景,为内容创作带来更丰富的声音表现力。Skyblight 金融行业定制模型
模型是一款专为 金融行业 优化的 TTS(文字转语音)模型,针对 品牌名称、人名、货币金额、电话号码、邮政编码 等在金融场景中常见的信息具有更高识别与朗读准确性,并保持高速响应。流式返回约50ms延时。
查看详细说明