费用: 部分功能免费
语言: 支持简体中文
简介: 阿里通义千问推出的超低延迟、多语种多音色文本转语音大模型,97 ms首包、49种角色音色,让AI真正“开口说话”
✨ 阿里通义千问推出的超低延迟、多语种多音色文本转语音大模型,97 ms首包、49种角色音色,让AI真正“开口说话”。
📌 功能特点
- ⚡ 首包延迟低至97 ms,支持流式实时输出
- 💡 49种高品质音色,覆盖男女老少、动漫/讲师/客服等角色
- 🔍 10大语种+9种中文方言(粤语、四川话、闽南语等)无缝切换
- 🎚 可调节语速、音高、音量、情感强度,上下文自动匹配语气
🚀 核心优势
- ✅ 稳定性与相似度SOTA,WER低于GPT-4o、MiniMax等竞品
- 👍 Thinker-Talker MoE架构,支持零样本声音克隆与跨语言迁移
- 🔒 阿里云API一键接入,按字符计费,免费额度1万字符/90天
🎯 适用场景
- 📈 短视频/广告配音,秒级生成多语种口播
- 🛠 客服机器人、游戏NPC实时语音交互
- 📰 有声书、语言学习App长文本朗读
Qwen3-TTS-Flash 发布了全新升级版本,此次更新围绕三个重点方向优化:声线丰富度、多语言与方言支持,以及自然度提升。

声线更丰富,角色更生动:
新版本提供 49 种高质量声线,覆盖男女老少及不同性格特征,可满足教育、娱乐、客服等多种场景需求。
用户可以体验到不同角色的语音表现,如活泼俏皮的 桃桃(Momo)、温暖贴心的童年好友 小野安娜(Ono Anna)、倔强直接的 “硬核女孩” 薇薇安(Vivian)、严格的教练 埃利亚斯(Elias)、睿智的长者 艾尔德里克·贤者(Eldric Sage),甚至还有可爱的萝莉音 邦妮(Bunny)。
多语言与方言支持显著增强:
Qwen3-TTS 现支持 10 种主流语言,包括中文、英文、德语、意大利语、葡萄牙语、西班牙语、日语、韩语、法语和俄语。
在 MiniMax TTS 多语言测试中,其平均词错误率(WER)低于 MiniMax、ElevenLabs 和 GPT-4o-Audio-Preview。同时,还支持 普通话、闽南语、吴语、粤语、四川话、北京话、南京话、天津话、陕西话等多种中文方言,能够忠实还原地区口音和语音韵律。
语速与韵律更贴近真人:
相比上一版本,Qwen3-TTS 对语音的 语速和韵律调整能力大幅提升,能够根据文本内容灵活调整语音节奏和情感表达,让生成语音更自然、贴近真人语音的说话方式。
开发者可通过 Qwen API 轻松调用 Qwen3-TTS,实现多语言、多方言、多声线的语音合成。
好的,我将你提供的上下文内容整合为单独展示的参考信息块,方便放在新闻稿末尾作为延展阅读或体验入口,同时保持新闻稿风格。如下:
Qwen3-TTS 体验地址:
- 在线体验 Qwen Chat:点击 Response → Read aloud http://chat.qwen.ai
- 官方博客:https://qwen.ai/blog?id=qwen3-tts-1128
- 实时 API 文档:https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3-tts-flash-realtime-2025-11-27
- 离线 API 文档:https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3-tts-flash-2025-11-27
- 在线语音 Demo:
- http://hf.co/spaces/Qwen/Qwen3-TTS-Demo
- http://modelscope.cn/studios/Qwen/Qwen3-TTS-Demo
豫公网安备41010702003375号