力压OpenAI高级语音模式,科大讯飞推出星火极速超拟人交互,实现人机对话“无缝衔接”

前沿资讯 1724063817更新

0

      8月19日消息,科大讯飞星火语音大模型宣布更新,推出了“星火极速超拟人交互”的新技术,该技术计划于8月30日上线讯飞星火App,向全民开放体验。星火极速超拟人交互在四个方面实现了突破:响应和打断速度、情绪感知情感共鸣、语音可控表达、以及人设扮演。

      “星火极速超拟人交互”技术能够模仿多种角色的音色和语气,如孙悟空、蜡笔小新等,甚至能够根据用户的指令调节情感、风格、方言和语速,让每一次对话都充满个性和情感。

      该技术,通过统一神经网络实现语音到语音的端到端建模,即便在频繁被打断的情况下也能迅速反应,更加符合日常对话情境。这种技术的响应速度之快,与人类正常聊天节奏几乎一致,允许用户随时打断、插话,实现了人机对话的“无缝衔接”。

      情绪感知是星火极速超拟人交互技术的另一大亮点。它不仅能根据声音的内容判断情绪,还能像朋友一样用合适的情感回应用户。无论是高兴时的笑声,还是悲伤时的安慰,星火极速超拟人交互都能一一应对。此外,它甚至能识别用户咳嗽、猫和狗的叫声等,给出对应的回复语。

      星火语音大模型支持多达74个语种和方言的“自由对话”,覆盖了37个主流语种和37种方言,其识别效果在多个语种上超越了OpenAI的whisper-V3,为跨国度、跨语种、跨文化间的对话提供了便利,也为多语言环境中的应用提供了强大支持。此外,该模型的语音合成拟人度超过83%,在首批40个语种中表现出色,使得合成语音更加贴近真人发音。

      星火语音大模型的另一个亮点是其在强干扰场景下的语音识别能力。科大讯飞展示了该模型即使在多人混叠说话的噪声场景中,也能实现高准确率的语音识别,这得益于其多模态能力,能够在实际应用中实现角色分离和实时转写。

      科大讯飞还发布了搭载星火语音大模型的讯飞翻译机,该翻译机具有多语种自动识别和增强式翻译功能,支持35种语言,让国际沟通更加便捷。此外,星火语音大模型的升级也扩展到了教育领域,科大讯飞推出的星火智慧黑板具备多模态理解与推荐、全自然交互、虚拟人辅学、智慧化录课与分享等功能,使得教学更加生动有趣,为学生提供了更加丰富的学习体验。

      随着智能语音服务市场的快速发展,预计到2030年全球市场规模将达到约731.6亿美元,星火极速超拟人交互技术的应用和普及将为语音市场带来新的发展活力。