2025年1月20日,道宝App正式推出了最新的“端到端”语音模型,并对实时语音通话功能进行了重大更新。这一进步标志着道宝在语音交互领域的又一飞跃,将ASR(自动语音识别)、LLM(大型语言模型)和TTS(文本转语音)的级联解决方案整合为单一模型,涵盖了语音识别、理解和生成。
据“智能涌现”测试显示,道宝的新功能中最引人注目的是其类似人类的表达能力和情感输出,这增强了对话的流畅性和智能化。特别是“灵魂歌手”和“多才星”模式不仅让道宝能够唱歌,还能进行丰富的角色扮演,使其成为用户互动的新宠。例如,当用户要求道宝模仿艺人于书欣的声音时,道宝不仅能成功复制角色的语气,还能俏皮地表现出自己的独特个性。
更令人印象深刻的是,道宝能够在自然对话中自发创作歌曲,无需复杂的命令或专业提示。用户可以随时请求道宝唱歌,并指定歌词主题。尽管道宝偶尔会犯些小错误,但其快速响应和即兴创作能力令人惊叹,展示了其强大的拟人化能力。
此外,“暴躁道宝”和“赞美大师”等新的个性模式为用户带来了新鲜感。这些个性模式使道宝能够在不同情境下展示不同的情感和风格,增加了互动的乐趣和真实性。
在当今快速发展的语音交互技术中,这次更新不仅扩展了AI的应用场景至情感陪伴和心理咨询等领域,还使AI的情感交流能力更接近人类。这种转变无疑将确保道宝在竞争激烈的市场中占据一席之地,并引领未来AI交互的发展。
总结:本文介绍了道宝App最新推出的“端到端”语音模型及其显著更新的实时语音通话功能。新功能包括类似人类的表达能力、自发创作歌曲的能力以及多种个性模式等。这些更新不仅扩展了AI的应用场景,并使其更接近人类的情感交流能力,在竞争激烈的市场中为道宝带来了优势。