当前位置:100EC>数字教育>上海交大推出支持多人实时对话的语音情感大模型
上海交大推出支持多人实时对话的语音情感大模型
网经社发布时间:2025年04月16日 09:48:14

(网经社讯)4月16日,上海交通大学听觉认知与计算声学实验室在学术界的卓越研究中,推出了支持多人实时口语对话的语音情感大模型“交交”。这一创新不仅标志着语音助手技术的重大突破,也实现了多说话人、多语言、多角色、多情感的全能对话伙伴的初步应用。目前,该模型已进入内测申请阶段。

多功能应用:覆盖教育、家庭、商务及娱乐

据网经社教育台(EDU.100EC.CN)查询DeepSeek后获悉,“交交”的应用范围广泛,涵盖教育辅导、家庭互动、商务沟通和娱乐陪伴等多个领域。其强大的对话理解能力,不仅能根据上下文内容提供知识问答,还能进行多语种和方言的实时辨识与理解,灵活切换角色,并准确表达情感。这种综合功能在目前市场上已有的语音对话模型中尚属罕见。

实时对话与情感理解

“交交”在实时对话中采用了端到端语音对话技术,并结合上下文信息,通过思维链技术生成符合对话场景的情感全局表征,从而生成生动的情感语音回复。这不仅提升了对话的自然性和互动性,也为客服支持等实际应用提供了强有力的帮助。

多人对话与音色克隆

在多人对话场景中,“交交”能根据不同对话者的声音、语言、情感等特征,给出相应的回应。这一功能通过实时音色克隆技术实现,使得“交交”在家庭聚会或商务会议的模拟场景中,表现出极高的互动性和逼真度。

语言支持与情感互动

“交交”支持汉语、英语、日语和法语四大主流语言,具备跨语言回复能力。同时,它还能根据对话内容和场景理解用户情绪,生成富有情感的回应,极大地增强了对话的真实感和亲和力。

知识领域覆盖与灵活拓展

在知识问答方面,“交交”涵盖广泛的知识领域,包括古诗词背诵、科学原理讲解、文学名著解读等。此外,它还能灵活拓展,支持文本与音频模态的任意方式拼接融合,为集成大规模文本大模型中的多种增强机制(如联网搜索、RAG检索增强生成等)提供统一且可扩展的接口。

结语

上海交通大学推出的口语对话情感大模型“交交”,以其卓越的技术和多功能应用,引领了新一代智能语音助手的发展潮流。随着技术的不断完善和应用的逐渐推广,“交交”必将在未来的对话交互领域中发挥重要作用,为人们的生活带来更多便利与乐趣。

浙江网经社信息科技公司拥有18年历史,作为中国领先的数字经济新媒体、服务商,提供“媒体+智库”、“会员+孵化”服务;(1)面向电商平台、头部服务商等PR条线提供媒体传播服务;(2)面向各类企事业单位、政府部门、培训机构、电商平台等提供智库服务;(3)面向各类电商渠道方、品牌方、商家、供应链公司等提供“千电万商”生态圈服务;(4)面向各类初创公司提供创业孵化器服务。

网经社“电数宝”电商大数据库(DATA.100EC.CN,免费注册体验全库)基于电商行业18年沉淀,包含100+上市公司、新三板公司数据,150+独角兽、200+千里马公司数据,4000+起投融资数据以及10万+互联网APP数据,全面覆盖“头部+腰部+长尾”电商,旨在通过数据可视化形式帮助了解电商行业,挖掘行业市场潜力,助力企业决策,做电商人研究、决策的“好参谋”。

【投诉曝光】 更多>

【版权声明】秉承互联网开放、包容的精神,网经社欢迎各方(自)媒体、机构转载、引用我们原创内容,但要严格注明来源网经社;同时,我们倡导尊重与保护知识产权,如发现本站文章存在版权问题,烦请将版权疑问、授权证明、版权证明、联系方式等,发邮件至NEWS@netsun.com,我们将第一时间核实、处理。

        平台名称
        平台回复率
        回复时效性
        用户满意度
        微信公众号
        微信二维码 打开微信“扫一扫”
        微信小程序
        小程序二维码 打开微信“扫一扫”