文章详情
应用场景来看,对话式AI不适合视觉场景,所以现在更多的是语音和听觉交互场景。在生成式AI的浪潮下,行业普遍认为多模态大模型是实现AGI的...
2025-04-03 10:10:02
文章详情介绍
应用场景来看,对话式AI不适合视觉场景,所以现在更多的是语音和听觉交互场景。
在生成式AI的浪潮下,行业普遍认为多模态大模型是实现AGI的必经之路,知名投资机构a16z最新关于Voice AI的报告也显示,随着大模型的不断进步,语音将成为一种关键的切入点,即对话式AI。
随着对话式人工智能技术的日益成熟,其应用场景也呈现出爆炸式增长。聊天机器人作为对话式AI的重要应用之一,被广泛用于客户服务、教育、医疗、娱乐等多个领域。
那么,对话式AI的爆发年会先出现在哪个领域和场景?
近日,在声网对话式AI引擎发布会上,阿里云智能集团通义千问高级产品架构师辛晓剑、Minimax解决方案高级总监冯雯、腾讯云AI产品架构师总监曹超,声网AIRTE产品线负责人姚光华参与了讨论。
多位与会嘉宾认为,对话式AI可能率先在桌面助手、手机助手、智能硬件、陪伴机器人等场景爆发。
腾讯云AI产品架构师总监曹超表示,对话式AI特有的优势在于能够有感情、有温度地传递声音和交互的方式,而且随着模型的升级,可以带来更多情感的传递。
“应用场景来看,对话式AI不适合视觉场景,所以现在更多的是语音和听觉交互场景。比如有些老人视力会有一些不便,用微信也都是长按说话,放到耳边贴得很近去听去看。这些人群同样需要一些工具解决自己的沟通和解决问题的诉求,对话式AI也给这些人群打开了新的机会和可能性。目前对话式AI的硬件视角很多也是基于手机。”
阿里云智能集团通义千问高级产品架构师辛晓剑补充道,“教育领域的学习机也是一个比较好的场景,目前全国的学习机出货量大概是每年6000万台,且由于大模型的加持,客单价有了非常明显的提升,此前学习机客单价为三四千块钱,现在网上品质稍好的学习机均价已经达到八千以上,这就是对话式AI加持带来的溢价空间。”
据了解,目前市场上的对话式AI产品主要包括亚马逊Alexa+、汤姆猫AI情感陪伴机器人、苹果Siri、Manus等。
近日,声网发布了全球首个对话式AI引擎,凭借650ms 超低延时响应、优雅打断、全模型适配等五大能力,对话式AI引擎可支持任意文本大模型快速升级为“能说会道”的对话式多模态大模型。
声网AI RTE产品线负责人姚光华表示,”经过一段时间与客户的打磨及实际使用场景调研,经统计,用户与AI 每产生1次对话中,平均会有约3轮问答,计算下来平均对话时长约为21.1s,单次成本仅需3分钱。如果每月对话次数15次,那么月成本不到5毛钱,年成本也只需5元。”
据介绍,通过声网对话式AI引擎,开发者可以快速部署智能助手、虚拟陪伴、口语陪练、智能客服、智能硬件等对话式AI场景。例如智能助手场景可以通过自然语言交互,帮助人们进行日程管理、信息查询和任务执行。
谈及大模型从文本走向多模态交互的关键方面,嘉宾们认为,多模态模型架构和训练范式变化不大,提升主要依赖数据质量和数量。实现多模态交互的关键在于将不同模态信息转化到同一语境,目前ASR(自动语音识别,是一种将人类语音转换为书面文本的技术)技术的发展有助于实现这一点。但要让交互体验更好,还需提升模型推理速度,解决如多角色长短期记忆、区分角色等工程化问题,同时也要应对不同模态交互中的复杂情况,如语音语义差异、视频处理等。
此外,嘉宾们普遍认为,DeepSeek爆火是好事,它实现了AI技术的破圈,吸引更多人关注AI。其开源对技术发展意义重大,推动了技术交流与创新,让更多人参与到AI探索中。在技术方面,Deep Seek给行业带来新思考,如在模型训练上,减少对大量数据的依赖,通过强化学习实现升级迭代,带来模型自我进化,降低算力需求,使AI普惠更具可能。此外,它还验证了模型API的商业模式,推动了应用开发范式的进步。
Minimax解决方案高级总监冯雯表示,DeepSeek出圈,对于AI行业的所有从业者都是一个很好的现象;相比之前,现在AI已经潜移默化地进入了更大的用户群体。“开源确实会极大地助力技术出圈,因为DeepSeek开源,最近我们发布的技术报告,都在积极地把最新的成果对外展示。”
特别声明:文章内容仅供参考,不构成投资建议。投资者据此操作风险自担。
最新思能攻略
更多- 天国拯救2波塞拉德图纸获取攻略-详细位置与获得方法介绍
- 金铲铲之战祝你发财的乌鸦攻略阵容推荐与玩法分析
- 中国人工智能蓬勃兴起:从智能聊天机器人到未来玩具的创新之路
- “你好,我是Mac电脑。” “而我则是智能人工助手。”
- Saga与虚拟世界的结合 — 探索人工智能推动的数字经济未来
- 摩尔代理人自我治理法律:人工智能引发的指数革命
- 魔兽争霸1中人类战役完整剧情梳理与分析
- 穿越火线中的AC是什么意思-深入解析穿越火线中AC的具体含义
- 燕云十六声中九剑枪装备获取攻略-九剑枪装备刷取的实用建议
- 燕云十六声杏花不见的获得方法解析-如何获取燕云十六声杏花不见
- PSP刺客信条血缘详细攻略流程解析(一)
- 天国拯救游戏控制台代码大全2025年—所有控制台代码均可永久使用
- 英雄联盟手游梅尔最佳装备搭配攻略2025-详细解析梅尔最强出装方案
- 如何通过有效的写作技巧(而非依赖AI)来减轻我的超速罚单
- 远传AI技术助力跨年夜网络畅通 2,300座新基站覆盖全台主要商圈
最新思能智能
更多- 全面解析英雄联盟双边无畏征召模式的玩法与特色
- 崩坏星穹铁道3.0版本预览兑换码大全-全新版本兑换码详细一览
- 从“鸡飞狗跳”到“父爱如山” 中间只需一个智能AI的助力
- Nature重磅研究:AI气象预测技术实现桌面级运行,预测速度提升千倍
- 金铲铲之战祝您事业有成奥恩最佳阵容搭配策略推荐
- DeepSeek发布V3重大更新:在代码和视觉上实现质的飞跃,附带5大评估维度
- 如何领取怪物猎人荒野的预售奖励?预售奖励详细介绍与领取方法
- 妈妈的绣感:在虚拟世界中寻找家庭温暖与亲情的纽带
- 联想moto精彩亮相2025年中国F1大奖赛 即将发布AI至尊小折叠新产品
- 仅用 4 周完成训练!鸿海研究院推出繁体中文 AI 大语言模型
- 深度解析大模型能力的核心要素:“巨量参数”和“丰富训练数据”之间的关系与影响
- 深入解析英雄联盟2025全球先锋赛KC战队各位成员的背景与表现
- 怪物猎人荒野解锁时间详细解析-全球发售时间表
- 掌握第五人格终场狂欢模式的全面玩家乐趣技巧与攻略
- 金铲铲之战s14六斗草人强力阵容推荐与搭配策略