AI突破"语言茧房":从对话交互到任务闭环的智能跃迁

Ai项目交流群,Ai账号交易充值,Ai软件分享,Ai网站导航,Ai工具大全等
复制公众号
用户只需在聊天框中轻描淡写地输入一句“帮我点两杯咖啡”,千问便能迅速调用淘宝闪购的服务能力,精准完成定位、推荐商家、生成订单等一系列连贯动作,并通过内置的“支付宝AI付”功能,实现一键轻松付款,真正诠释了“言出必行,即刻送达”的便捷体验。
近日,阿里巴巴发布了最新版本的千问App,这款应用不仅支持人工智能(AI)点外卖、订机票、订酒店等多元化功能,更打通了从需求精准表达、任务高效执行到支付顺利完成的全流程,构建了一个完整的AI办事闭环体系。
从单纯的“聊天对话”到全面的“办事服务”,AI正以前所未有的速度从辅助工具属性向超级入口角色转变。阿里巴巴、字节跳动、腾讯等科技巨头纷纷布局,不仅掀起了一场面向广大消费者的入口争夺大战,更在悄然间重塑着未来的流量分发逻辑与商业生态格局。
“所谓AI入口,其本质在于利用AI智能体取代传统操作系统的人机交互界面,实现对端侧设备的全局性智能驱动。”中国互动媒体产业联盟专家委员会委员、数字文化产业工作组组长包冉在接受科技日报记者采访时解释道。在这一模式下,用户无需再依赖操作系统逐个启动App,而是可以直接通过自然语言与AI进行交互,调用所需的各种能力。
这种全局性智能驱动模式不仅局限于手机端,更延伸至电脑、智能眼镜、智能电视等各类终端设备。“只要设备具备基础的联网能力,并接入云端AI,智能体就能自动完成对用户真实需求的深度整合与高效处理。”包冉进一步阐述道。他认为,未来用户真正关心的,不再是打开了哪个App、停留了多长时间,而是能否高效、便捷地完成购物、信息获取、社交互动、导航指引等最终目标。
“AI在拥有了‘超强大脑’之后,如今又长出了能够触达真实世界的‘手和脚’,真正在生活中为用户排忧解难、分担事务。”千问C端事业群总裁吴嘉介绍道。千问App已全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里巴巴生态体系内的核心业务,实现了点外卖、订机票等AI购物功能,并上线了超过400项AI办事服务,极大地丰富了用户的使用场景与体验。
特别是在深度接入“支付宝AI付”和政务服务后,用户无需在多个页面间来回跳转,也不必手动搜索繁琐的政策文件,只需在对话框中用一句话清晰描述需求,即可轻松查询签证、户口、公积金等50项民生服务事项,真正实现了政务服务的智能化、便捷化。
千问“办事能力”的显著提升,离不开底层大模型技术的持续突破:千问大模型的编程能力得到了大幅提升,使其能够实时构建各种实用工具;全模态理解能力的增强,则让其能够看懂界面信息、听懂声音指令、读懂图文报表;而超长上下文处理能力的提升,更是大幅提高了复杂任务的交付上限与准确性。
“基础大模型在技术层面的不断迭代升级,为大模型的实用化进程奠定了坚实基础。”中国信息通信研究院人工智能研究所所长魏凯表示。据中国信息通信研究院的最新测试结果显示,今年以来,模型在语言和多模态理解能力方面的综合能力分别提升了30%和50%,推理、编程等能力也呈现出“又好又快”的蓬勃发展态势,AI正逐步从辅助性工具转变为具备交互学习能力的智能伙伴。
与此同时,智能体正成为大模型应用落地的主要形式,并逐步显现出“数字劳动力”的雏形。魏凯介绍道,一方面,在网页交互、信息整合、调查研究等通用场景中,一些通用智能体的表现令人眼前一亮;另一方面,面向编程、法律、人力资源等垂直领域的专用智能体,则聚焦特定行业任务,强化专业适配能力,成功实现了应用落地的破局与拓展。
然而,魏凯也提醒道,无论是专用智能体还是通用智能体,目前都还处于发展的初级阶段,其任务规划的可靠性、与既有业务系统对接的复杂性以及权责界定等问题依然突出。“要真正形成强大的生产力,不仅依赖于基础模型的进一步进化与升级,更需要与领域专有数据和流程进行深度结合与优化。”魏凯总结道。

Google Gemini
Sora