蚂蚁集团推出其AGI战略级产品——全模态通用AI助手「灵光」。这不仅是蚂蚁”AI First”转型的重要里程碑,更开创了AI助手从”对话工具”向”应用生成平台”跃迁的新范式。
1. 灵光对话:让知识”活”起来的可视化回答
传统AI助手往往局限于文字堆砌,而「灵光对话」采用结构化思维设计,每次回答都像是精心策划的展览。当用户询问”怎么做糖醋排骨”时,它不会简单罗列步骤,而是先呈现色泽红亮的菜品图,再搭配图文并茂的教程,使用不同字体、小标题、表情包等多元排版,让信息理解效率大幅提升。
更突破性的是其**全模态输出能力**:所有内容均由模型即时生成,无需调用预设模板。无论是财报数据的动态图表、霸王龙的3D可交互模型,还是旅行路线的可交互地图、量子纠缠的生成式动画,都能在一个对话中自然呈现。这种”让复杂变简单”的设计理念,让知识获取变成沉浸式探索。
2. 灵光闪应用:一句话生成可交互小工具
这是「灵光」最具革命性的功能。用户只需用自然语言描述需求,系统**最快30秒、最长1分钟内**即可生成一款可编辑、可交互、可分享的AI应用。
例如:
这些闪应用并非静态页面,而是能直接调用大模型后端能力,实现与外部实时交互的真正应用。从健身计划工具到旅行规划器,从健康食谱生成器到个性化预算表,零门槛享受AI Coding带来的生产力变革,这正是”人人都是开发者”的生动实践。
3. 灵光开眼:AGI相机看懂物理世界
搭载先进的AGI相机技术,「灵光开眼」通过实时视频流解析,让手机变成能观察、理解、创作的眼睛。它支持**文生图、文生视频、图生图、图生视频**等多种创作模式,可实时理解复杂场景并支持语音双向交互。
旅游时对准古建筑,它能实时讲解历史;看到不认识的植物,即时提供百科知识;上传照片后可自由提问”这是什么””怎么用”,甚至指令修图改图,为静态影像注入动态生命力。这种”所看即所得”的体验,打破了数字世界与物理世界的边界。
「灵光」的核心技术突破在于**全代码生成多模态内容**——这是业界首个实现该能力的AI助手。其背后依托蚂蚁百灵大模型(已跻身万亿参数阵营),通过多智能体协作的Agentic架构,动态调度图像、3D、动画等专用Agent与工具,实时协作完成复杂任务。
所有呈现结果,包括图表、动画、小应用等组件,均由模型根据对话情境即时生成,而非预制模板调用。这种”生成式呈现”能力,配合支付宝生态12亿实名用户和日均10亿笔交易的数据养分,构建了”识别-理解-推荐-交易”的全链路闭环。
作为蚂蚁集团AGI战略的产品级探索,「灵光」由集团CTO何征宇直接领导的AGI研究部门研发,是继”支小宝””AQ医疗管家”后的第四款独立AI应用,标志着蚂蚁从垂直场景AI向通用AI的跨越。
2025年以来,蚂蚁加速AGI布局:发布AI医疗管家AQ、成立灵波科技进军具身智能、百灵大模型持续迭代。「灵光」的推出,完整展现了蚂蚁从底层大模型到上层应用落地的全链路能力。行业分析认为,”闪应用”与支付宝生态的深度结合,是蚂蚁布局AI时代超级入口的关键策略。
「灵光」精准把握了2025年AI应用从”玩具”向”工具”转型的趋势,覆盖个人用户、职场人士、中小团队的多元需求。无论是学生拍题答疑、白领处理文档、商家设计营销工具,还是家庭生活小助手,它都能提供”让复杂变简单”的解决方案。
目前,这款集AI搜索、对话、识图、绘画、视频生成、文档处理、语音交互等十余项能力于一身的全能助手已全面开放。当AI学会自己写代码、生成应用、理解世界,真正的智能时代才刚刚开始。