当前,我们处在人工智能发展的新拐点,大模型的能力涌现加速通用人工智能时代的到来,原生统一多模态、具身智能、AI for Science,将进一步深化人工智能对世界的感知、理解与推理,连接数字世界与物理世界,驱动科学研究创新突破。
1 月 8 日,北京智源人工智能研究院(下称智源研究院)发布「2025 十大 AI 技术趋势」。今年的十大 AI 趋势是智源研究院根据行业技术及应用热点,给出的年度 AI 趋势预测。从基础设施到产品应用,智源对 Scaling Law、基础模型、具身智能、超级应用、AI 安全等关键方向作出预测。针对每个趋势观点,报告给出其可成为 2025 年度趋势的论证逻辑。
在十大趋势发布会现场,来自清华等高校和企业界的领域专家,以及智源相关研究中心负责人对每项趋势进行了深入分析和点评。
智源研究院副院长兼总工程师林咏华发布「2025 十大 AI 技术趋势」。
在十大趋势的代表案例中,不乏中国自研技术和产品的身影。
在多模态领域,智源研究院发布完全自研的基于自回归技术的原生多模态世界模型 Emu3,实现了视频、图像、文本三种模态的统一理解和生成。
在模型应用领域,豆包月活跃用户数于 2024 年 12 月达到了 7116 万,成为国内第一、全球第二的 AI 原生应用。在服务类智能体赛道,蚂蚁集团旗下支小宝、蚂小财等系列 AI 管家产品,重塑了 AI 产品形态。
与此同时,在 AI 大模型及深度数字化趋势下,安全科技的价值在放大。智源研究院持续推进 AI 安全底层关键技术研究,同时积极推进 AI 安全国际合作:2024 年 3 月,发起并承办我国首个 AI 安全国际对话高端闭门论坛,与全球 AI 领袖学者及产业专家联合签署《北京 AI 安全国际共识》。2024 年 4 月,联合国科技大会发布了两项大模型安全标准,其中《大语言模型安全测试方法》由蚂蚁集团牵头。
智源研究院院长王仲远表示,当前,我们处在人工智能发展的新拐点,大模型的能力涌现加速通用人工智能时代的到来,原生统一多模态、具身智能、AI for Science,将进一步深化人工智能对世界的感知、理解与推理,连接数字世界与物理世界,驱动科学研究创新突破。智源研究院作为聚焦人工智能领域的新型研发机构,我们希望在这个特殊的时刻以十大趋势为出发点,为人工智能行业的从业者指明发展方向,携手共进。
趋势一 科学的未来:AI4S 驱动科学研究范式变革
大模型引领下的 AI4S(AI for Science),已成为推动科学研究范式变革的关键力量。2024 年,科研人员使用 AI 的比例快速增加,AI 对科学研究方法和流程的变革效应也开始显现。2025 年,多模态大模型将进一步融入科学研究,赋能多维数据的复杂结构挖掘,辅助科研问题的综合理解与全局分析,为生物医学、气象、材料发现、生命模拟、能源等基础与应用科学的研究开辟新方向。
趋势二「具身智能元年」:具身大小脑和本体的协同进化
2025 年的具身智能,将继续从本体扩展到具身脑的叙事主线,我们可以从三方面有更多期待。在行业格局上,近百家的具身初创或将迎来洗牌,厂商数量开始收敛;在技术路线上,端到端模型继续迭代,小脑大模型的尝试或有突破;在商业变现上,我们也必将看到更多的工业场景下的具身智能应用,部分人形机器人迎来量产。
趋势三「下一个 Token 预测」:统一的多模态大模型实现更高效 AI
人工智能的本质在于对人的思维的信息过程的模拟。当前的语言大模型、拼接式的多模态大模型,在对人类思维过程的模拟存在天然的局限性。从训练之初就打通多模态数据,实现端到端输入和输出的原生多模态技术路线给出了多模态发展的新可能。基于此,训练阶段即对齐视觉、音频、3D 等模态的数据,实现多模态的统一,构建原生多模态大模型成为多模态大模型进化的重要方向。
趋势四 Scaling Law 扩展:RL + LLMs,模型泛化从预训练向后训练、推理迁移
基于 Scaling Law 推动基础模型性能提升的训练模式「性价比」持续下降,后训练与特定场景的 Scaling law 不断被探索。强化学习作为发现后训练、推理阶段的 Scaling Law 的关键技术,也将会得到更多的应用和创新使用。
趋势五 世界模型加速发布,有望成为多模态大模型的下一阶段
更注重「因果」推理的世界模型赋予 AI 更高级别的认知和更符合逻辑的推理与决策能力,这种能力不仅能推动 AI 在自动驾驶、机器人控制及智能制造等前沿领域的深度应用,更有望突破传统的任务边界,探索人机交互的新可能。
趋势六 合成数据将成为大模型迭代与应用落地的重要催化剂
高质量数据将成为大模型进一步 Scaling up 的发展阻碍。合成数据已经成为基础模型厂商补充数据的首选。合成数据可以降低人工治理和标注的成本,缓解对真实数据的依赖,不再涉及数据隐私问题;提升数据的多样性,有助于提高模型处理长文本和复杂问题的能力。此外,合成数据可以缓解通用数据被大厂垄断,专有数据存在获取成本等问题,促进大模型的应用落地。
趋势七 推理优化迭代加速,成为 AI Native 应用落地的必要条件
大模型硬件载体从云端向手机、PC 等端侧硬件渗透。在这些资源受限(AI 算力、内存等)的设备上,大模型的落地应用会面临较大的推理侧的开销限制,对部署资源、用户体验、经济成本等均带来巨大挑战。算法加速和硬件优化技术持续迭代,双轮驱动加速 AI Native 应用落地。
趋势八 重塑产品应用形态,Agentic AI 成为产品落地的重要模式
2025 年,更通用、更自主的智能体将重塑产品应用形态,进一步深入工作与生活场景,成为大模型产品落地的重要应用形态。从 Chatbot、Copilot 到 AI Agent、Agentic AI,2023 年以来行业对于 AI 应用形态的理解越发深入。从更强调产品概念的 Agent,到更强调应用智能程度的 Agentic AI,我们在 2025 年将看到更多智能化程度更高、对业务流程理解更深的多智能体系统在应用侧的落地。
趋势九 AI 应用热度渐起,Super App 花落谁家犹未可知
近一年时间,生成式模型在图像、视频侧的处理能力得到大幅提升,叠加推理优化带来的降本,Agent/RAG 框架、应用编排工具等技术的持续发展,为 AI 超级应用的落地积基树本。虽然 Super APP 花落谁家尚未尘埃落定,但从用户规模、交互频次、停留时长等维度来看,AI 应用热度持续攀升,已到应用爆发的黎明前夕。
趋势十 模型能力提升与风险预防并重,AI 安全治理体系持续完善
作为复杂系统,大模型的 Scaling 带来了涌现,但复杂系统特有的涌现结果不可预测、循环反馈等特有属性也对传统工程的安全防护机制带来了挑战。基础模型在自主决策上的持续进步带来了潜在的失控风险,如何引入新的技术监管方法,如何在人工监管上平衡行业发展和风险管控?这对参与 AI 的各方来说,都是一个值得持续探讨的议题。
扫码下载报告全文