2024，大模型的 iOS 时刻

科技史的组成，是几百年间一个又一个决定性时刻的串联。

2010 年 6 月 8 日凌晨一点，美国旧金山 Moscone West 会展中心的苹果发布会上，一身黑 T 恤蓝牛仔的乔布斯正式登台，他手握的 iPhone 4 自此成为跨时代的产品设计，凭借新理念的工业设计、500 万像素摄像头和视网膜显示屏以及 Facetime 视频通话等 100 多项新功能，这场发布会演讲，数次引起台下雷鸣般的掌声。

伴随着「very change, much wow」就这样改变一切的口号，全世界范围内的移动互联网浪潮就此拉开序幕。

不过，iPhone 4 改变世界背后，硬件的革新只是表象，所能影响到的，不过苹果与苹果产业链上下游，以富士康为代表的代工厂们。

真正让 iPhone 4 发布成为全球历史性一刻的，是 IOS 的推出，以及此后几年间安卓系统的快速跟进。开放的操作系统，让手机脱离了单纯的电话、拍照、播放音乐的功能限制，全世界软件企业的共同参与，进一步延伸了手机的边界，也孕育了 Facebook、TikTok、微信、美团等一大批超级应用，世界自此跑步进入移动互联网的时代。

应用决定想象力，成为新的行业铁律，而这条铁律，也正一点点在 2024 年的大模型时代再次被验证。

技术在不断进步，但商业模式，却总是踏着相同的韵脚不断重复。没有人会怀疑，大模型，正进入自己的 iOS 时刻。

01 创造大模型时代的明星产品经理

移动互联网的诞生初期，2010 年前后，曾经有一本爆款图书面世《人人都是产品经理》。

书中传达的理念，一时之间，给了无数求职无门的文科生们指出了一条新的职业方向。只是很快，大批涌入的文科生们就发现，产品的设计理念与技术的可行性是两回事；产品功能的实现，也始终离不开对代码底层逻辑的了解，《人人都是产品经理》不过是出版商为了卖书，使出的修辞手法。

一众大模型企业是否有从这本书身上取到经不得而知，但门槛降低才能生态成长的理念的确一脉相承：在大模型时代，代码能力，不再是影响产品创意的决定性因素，理念设想到产品落地，中间也仅需与 AI 的不断对话。轻装上阵，成为这一时期的大模型落地关键词。

第二届百度「文心杯」创业大赛正是这一现状最好的观察切口。

作为国内大模型领域最高规格、力度最大的创业大赛，百度「文心杯」创业大赛至今已连续举办两届。本届比赛，更是直接吸引了近 1600 个项目报名，其中，利用 AI 原生应用项目占比，更是从去年的 8 成提升至今年的超 9 成。

其中，值得一提的是，在本届文心杯的参赛团队中，超过 30% 参赛团队没有专业程序员。

就以本次比赛的二等奖获得者 Kotoko 虚拟角色社交互动平台来说，这是一款 AI-Native 社交游戏（类 AI 版模拟人生），应用底层基于 Multi-Agent 架构，可以实现环境-角色以及角色-角色的智能化互动，用户可创作个性化 AI 角色，体会与亲手创建的「纸片人」建立连接的快乐。其 CEO 是出身于商学院与投资人背景的 97 年创业者。而 CPO，则是 95 年出生，毕业于伦敦艺术大学，擅长游戏系统策划。

Kotoko：虚拟角色社交互动平台｜来源：百度

与开发门槛降低伴随而来的，是应用创新的广度增加。

数据显示，去年的文心杯，还有约 30% 的参赛项目集中在通用办公及营销领域，今年参赛方向更加多元，涵盖文娱、电商、营销、医疗、办公、硬件、企业服务等等千行百业，整体的交付质量，也从过去的可能性展示，变成了真正的产品级交付。

比如一等奖，极睿科技，其产品定位于一站式电商素材 AI 工具，面向电商场景，为消费品牌提供覆盖图文及短视频的 AI 内容生成、管理工具及转化服务。

极睿科技：一站式电商素材 AI 工具｜来源：百度

获奖项目水母智能则在 AI 绘画的基础上更深入一步，定位为 AI 漫画/漫短剧创作工具及内容平台，基于自研 AI 漫画生成工具链来赋能创作者，打造创作者社区和内容平台。当前，社区内累计的 AI Native 创作者已达 200 万，累计创作 1 亿+作品；并与国内外头部发行平台、网文平台等建立合作关系，已获得独家网文 IP 150 个。

水母智能：AI 漫画平台｜来源：百度

技术的成熟，抹平了代码能力的差距，数量的爆发，带来了应用在千行百业的落地。此时此刻，摆在新时代开发者眼前的，似乎只剩行业经验这一道最后的鸿沟。

02 生态意味着什么？

大模型不是万能的，正越来越多的成为共识。

体现在技术侧：以百度为代表，越来越多的大模型头部玩家，不再过分强调模型性能的领先，转头讲起了生态与低门槛的故事。

而体现在应用开发侧：市场需要商业级交付，讲述大模型能做什么的美好期许前，承诺「我们的产品」可以帮用户解决哪些问题，成为竞争中新的赛点。

依旧以前面提到的做 AI 漫画的水母智能为例。漫画行业有一个定律：只有前 5%-10% 的内容是盈利的，盈利的前提漫画的品质做到 A+和 S 级。然而，中国能达到 A 级能力的主笔只有 200-300 位，能到助理水平的画师，也仅有两千到三千位，但市场中每年毕业的美术专业的大学生新增数量，却数以万计。

而在这一背景下，人们对大模型的期待，就不只是简单会画图，而是会画 A 级漫画，能用商业级产品，切切实实的为企业降本。

比如，产品应该是专业级的一体化的工作台，使用产品时，不需要像 SD 那样左右横跳，从文生图到图生图，又条件生图。

其次，漫画不同于单张图片，需要保持画面主角的一致性，对姿势、表情、特效等等的细节要求也更为苛刻：比如，同样是拥抱，但到底是熊抱还是抱头、抱腰，在 A 级变化中是有严格要求的。

而解决这些问题，大模型只是整个企业工作流中的一环，能完成人物的一致性，可以提供高级训练工具的企业，才是真正的赢家。

类似的情况，也发生在做 AI 心理诊疗的镜象科技身上。看起来 AI 心理诊疗，不过是聊天模型的翻版，但是 AI 其实并不能理解人的情绪，只能在行为和表达层面去进行计算推理。

镜象科技：基于大模型的专业心理诊疗 AI 智能体｜来源：百度

而人类情绪复杂，常规的分类就有 18 种，最细的颗粒度甚至可以到 100 多种。除此之外，人的人生事件也可以被分成上千种，就算读书、毕业，也能分成十几、二十种不同的情况。

而这些精细的数据，并不存在于公域的互联网，反而是创业公司或者专业心理诊疗机构的核心壁垒。为建立数据库，镜象科技招募了十几个临床咨询的博士，花了两三年时间，不断收集生产数据，然后基于此进行训练，这才让最终的模型表达方式和回应方式，更像一个真实的心理咨询师的表达。

竞争的主战场，重新从技术被拉回传统赛道中的经验与数据积累，然而一个新的问题也随之产生：既然大模型不是万能的，那么百度承担的角色是什么？

03 从文心大模型到智能体生态，百度的基础设施蓝图

移动互联网时代，最大的增量机会出现在移动应用开发，但生态的繁荣，也进一步反哺，成为了苹果万亿市值的底座。

类比 iOS，成为大模型时代的基础设施，或许是关于百度，在大模型时代最精准的定位。

而这个定位，则要从技术、成本与生态三个角度来展开。

技术层面，在 ChatGPT 尚未面世的 2019 年，百度就发布文心大模型 1.0 版，历经四年多的技术深耕和研发迭代，文心大模型已经升级到 4.0 版。其中，2024 年 6 月，WAVE SUMMIT 深度学习开发者大会发布的文心大模型 4.0 Turbo，则通过数据、基础模型、对齐技术、提示、知识增强、检索增强和对话增强等核心技术的持续创新，以及飞桨文心的联合优化，成为目前市面上性能第一梯队的大模型产品。

与此同时，针对那些对成本要求更高的客户，5 月，百度将 ERNIE Speed、ERNIE Lite 和 ERNIE Tiny 三款轻量模型免费；7 月，百度又大幅降低了文心大模型 3.5 和 4.0 两款旗舰模型的价格，将大模型的使用成本一降再降。

但文心大模型针对的，依旧是那些已经具备成熟技术开发能力的企业，如何让大模型能被更多没有经验的产品经理、传统行业从业者，甚至小学生使用，其实还需要更低的门槛，比如成熟到几乎没有门槛的开发平台，而这则需要千帆与智能体生态的共建。

对应到产品上，则是今年百度 Create 大会上百度发布的三个产品，AgentBuilder、AppBuilder、ModelBuilder。其中，AgentBuilder 作为基于文心大模型的智能体构建平台，通过提供的零代码与低代码开发模式，能够大大降低智能体的开发门槛，即使是没有编程基础的小白，也能仅用「一句话」就创建智能体。

至于为什么是智能体，李彦宏曾经对大模型的发展阶段做过一个三阶段预判

「一开始是对人进行辅助，最后出来什么东西需要人把最后一道关，我们确定它的效果是 OK 的，各方面都不错才会让它出去，这是 Copilot 阶段；再往下走就是 Agent 智能体，外界对于 Agent 有各种各样不同的定义，最主要还是说它有了一定的自主性，具备自主使用工具、反思、自我进化等能力；这种自动化程度再往下走就变成一个所谓的 Al Worker，能够像人一样做各种各样的脑力和体力劳动，各方面的工作都可以独立完成。肯定要有这么一个过程。」

其中，智能体的意义，在百度文心杯创业大赛颁奖视频致辞上，李彦宏再次做了补充：「智能体相当于 PC 时代的网站和自媒体时代的账号，它最明显的特点是门槛足够低，谁都能上手，天花板又足够高，可以做出非常复杂，非常强大的应用。我认为，将来会有数以百万量级的智能体出现，形成庞大的智能体生态。」

通过文心大模型+千帆平台等 AI 基础设施作为应用开发的根基，智能体进入人人可开发时代。

数据显示：百度 2024 年 Q2 财报数据显示，目前，文心大模型日均调用量超 6 亿次，日均处理 Tokens 文本超 1 万亿，与 23 年 Q4 公布的 5000 万次日均调用量相比，半年增长超 10 倍，日均调用量和日均处理的 Tokens 数均为国内最高。

04 大模型 iOS 的最后一块拼图——分发

很长一段时间里，百度内部都有一个讨论：做大模型的企业不少，其中不乏云计算公司和一众同规模的大厂；而发掘优秀大模型创业团队，风投也能做到。

那么百度，与风投以及其他企业的区别是什么？

答案是对标 iPhone，百度不仅有技术和生态，更能让开发者赚到钱。秘密就藏在百度的智能体分发生态中：搜索场景，正是智能体最重要的落地方向；贴吧、文库、百度知道、爱奇艺，则是各种垂类智能体最精准的应用场景。

据统计，智能体在百度生态的分发量 7 月日均分发次数已经超 800 万，是 5 月的两倍。此外，在百度开发智能体的商户已达 1.6 万家，覆盖教育、法律和 B2B 等行业。其中，最常用的智能体包括内容创作、性格测试、日程规划等类型。用户、开发者、服务商、商户均为智能体生态的重要参与方，

最典型的例子是百度在 6 月推出的高考智能体，可满足不同考生的个性化需求，帮助他们选择大学和专业。高考后，该智能体的日活跃用户峰值接近 200 万，实用性受到认可。

前文提到的水母漫画，不仅借助文心大模型，重塑了工作流，干掉了 50% 的决策和环节，降低了 62% 的成本，AI 漫画还上线了百度的移动端，然后百度的上游 IP，百度的网文也成为上游的 IP 供给方。

而对镜象科技来说，去年底开始就和百度 MEG 开启了业务的合作，今年还将继续推进大搜索、网盟以及 HCG 健康合作。比如，用户在搜索场景中，搜一些心理学相关的问题或者关键词，会调起在搜索中原生的智能体，由镜象科技提供的内容来回答用户搜索的问题。

至此，百度不只是帮助企业完成智能体搭建，同时还帮助企业完成了智能体落地的最后一环，分发与赚钱。

尽管，相比研发大模型，全球领先，比赛中做一个漫画工具，心理诊疗 agent，似乎并不性感。

但大模型时代，一切微小变革，或许将深切地改变一个时代潮流的流向。

而身处其中，我们往往后知后觉，但维度拉长，翻开这一页，就会发现，这一点点的微光，正是一个时代中，我们努力改变未来所留下的清晰注脚——大模型的 iOS 时刻里，不只有聚光灯下的 OpenAI 与百度们，更有成千上万的应用开发者。

*头图来源：百度

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

最新文章