腾讯云拉开了一张大幕,唯独少了基础的通用大模型。
大模型时代,腾讯用自己的方式,迈出了第一步。
6 月 19 日下午,腾讯云召开发布会。首次正式公布行业大模型研发进展,并发布面向 B 端客户的腾讯云 MaaS(Model-as-a-service,模型即服务)服务解决方案。
值得注意的是,腾讯云并没有像此前的谷歌、微软,或者国内的百度、阿里等大厂一样,公布一个基础的通用大模型。腾讯云 MaaS 的技术底座是一系列的行业大模型,包括金融、政府、文旅、传媒、教育等。基于这些基础模型,腾讯云的客户只要加入自己的场景数据,就可以生成契合自身业务需要的「专属模型」。
国内通用大模型的研发进程受算力紧张、起步较晚等因素制约,客观来说与 OpenAI 等全球领先的团队相比还有一定差距。但大模型在国内落地的需求却已刻不容缓,为了解决落地问题,推出更有针对性的行业大模型,并利用数据精调来满足业务需要,已经成为国内云服务商曲线解决当下困境的一种选择。
这背后的逻辑是:重要的是解决具体场景的需求,只要产品的效果够好,用户并不会关注技术底座到底是通用大模型还是行业大模型。
显然,腾讯云做出了相当务实的选择。会上,高管们介绍了一系列腾讯云 MaaS 的应用案例,其中既有针对腾讯企业端 SaaS 产品的智能化升级,也有与央视等外部合作伙伴一起探索的应用案例。
01
腾讯云 MaaS:
行业大模型精选店
腾讯云 MaaS 全景图
会上,腾讯首次公布腾讯云 MaaS 服务解决方案。
腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生介绍,腾讯云 MaaS 是基于 TI 平台打造的行业精选模型商店,覆盖金融、文旅、政务、传媒、教育等 10 大行业,提供超过 50 个解决方案。在这些能力模型的基础上,客户只需要加入自己独有的场景数据,就可以快速生成自己的「专属模型」。
比如,腾讯云已经和国内某头部在线旅游公司,基于「文旅大模型」打造了机器人客服,后者可以自动判断用户意图,并调用相应的 API,高质量完成用户咨询及服务。
如果一个用户问,「节假日有哪些比较经济的旅游景点推荐?」基于通用大模型的客服机器人,只能给出一些简单的景点介绍和路线规划。但是当使用大量有针对性的行业数据来做模型精调之后,客服机器人的回答就变得更加细致,能够规划出每天的交通、景点安排,给出经济实惠的定制化推荐方案。
除了提供基础的行业模型,数据方面,腾讯云同时推出了基于腾讯云 TI 平台的行业大模型精调解决方案。
精调行业大模型是为了帮助模型开发者与算法工程师,解决数据的处理问题,高效率、高品质、低成本地创建和使用大模型。此外通过 TI 平台以及模型的私有化部署、权限管控和数据加密等方式,腾讯云还希望帮助开发者和企业客户解决数据安全和隐私方面的担忧。
比如腾讯云与中央电视台打造的「央视人工智能开放平台」。开发过程中也面临数据量庞大、形态复杂的问题,导致传统的数据标签体系都无法达标。
为此,双方重新构建了一套传媒专属的数据标签体系,同时也研发了创新的「标签权重引擎」,让数据标签颗粒度更细,并按照核心度排序。在这样的数据标签体系支撑下,视频编辑用自然语言就能实现跨模态检索。比如,输入「居民消费力」,系统可自动提供商场、超市相关素材,再搭配智能剪辑,就能快速生成视频。
最后是关于大模型持续运转的燃料——算力。在大模型的训练和使用过程中,需要大量异构算力的支持,对网络速度与稳定性要求也很高,加上 GPU 服务器比一般服务器稳定性更低一些,服务器的运维、问题的排查更频繁,整体运维的难度与工作量会高很多。
对此,腾讯云打造了面向模型训练的新一代 HCC(High-Performance Computing Cluster)高性能计算集群,搭载最新次代 GPU,结合多层加速的高性能存储系统,加上高带宽、低延迟的网络传输,整体性能比过去提升了 3 倍。汤道生表示,HCC 获得了很多客户的高度认可,几家 AI 独角兽都与腾讯云展开了合作。
除了计算集群,腾讯云还公布了更适合 AI 运算的「软能力」——向量数据库,它能更高效地处理图像、音频和文本等非结构化数据,支持单索引 10 亿级规模,比单机插件式检索规模提升 10 倍,数据接入 AI 的效率,也比传统方案提升 10 倍。
02
行业大模型加持,
腾讯三大 SaaS 产品升级
腾讯云的行业大模型解决方案发布较晚,但这段时间他们也没有闲着。
会上,腾讯云介绍了一系列已经落地到产品的大模型应用案例,其中大部分都是对腾讯已有的 SaaS 产品进行智能化升级,包括腾讯会议、腾讯企点智能客服、AI 代码助手。
整体来看,腾讯智能化升级的核心是智能助手,不论是腾讯会议的智能助手,腾讯企点的智能客服,还是辅助生成代码的 AI 助手,本质上都是针对不同场景下的 AI 助手。
这种思路与微软有相似之处。微软在今年 5 月的 Build 大会上宣布,将把基于通用大模型打造的智能助手 Copilot 融入到自己的各个 ToB、ToC 产品服务体系,包括 Windows、GitHub、Bing 搜索、Azure 云等。
腾讯会议
在过去的两年里,腾讯会议一直试图为用户提供更好的会前、会中、会后服务,但腾讯云副总裁、腾讯会议负责人吴祖榕也坦然承认「说实话收效甚微」。
比如,在会议开始前询问对方能否听清自己的声音是一个常见的场景,但这一问题过去一直没能被解决,直到此次腾讯会议推出的覆盖会议全流程场景的 AI 小助手。在 AI 小助手的帮助下,用户开麦后就能接收到自己的声音状况是否良好的提示,以此减少彼此询问造成的时间损耗。
上述场景只是一个很细节的点,除此之外,腾讯会议 AI 小助手还能在会前、会中、会后分别提供给用户全流程的服务。
众所周知,对于一线员工而言,会前约各位参会人员的时间是一个非常「痛苦」的过程,涉及到很多人员的时间协调,但是通过 AI 小助手,就可以将非常「痛苦」地反复询问和修改变成一个完全数字化的过程。
在会议过程中,即便你因为某些原因错过了部分会议内容,只需打开 AI 小助手轻轻一点,此前的会议内容就能尽收眼底。与此同时,参会者还可以通过 AI 助手针对性地在会议中查看某位成员的发言并进行互动。
会议结束后,AI 助手对于会议的记录提炼,也不只是简单的转写,而是会分段落、分层次地总结出整场会议的主要内容。通过将会议时间线划分为不同段落,AI 助手能够更方便用户依据「章节」「发言者」「话题」快速定位到相关内容。此前,会后智能录制已经在 5 月份小批量开放给会员和企业客户试用,在此次大会上,腾讯也表示将正式向所有付费用户开放智能录制功能。
智能客服
在传统的运营模式中,团队经常面临两大困扰:一个是官网用户的运营分析复杂琐碎,另一个就是官网的客服成本居高不下。针对这两点,腾讯企点尝试用企点智能分析和企点智能客服提供更加高效和精准的全流程管理服务。会上,腾讯企点以「腾讯云官网」为例,介绍了腾讯企点的全新产品,以及行业大模型将如何帮助运营团队解决实际问题。
首先,依托于腾讯云行业大模型以及腾讯在分析领域的积累,企点分析 AI 助手拥有五大核心能力,分别是:数据的理解,指标的拆解,语言的查询,AI 的推理,结论的提炼。
在五大能力的加持之下,销售人员只要问一句「哪个产品卖的最好」,就可以实现准确的商业分析,不需要花费大量的时间,学习复杂的软件、制作看板。运营人员还可以将 AI 助手生成的分析结果保存至官网购买专业分析看板中,后续运营人员就能够在该面板中监控官网的核心购买数据。更便捷的是,AI 分析助手还提供了「一键报告生成」功能,通过此功能运营人员可以立刻获得官网购买页专题分析的周报信息。
其次,在客户感知力更强的客服领域,传统的客服机器人往往会在帮助企业降本增效的同时损失部分用户体验,而新一代的腾讯企点智能客服,基于行业模型,结合客户业务需求进行训练与精调,可以提供更精准、更详细的回答,甚至调用业务系统来提供实时数据。对比上一代智能客服的机械回答,用户体验有很大的提升。
代码助手
腾讯云 AI 代码助手是此次大会上推出的又一款基于腾讯云行业模型的新产品。据介绍,借助腾讯云新一代 AI 代码助手,程序员可以在沟通、编码、排错、评审、调优等环节提升生产力。
AI 代码助手在全环节的功能包括:
- 在沟通环节,可以通过上下文推理可以帮助程序开发者加快理解代码逻辑;
- 在编码环节,可以根据当前代码类型对代码进行补全,并反向生成注释和单元测试;
- 在排错环节,可以定位错误问题并生成修改建议;
- 在评审环节,针对开发者提交的变更列表,可以帮助开发者生成评审建议和提交信息;
- 在调优环节,可以通过自然语言指令快速修改代码,实现效果调优。
腾讯 AI 代码助手支持 C/C + +、 JavaScript、Go、Python 等多种变现语言和常用开放的框架,以及 VS Code 等主流 IDE。同时基于正负反馈,AI 代码助手可以持续进行训练调优,实现工具的持续改进。目前,腾讯 AI 代码助手已经在腾讯内部团队展开试点,数据发现,AI 代码助手对开发者提高效率有接近 50% 的提升。
其他第三方应用案例
除了腾讯自身的 B 端产品,腾讯云还在会上公布了一些与第三方合作的案例。
1、文旅:智能客服大模型应用
在文旅领域,一家线上旅游 OTA 公司。其传统智能客服需要人工进行对话配置,知识维护量大、耗时长,且涉及订单等复杂业务场景,在无配置的情况下,无法通过机器人闭环解决问题。精调后的客户专属模型,无需配置对话流程,即可实现端到端解决业务问题。提升任务完成率,降低整体成本。
2、金融:OCR 大模型及智能客服场景
在金融领域,腾讯与客户探索了 OCR 大模型在银行单据处理场景中的应用。传统的 OCR 深度学习模型不具备阅读理解和推理能力、模型指标上限低,不同场景下模型能力无法复制,定制成本高。腾讯云联合一家头部银行,基于 OCR 大模型,上线了 4 类票据的自动化识别流程,信息录入准确率提升 50%。
3、政务:政务咨询场景
政务领域,腾讯云与福建大数据集团合作,基于大语言模型能力打造了首个智慧政务平台。其构建的小闽助手是福建政务领域首个互动式大模型应用,可以为市民提供 7X24 智能咨询服务,譬如办事指南、政策咨询、数据查询等。
4、教育:教育行业大模型
上海大学结合自身场景数据,通过腾讯云 TI 平台进行精调,构建了专属的教育行业大模型,计划覆盖包括在校生、毕业生全生命周期,提供咨询和问答内容,首个场景聚焦招生专业咨询和规章制度咨询。其他使用场景还包括教学助手、大模型人才培养、招生助手、作业批改。
5、传媒:媒资管理场景
央视多年积累了海量的音视频、图片、文稿等信息资源,但过去由于缺少智能的技术手段,人工编辑整理的投入成本大,但检索效率低,难以满足媒体采编存管播发全流程的时效性、高质量需求。对此,基于行业大模型能力,腾讯云帮助央视加强智能标签的理解、泛化能力,同时提升媒资检索能力,支持使用自然语言描述的方式精准检索视频、图片素材,跨越了模态屏障。
03
国内 MaaS 混战开启,
腾讯云要怎么做?
随着腾讯云正式宣布入局大模型,国内云服务市场排名靠前的几家,包括阿里云、华为云、腾讯云、百度云等都已加入这场大模型混战,国内 MaaS 的竞争已经拉开序幕。
在海外市场,大模型的到来在很短时间内就对云服务市场的格局产生了冲击,快速增长的微软云正在挑战亚马逊的霸主地位。而在国内尚没有明显的大模型领先者,各家云厂商在入局后,需要找到自己在这场竞赛中的定位。
今天大模型落地痛点,简单用一句话总结,就是行业需要更好用的模型,能用更低的成本部署,得到更好的效果。而腾讯的优势主要是其过去积累的庞大的业务数据和算力基础设施,今天腾讯云的解决方案,就是基于这些过去的积累,解决大模型应用落地的痛点。
首先,腾讯旗下有多个不同的业务板块,多年来在金融、传媒、文旅、工业等不同领域积累了大量的数据和经验。以此为养料,腾讯云才能构建起一系列针对不同行业的行业大模型,同时针对一些特定的任务进行优化,比如对客服等场景中的「对话问答」、「相似问生成」等,从而确保使用时仅需少了数据就可以达到较好的精调效果。
此外,大模型训练的基础是算力。腾讯云在大模型算力方面拥有领先优势。早在今年 4 月,腾讯云便发布了面向大模型训练的新一代 HCC 高性能计算集群,采用最新一代腾讯云星海自研服务器,结合多层加速的高性能存储系统,具备 3.2Tbps 业界最高互联带宽,算力性能提升 3 倍。
腾讯还有自己的升级框架加速能力太极 Angel,可以提供更优的训练和推理加速能力。在传统 CV、NLP 算法模型的基础上,新增了对大模型的训练和推理加速能力,通过异步调度优化、显存优化、计算优化等方式,相比行业常用方案性能提升超过 30%。
针对成本高、落地难的问题,腾讯云 TI 平台实现针对行业场景的低成本落地。在少量算力的基础上,提升特定任务的效果,比如智能客服场景,训练性能可提升 10 倍,训练成本下降 90%。
除了针对 B 端客户的解决方案,腾讯云也在尝试建立行业大模型的标准体系。腾讯云在会上公布,正在联合中国信通院,共同构建行业大模型的标准体系及能力架构,包括 1 套 ILMOps 方法论、60 多项能力建设指标。这个标准体系覆盖多个行业,涵盖模型行业能力、模型工程化性能、模型算力网络、模型安全可靠等方面。