阿里云 CTO 周靖人:通义真正实现全尺寸、全模态开源,下载量已破 2000万

摘要

阿里云坚持拥抱开源开放

7 月 5 日,在上海世界人工智能大会上,阿里云 CTO 周靖人公布近期通义大模型和阿里云百炼平台的最新进展。近 2 个月,通义千问开源模型下载量增长 2 倍,突破 2000 万次,阿里云百炼服务客户数从 9 万增长至 23 万,涨幅超 150%。

周靖人重申了阿里云拥抱开源开放的坚定立场,「两年前,我们在世界人工智能大会上发布通义大模型系列,当时我们公布,通义核心模型将开源开放。到今天,通义千问已经实现真正意义上的全尺寸、全模态开源,拉平了开源、闭源模型之间的差距。」

通义千问开源模型深受开发者欢迎,总下载量 2 个月内增长 2 倍

近一年来,通义模型系列持续进化,基础模型性能不断提升,引领国产大模型进入全球 AI 竞技场。根据权威基准 OpenCompass 的测评结果,通义千问-Max 得分追平 GPT-4 Turbo,是该基准首次录得国产大模型取得如此佳绩。

去年 8 月,通义率先加入开源行列,沿着「全模态、全尺寸」开源路线陆续推出了数十款模型,包括语言大模型、多模态大模型、混合专家模型、代码大模型等,在权威榜单多次创造中国大模型的「首次」。

通义千问最新推出的开源模型 Qwen2-72B 更是风靡全球。在模型匿名 PK、8000 多位开发者参与投票的中文大模型竞技场 Compass Arena 上,Qwen2-72B-instruct 以 1090 的总分取得国产大模型最高分,总分仅次于 GPT-4o。在国际开源社区 Hugging Face 组织的 Open LLM Leaderboard 模型测评中,Qwen2-72B-instruct 再度登顶,力压 Llama-3、Mixtral、Phi-3 等海外模型。

HuggingFace 联合创始人兼 CEO Clem 发文表示:「Qwen2 是王者,中国在全球开源大模型领域处于领导地位。」

大模型的训练和迭代成本极高,绝大部分的 AI 开发者和中小企业都无法负担。周靖人表示,「阿里云主动开源性能达到 GPT4 级、超越众多闭源模型的大模型版本,真正拉平了开源、闭源模型之间的差距,让普通开发者也能用上最好的 AI 模型,大大加速了大模型的应用落地进程。」

通义千问 Qwen 系列开源模型在全球深受开发者群体欢迎,总下载量在近两个月内增长 2 倍,已突破 2000 万次。开源社区中还出现了超过 3100 款基于 Qwen 二次开发的模型和应用。

通义千问大降价后,阿里云百炼服务客户数已从 9 万增长至 23 万

今年 5 月,百炼大模型平台全面升级为阿里云承载云+AI 能力的重要平台,提供一站式、全托管的大模型定制与应用服务。

阿里云百炼平台主动拥抱社区生态,率先兼容 LlamaIndex 等开源框架,支持最大程度的开放性和自由度,让企业像搭乐高一样搭应用。开发者 5 到 10 行代码即可快速构建 RAG 应用,让大模型拥有「最强外挂」。

在模型服务上,阿里云百炼同样坚持打造开放生态。目前,百炼平台集成了上百款大模型 API,除了通义、Llama、ChatGLM 等系列,还首家托管零一万物、百川智能等大模型,覆盖国内外主流厂商,联动魔搭开源社区,还支持企业上架通用或行业模型,给开发者提供足够多样化的模型选择。

为了最大程度降低模型使用门槛、加速 AI 应用爆发,5 月 21 日,通义千问系列模型大幅降价,GPT-4 级主力模型直降 97%,低至百万 tokens 仅 0.5 元。

周靖人介绍,降价后大批客户在阿里云上直接调用大模型。近 2 个月,百炼服务企业客户数从 9 万增长至 23 万,增长超 150%。一汽、微博、金山、完美世界、央视网、蓝凌科技等众多知名企业都是阿里云百炼客户。

开源开放战略正为阿里云带来新的商业增长。周靖人强调,阿里云会将坚持拥抱开源开放,打造一朵「AI 时代最开放的云」。阿里云将携手业界伙伴,持续通过开放的算力平台、开源的自研模型、优质的模型服务,帮助中国企业和开发者抓住大模型时代的机遇。

 

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。