燧原科技宣布升级企业战略 -- 全面打造 AIGC 时代的基础设施

摘要

  燧原科技宣布升级企业战略:以全栈软硬件和集群产品为数字底座,结合 MaaS (Model as a Service) 的业务模式,全面打造人工智能技术生成内容 (AIGC) 时代的基础设施。

  燧原科技宣布升级企业战略:以全栈软硬件和集群产品为数字底座,结合 MaaS (Model as a Service) 的业务模式,全面打造人工智能技术生成内容 (AIGC) 时代的基础设施。

  一、燧原大模型技术与产品深耕已久

  燧原科技自创业之初就瞄准云端训练产品市场,以突破高难度训练芯片为目标,2019 年推出的第一代产品云燧 T10/T11 是国内第一款具备 FP32 高精度算力的训练产品。其创新的片间高速互联,以及软件栈聚焦优化数据并行与模型并行等大规模集群的训练能力,奠定了今天燧原的训练产品在国内大规模集群训练场景的领先优势。

  基于云燧 T11 的冷板式液冷方案,燧原科技为之江实验室构建了超千卡规模 AI 液冷集群,以赋能文本到视频生成的场景为目标,成功支持了 GPT-2、源 1.0 及实验室自研蛋白质结构预测等多个超大规模巨量模型的高效训练。液冷智算集群也顺应国家的绿色低碳环保的要求,PUE 经实测最低可降至 1.08。

  历经五年的产品迭代和优化,燧原科技现已拥有从硬件、软件到系统的全栈解决方案,结合云燧训练和推理产品在行业落地打磨的实践经验,可为客户提供丰富多样的人工智能系统软硬件产品,全方位降低 AI 算力中心部署和应用成本。

  二、厚积薄发,燧原科技发力

  在大模型标杆项目落地经验指引下,以大幅缩短大模型开发与应用周期为目标,针对大模型场景下的算力需求特性,燧原科技现已针对大模型场景形成从硬件、软件、系统方案的全栈技术,全面支持大模型生产,包括但不仅限于:

  大模型现有生态接入:支持 PyTorch、TensorFlow、PaddlePaddle、OneFlow、Megatron-LM、FairScale 等主流 AI 框架和分布式加速库,支持 GPT-2、源 1.0、悟道 2.0、CPM 等主流 AIGC 大模型的 Pretrain 和 Finetune。

  大模型极致性能提供:采用自主研发的 GCU-LARE 技术和 ECCL 分布式通信技术,提升大模型训练多机多卡高速互联的性能,支持数据并行、模型并行、流水线并行和混合并行等并行加速功能,支持 Activation Checkpointing、ZeRO 优化器、CPU offload、AMP(自动混合精度) 等算力和显存优化方法,可快速高效地进行大模型训练。

  大模型训练 TCO 优化:从大模型应用端到端、技术全栈角度,燧原科技提供一体化大规模 AI 算力集群方案 -- 云燧智算机 (CloudBlazer POD),方案采用一体化设计,是专为人工智能场景下计算、存储、网络、软硬协同设计的标准化产品,以"全局优异"为目标,大幅降低建设满足大模型场景需求的 AI 算力基础设施的总拥有成本 (TCO)。

  大模型业务高性价比推理加速:凭借云端推理产品云燧 i20 通过互联网社交应用服务上亿规模用户的成功经验,同时与广泛的落地场景进行打磨,燧原的推理产品在支持 Stable Diffusion、GPT-2、T5 等 AIGC 大模型推理上具备高性价比,加速 AIGC 相关下游场景的商业落地。

  燧原科技大模型全栈技术

  燧原科技创始人、COO 张亚林表示:"人工智能技术的发展正在步入一个全新的阶段,AIGC 内容生成类模型以及所生产的内容生动反映了人工智能从感知、认知进阶到生产,也正在重构互联网商业模式,催生数字经济新突破。在以 ChatGPT 和 Stable Diffusion 为代表的 AIGC 技术浪潮下,燧原科技凭借在大模型训练及推理的产品技术优势,结合 MaaS 的业务模式,构建 AIGC 时代的基础设施底座。"

  关于燧原科技

  燧原科技专注人工智能领域云端算力产品,致力为人工智能产业发展交付普惠的基础设施解决方案,提供原始创新、全栈自研、具备完全自主知识产权的通用人工智能训练和推理产品。凭借其高算力、高能效比以及灵活编程能力,可广泛应用于互联网、金融、交通、能源及新基建等多个行业和场景。

  燧原科技携手业内标准组织,秉承开源开放的宗旨,与产业伙伴一起促进人工智能产业发展。

来源:东方新闻

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。