燧原科技宣布升级企业战略 -- 全面打造 AIGC 时代的基础设施

　　燧原科技宣布升级企业战略：以全栈软硬件和集群产品为数字底座，结合 MaaS (Model as a Service) 的业务模式，全面打造人工智能技术生成内容 (AIGC) 时代的基础设施。

　　一、燧原大模型技术与产品深耕已久

　　燧原科技自创业之初就瞄准云端训练产品市场，以突破高难度训练芯片为目标，2019 年推出的第一代产品云燧 T10/T11 是国内第一款具备 FP32 高精度算力的训练产品。其创新的片间高速互联，以及软件栈聚焦优化数据并行与模型并行等大规模集群的训练能力，奠定了今天燧原的训练产品在国内大规模集群训练场景的领先优势。

　　基于云燧 T11 的冷板式液冷方案，燧原科技为之江实验室构建了超千卡规模 AI 液冷集群，以赋能文本到视频生成的场景为目标，成功支持了 GPT-2、源 1.0 及实验室自研蛋白质结构预测等多个超大规模巨量模型的高效训练。液冷智算集群也顺应国家的绿色低碳环保的要求，PUE 经实测最低可降至 1.08。

　　历经五年的产品迭代和优化，燧原科技现已拥有从硬件、软件到系统的全栈解决方案，结合云燧训练和推理产品在行业落地打磨的实践经验，可为客户提供丰富多样的人工智能系统软硬件产品，全方位降低 AI 算力中心部署和应用成本。

　　二、厚积薄发，燧原科技发力

　　在大模型标杆项目落地经验指引下，以大幅缩短大模型开发与应用周期为目标，针对大模型场景下的算力需求特性，燧原科技现已针对大模型场景形成从硬件、软件、系统方案的全栈技术，全面支持大模型生产，包括但不仅限于：

　　大模型现有生态接入：支持 PyTorch、TensorFlow、PaddlePaddle、OneFlow、Megatron-LM、FairScale 等主流 AI 框架和分布式加速库，支持 GPT-2、源 1.0、悟道 2.0、CPM 等主流 AIGC 大模型的 Pretrain 和 Finetune。

　　大模型极致性能提供：采用自主研发的 GCU-LARE 技术和 ECCL 分布式通信技术，提升大模型训练多机多卡高速互联的性能，支持数据并行、模型并行、流水线并行和混合并行等并行加速功能，支持 Activation Checkpointing、ZeRO 优化器、CPU offload、AMP(自动混合精度) 等算力和显存优化方法，可快速高效地进行大模型训练。

　　大模型训练 TCO 优化：从大模型应用端到端、技术全栈角度，燧原科技提供一体化大规模 AI 算力集群方案 -- 云燧智算机 (CloudBlazer POD)，方案采用一体化设计，是专为人工智能场景下计算、存储、网络、软硬协同设计的标准化产品，以"全局优异"为目标，大幅降低建设满足大模型场景需求的 AI 算力基础设施的总拥有成本 (TCO)。

　　大模型业务高性价比推理加速：凭借云端推理产品云燧 i20 通过互联网社交应用服务上亿规模用户的成功经验，同时与广泛的落地场景进行打磨，燧原的推理产品在支持 Stable Diffusion、GPT-2、T5 等 AIGC 大模型推理上具备高性价比，加速 AIGC 相关下游场景的商业落地。

　　燧原科技大模型全栈技术

　　燧原科技创始人、COO 张亚林表示："人工智能技术的发展正在步入一个全新的阶段，AIGC 内容生成类模型以及所生产的内容生动反映了人工智能从感知、认知进阶到生产，也正在重构互联网商业模式，催生数字经济新突破。在以 ChatGPT 和 Stable Diffusion 为代表的 AIGC 技术浪潮下，燧原科技凭借在大模型训练及推理的产品技术优势，结合 MaaS 的业务模式，构建 AIGC 时代的基础设施底座。"

　　关于燧原科技

　　燧原科技专注人工智能领域云端算力产品，致力为人工智能产业发展交付普惠的基础设施解决方案，提供原始创新、全栈自研、具备完全自主知识产权的通用人工智能训练和推理产品。凭借其高算力、高能效比以及灵活编程能力，可广泛应用于互联网、金融、交通、能源及新基建等多个行业和场景。

　　燧原科技携手业内标准组织，秉承开源开放的宗旨，与产业伙伴一起促进人工智能产业发展。

来源：东方新闻

最新文章