NVIDIA 与全球顶级服务器制造商合作推进 AI 云计算。
5 月 30 日,NVIDIA 公司 (纳斯达克代码:NVDA) 宣布同全球领先的原始设计制造商(ODM)- 富士康(Foxconn)、英业达(Inventec)、广达电脑(Quanta)与纬创(Wistron)开展合作,以期更加快速地满足市场对 AI 云计算的需求。
通过 NVIDIA HGX 合作伙伴计划,NVIDIA 将让每家 ODM 尽早访问 NVIDIA HGX 参考架构,NVIDIA GPU 计算技术以及设计指南。微软 Project Olympus 计划、Facebook 的 Big Basin 系统与 NVIDIA DGX-1™人工智能超级计算机也均使用了 HGX 数据中心设计方案。
通过将 HGX 用作起始秘方,ODM 合作伙伴可以与 NVIDIA 一起更加快速地为超大型数据中心设计并推出一系列合格且经过 GPU 加速的系统。通过该计划,NVIDIA 工程师将与 ODM 密切合作,以减少从设计到生产部署的时间.
在过去的 1 年里,对于人工智能计算资源的总体需求急剧增长,而市场对于 NVIDIA GPU 计算平台的采用及性能需求也随之增加。今天,全球前 10 家超大规模企业均在其数据中心内使用 NVIDIA GPU 加速器。
凭借新的基于 NVIDIA® Volta™的 GPU 所提供的比上一代 GPU 三倍的性能,ODM 可以根据最新的 NVIDIA 技术为市场需求提供最新产品。
NVIDIA 加速计算业务部总经理 Ian Buck 表示:「加速计算正在飞速发展 – 在仅仅 1 年之内,我们便使得 Tesla GPU 深度学习性能提升了 3 倍 – 这对系统设计方式产生了显著影响。通过我们的 HGX 合作伙伴计划,设备制造商可以确保其向不断扩大的云计算提供商提供最新的 AI 技术。」
灵活、可升级的设计
为了满足超大规模云环境所独有的高性能、高效率和大规模扩展需求,NVIDIA 构建了 HGX 参考设计。由于可以根据工作负载需求进行高度配置,HGX 能够以多种方式轻松融合 GPU 与 CPU,进而用于高性能计算、深度学习训练与深度学习推理。
标准的 HGX 设计架构包含 8 颗 SXM2 尺寸的 NVIDIA Tesla® GPU 加速器,并采用 NVIDIA NVLink™高速互连技术与经过优化的 PCIe 拓扑并以多维数据集网格连接。借助模块化设计,HGX 机箱适用于全球现有数据中心机架部署,并酌情使用超大规模 CPU 节点。
NVIDIA Tesla P100 与 V100 GPU 加速器均兼容于 HGX。今年底,在 V100 GPU 上市后,这可以让基于 HGX 的所有产品实现即时升级。
对于想要托管全新 NVIDIA GPU Cloud 平台的云提供商而言,HGX 堪称理想的参考架构。NVIDIA GPU Cloud 管理着一系列完整集成且经过优化的深度学习框架容器的目录,包括 Caffe2、Cognitive Toolkit、MXNet 与 TensorFlow。
富士康/鸿海精密工业股份有限公司总经理兼鸿佰科技股份有限公司(Ingrasys Technology Inc.)总裁 Taiyu Chou 表示:「通过与 NVIDIA 的这一全新合作伙伴计划,我们将能够更加快速地满足我们客户不断增加的需求,其中部分客户管理着一些全球最大型的数据中心。尽早获得 NVIDIA GPU 技术与设计指南,将有助于我们更加快速地推出创新型产品,充分满足我们客户不断增长的人工智能计算需求。」
英业达集团 IEC China 业务主管 Evan Chien 表示:「与 NVIDIA 开展更加密切的合作,将有助于我们为全球数据中心基础架构注入更高水平的创新。通过我们的紧密协作,我们将能够更加有效地满足管理超大规模云环境公司的计算密集型人工智能需求。」
广达电脑高级副总裁兼云达科技(QCT)总裁 Mike Yang 表示:「借助 NVIDIA 的人工智能计算专长,我们将能够立即向市场推出变革性的解决方案,满足人工智能时代的新计算需求。」
纬创首席技术官兼企业业务组总裁 Donald Hwang 表示:「作为 NVIDIA 的长期合作伙伴,我们期待着深化我们之间的关系,以便我们能够满足超大规模数据中心客户日益增长的计算需求。我们的客户渴望获得更高的 GPU 计算力量,以处理各种人工智能工作负载,而通过这一全新合作,我们将能够更快速地提供新的解决方案。」
微软 Azure Hardware Infrastructure 总经理兼杰出工程师 Kushagra Vaid 表示:「我们与鸿佰科技及 NVIDIA 合作开创了全新行业标准设计,以满足人工智能新时代日益增长的需求。HGX-1 人工智能加速器是作为微软 Project Olympus 的一部分而开发的,以便通过为多达 32 颗 GPU 选用高带宽互联性而实现极高的性能可扩展性。」