原创架构创全球算力纪录 壁仞科技BR100的底气揭秘

摘要

国产高端 GPU 芯片企业壁仞科技日前在上海发布了其首款产品 BR100,算力创下全球算力纪录,国产 GPU 企业一举打破了国际巨头的纪录,引起广泛关注。

国产高端 GPU 芯片企业壁仞科技日前在上海发布了其首款产品 BR100,算力创下全球算力纪录,国产 GPU 企业一举打破了国际巨头的纪录,引起广泛关注。

根据壁仞科技创始人、董事长、CEO 张文在发布会上公布的数据,BR100 的 16 位浮点算力达到 1000T 以上、8 位定点算力达到 2000T 以上,单芯片峰值算力达到 PFLOPS 级别,互连带宽上也创下国内纪录,还是国内率先采用 Chiplet 技术、率先采用新一代主机接口 PCIe 5.0、率先支持 CXL 互连协议的通用 GPU 芯片。

BR100 直接把中国的通用 GPU 芯片带入了「每秒千万亿次计算」新时代,峰值算力达到国际厂商在售旗舰产品 3 倍以上。

国产 GPU 企业有此底气,背后的秘密是什么?

这个成绩与壁仞以强大的原创架构结合在芯片设计上采用了 Chiplet 与 2.5D CoWoS 先进封装技术,同时兼顾高良率与高性能有重要的关系。

这样的设计让 BR100 在性能上能够媲美英伟达于 2022 年发布的 4nm 芯片 H100。在与后者 2020 年发布的 7nm 芯片 A100 相比时,BR100 还能实现三倍的性能提升。

壁仞科技联合创始人、CTO 洪洲表示,「完全自主的原创架构、先进的封装技术、超大的芯片规模和丰富的片上缓存让我们有了这样的底气 "。

据介绍,壁仞科技这个名为 " 壁立仞 " 的原创架构以数据流为中心,对数据流进行深度的优化,而通过六大技术特性,比较完整地解决了数据搬移的瓶颈和并行度不足的问题,使得 BR100 芯片在给定的工艺下实现了性能和能效的跨越式进步。

据介绍,BR100 采用了 Chiplet 设计理念,让芯片总面积可以突破光罩尺寸对单芯片面积的限制,集成更多的算力和通用性逻辑;此外,通过缩小单个计算芯粒的面积,还可以同时提升产能与良率,进而极大地降低硅片的成本,并支持更灵活的产品策略。

通过采用 Chiplet 的方式还可丰富产品形态,例如壁仞科技此次发布的 BR104 为单 die 产品,该款芯片同样基于壁立仞架构,性能约为 BR100 的一半,同样超越了国际厂商的在售旗舰产品。「Chiplet 设计让我们可以通过一次流片,同时得到两种芯片,大大加快了迭代速度,同时覆盖不同层级的市场。」洪洲说。

壁仞科技在 BR100 的接口上也提供了丰富的支持。如支持 PCIe 5.0 接口技术与 CXL 通信协议,使其双向带宽 128 GB/s;原创 BLINK 高速 GPU 互连技术,单卡互连带宽达 512 GB/s,并支持单节点 8 卡全互连。

整体而言,BR100 具有高算力、高通用性和高能效,「三高」特征,让它破势而出,一面市就直接力压全球领先产品。

来源:朝闻天下

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。