百度飞桨螺旋桨 HelixFold-Single 入驻北鲲云 ISV,蛋白结构预测达到秒级别!

摘要

ISV 计划由北鲲云发起,秉承完全开放的生态策略,致力于与合作伙伴一起,为有高算力计算需求的用户提供多样且更具价值的极致应用,目前已同多家行业领先企业达成合作,为合作伙伴提供平台推广服务及专业技术支持。

ISV 计划由北鲲云发起,秉承完全开放的生态策略,致力于与合作伙伴一起,为有高算力计算需求的用户提供多样且更具价值的极致应用,目前已同多家行业领先企业达成合作,为合作伙伴提供平台推广服务及专业技术支持。

在技术前沿探索中,百度智能云一直走在行业前列。今年 9 月,百度智能云全新推出的「云智一体 3.0」架构,汇聚了百度在人工智能各个层面领先的自研技术,依托昆仑芯片、深度学习框架飞桨、文心大模型,打造了「芯片-框架-大模型-行业应用」闭环的智能化路径。

聚焦生命科学领域,百度智能云从生命科学行业核心场景切入,通过打造行业标杆应用,带动和沉淀高性价比的异构算力和高效的 AI 开发运行能力,进而向上可以优化生命科学行业已有应用、孵化新应用。目前百度智能云依托底层技术,全新赋能生命科学领域,形成涵盖小分子药物研发、蛋白药物研发、mRNA 疫苗设计、精准医疗等生命科学领域综合解决方案,为生命科学领域构建超强「算力」和「智力」;再结合百度网盘企业版提供的企业极速共享空间、文件接收方极速下载、无限制预览等功能,为生命科学领域提供多维「数据」赋能。

百度飞桨螺旋桨携基于单序列的蛋白结构预测模型 HelixFold-Single 正是在蛋白药物研发方面的成果,近期也已经成为了成为北鲲云 ISV 计划合作伙伴。通过北鲲云超算平台对外提供服务,助力生物医药客户创新蛋白质药物研发, 进一步提升药物研发的智能化水平。

北鲲云致力于为客户提供多样且优质的云计算服务,打造健康、完整的云生态圈。作为生物医药研发的重要理论基础,计算生物学成为人工智能发展的重要应用场景之一。通过人工智能的方法,HelixFold-Single 能帮助用户极大地提升结构预测的速度,模型推理的速度平均提升数百倍。

NVIDIA A100(40G) GPU 单卡测试结果

在计算效率极大提升的同时,HelixFold-Single 模型在精度上也不输 AlphaFold2,甚至在 MSA 更深的蛋白上表现比 AlphaFold2 更优。这也从侧面论证了,模型通过调大参数可以从海量蛋白质数据中学习到共进化信息,不用 MSA 也可以精准预测蛋白的三级结构信息。

HelixFold-Single 预测的蛋白结构(紫色)、AlphaFold2 预测的蛋白结构(绿色)和实验测量的蛋白结构(蓝色)对比

除了 HelixFold-Single, 此前百度飞桨螺旋桨团队发布的 HelixFold 也同样支持在北鲲云平台上使用。HelixFold 是团队在国产平台上实现的基于 MSA 的蛋白质结构预测算法,围绕着显存峰值、训练速度、分布式策略进行了全面的性能优化。通过与原版 AlphaFold2 模型和哥伦比亚大学 Mohammed AlQuraishi 教授团队基于 PyTorch 复现的 OpenFold 模型的性能对比测试显示,HelixFold 模型的训练性能相比 AlphaFold2 提升 106.97%,相比 OpenFold 提升 104.86%。

HelixFold 与 AlphaFold2、OpenFold 端到端训练速度对比

在性能大幅度提升的同时,HelixFold 从头端到端完整训练可以达到和 AlphaFold2 论文媲美的精度。在包含 87 个蛋白的 CASP14 数据集和包含 371 个蛋白的 CAMEO 数据集上,HelixFold 模型 TM-score 指标分别达到 0.8771 和 0.8885,与原版 AlphaFold2 准确率相当甚至更优。

HelixFold 与 AlphaFold2 精度对比

此次双方合作,除 ISV 计划外,在行业智能化升级的深化过程中,百度百舸支持在生科医疗以及智算中心等领域作为 AI 基础设施, 提供普惠多元的 AI 算力。比如,将药物蛋白质结构预测模型的训练效率提升了 2 倍,更加极致的满足了产业智能化的 AI 算力需求。

北鲲云产品围绕 CLOUD-HPC,从 IaaS 层到 PaaS 层到 SaaS,形成全套的解决方案。在 IaaS 层,围绕高性能对基础设施的特殊要求,形成一套弹性的算力调度系统和一套高性能的并行文件系统;在 PaaS 层,基于通用、便捷、智能的作业调度系统和公共服务,打造一站式高性能计算平台;在 SaaS 层,深入行业领域,将行业需求结合到产品设计中,同 ISV 合作伙伴整合形成一体化解决方案,提高资源利用率,提供行业级别的云平台。

北鲲云作为 Cloud-HPC 的先行者,已为上千家企业提供高性能计算解决方案,此次百度 HelixFold 和 HelixFold-Single 的入驻,双方将依托各自优势,聚焦生命科学,以自主可控为抓手,在蛋白结构预测等细分领域展开合作,成为云上高性能计算新引擎,为客户带来更好用更高效的蛋白结构预测服务。

北鲲云创始人兼 CTO 李青松表示:「此次与百度飞桨的合作双方将结合各自的优势,助力生物医药客户创新蛋白质药物研发, 进一步提升药物研发的智能化水平。 同时我们也在努力打造更完善的合作伙伴生态,通过企业价值平台建设,整合内外部资源,形成新的生态优势。价值的创造和获取来自产业链上下游之间的合作伙伴和客户共同创造,同时我们也希望能有更多类型的 ISV 及开发者能够参与到北鲲云合作伙伴生态当中。」

百度智能云 GTM 副总经理张玮表示:「此次百度与北鲲云的深度合作,北鲲云拥有非常专业的技术团队,利用百度智能云的基础资源,通过北鲲云提供调度平台能力,能够在短时间内,集成百度飞桨螺旋桨行业领先的模型,为生命科学行业用户提供 On-Demand 服务。」

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。