阿里云的脚步已经越迈越远了
昨天,阿里本年度第一次重量级的大会——云栖大会·深圳峰会——在深圳举行,会上,除了阿里云总裁胡晓明直接对「马化腾和他的团队」表示了不满之外,更值得注意的恐怕还是阿里云在会上发布的几款新产品、新战略和新技术。
在云计算市场本身,阿里云宣布新开服的华北 3 数据中心降价 20%,以及 CDN 大陆地区的产品组合降价 35%,并且还发布了包括高性能计算 ECS 产品、新的数据中心,以及新的存储产品等多款新产品。除此之外,ET 医疗大脑、ET 工业大脑,以及新的机器学习平台 PAI2.0 都是阿里云在人工智能方面的新举措。从中,我们也可以看出阿里云除了继续巩固自己在国内云计算市场上的优势地位之外,在新技术的开发与应用上也逐渐开始发力了。
(阿里云总裁胡晓明)
ET 医疗大脑与 ET 工业大脑
首先,全场最引人关注的莫过于 ET 医疗大脑项目了。因为几乎所有人都承认,医疗市场将会在未来爆发出极大的潜力,因此有很多大公司都在布局这个领域,比如国内的百度以及国外的 IBM 等公司。而阿里云通过发布 ET 医疗大脑,也宣布正式进入医疗 AI 领域。
阿里云方面表示,经过一年多的研究训练,人工智能 ET 已具备多项医疗能力,可在患者虚拟助理、医学影像、精准医疗、药效挖掘、新药研发、健康管理等领域承担医生助手的角色。而它的背后则是阿里投入了大量资源,采用深度学习技术,通过海量的数据作为示例来训练机器完成特定任务。通俗地说,就是让计算机通过学习病例数据来提升医术。由于可以 24 小时不睡觉,同时处理成千上万项任务,ET 的学习进步速度大大超过人类。
阿里云人工智能科学家闵万里说:「在多个病症的测试中我们意识机器不仅能够完成任务,而且在某些方面做的和人类医生一样好。ET 完全有资格成为医生的助理。」
除了能大幅提升医生的工作效率外,ET 医疗大脑还尝试从根本上战胜癌症。通过和华大基因合作,ET 对大量肺腺癌病例的 DNA 序列进行分析,寻找致病的关键基因突变。
「我们将 ET 医疗大脑设置为一个开放的人工智能系统。除了阿里云的人工智能科学家投入到研发当中,我们更希望能吸收外部精良的算法与医学经验,这样 ET 才能更快地成长为一名高级医师。」闵万里说。
同时,阿里云还宣布联合英特尔、LinkDoc 启动天池医疗 AI 系列赛,第一季对早期肺癌诊断发起挑战。
此外,阿里云也在云栖大会深圳峰会上正式发布了 ET 工业大脑,让工业生产线上庞大的钢铁躯体拥有智能大脑。阿里云总裁胡晓明表示,我们希望利用人工智能技术发挥「中国智造 1%」的威力。中国制造业如果提升 1% 的良品率,意味着一年可以增加上万亿的利润。
在这个部分,阿里云举了苏州能源巨头协鑫光伏的例子。这家厂商将标准化车间所有端口的数据传入工业大脑,随后通过人工智能算法,对所有关联参数进行深度学习计算,分析出与良品率最相关的 60 个关键参数,并搭建参数曲线,在生产过程中实时监测和控制变量。
据胡晓明表示,目前,通过 ET 工业大脑的帮助,协鑫光伏的生产良品率已经提升 1 个百分点,每年可节省上亿元的生产成本。
闵万里透露,目前 ET 工业大脑已经在流程制造的数据化控制、生产线的升级换代、工艺改良、设备故障预测等方面开展工作。ET 的目标是成为一个不断吸收专业知识的「大脑」,可以指挥各种类型的工业躯体。「我们希望用 21 世纪的机器智能,帮助人类更好地指挥 20 世纪的机器」。
新的机器学习平台 PAI2.0
而另一个重要的人工智能领域的新发布就是机器学习平台 PAI2.0。相比 1.0 版本,PAI 2.0 有多项重大更新,除增加了 100 余种算法外,更重要的是对主流深度学习框架 TensorFlow、Caffe 和 MXNet 的全面兼容。
此次 PAI2.0 的重大升级主要包括以下方面:
1、全面拥抱开源
PAI2.0 编程接口完全兼容深度学习框架:Tensorflow、Caffe 以及 MXNet,用户只需要将自己本地编写的代码文件上传至云端就可以执行。
Tensorflow、Caffe 和 MXNet 是目前全球主流的深度学习开源框架。Tensorflow 开源算法和模型最丰富;Caffe 是经典的图形领域框架,使用简单;MXNet 分布式性能优异。
对于底层计算资源,PAI2.0 提供了强大的云端异构计算资源,包含 CPU、GPU、FPGA。在 GPU 方面,PAI2.0 可以灵活实现多卡调度。
借助这些框架以及强大的计算资源,用户能非常方便地就可以将计算任务下发到对应的分布式计算机群上,实现深度学习模型训练与预测。
2、更丰富的算法库
PAI2.0 提供 100 余种算法组件,涵盖了分类、回归、聚类等常用场景,还针对主流的算法应用场景,提供了偏向业务的算法,包含文本分析、关系分析、推荐 3 种类别。
「算法全部脱胎于阿里巴巴集团内部的业务实践,所有算法都经历过 PB 级数据和复杂业务场景的锤炼,具备成熟稳定的特点」,阿里云首席科学家周靖人说。
3、支持更大规模的数据训练
PAI 2.0 新增了参数服务器(Parameter Server)架构的算法。不仅能进行数据并行,同时还可将模型分片,把大的模型分为多个子集,每个参数服务器只存一个子集,全部的参数服务器聚合在一起拼凑成一个完整的模型。
其创新点还在于失败重试的功能。在分布式系统上,成百上千个节点协同工作时,经常会出现一个或几个节点挂掉的情况,如果没有失败重试机制,任务就会有一定的几率失败,需要重新提交任务到集群调度。PS 算法支持千亿特征、万亿模型和万亿样本直至 PB 级的数据训练,适合于电商、广告等数据规模巨大的推荐场景。
阿里云首席科学家周靖人说,在过去的一年时间里我们协助客户落地了多项重大的人工智能应用。但人工智能要想真正成为成为普惠科技,需要一款更加通用的生产工具。PAI2.0 正是为此而生。
人工智能综合了多门学科的技术,对人才要求极其高,除了懂统计学中各种复杂的机器学习算法,还要懂实现逻辑以及分布式架构理论。PAI 可以大幅的降低人工智能的门槛以及开发成本。
从操作界面来看,PAI 没有繁琐的公式和复杂的代码逻辑,用户看到的是各种分门别类被封装好的算法组件。每一个实验步骤都提供可视化的监控页面。在深度学习黑箱透明化方面,PAI 也同时集成了各种可视化工具。
PAI 的基础设施和计算框架建立在阿里云飞天计算平台之上,通过云的模式大幅降低了计算成本,支持 MR、SQL、MPI、PS、GRAPH 等多种分布式计算框架,对于底层的 CPU 和 GPU 计算机群可以灵活调用。
两年时间里,PAI 在阿里巴巴内部已经被广泛使用。以淘宝搜索为例,搜索结果会基于商品和用户的特征进行排序。通过使用参数服务器,淘宝可以把百亿个特征的模型,分散到数十个乃至于上百个参数服务器上,打破了规模的瓶颈。
在阿里云的客户当中,广东省气象局对 PAI 的使用最具代表性。他们使用 PAI 对临近预报 (0-3 小时内) 的降雨量进行建模预测。通过拖拽操作就完成了数据清洗、特征工程,非线性机器学习算法训练以及结果评估的工作。
PAI 还被应用在各种前沿科技领域。华大基因联合阿里云科学家,正使用 PAI 对肺腺癌患者基因进行分析,试图寻找到导致肺腺癌病发的关键基因突变。