创新中心
个人中心
创新中心
个人中心

阿里云在AI制药方向的思考和实践分享 | 云谷创新谈

阿里云创新中心> 创业资讯> 阿里云在AI制药方向的思考和实践分享 | 云谷创新谈

阿里云在AI制药方向的思考和实践分享 | 云谷创新谈

阿里云创新中心 2023-04-04 15:05:46 15407
“就像我们今天的讨论主题一样,也许药物研发的奇点已经来临。大数据、人工智能的技术推动体现出很好的苗头。”

2023年3月22日,阿里云云谷创新谈——AI制药研讨会在上海浦东国际人才港5号楼3F举行,阿里云高性能计算产品负责人黄泽辉带来了题为《阿里云在AI制药方向的思考和实践分享》的演讲,以下是他的演讲内容整理,供阅览:

图片1.jpg

阿里云高性能计算产品负责人 黄泽辉

对于阿里云来说,我们其实是在AI制药中提供infrastructure,虽然不像现场各位专家有很多行业know-how,但我们有罗氏(罗氏集团)这样的药厂客户,也有深势科技等AI制药的合作伙伴。所以两者结合起来,尝试去分享一些阿里云看到的AI行业趋势,以及从计算基础设施的角度带来的思考。

图片2.jpg

大家都知道新药研发挑战巨大,比如著名的“双十定律”,十年十亿美金,大概只有10%的药物能进入临床。近年来,药物研发成本越来越高,投入越来越大,但获批的药物反而越来越少。

就像我们今天的讨论主题一样,也许药物研发的奇点已经来临。大数据、人工智能的技术推动体现出很好的苗头。典型的案例就是英矽智能,通过人工智能的方式,其在21天内就可以识别出一个有效的激酶抑制剂位点,仅仅花费15万美元。而最近大热的预训练大模型,也展示出新药研发的巨大潜力。刚刚深势科技的徐总介绍了他们的Uni-Mol大模型,NVIDIA昨天也刚发布了他们BioNeMo的大模型,后续会有非常大的应用前景。毫无疑问,生物医药行业的未来将由计算驱动。

图片3.jpg

从计算驱动的角度看,除了计算机辅助设计(CADD),现在开始出现很多基于AI的工具。对于传统物理计算来说,精度较高,算力要求高,类似于大家比较熟悉的高性能计算场景。对人工智能来说更强调数据,人工智能更有启发性、创造性。从新药研发的角度来说,从靶点发现到先导化合物优化,整个环节甚至到临床试验以及上市后的监管,其实都有相对应的AI和数字化解决方案。目前来看,两者是相互补充而不是相互替代的关系。

图片4.jpg

2020年是AI制药元年,出现一大波科学家创业的公司。目前绝大多数AI制药公司,还集中在药物发现环节,真正涉及到临床前开发或者临床开发的部分还是比较少。

另外,这些公司的发展通常有三种典型模式。首先大家基于新范式,比如AI for Science,做了一些更好的AI工具来服务新药开发。这些创业企业把它作为SaaS服务,提供给客户使用。其次,有一些CRO公司,可以和传统药企合作,开发一些临床前候选药物的阶段。最后,企业也可以直接自研管线,作为Biotech公司,自己用AI技术研发新药。不同公司处于不同阶段,也有三种模式都支持。

图片5.jpg

作为云计算厂商,我们在这其中更多的还是关心算力和数据的问题。关于计算,我们觉得有以下几个值得关注的问题:

1、多元化算力需求。AIDD以及传统CADD,对算力的需求是巨大的,比如需要短时间内完成几亿分子的对接。除了传统的CPU以外,我们还需要通过GPU加速,甚至通过FPGA加速。对于一个企业来说,除了公共云外,也有本地IDC或者其他多元的算力。如何管理是一个挑战。

2、成本优化。面对如此大规模的算力需求,大家都有非常强的成本优化意愿。如何充分发挥云计算弹性按需优势,利用云的灵活售卖、竞价等能力,优化和管理用云的成本。

3、HPC+AI融合。目前既有传统CADD工具,也有新范式AIDD工具,两者都会用到。对于同样的基础设施,很可能既需要它实现一些HPC作业,也需要实现一些AI的作业,怎么在一套集群上做统一管理和统一调度。这要求我们能进行HPC+AI的统一资源管理和作业调度。

4、算法平台商业化。很多科学家团队有非常好的AI算法工具,但是怎么让它快速变成能向第三方药企提供的服务系统和平台化的产品,其实非常有挑战。SaaS模式作为AI制药创业公司需要优先跑通的模式,对他们来说短时间内获取现金流,支持继续向前发展很重要的点。

图片6.jpg

总体来说,阿里云为AI制药行业提供的能力,可以分为以下3个层次:

1、云计算是先进计算的代表,我们为合作伙伴和最终客户,提供大规模高性能基础设施。

2、针对AI制药行业多元化算力、混合云架构以及HPC+AI融合等复杂IT需求,提供PaaS产品服务,去支持海量计算任务分布式的执行。

3、从最终用户的角度来说,阿里云提供CADD/AIDD的工具帮助开展业务。从创业公司的角度来说,阿里云提供了IaaS、PaaS能力,帮助客户把简单的AI算法变成真正意义上的SaaS服务,并且满足他在商业化的具体诉求。

对于高性能基础设施来说,与传统线下超算相比,今天基于云的HPC集群可以满足绝大多数业务场景的性能要求。云超算是超算民主化、普惠化的重要途径,可以克服线下超算的诸多难题,正在改变企业的研发创新环境。

图片7.jpg

阿里云完全自研的飞天操作系统,可以基于全新的数据中心CIPU架构,提供基本没有虚拟化性能损耗的神龙裸金属服务器。并且和线下超算相比,云计算能提供包括CPU、GPU、FPGA在内的最新算力,大大提高AI制药计算分析的效率。

图片8.jpg

不仅如此,阿里云也新推出自研ARM架构的倚天实例,为生命科学行业等计算密集的场景提供高性价的优秀算力。同等算力下,价格比Intel的IceLake低30%,比AMD的Milan低9%,可以适配和满足基因分析、CADD典型的业务需求。

图片9.jpg

同样基于CIPU架构,阿里云的ECS可以提供大规模的eRDMA网络通信能力,支持100G的网络带宽,时延低于5微秒,与VPC网络相比降低了70%。因此,无需专门资金建设RDMA网络,阿里云上的HPC集群,可以通过eRDMA来实现节点间的高速互联,满足MPI和人工智能类的紧耦合任务。

图片10.jpg

最后,对于HPC、大数据和人工智能的计算任务,阿里云提供高性能的并行文件存储。

图片11.jpg

这些基础设施组合,为AI制药用户提供了大规模、高性能、按需弹性且多元化的计算选项,帮助客户提供效率的同时,大大降低建设和使用的成本,帮助AI制药加速创新。

当然,我们还会通过弹性高性能计算(E-HPC)产品,来帮助客户管理这些底层的基础设施,为客户提供简单便捷的使用体验。从创建集群、到作业调度以及数据的可视化,端到端的解决AI制药中的客户问题。

图片12.jpg

E-HPC集群的规模和客户的应用负载直接相关。举个例子:我们在云上有一个计算环境,最开始没有任何资源,不产生费用。在有实际任务需要跑时,可以根据实际需要的作业数量,动态的创建计算节点来执行任务。当计算完成后,计算资源自动释放,客户只需要为实际使用的资源付费。

图片13.jpg

除了支持公共云的模式外,大多数客户还有自己线下的计算资源,需要混合云的方案。通过E-HPC,在不改动客户线下架构和配置的情况下,利用我们基于任务负载的自动伸缩能力,来发挥云的弹性能力,解决业务突发情况下线下计算资源不足的问题。

图片12.jpg

对于HPC+AI的需求,E-HPC融合K8S的调度能力,提供常见的Tensorflow、Pytorch等机器学习框架。同时,通过AIACC的产品为深度学习中多机多卡训练任务,提供带宽优化,延迟优化等加速能力。

图片15.jpg

我们还提供了无影。从数据预处理、作业计算到最后结果的可视化,为AI制药用户提供一站式的研发创新环境。

图片16.jpg

最后,我们把AI制药里需要考虑的全栈技术和产品,保存成一个HPC集群模版,包括软件的安装配置、计算和存储的规格选择,依赖的数据文件等你等。用户只需要一键安装,就可以开始使用。

图片17.jpg

这个功能不仅针对最终用户,也为我们的合作伙伴服务。通过集群模版和阿里云计算巢的能力,我们可以帮助AI制药的创业企业,快速讲AI的工具和算法,变成一个在线的SaaS服务,可以进行商业化售卖和在线的运维支持。

图片18.jpg

我们不仅只是做技术支撑,更希望打造一个场,就像今天的会议一样。阿里云围绕生物制药行业,成立了数智CRO联盟,希望提供2大能力。

图片19.jpg

首先,我们希望他是一个技术平台,今天阿里云有非常好的基础设施,但是对于用户来说,这并不是直接可用的算力。对新药研发来说,涉及到实验部分、计算部分、模拟、仿真,包含临床试验EDC部分,我们希望按照新药研发需要的能力图谱,把最优秀的软件厂商能够聚合到一起,能够在阿里云上形成连通的服务平台。

其次,也是针对现在的商业公司井喷,大家都在往前走的态势,我们希望成立一个资源对接平台。比如生物医药协会、产业园区,以及投融资、媒体渠道,我们希望能够针对新药研发里的关键能力,能有资源对接和共同宣传。

综合这三层能力,我们与客户和伙伴在AI制药领域积极实践和探索,也有不少成功案例。今天以我们的合作伙伴深势科技为例,可以看到阿里云如何全方面的助力新药研发创新。

图片20.jpg

ABACUS是深势科技按照AI for Science的范式,全新推出的工具。在双方共同努力下,软件可以完全适配到阿里云的 ECS 倚天实例上。一方面性能与Intel实例接近的情况下,成本下降了30%。另一方面,通过倚天的eRDMA能力,多节点(8节点)并行处理的效率也至少提高25%。目前如何在CADD/AIDD软件工具层面实现降本增效,这里展示了非常大的潜力,不仅是ARM,也包括GPU/FPGA等更多的异构计算能力。

图片21.jpg

通过E-HPC提供的PaaS能力,深势可以打造了他们新一代的药物计算平台。阿里云提供的大规模的计算调度、分布式缓存等核心产品能力,可以帮助客户减轻IT负担,专注于上层业务,为行业提供更多更新的AI制药平台。

图片22.jpg

在阿里云和伙伴能力深度融合的基础上,通过计算巢生态、数智CRO联盟等多种形式,我们和深势科技共同服务了泓博医药,帮助更多行业客户采用AI制药的新工具,加速生物医学行业的数字化转型

以上就是我的分享,谢谢大家。

下载二维码.jpg


阿里云创新中心简介

阿里云创新中心将阿里技术、产品、业务的生产力,转化为对企业发展有价值的推动力,将更普惠、更安全、更绿色的产品和服务提供给科技型中小企业,在中小企业科技创新、日常运营、职业技能培训、资金对接、跨境出海等方面提供全方位支持。

截至目前,阿里云创新中心累计为中小创企业提供2亿的双创云资源,共服务了超过350万的创业者、50万小微企业,孵化出600多家高成长创新企业,调研数据显示头部企业估值规模超1387亿,每年估值增速超过35%。

image.png

版权声明: 创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余文章均来自所标注的来源,版权归原作者或来源方所有,且已获得相关授权,创新中心「创业资讯」平台不拥有其著作权,亦不承担相应法律责任。如果您发现本平台中有涉嫌侵权的内容,可填写「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。