创新中心
个人中心
创新中心
个人中心

完成数亿元Pre-A轮融资,西湖欧米如何打造蛋白质组学AlphaFold | 高榕「未来」

阿里云创新中心> 创业资讯> 完成数亿元Pre-A轮融资,西湖欧米如何打造蛋白质组学AlphaFold | 高榕「未来」

完成数亿元Pre-A轮融资,西湖欧米如何打造蛋白质组学AlphaFold | 高榕「未来」

高榕资本 2022-01-13 00:00:00 502
2021年7月,DeepMind团队和欧洲生物信息研究所(EMBL-EBI)合作,发布由AlphaFold预测的蛋白结构数据库,完成了人类蛋白质组98.5%的蛋白质结构预测。这被认为是本世纪最重要的科学突破之一。

2021年7月,DeepMind团队和欧洲生物信息研究所(EMBL-EBI)合作,发布由AlphaFold预测的蛋白结构数据库,完成了人类蛋白质组98.5%的蛋白质结构预测。这被认为是本世纪最重要的科学突破之一。

蛋白质是生命活动的齿轮,但只知道齿轮的形状还不能组装成一台可以运行的生命机器。我们还需要了解生命体中不同齿轮的类型和数量;更重要的,这些齿轮还在永不停歇地动态变化与相互作用着。这就是蛋白质组学想要去破译的密码。

西湖欧米成立于2020年7月,致力于开发和应用以蛋白质谱为主的多组学技术,基于蛋白质组大数据,发现可定量的生物规律,助力精准医学和药物研发。今天,西湖欧米宣布完成数亿元Pre-A轮融资,由倚锋资本和高瓴创投共同领投,高榕资本、幂方资本和西湖科创投跟投。高榕资本曾于2021年初联合领投西湖欧米种子轮融资。

我们也与蛋白质组学领域知名专家——西湖大学生命科学学院特聘研究员、西湖实验室imarker Lab主任、西湖欧米创始人郭天南博士进行对话。以下是他的讲述:

64010.jpeg

蛋白质的复杂性要高出许多维度

大家一提到生命科学,可能会想到基因。基因是生命的蓝图,是一维的线性序列;基因通过转录组,表达为蛋白质,组成三维世界的生命体。

看过科幻小说《三体》会知道,在一维空间,似乎永远无法理解三维空间的复杂性。相比较基因,蛋白质的复杂性要高出许多维度。首先,一种基因可以表达成多种蛋白质;其次,蛋白质会像“变形金刚”一样不断在时空上发生变化;此外,蛋白质还有翻译后修饰,有复杂的复合物,蛋白质还在不断地生成和降解。

目前人类已经基本解锁基因组,但还没有任何科学家能够告诉我们,一个红细胞里有多少蛋白质。它的复杂程度比当今地球上人类的关系网更高。

与此同时,人类的健康和疾病同蛋白质息息相关,疾病治疗的效果也取决于蛋白质机器的调控。

64011.jpeg

大家还记得电影《我不是药神》中的神药“格列卫”。格列卫的适应症是慢性髓性白血病,原本是不治之症。十几年前,我在武汉协和医院血液科学习工作,当时格列卫刚刚进入中国,我记得非常清楚,一盒药30万。很多病人无法负担,医院的科室会买下来,一颗一颗地卖给病人。后来我们知道,这个药物的靶点就是一个融合蛋白,通过药物小分子去抑制融合蛋白,就可以控制疾病的发展。

未来我们希望让更多“不治之症”可以被治愈,必须建立在对蛋白质有更多认知的基础上。

打造蛋白质组学领域的AlphaFold

我们致力研究的蛋白质组学,不仅要看蛋白质的结构。还要在此基础上,看到一个临床样品,一个肿瘤细胞中,到底有哪些蛋白质,每种蛋白质有多少数量,以及蛋白质动态变化的数据。这些数据对于药物发现、健康理解、疾病治疗都可能会产生颠覆性的作用。

今年的诺贝尔奖第一次颁发给气象学家,回答了为什么气候模型在天气多变且混乱的情况下依旧可靠的问题。

▲ 人类可以预测天气,为什么不能预测疾病的进展?
▲ 物理学、化学、经济学中都有很多公式和规律可循,为什么蛋白质微观世界没有公式?
▲ 新冠突如其来,为什么有些人是轻症、有些是重症?
▲ 为什么某种靶向药,对于一部分肿瘤病人有效、另一部分无效,有些人开始有效、后来又出现了耐药性?

这些为什么,都是因为我们缺乏对于蛋白质机器的理解。我认为,这个不能理解的背后,是因为我们缺乏对蛋白质进行定量数据积累的过程,以及没有一个合适的算法。

我们希望尽可能收集关于蛋白质组的动态数据,利用AI技术去打造一个可以预测蛋白质动态变化的新型引擎。这个引擎的复杂程度要比AlphaFold复杂很多倍,也需要积累足够量的数据作为基础。

过往我们没有蛋白质组的数据,是因为没有合适的技术和工具。就像以前我们没有望远镜,看不到那么多星星;没有显微镜,看不到细胞的存在。

幸运的是,今天我们有了前沿蛋白质组技术,带领我们推开一扇新的大门。

高通量蛋白质组技术

近几年来,人们在质谱方面取得很大的进步,从一个全新的层面去检测蛋白。质谱技术是非常复杂的综合性工程,需要结合化学、物理学、生物学、数据分析等学科,也需要依赖非常昂贵的设备,并且设备还在经常更新,因此主要集中在高校或实验室里。

但进入临床之后,对蛋白质组的鉴定和定量成为一个全新的命题。因为临床样品和实验室中的动物样品相比更加复杂。

我们的技术基础是PCT-SWATH/DIA,它是压力循环技术、连续窗口采集所有理论碎片离子和数据独立采集的缩写。这是我曾在瑞士Ruedi Aebersold教授(蛋白质组学领域的开拓者之一)领导的蛋白质组学研究组开发的高通量蛋白质组技术,实现了对小量临床样本的高重复性、高通量的质谱分析,科研成果发表于Cell、Nature Medicine等杂志。

这种技术可以分析处理极其微量的组织,任何含有蛋白质的样品都可以进行有效的蛋白质组分析,包括血液、尿液、头发、指甲、骨骼、肠道微生物等;此外我们可以处理石蜡组织,因此临床大量的石蜡样品我们都可以去做鉴定,相当于打开了一个尘封的宝库。

实现这些目标的一个独特关键在于压力循环技术(Pressure Cycling Technology),可以利用多次常压和超高(液)压之间的快速循环,实现生物分子的精确提取。想象一下,将样品放在一个150微升的管子中,增加3000个大气压,然后释放压力,然后再施压,不断循环,从而将极其微量组织中的蛋白质有效提取出来。

64028.png

另一方面,我们还在开发计算资源,以实现快速、低成本的蛋白质组大数据集的数据分析。西湖欧米团队还很年轻,但目前已经拥有了世界上领先的临床蛋白质组技术。目前全球范围内,我们分析过的临床样品和积累的蛋白质组数据,无论是从种类还是数量上看,应该是最多的之一。

在蛋白质组大数据基础上,我们也在结合领先的人工智能算法,去建立可以预测蛋白质组动态变化的智能引擎。目前没有任何已知的成熟人工智能算法,可以直接用于蛋白质组大数据的分析,因为这是一个新的数据类型,新的数据格式,也是新的科学问题。我们相信,中国的人工智能技术,无论在理论还是实践上,在全世界都是非常领先的,也有非常多优秀的AI人才。AlphaFold横空出世之后,也有很多AI人才希望进入生命科学领域,我认为这是非常好的势头。

助力精准医疗:诊断与制药

有了上述数据和技术,我们希望未来可以真正助力精准医疗。

对于精准医疗的理解,有广义、狭义。总得来说主要是两个方面——诊断,尽可能实现疾病的早诊;治疗,用最合适的药物进行治疗。在这两个方向,西湖欧米已经有了阶段性的成果与尝试。

在诊断方面,我们首创的甲状腺结节良恶性诊断的AI赋能的蛋白质组LDT产品计划将于2022年第一季度问世。甲状腺结节非常常见,50%的成年人会有甲状腺结节。对于甲状腺结节的诊断不是问题,通过B超就可以看到;问题在于不知道结节的良恶性,目前有30%的甲状腺结节,通过细胞学穿刺的方式无法判断良恶性。

对于病人来说,是否切除?甲状腺是非常重要的器官,是连通大脑和全身其他器官的桥梁,有人把甲状腺比喻成公司的CEO,摘除甲状腺就需要终身服用激素药物。有人说用基因测序诊断,但基因测序敏感性虽高、特异性却差,特异性只有10%到50%,也就是说50%-90%的病例被诊断是恶性,实际上是良性。通过西湖欧米开发的诊断LDT产品,可以将结节良恶性诊断的准确率提升到90%左右。目前我们的产品正在多中心、多国家进行验证和优化。

这是蛋白质组结合AI技术在诊断上非常好的应用,也是全世界范围内第一次做如此大量、多中心的蛋白质组数据,目前已经收集了超过3000例样品的蛋白组学分析数据。除了甲状腺癌,未来我们还将进一步推动包括甲状腺癌、前列腺癌、乳腺癌、直肠癌在内的多项体外辅助诊断产品研发及上市。

另一个诊断方面的应用,是进行糖尿病、高血压这类慢性病的早期诊断。慢性病的发生,是一个综合复杂的过程,有基因的因素,也受环境、生活习惯的影响。我们有一个研究队列,对糖尿病、高血压的慢性病人进行十几年的追踪,每隔一段时间收集血液、尿液等样品,对其中的蛋白质组进行分析,从而开发出多模态的模型,预测哪些人是高风险人群。

过往我们对于疾病的诊断,一般是静态的;但实际上,所有疾病都是动态的,每天的情况都在发生变化。除了观察病人的体温、红细胞与白细胞数量等信息,我们相信在这些症状出现之前,在微观世界一定发生了很多的变化。目前我们正在与多家医院合作,建立辅助精准医疗平台,希望通过对病人从入院到治疗、康复、出院一系列过程中蛋白质组的监测,对疾病进行更细致、更底层的监控。

64012.jpeg

在治疗方面,也有实际的案例。我们知道,几乎所有药物都是针对靶点蛋白质来设计的;还有个别尽管不是直接针对蛋白质,也通过蛋白质起作用。因此药物成功,离不开对蛋白质的检测。蛋白质组数据应用于药物研发,也是近一两年才真正在实际场景中应用。

我们有一个项目,是进行卵巢癌的临床治疗。卵巢癌是非常恶性的一种女性疾病,在实际临床中,我们会发现某种药物对于有些病人的疗效很显著,但有些病患则对药物抵抗。我们与几家医院合作开发了模型,去预测药物会对哪些患者更有效。

未来,我们会在AI制药领域有更多的布局,让新药研发人员,可以使用以前不敢想象或者太过昂贵的蛋白质组分析结果。

做交叉学科背景人才的“翻译官”

蛋白质组学很多人想去做,但是为什么难?

因为涉及的学科太多,涉及化学、物理、生物、医学、人工智能、药物研发等领域。这些学科一定要融合,而不只是把油和水放在一起。

这就要求团队的带头人,一定要懂得各个学科的知识。我本身是学医,后来掌握了质谱的运行原理及实操,也写过程序,也学习过机器学习的基本概念。所以我在团队中很大的作用是做翻译。

64013.jpeg

有时候同样一个单词,在不同学科人的理解中是不一样的。我要用不同的语言去切换,让不同学科团队的人可以协作。所谓语言就是一个学科的术语,包括理论框架和实践细节。

当然,仅仅依靠一个人去说多种语言是不够的,我们也希望能够培养一批这样的人才。目前,西湖欧米已组建一支近80人的团队,覆盖生物技术、人工智能和药物研发等领域。

未来,我无比期待,邀请更多跨学科的人才加入我们,一起解密生命的密码。

*本文转自高榕资本 ,如需转载请联系高榕资本申请授权

版权声明: 创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余文章均来自所标注的来源,版权归原作者或来源方所有,且已获得相关授权,创新中心「创业资讯」平台不拥有其著作权,亦不承担相应法律责任。如果您发现本平台中有涉嫌侵权的内容,可填写「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。