2023年《麻省理工科技评论》“35岁以下科技创新35人”中国区发布将来到上海。本次论坛我们聚焦「Infinitas 未来无限」,我们将搭建一个展现“青年人”智慧与潜力的舞台,聚集全球创新人才和资源,让更多人见证他们不懈的探索和追求,让一点火苗点燃他们无穷的创造力。让上海与我们共同见证这片广阔无垠的舞台上,追梦者们绽放出耀眼的光芒。

王雅X.jpg

以下是西湖大学特聘研究员、博士生导师王雅婕在2024中国科技青年论坛精彩讲话,由云现场整理。


各位老师、各位专家,大家早上好!刚才听了田老师和杨老师精彩纷呈的演说,我在这里有点自惭形秽。今天与其说是为大家介绍一下我的研究,更不如说是向各位老师探讨一下,如果有讲的不好或者不对的地方,请各位老师批评指正。

我非常荣幸能够参加此次TR35,简单给大家介绍一下我们课题组的研究。今天的演讲是《AI-BT-Chem助力生物催化剂的开发》。简单介绍一下我们的研究背景,石油是现在工业文明的基础,但它也是不可再生的资源。据统计,石油资源将在2050年逐渐枯竭,煤炭资源也在之后的20-50年间将逐渐枯竭,而且以石油为基础的产业发展,虽然给我们的生活带来了翻天覆地的变化,但是也造成了系列环境污染和全球变暖的问题。

以绿色发展为理念指导的生物制造是在利用现代的合成生物技术,例如合成生物学与蛋白质工程,来满足世界发展低碳经济和可持续发展制造业的迫切需求。以煤和微生物为主的生物催化相较于传统的化学催化而言,有自我再生、自我增长、自我优化和可持续环保等优势,在化工、能源、农业、医药等领域也有着日益增长的应用。据麦肯锡估计,未来生物制造将覆盖60%-70%的化学品生产,是继互联网之后将会是第二个10万亿美金级别的市场,关系到国泰民生,现在被列为各国科技较量的关键技术之一。但是生物催化离广泛的工业应用还有很长的一段距离,往往生物催化的活性比较低、稳定性比较差,且反应类型受限。

在过去的30年,定向计划作为最主要且最有效的煤改造方法之一,已经被广泛用于提高煤的活性、稳定性以及扩展煤促反应类型。比如2019年全球最大的制药公司默克通过多轮的优化实现了一条()我们做实验的就知道的,定向进化有非常多的优势,但它也不是万能的,其实这个过程需要反复试错,因此投入量是非常大的。特别是当我们对于一些改造目标没有高通量筛选平台的时候,往往这个改造的效果就不尽人意。而且如果当煤的起点选的不好的时候,可能后续大量的实验也付诸东流。我们实验室将针对生物催化的技术瓶颈,通过结合人工智能、定向进化以及化学催化,想要打造高效的煤制剂开发平台,通过创建高效的新酶挖掘工具,搭建高通量蛋白酶工程改造平台,以及构建化学酶偶联催化体系,来突破生物催化剂的各个瓶颈。

简单介绍一下我自加入西湖大学以来的两个近期将要发表的工作。首先是关于开发精准新酶挖掘的工具开发工作,随着基因测序的高速发展已经不断成熟,越来越多的蛋白质序列和基因序列被揭示出来,迄今为止在蛋白质的data base里已经被deposit了超过2.27亿个蛋白序列,这对生物催化剂来开发而言,无疑是非常丰富的资源。但是我们怎么从这两亿多的蛋白质里选出我们想要的呢?这是学者们一直关心的问题。

在过去研究中,我们发现定向计划对起始点的要求非常高,一个好的起点往往使后续的工程改造事半功倍,一个不好的起点往往是后面的工程改造举步维艰。当我们拿到一个目标反应,我们想要去找到这么一个好的生物催化剂,我们通常首先建一个library,从中筛选到好的酶点。优质的酶库有几大特点,首先要有足够高的序列和结构多样性,首先都要具备目标酶催化活性,而且要具备发现个别潜力好的元件。我们通过序列相似度比对以及进化关系分析,去筛选出一些酶进行测试。这个方法其实有很多弊端,首先是当序列相似度比较高的时候,我们发现突破先有性质的可能性非常低。但是序列相似度低的话,可能往往丧失了目标酶活性,整个过程有很大的随机性,而且精准度比较低,需要反复试错。并且发现更优质酶元件的潜力就更差,所以投入是非常大的。

近几年随着人工智能以及深度学习的发展,越来越多的利用大语言模型对酶功能的注释工作越来越多了,比如说张慧敏(音)老师去年发表的那篇论文,完成了更精准的对酶的ESM()这一一系列的工作主要focus在对酶的注释上。即使对于同种功能的酶有相同的ECnumber,我们也有成千上万的序列供我们选择,怎么从海量的库里找到催化性能优于目前文献报道或者工业上应用的酶元件呢?就是国外比较关注的问题。

基于此,我们基于深度学习开发了一个能够更精准定位到催化性能更优质的酶元件,ESM-Ezy,利用这个工具,我们搜索到了()大致在20%-30%之间,从而保证了一定序列和结构上的多样性。令人欣慰的是,我们找到的这些酶元件,我们能以比较高的概率定位到催化性能优于目前报道以及摹本的酶。大于20%的酶有更好的有机溶剂耐受,20%-40%的酶有更好的耐热型,并且我们也预先目前最耐热的多铜氧化酶,以及解析了有铜锰中心的多种氧化酶。()我们也在细胞毒性实验中展现出了更好的表现。

目前我们也在别的酶上对工具进行测试,不是所有的酶都能用这个工具挖掘到催化性能最好的,因此这也是我们长期要探索的方向。

另外一个方向的工作就是构建化学酶偶联催化系统,为什么要构建化学酶偶联催化系统呢?即使现在合成催化、合成生物学有如此大的作用,但我们生活中方方面面的所有化学品,99%以上或者说95%以上其实都是由化学催化剂催化生产而得的,所以构建化学酶偶联催化系统,我们本质上是想将化学催化的反应性和煤催化的选择性进行特异性结合,从而构建出更高收率、更低成本、更环保安全的反应体系,来拓展酶促反应的类型和提高酶催化的反应效率。

比如说我们之前将光催化和酶催化创新性结合,创建了新型的不对称光酶协同偶联催化体系,()也为之后光酶系统偶联催化系统奠定了一定的理论基础和技术基础,大家可能也听说最近几年光酶系统发表的文章越来越多了,也再次为我们验证了系统其实是一个非常可行、可以突破酶催化的反应类型。我们用这样的系统合成了很多药物,例如巴洛芬、菲尼布特(音)以及多种生物活性分子的属性前提,也展示了光酶催化体系在产业上具有一定的应用潜力。

()大家也知道为了缓解能源危机以及缓解大气中日益上涨的二氧化碳含量,二氧化碳的捕捉与还原是化学催化领域比较关注的问题,特别是如何选择突破自然界的二氧化碳固定效率,提高二氧化碳合成多碳化合物的效率也一直是个难题。大家知道电催化确实能够以比较高的效率完成二氧化碳的还原,生成一氧化碳或者甲酸,但是电催化在还原二氧化碳生成甲醇以及其他多碳化合物上,其实是非常难的,因为它的选择性非常差,所以电催化其实在合成多碳或者甲醇这样的产物上是有非常多技术瓶颈的。但是相比而言,煤催化是选择性非常高的,我们现在身体里所需的所有碳水化合物,其实最初都是由植物通过二氧化碳的固定,这样一步步转化来的。但是生物催化固定二氧化碳的效率也非常低,主要是因为二氧化碳的还原需要非常多的能量,因此目前越来越多的工作也集中在了怎么样去做电酶()通过结合电催化的还原力和酶催化的选择性去提高二氧化碳的固定效率以及提高二氧化碳固定的选择性。在以往的研究中,人们往往借助电催化所介导的NADH或者还原()的再生,与二氧化碳固定路径中的多个氧化还原酶相结合,本质上是电催化所介导的间接电子传递或直接电子传递,来给二氧化碳还原过程中的氧化还原酶提供还原力。

这样的系统效率非常低,因为它还是要使用二氧化碳固定路径当中的线速步骤酶,比如甲酸脱氢酶,它催化二氧化碳到甲酸的转化,这个过程是热力学不(英文)的过程,所以效率比较低。因此我们在想能不能做一个化学的双功能催化剂,它一方面可以将二氧化碳高效的转化成甲酸,另一方面还可以进行NADH的高效(英文),并且它还要与后面所有酶的反应进行高度适配。因为在(英文)中最难的问题就是化学催化剂怎么和生物催化剂有高效的适配。因此我们进行了大量的筛选以及构建,最后找到了双功能的M-complex,它既可以催化二氧化碳到甲酸的高效转化,是甲酸脱氢酶的83倍,同时它还能进行NADH的快速循环,并且这两个功能很有意思的是它们两个目前互不干扰,不会因为一个的存在而影响到另外一个的速率。

我们通过把M-complex与后续的多个酶一起反应,()M-complex使用,我们从二氧化碳通过电酶系统合成甲醇的速率和产量,以甲酸为产物直接从酶合成甲醇的产量是相当的,验证了M-complex系统和我们后续的酶反应是(英文)的。第二个是M-complex的使用,大大提高了甲酸的生成速率,也提高了甲醇的生成产量,是醇酶()既解决了酶催化反应速率受限,也解决了电催化选择性受限的瓶颈,做到了1+1大于2,之后我们也用这种方法合成了更长的碳链,包括DHA等。

总体来说,我们实验室针对生物催化领域所面临的问题,通过结合合成生物学、蛋白质工程、化学催化和人工智能,想要打造高通量、高效的酶催化挖掘改造平台,用于拓展酶的反应类型,以及攻克线速酶(音)的催化性能瓶颈。我们实验室想要实现二氧化碳到氮气,实现多碳化合物或人体所需要的氨基酸。

我们实验室有不同背景的研究人员,可以展开跨学科的研究。在这里做个小广告,希望正在招收蛋白质工程、有机合成以及计算机方向的博士生和博士后,希望志同道合的小伙伴加入,也欢迎大家来西湖大学指导工作,谢谢大家!