合成生物学(工程生物学)是生命科学领域的一门新兴交叉科学,被认为是理解生命的新钥匙(造物致知)和未来的颠覆性技术之一(造物致用)。
为进一步加强国内外合成生物学领域的交流合作,提高我国在合成生物学领域的国际地位,推动国内生物产业蓬勃发展, 2023 年 4 月 27-28 日第四届工程生物创新大会、第二届中国合成生物学学术年会、首届亚洲合成生物创新大会将在深圳光明科学城启幕,为推动中国与亚洲合成生物科学与产业发展提供交流平台,为加速深圳合成生物产业发展集聚贡献力量。
以下是中国科学院分子植物科学卓越创新中心研究员杨晟在第四届工程生物创新大会上的精彩致辞,由云现场整理。
感谢主持人的介绍,感谢林章凛教授的邀请,感谢组委会精心的安排。我今天的报告,听上去比刚刚李世默先生的题目要小得多,希望我的报告能更加接地气。
关于合成生物学的前景,李先生都已经介绍过了。这个分论坛叫“合成生物驱动生物制造”,对我们实验室来讲,我们是个应用导向的,更多是生物制造的目标,来驱动我们合成生物工具、方法的发展。生物目标对我们的实验室来讲,要么是大分子酶做蛋白质,要么是化学品,细胞这块属于医疗品,今天我就不讲这块的内容了。
由于生物的复杂性,一般的企业或我们的合作伙伴,会给我们一个成功标准,你达到成功标准,就可以进入工业化。怎么才能尽快达到这个标准?由于生物系统的复杂性,我们要做很多次迭代。怎么加速研发?一方面,你不要迭代,一次性精准设计就完成了。还有一种方法,把迭代做得非常快速。
先讲一下我们以前做酶的例子。有一个基因,做基本的TB配方,18℃做发酵,不行的话用各种温度和培养基去试。据2008年的统计,大概是30%的成功率。后来我们转变了方法,由于合成生物学、合成化学做DNA获得更加容易,所以我们就用了变化的思路,用了一个我们长期以来做的比较稳健的表达系统,我们在里面置换基因,其他的培养基温度,我们用的都是标准的方法,这样我们就不用迭代了,只需要把基因塞进去,哪一个基因好,就这样往下做,这样我们做下来的成功率有90%,速度快很多,克服了一种酶、一套工艺的传统模式。菌种前面的基因合成好,挑一个最好的,进入后面的流程,后面全都是标准的生物化工的单元操作。
我们建立了两吨罐的中试车间,因为不用迭代了,整体的研发成本非常低,做得非常快,当时我们做了200多个酶的项目。我们有26种酶都已经进入了工业化,催化生产了24种化学品。但现在这块我们不大做了,因为现在很多公司做得很好了,我们自己也孵化了一些公司。
另外,我们做化学品。虽然化学品比酶简单,但它牵扯到更多的基因调控。我们的对策就是要加速这个构建的过程。
工程细胞的构建,比如以很经典的大肠杆菌来讲工程的例子,它大概有32个基因,做了32个靶点改造。我们做基因编辑,一般一个礼拜、一个靶点,加上测试,时间更长。也就是说,你做32个靶点的话,要做32周,抄答案也要抄半年。如果能引入这个靶点的集合,就能大大加速这个过程。另外,在很多工业生产菌里,最后都要经过高通量筛选。我们做合成生物学,希望在里面做反向工程,找到哪些基因的组合对生产性能是有帮助的。我们通过各种各样的组合,可以找到有效的集合,学习里面的原理,再进行迭代。这种组合非常多,也需要有多重编辑的工具,之前做CRISPR还是很困难的。
2019年我们读到了两篇文章,用CRISPR模块可编程地发现靶标,招募转座子系统,可以把DNA插入认定、指定的地方,可以实现并行操作。当时我们就有这样的构想,用一段CRISPR指向基因重复点,做多拷贝插入,甚至组成array,靶向任意序列,进行多拷贝整合,还可以做多基因中断。要实现它,我们做了一些基因组的挖掘,从半透明假交替单胞菌里找到了一个酶,它的活性非常高,首先我们表征了它的PAM,是否有什么序列,我们把它在染色体DNA里做了一些移动,它不挑PAM。有些比较低,在别的地方它的效率也是更高的。大家可以看到,AA略低一点,但它也是能编辑的,所以不挑PAM。用另外一种方式,我们把它的PtrCAST序列前面随机化,再做插入做高通量测序。统计以后,我们发现它也没有明显的序列偏好性,所以它不挑PAM。另外,我们的插入方向和间距经过却都是非常确认的,靶标在48bp、50bp左右插入。它的插入片段非常大,15kb的时候还能达到100%,而且它比较容错。我们找到的这个PtrCAST具有高活性、大片段、不挑PAM,插入的方向和距离都非常清楚。
看一下它的效果,首先我们做了一个18个重复的序列,经过五天的传代,颜色越深的代表拷贝数越高,传五天就能在基因组上达到16个拷贝,我们用不同的位点组成array,三天就可以把8个位点全部中断掉。可以做什么应用?首先可以做多拷贝整合,建立酶表达盒剂量文库,在8个酶的位点上传三轮,就能收获1-8个拷贝的表达盒菌株,6拷贝的表达率最高,比对照的PET质粒的表达高很多,优势比较明显,可以高2.5倍,这是在酶表达上的应用,有些已经到了工业上15吨灌的应用。
这是一个氨糖的例子,氨糖要阻断,过表达2个基因,我们可以把阻断的基因放在array上,过表达放在cargo上,5个拷贝的发酵单位是最高的。从右下图可以看到,它做发酵罐的时候,比质粒的版本高很多。对比一下,如果你用cas9,要构建3轮质粒,用MUCICAT这个方式只需要构建2轮质粒。
再看一下Cas9与CAST多靶编辑时效对比。如果在3靶以下,MUCICAT靶点数的增加,对时间的影响不大,而Cas9的靶点数越高,由于是多轮迭代,时间是增长的。将来我们要做基因组编辑,做复杂的基因设计,就可以一步实现多拷贝整合和多基因中断,所有的设计都能做进去,甚至我们可以多层多拷贝,比如一条途径,把它设计在工程细胞上的几个位点做拷贝数的整合,我们还可以把这些竞争的途径全部敲掉,放在一个array上,然后把另一条途径增强。由此,我们可以布置在2个甚至3个不同的质粒上,把整合的两个途径,放在各自的两个cargo上,把敲的或者整合的放在一个CRISPR位点上,一步实现复杂的基因设计,把原来需要半年才能做的,现在几个礼拜就可以做了。
小结一下。我们实验室挖掘到一个活性创记录的CRISPR相关转座酶,基于CRISPR相关转座酶的MUCICAT在多重基因组编辑具有显著优势,MUCICAT能快速实现复杂的微生物染色体改造设计,所以我也推销这个工具。我们的工具,许可了非常多的公司,它做了2000多次分发,我们许可给很多公司使用。我们也做了一些实战。
前面李世默先生也讲到纤维素秸秆的利用,我们开发的木糖酵母许可给了一家公司,这说明了我们的商业化应用,主要是在巴西。2015年,我们就可以开始收到钱了,它有CostaPinto工厂,左边加油站的葡萄牙写的是“这里有乙醇,是二代的”。经过六七年的运营,这个技术已经相当成熟了,所以今年他们Bonfim另一个园区里,今年就要投产了,他们甘蔗渣的乙醇汽油也供给了法拉利的F1车队使用。他们还有两个产能,在巴西圣保罗州,正在新建,预计明年会投产。他们现在的瓶颈有两个,一方面是需求,跟甘蔗糖相比,它的成本还是高的,这是生物基代培育的市场。另一方面,它是生物质,要取决于制糖厂剩下的甘蔗渣还有多少。这样的纤维素平台,除了做酒精以外,还可以做其他的东西。
另一个例子,我们跟国内比较大的发酵企业梅花集团也做了一些合作,针对他们的谷氨酸,我们定制了一些基因组编辑工具,对他们进行了理论计算、代谢重塑、精准改造,比如他们主要的产品味精谷氨酸,通过我们的代谢,他们多年的菌种现在可以验证了,成本已经下降了。
以上的很多工作,确实都是由我们的合作企业来拉动的,我们也孵化了不少公司,在这里一并表示感谢。我们培养的教授不多,但培养了很多企业家,包括我们前面做的酶,他们去卖酶的,以及做工程益生菌、合成器转化的,各种各样的都有。
非常感谢大家,我的报告就到这里。
这是我们的公众号,请大家多多指正。