合成生物学(工程生物学)是生命科学领域的一门新兴交叉科学,被认为是理解生命的新钥匙(造物致知)和未来的颠覆性技术之一(造物致用)。
为进一步加强国内外合成生物学领域的交流合作,提高我国在合成生物学领域的国际地位,推动国内生物产业蓬勃发展, 2023 年 4 月 27-28 日第四届工程生物创新大会、第二届中国合成生物学学术年会、首届亚洲合成生物创新大会将在深圳光明科学城启幕,为推动中国与亚洲合成生物科学与产业发展提供交流平台,为加速深圳合成生物产业发展集聚贡献力量。
以下是清华大学化学工程系研究员、聚树生物科学创始人张翀在第四届工程生物创新大会上的精彩致辞,由云现场整理。
各位老师,各位同仁,大家好。
首先非常感谢合成所以及林章凛老师给我这个机会,让我能够在这里分享工作。我今天汇报的题目是《超高通量技术赋能工程细胞系统智创》。我是清华大学的化学工程老师,同时也是聚树生物的创始人。
今天我们的主题是合成生物驱动制造,生物制造的驱动力是什么?2021年诺贝尔物理学奖得主乔治·帕里西说,生物学正在经历一个巨大的转型时期:对大量超比例增长的数据的识别,使定量研究方法的使用不仅成为可能,而且是必不可少的。回顾细胞百年的历程,最早是时间换空间,后面是技术换空间,未来我们期待数据能够成为细胞构建的重要驱动力。
刚才我说到这个百年的历程,从1928年弗莱明发现青霉素开始,我们人类第一次开始有意识地利用纯的微生物做生物制造,后面我们有基因工程、经典代谢工程、系统代谢工程等一系列进展,我们发现在工程细胞选育的事情上,其实是很长的历史演进。从发展的历程来看,它也是逐渐地从细胞外到细胞内,从细胞一个个的基因,到更多系统的层次。所谓育种的本质是什么?从工科人的眼睛里来看,就是根据表型需求设计,这个表型是产量产率,基因型就是我们的ATCG。
实际上经过那么多年的探索,我们对于基因型和同表型关联的认知,还是非常少的。目前我们典型的工业细胞工厂,在它构建的时候,我们仅仅用了非常少量的一部分信息来构建。事实上,相对于整个基因组来说我们还有巨量的未知大陆,需要我们去开发。如果我们有一张这种基因型关联的全基因图谱,能够深入挖掘基因型和工业表型关联的时候,对于我们做菌种和数据设计来说,将是非常重要的资源。
怎么实现这件事情?我们传统在做这件事情的时候,早期我们能做一个或若干个基因的研究,现在随着生物技术的发展,我们有没有可能做到更大规模的这种研究?我们要感谢CRISPR技术的到来,CRISPR让我们能够在全基因组水平上的任意位置,可定制、可编辑、可追踪地设置编辑、抑制、激活、敲除等基因组扰动的状态。基于全基因组获得的sgRNA设计,我们还要感谢合成技术,让我们非常便宜地获得实体的SDR文库,这样我们就可以通过高通量的构建,获得基因组层面上,甚至覆盖全基因组位置的大的文库。
我们知道,对于一个典型的工业微生物来说,它的基因是4000个,如果我们对每个基因进行10个位点的干扰或激活,这样的库大概是4万的文库。如果我们一个个测,显然是不可能的,我们需要用混合的方法。考虑到混合复杂的覆盖度,我们大概需要做百万量级的测试,才有可能实现这个全基因组规模和表型关联的研究。
面对这个问题,我们把液滴微流控技术应用于表型筛选平台上。实际上它是一个老技术,我们把液滴看成是微小的生物反应器,利用装备手段,可以把液滴控制在提升、纳升和微升的不同量级,随着体积的减少,它的通量就会越高。同时,对于液滴微流控技术,我们可以实现各种不同层面的操作,来最终实现表型的分选。
如果做一个简单的比较,我们目前在高通量领域,基于这套系统,主要还是基于孔板做表型测试。液滴微反应器在通量、体积,以及体积带来的成本降低方面,都具有非常显著的优势。同时,我们也注意到,在孔板体系里再做培养的时候,菌株的容量和混合往往会受到一定的限制,在液滴体系里,容量和混合非常均一,所谓的工业相似性非常强,让我们有更好的机会测试特定代谢物或生长表型的工业级水平。
我们目前构建了不同类型的工业微生物,当然我们这些工业微生物主要还是模式菌,我们现在也在逐渐扩展到CHO的细胞里。通过底盘文库的构建,在细胞株的筛选层面,我们可以很快对接文库,通过表型关联分析,获取具有重大影响的位点来实现重构。这个方法论,我们认为是通过全基因组规模再次基因组的地理大发现,获取我们前人没有研究或没有关注到的位点。
不管是跟学术界还是产业界的合作,我们发现,这样一套技术的方法论,今天很多老师都讲到,合成生物学领域卡住我们的还是专利或位点。通过全基因组规模无偏的挖掘,它有很典型的专利“三性”的特点。一是我们挖掘的往往是新颖的位点,因为前人还没有这样做过;另外,实际上我们对细胞的认知还是很浅的,这样我们可以得到很多有创造性的价值;以及有实用性的位点,我们也希望这样的方法,能够实现新一代细胞底盘的构建。
下面的几张片子,简单向大家介绍一下基于这样的技术体系,聚树生物做超高通量微生物和CHO底盘的平台。刚刚介绍了,我们基于液滴微流控,可以把基因表型关联变成数据,我们的实体平台称为小设施驱动大设施,在液滴微流控平台,可以实现百万级通量,测试成本更低,同时我们建立了基于孔板和自动化机械臂的大设施,从通量和数据丰富度的层面实现它的平衡。
另外,事实上在全基因组规模,我们可以和GM模型整合,实现数据的mapping,但之前我们很少有把真正的数据整合进去,所以我们希望通过GPA数据,构建机理混合驱动的细胞工厂设计。目前我们建立了第一期平台,它在北京昌平。这样的平台,具备全基因组规模的测试、自动化的基因编辑和测试,以及最终的小试和工艺的优化,是一个一体化的平台。目前我们正在筹划建立哺乳动物细胞的基因编辑平台。同时,在数据层面,我们专注于工程细胞底盘数据平台的开发,目前基于现有知识的综合体检测引擎,我们很快会发布我们自己的主题数据库。实际上我们在不同工程细胞的层面上,可以产生实体的高通量GPA数据。基于生物调控的图数据网络,我们希望通过对数据的清晰和规范,提供标准的GPA数据的定义和接口。最后,结合我们的GEM模型,实现数据的解读和可视化,为工程细胞的改造提供辅助的决策系统。
当然,除了工业微生物领域,我们期待做的很重要的一个方向,就是哺乳动物细胞合成生物学领域。大家很清楚,CHO及HEK这样的体系在生物细胞和治疗领域具有非常重要的价值,它也覆盖这个领域的上游基础设施,但这方面我们受制于人。据统计,2021年和2023年,这两个市场大概有53亿美元这么大,所以我们希望通过深度去做CHO细胞的位点,以及相应工艺的开发,来突破治疗性蛋白及制造平台的研发。
我们也知道,对于传统的CHO或HEK体系,它的开发流程基本还是基于单克隆的逐级筛选,最终实现工艺优化的平台。对于我们现在在基因型表型层面上,能够获取多样性菌种能力的情况下,我们也希望整合一个大上游平台,把细胞的分选、通量工艺的筛选和多组学的研究整合在一起,从宿主细胞池开初,就能判断它的工艺可持续性和最终产品的可制造性,这种大上游平台对于CHO的制造来说,将会是整合合成生物学和工艺这两端的新的研发范式。
目前我们在CHO细胞上具备了基因编辑和改造能力,包括高通量表型筛选的能力。不管是蛋白质的产量,还是蛋白质的质量,以及细胞生长的profile层面都具备百万级高通量的能力。结合我们的GPA模型,在去岩藻糖化、唾液酸化、半乳糖基化方面,我们也具备模型开发能力。
如果需要做一个总结和构想的话,一开始我给大家介绍了我们基本的想法,如果从纯数据的角度考虑工程细胞的构建,它的本质是基因型和环境参数互作而获取的表型,这张就是我们所说的基因型表型关联图谱。随着我们对于GPA数据的更深入挖掘和获取,以及它和GPA模型的整合,将帮助我们实现基于GPA数据的未来制造。这也是我本人以及我们公司,需要在CHO领域着力发展的方向。
以上就是我的报告,谢谢各位老师。