2023年《麻省理工科技评论》“35岁以下科技创新35人”中国区发布将来到上海。本次论坛我们聚焦「Infinitas 未来无限」,我们将搭建一个展现“青年人”智慧与潜力的舞台,聚集全球创新人才和资源,让更多人见证他们不懈的探索和追求,让一点火苗点燃他们无穷的创造力。让上海与我们共同见证这片广阔无垠的舞台上,追梦者们绽放出耀眼的光芒。
以下是在2024中国科技青年论坛圆桌对话精彩瞬间,由云现场整理。
陈禺杉:欢迎三位老师,因为刚才诸葛老师已经相对详尽的给大家介绍了自己的工作,我们先请魏老师和沈博也简单地介绍一下自己现在所从事的工作。
沈亦晨:大家好,我叫沈亦晨,我是曦智科技的CEO,现在主要在创业的过程中。刚才诸葛老师把我们做的很多东西都讲了,我们主要是通过设计光电混合的芯片和计算系统,来解决现在智能计算碰到的一些瓶颈问题。现在公司主要在上海,250人左右的规模。
魏云超:大家好,我是来自北京交通大学的魏云超,我2021年入选TR35,我目前是大学教授,干着教授应该干的事情。我本身是做计算机视觉的,近几年随着多模态大模型的出现,我们实验室的研究方向也做了一些调整,包括我们现在在做的跟多模态大模型相关的研究,以及生成式,还有如何让这个模型能够持续学习新的知识,做连续学习方面的研究,同时还有如何把这些技术和产业相结合,做一些落地应用。
陈禺杉:谢谢两位老师,三位老师都是我们往届的TR35,而且也都是人工智能相关领域的创新人物。我知道沈博是比较早的TR35了,从你们入选TR35到现在,比如说在自己的科研和创业过程中,有哪些收获和体会,可以跟我们新一届的TR35分享。
沈亦晨:我2017年入选的TR35,2016年的时候我刚刚从MIT博士毕业,2017年的时候刚刚成立曦智科技,入选TR35也代表着我创业生涯的开始。过去7年,一直在做科技创业,把一家从一个人一个PPT的公司做到现在250人的公司。我更多的体会是从学术往产业化转,可能是过去七年最大的体会。
这个转变有多个方面,真要讲的话,可能一个小时都讲不完。总结一下,一个是个人的认知变化,从一个纯粹做科研的学术角度去考虑问题,到从产业角度去考虑问题,我觉得最大的变化是作为一个科学家,最开始考虑的是怎么样做出惊天动地、能上大新闻的技术,能发Nature,那发Science,就觉得这就是最大的成就。但是做产业以后,可能反而做出一个很重要、很厉害的技术是其次的,更重要的是怎么样能把自己的产品让更多的人用起来、卖出去。其实技术是让更多人用起来的一个核心元素,尤其在集成电路方面,因为如果他没有太多的技术创新,大概率是一个红海市场,所以会有很多其他企业也在做这样的事,毛利率成本会被打到很低。像我们这样背景的人,只有通过更加有壁垒的,尤其芯片层面的技术,才能够在市场上做出更好的性价比产品,我觉得这可能是最大的心态上的变化。所以在思考很多技术的层面会更加商业化一点,或者从全方面去考虑这个问题。
第二,以前一直在想去花更大的努力做到100分的事,但是过去7年慢慢改变,用最小的时间做到80分的事,这可能是产业和学界、科研最不同的点。我们创业七年多的时间里全世界都变了,2017年和现在发生了翻天覆地的变化,从全球范围的经济形势,从中美的关系,比如我们最早在美国成立的公司,现在主要扎根在中国。我们最早就是用光电混合做计算,但是2017年的计算场景和现在围绕大模型的计算产品也有巨大变化,怎么样用最快的时间让公司的产品和技术路线迭代到最适合现在的社会和世界形势变化,可能也是心态上的转变。
魏云超:就这个问题,可能创业的沈老师会回答的更好。我自己是2016年博士毕业,后来在新加坡国立大学、美国UIUC,后来到了悉尼科技大学做博士后以及任教。我2021年入选,2021年对我来说是运气比较好的一年,那年我回国,另外是TR35,然后也拿到了我们国家的张江。这个事情对我的影响还是挺大的,我们这个奖,你拿到之后就会想着未来怎么把自己的科研做得更好,如何去选方向,如果让你的工作做得更加impact。我当时做的时候有很多风头找到我说要不要创业等等,那一年回国相当于从零开始,整个团队没有起来,所以这个就搁置了很久。在培养学生的过程中,一直督促着我怎么样可以把未来的工作做得更impact。
作为高校老师,我觉得影响比较大的就是你去申项目等等,你可能有了这个奖,会让我们变得更容易,会有助推作用。总之,这个奖带来的东西还是挺多的。
诸葛群碧:我2008年回国,2020年拿的TR35奖,当我们把自己摆在某一个圈子里的时候,你可能就会做那个圈子里的人做的事情,认为自己找一个好工作、挣这点钱就够了。但是拿了TR35的奖,我就感觉我是TR35的一员,获得TR35的人在做什么事情,我就应该去做什么事情,怎么样尽到自己的一份力量。
我的背景是从公司出来的,我在公司里干了4年,从engineering的思路变成professor的思路。你要思考一个公司里有几百人、上千人,甚至几万人在做这个事情,我们只有十几个人,还是学生,我们怎么发挥自己的价值?这是我过去几年一直在思考的。我经常给他们举一个例子,讲斯坦福、李飞飞教授的例子,我最近刚买了她自传的书。她在当初建数据集的时候,带着几个学生,把这个数据集建起来,建起来之后加速了AI时代的发展,我觉得我们在高校更应该思考idea的创新,怎么用一个支点撬起一个世界。
陈禺杉:谢谢各位老师对TR35那么高的评价,我们TR35也是希望让更多优秀的科研人员和科技创业者被大众所知道,而且《麻省理工科技评论》刚好能提供这样的通道,因为它在国内来说,大家觉得它的认知还不错,而且在美国来说,它也算是相对比较中立的荣誉。如果能为各位老师们在今后的创业和科研道路上提供一些方便和帮助,对我们来说也是非常欣慰的。
第二个问题比较回归主题了,几位分别在人工智能领域不同的segment做具体工作。各位在数据、算力、算法等各个环节,在当下人工智能大爆发的环境下,各自分别都做了什么样的突破以及分别致力于解决哪些场景和痛点?
沈亦晨:我是这样想的,其实我们刚刚毕业的时候,2016年、2017年的时候迎来了上一波人工智能的爆发,在机器视觉的爆发。两年多以前,第二批更大的以language model为主的人工智能的爆发。我觉得人工智能爆发的惯常思维是因为大家发现了CNN、transformer,所以迎来了人工智能的爆发。另外一个点,我觉得更接近事实的是随着算力价格降到了一个水平以后,带来了每一代人工智能的爆发。当英伟达GPU出来以后,2015年、2016年大家用低成本算力才可以把原来不怎么能用的CNN变得越来越有用。随着算力的进一步提升,才有了现在的大模型。比如英伟达最近发布的B100,它的NVL72,可能一个机柜的算力就等于原来1000张A100的算力,进一步降低了算力成本,所以现在更多的人工智能科学家其实是根据现在能掌握到的算力上限,去开发最适合于这种算力的人工智能。
我们曦智科技主要是从算力底座来帮助现在去提升算力的上限,主要是通过两方面。第一,包括英伟达在内,过去两代他的B100、H100都是基于4纳米的制成,可能是历史上第一次他连续两代芯片并没有在制成上进一步提高,随着摩尔定律越来越小,全球范围内有很多公司寻找未来怎么进一步延续摩尔定律。我们希望通过一种光电互联混合的方式,通过部分用硅光器件去代替现在芯片上的一些晶体管,去降低它的功耗,能够进一步降低单位成本的算力提升。
第二,可能跟现在的地缘政治有关系,不仅仅从技术层面上做3纳米、1纳米、2纳米越来越难了。对于我们国家算力来讲,可能面临一个更严峻的问题,7纳米往后基于EUV光刻机以及更先进制成工艺的技术,现在也越来越难以掌握,所以可能在相当的一段时间内,会停留在7纳米的工艺。同时,更先进工艺的国外芯片产品也越来越难以进口到国内,这种情况下怎么样能够把基于7纳米工艺的更多国产芯片更好地连接起来,去组成更低成本的算力。
刚才诸葛老师也说了很多,可能需要一些底层的创新,不仅是沿用现在光模块的方式,而是更高集成度的芯片层面集成,把更多算力集成起来,去提供现在的算力基座。现在主要做的是这两部分。
魏云超:从高校的角度,多模态大模型和大语言模型主要之后,我个人觉得公司和高校要做的研究划分其实越来越清晰了,公司的使命其实就是做一些更强的基座模型,而高校更多的是发现一些有意思的topic,去做一些算法相关的研究。比如像我们团队这边,我本人早些年做的是图像分割、视频分割,核心来讲是如何让模型能够识别每个像素的语义。
有了大模型的加持之后,我们可以做一些更有意思的。比如我们今年做了PSLM(音)的工作,我们提问它一个问题,它可以通过场景的解析定位出它想要的任何物体等等。我们在算法上第一个干的事情就是如何使得现在的精细化理解跟大语言模型结合,赋予它这种推理能力。它和现在的具身智能、视觉感知有非常紧密的联系。
我们在做的另外一个事情就是如何让这个模型能够持续地学知识,这是一个很古老的概念,叫continue learning,如何让这个模型在不断的使用过程中变得更强。多模态模型的知识也非常丰富,有些知识是该学的,有些知识是不该学的,我们能不能在做的过程中把一些不好的知识给选择性遗忘,这也是我们在做的事情。
如果我们现在在做生成式的东西,生成式模型在市面上也有很多,但是他们在生成物体的过程中速度是很慢的。我们也在研究如何在3D、4D上把这个东西加速,这是我们在基础算法研究上做的东西。应用层面上,高校的好处是不像公司会有竞争关系等等,高校是比较free的,我们可以跟有些数据壁垒的公司合作,去做一些比较有意思的研究,把我们现在的算法真正的跟之前没有被计算机视觉或者多模态大模型探知过的领域进行融合。我们现在做的比较意思的是跟民航合作,X光机、CT机成像的图片,如何更好的把认知算法和这些场景结合,也是我们现在在做的东西。
诸葛群碧:这个主题我前面讲了很多了,我就加一点好了。我们一直在思考,今天的大模型还在数据中心里,未来会长什么样,五年、十年后这个世界会是什么样。我们想象的这个世界,五年后、十年后,比如有一个模型会专门负责家庭,每个校园、每个园区可能都有一个。未来无论是小模型、中模型还是大模型,它可能会遍布全世界非常多的地方,它背后的网络基础设施要怎么样,跟今天的IP网络完全不一样。我们在构思那样的世界,在做这方面的研究和布局。
陈禺杉:今天台上的三位老师分别是在算力、算法和通信三方面做跟计算AI相关的事情。我顺着诸葛老师刚才提的东西,因为诸葛老师刚才预测了一下五年、十年后的基建或基础网络应该什么样。我想问一下三位,现在毕竟大模型出现之后,跟很多垂直行业都有了很深的整合,不管是生命科学还是材料、能源等各个行业,大家都对本专业有了新的看法。从自己所在的行业出发,未来我们所在的行业有可能跟其他的哪些垂直领域有融合或合作?
沈亦晨:从集成电路角度的话,其实它不仅仅是应用到人工智能的,非人工智能类的计算现在也越来越多,现在各种各样的计算都会或多或少用上一些人工智能,对我们来讲,一方面主要是在算力,我们现在做的很多芯片其实也不仅仅是针对人工智能,很多在控制理论、蛋白质合成方面,也会有很多应用。
换一个角度,今天的大模型可能也不是明年或后年大家想象的这种大模型方式,但是总体来讲,我们一直在做的事情是通过更高的算力去开发更聪明的人工智能,反过来让它能够做集成电路的设计,这也是现在很有意思的一件事情,能够让它自己转起来,这也是我们现在做的事情,也有一些客户。
魏云超:垂直领域的应用其实很多了,在高校,老师很多方面有点拿着锤子找钉子的感觉。北京交通大学其实是一个铁路背景的学校,包括如何跟轨道交通结合,其实也是一点。自然场景图片等等看着很火热,其实还是有很多领域没有被探究到,而且有些领域的数据壁垒是非常强的,会存在一些有数据没技术,或者有技术的人没办法access这些数据,我们现在在做的智能安检和铁路都是。
前段时间我去北大肿瘤医院和季家福(音)老师聊,他们从医院角度也有很多需求。他们看到我们AI领域做的东西,他说我们想的AI跟你们做的还是不太一样,我们希望AI能让专业的医生更专业。比如通过影像化的变化让手术做得更好等等,如果没有跟垂直领域很好的沟通,其实不会知道这些需求,我觉得有很多领域可以去尝试。
诸葛群碧:可以跟很多方面融合,我讲一个我们最近正在做的,我们想让AI帮我们做实验,因为感觉我们自己做实验太辛苦、太慢。更重要的是什么呢?它能不能在数据里找出一些我们发现不了的规律,我们最近在尝试做这样的事情,它可以自己来设计实验怎么做,根据实验的反馈,再来重新调整设计,基于这些数据,看一下有什么样的规律,对它进行分析,再展示给我们看。我觉得AI for Science未来的发展空间是各个领域都非常大的。
陈禺杉:最后是关于人才,现在生化环材属于非常火热的专业了,人工智能就更不用说了,一直以来人才相对短缺,而且用人成本也比较高。沈博从产业界出发,两位老师从学术界出发,都可以谈一下自己团队在招募或者培养的过程中,会有一些什么样的心得体会,或者说需要什么样的知识,不管是来自于民间的还是政府的,我们也希望这些声音能通过我们的直播平台和在场的领导们传播出去。
沈亦晨:从企业来讲,可能永远绕不过去一个问题就是行业薪水。我们作为面对人工智能的集成电路公司,我们主要的人才要么是做集成电路的,要么是做人工智能的。这两个关键词可能是过去五年整个行业薪水涨得最快的,一方面比较关键的是作为一个企业,怎么样能够现实一点,让员工能够有安全感,企业的延续性和前景是好的,并且提供的薪酬是比较有竞争力的,我觉得这是蛮核心的,从公司层面要不断地让人才看到不断的成功,各方面的成功,产品上的成功、融资上的成功、技术突破上的成功,这是很重要的一个点。
另外,和学术界的合作也是我们现在比较重视的点,不仅仅是我们公司自己招全职员工做产品,做产品的人才和完全原创的人才可能是两种,包括和交大在内,也成立了很多联合实验室,把一部分我们公司的资源放给高校,相对来讲成本更低一点,另一方面有更多机会和人才能够变相的帮助我们发展。
魏云超:从高校的话,我觉得两方面。一方面是博士生、硕士生的培养,可以给他们搭建更好的平台,让他们能够access更多的计算资源,能够有更好的指导等等,让他们在自己感兴趣的领域尽可能发挥他的全部,不会被各种外因去制约。第二,从高校青年老师的角度,青年老师的压力其实很大,进到高校里,他既有教学的压力,还有职称晋升的压力,甚至还有人才帽子的压力。学校给更好的人才晋升通道,以及国家有更好的评审机制,让真正特别强的人出来,我觉得是比较好的。
诸葛群碧:我从学生选择专业的角度再谈一谈,现在的学生都往AI跑,搞得我们这些传统行业的生源质量比以前差很多,我觉得正确的引导非常重要,并不是每个同学都适合学某一个专业,怎么正确引导他们找到自己的兴趣,而不是别人说的这些热门方向,而是他真正自己感兴趣并擅长做的。AI发展的这么好,也有讲到计算硬件、通信硬件、底层芯片硬件等等,其实它的空间非常大,相对来说目前的竞争不会像AI算法、大模型那么激烈。怎么对学生做更好的专业引导,让这些学生真正走到适合他们的专业方向上去,同时更好支撑我国在各个方面的布局,这样可以给沈博的公司输送更多专业人才,我觉得这样未来可能会更好一点。
陈禺杉:三位老师都是各自领域非常优秀的青年领导了,我们的论坛就到这里,谢谢三位老师。