​月之暗面创始人杨植麟分享创业经历与心得:困难以天计,仍需砥砺前行
2024-05-18 青年

青年报·青春上海记者 范彦萍/文、图

去年3月,聚焦通用人工智能大模型研发的公司Moonshot AI月之暗面成立,10月即推出全球首个支持输入20万汉字的智能助手产品Kimi,让月之暗面创始人杨植麟这个1993年出生的90后青年创客成为资本市场的宠儿。

在今天举行的第五届上海创新创业青年50人论坛上,场内的杨植麟分享了自己的创业经历与心得,场外的他被围得团团转。

  //  从小就是别人家的孩子  //  

从小,杨植麟是非常典型的别人家的孩子,从小优秀到大是什么感觉?去年成立的月之暗面,现在已经成为国内通用大模型领域的六家独角兽之一。今年2月19日,月之暗面完成了最新一轮的融资,金额超过10亿美元,刷新了国内AI领域最大单笔融资纪录。该轮融资过后,月之暗面的估值已达约25亿美元(约合人民币180亿元)。

除了创始人的身份外,杨植麟还是清华大学助理教授,2019年度北京智源青年科学家,上海期智研究院PI。本科毕业于清华大学计算机系的他,博士毕业于卡内基梅隆大学计算机学院。2022年4月28日,杨植麟入选AI华人青年学者榜单。他也是中国35岁以下,NLP(自然语言处理)领域引用量最高的研究者。

杨植麟介绍说,人工智能在过去十年时间里发展非常迅速。“2018年我开始和谷歌同事训练语言模型,最早训练了比RAN更好的语言模型。”

2019年时,杨植麟和小伙伴选择回国创业。谈及当初的选择,他毫不讳言彼时的时机:“当时有两个最主要的因素,第一个因素是环境,当时看到巨大的机会,包括政府支持、风险投资的支持,中国过去几十年的教育发展,使得你有机会做AI创业,包括AI产业在过去十年也发展迅猛,培养了一批新的人才;第二个比较重要的条件是我们看到AI有非常大的机会,符合第一性原理。”

“技术的发展是非常神奇的,为什么2022年底发布的GPT-4可以成为里程碑?因为它能做到以前不可能做到的事。”杨植麟说,这其实是一个天时地利的结果,互联网发展二十多年,本身创造了很大的价值,但很可能再过三四十年回头看,会发现互联网最大的价值是为AI积累了大量数据。此外,AI的出现还得益于硬件的进步,包括Transfomer架构的提出以及半导体发展。

那么人工智能接下来的发展新方向是什么?在杨植麟看来,是要从回答简单的问题,发展到解决长链路的复杂任务,还要从完成1%的工作流到90%的工作流。“比如以一些非常专业的文档为基础,接下来所有的学习过程都在人工智能中进行,就可以快速在一个新的领域成为专家,这也是非常重要的应用场景。”

  //  未来,AI可以让你快速在新领域成为专家  //  

什么是处理更复杂问题的能力呢?杨植麟解释说,比如在用人工智能分析一项研究进展时,它不仅要能知道是最新进展如何,哪些研究机构做得好,甚至可以直接编写代码、分析实验结果,还可以和实验者讨论接下来的研究方向。也就是说,它不光可以被动地遵循你的指令,还可能给你提出挑战。你给它一个指令,如果指令本身有问题,它可以跟你探讨,然后和你一起去工作。

杨植麟透露说,他们观察到又有一个非常重要的技术,该技术可以类比AI时代的内存。“因为计算机时代的内存经历了几十年的发展,1970年代当时出来的微计算机有128K的内存,今天看起来非常小,当时很多应用跑不起来,过了几年突然出现512K内存,有些应用可以开始跑了,最早的Excel、Word等应用开始出现。后来内存经过三四十年的发展,到现在几个G的内存非常常见。这个大概可以理解为大模型内存,一次性可以往大模型输入多少,这个决定了参与计算数量,比如一口气想阅读一百篇论文或一口气分析二十篇财报,或现在有一千份简历同时处理,或做复杂的任务,完成某个行业的研究报告,访问很多链接,在里面推理、思考,完成组合式的任务,它背后都需要很强的上下文才有办法推理,对更复杂的依赖关系建模完成更加复杂的任务,我们在这个方向取得一些小的进展,我们现在支持两百万字上下文窗口的输入,为更多的可能性提供基础。”

他介绍说,如果问题的复杂度非常高,需要把这个很复杂的问题拆解成更长的序列,这里涉及到一个均摊的过程,可以把很复杂的问题拆解,使得每步变成更简单的问题。比如每个人的交互历史都可以被记录下来,提供更个性化服务。“未来,甚至可以能够让你快速学习一个新的领域,快速在新领域成为专家,这也是非常重要的应用场景。”

  //  希望能够在爬楼梯和看风景之间取得平衡  //  

在谈及创业公司的发展时,他表示,创业公司重要的是组织,组织要适应生产方式,适应新技术,你有新的技术时生产方式往往发生变化。从0到1搭建新的组织可能有非常大的优势,比如大模型开发方式和互联网的开发方式很有可能是完全不一样的。互联网的开发方式很多时候要做规划式的发展,比如定一个目标接下来要开发什么,很少遇到因为有技术的瓶颈导致这个东西开发不出来。“大模型是涌现式的,比如要训练10的25次方运算,不知道训练到这个节点能涌现出什么新的能力,不能说一个个案例每个分类优化,要更多关注基础能力,让模型涌现。”

杨植麟打了一个比方,不是说直接指一个地方种一棵树,而是直接把整片森林承包下来,生产方式不一样,组织对应要做调整。“相比大企业,这就是新的创业公司可能具备的优势。我们一直在这个方向做探索,希望在这里面不断迭代出更大的组织。”

他还希望,能够在爬楼梯和看风景之间取得平衡。模型的能力接下来有非常大的提升空间。我们今天还在产业的开端,刚做到10的25次方运算,接下来会有26、27、28、29等次方的运算,不断提升。“我们希望能够更多把精力放在爬楼梯上,不仅仅只是看风景。”

当被问到创业是否顺风顺水时,杨植麟表示,这只是表象,困难是以天计的。不管是招募优秀的人才,还是融资等,都面临各种挑战。

很少有人知道,这样一位技术男、理工男,儿时的梦想是做摇滚歌手、流浪诗人,出席论坛的他的发型有点潮,光看外表很难与技术大咖的身份联想起来。

杨植麟表示,创新创业和摇滚本质上有一些相通的地方,都是和创新有关——怎么能够去通过一些新的东西,带来一些增量的不同。比如像摇滚一开始发展的时候也是一个全新的流派,它在当时的时代背景下代表完全不一样的思想。“我觉得我们今天研发新技术很大程度上也是如此。摇滚发展很好的时候,正好是计算机开始发展的时候,当时IBM是全世界最大、市值最高的公司,大家当时形容IBM既是太阳又是月亮又是星星,日月星辰被它包揽了,微软当时只有几个人,他们真的做了一个很颠覆式的创新,这可能是我们想要努力的一个方向。”

他希望,社会各界对创新精神更多一些包容。“很多时候创新意味着要有一些很奇怪的想法,但我觉得还是比较荣幸,不管是之前在清华还是现在这个创业的环境里,都能得到很多的包容和支持。”

青年报·青春上海记者 范彦萍/文、图

编辑:梁文静

来源:青春上海News—24小时青年报

返回上页 回到首页

青年报社 版权所有

总机:021-61176117 | 广告热线:021-61173717 | 违法和不良信息举报电话:021-61177819 / 61177827 举报邮箱:services@why.com.cn    测试版