对谈胡伟武:龙芯的“自由王国”之路

2021-06-15 10:07:29 admin 480
自主CPU的市场化之战怎么打

编者按:本文来自微信公众号“远川科技评论”(ID:kechuangych),作者:杨健楷,36氪经授权发布。

本文聚焦在了社会广泛关注的国产CPU领域,嘉宾是龙芯创办人胡伟武先生。

2020年11月29日,远川研究所发布了《谁主沉浮:国产CPU的三大路线之争》一文。该文讲述了在缺芯少魂的时代背景下,胡伟武等人在2001年成立龙芯课题组,在2002年成功研发出龙芯一号CPU,打破了英特尔等国外厂商在中国市场的垄断局面,其后的十几年,龙芯经历了数度起伏,现已成为国产CPU产业第一梯队中的佼佼者。

上述文章发出后,引发了业内对于技术路线的讨论:引进,还是自主?对于不同的架构和公司,曾有不少专业人士提出自己的意见,并与远川研究所科技组做了深入探讨,引发我们进一步思考,国产CPU自主派的价值,究竟在哪里?

带着这个核心问题,我们在今年5月27日在上海与胡伟武做了两个小时的长谈,全面复盘了龙芯的二十年历史,试图厘清以下问题:

1. 以龙芯为代表的自主派路线是如何诞生的?

2. 龙芯是如何摸索出一条成功的市场化路径的?

3. 国产CPU产业的历史发展规律是什么?

一番交谈下来,上述疑问悉数得到解答。胡伟武为我们讲述了一个全新的国产CPU故事,展现了龙芯不同成长阶段的时代背景,总结了一个自主派团队二十年的战斗经验。

在胡伟武看来,龙芯二十年做的所有事情,都围绕一个中心展开:在外国厂商垄断的生态体系之外,中国的信息产业发展需要一个独立自主的存在。龙芯最为重要的价值,是在这件事情上做了二十年,也就能够从不掌握产业规律的“必然王国”,走到掌握并充分利用产业规律的“自由王国”,最终将在2023年走向公开市场。

那么,龙芯是如何走向“自由王国”的?以下,是远川与胡伟武的对话:

01 自主派路线的诞生

题记:从2002年龙芯一号成功,到2006年纳入“核高基”项目,龙芯从计算所的一个课题组出发,短短几年受到了国家意志的认可,这是龙芯创业的第一阶段。在这部分,胡伟武讲述了龙芯的历史传承和自主创新的时代背景。

远川 :中科院计算所在上个世纪六七十年代时建立了一个完全自主的计算机体系,后面第二代创立了联想和中科曙光,怎么看龙芯与这两代之间的关系?

胡伟武 :我国第一代计算机是完全自主但没有市场化。华罗庚先生最早倡导发展计算机,在中科院数学所成立了一个三人计算机研究小组,我的导师夏培肃是其中一个。计划经济时代,主要是为两弹一星、天气预报、石油勘探等国家工程造计算机,国家计委下达任务后,几乎可以从矿石开始造,一点都不需要依赖国外,由此形成了一个国内的小循环,但是没有市场化。

第二代计算机完全市场化,但丧失了自主性。这个阶段的典型代表是中关村一条街,计算所办了联想。当时确实造不如买,国外工业化批量生产便宜的计算机,如PC机。与之相比,我们造的计算机相互之间指令、软件各不相同。

完全市场化后,我们的计算机研发从两个核心领域退出,一个是CPU,一个是操作系统。那时我们在高性能计算机领域被别人卡脖子,用的时候还要建个玻璃房子被监视操作,所以我在计算所读研究生开始,就觉得我们被西方国家卡脖子,只不过那时候是高性能计算机。

在这个背景下,我的导师夏培肃院士联合金怡濂院士(2002年度国家最高科学技术奖获得者)、周毓麟院士在1997年主持召开香山科学会议,讨论我国高性能机发展问题。这是科学界每周举行的一个务虚会,会后形成一个报告呈送中央,我96年初博士毕业,有幸作为会议秘书参会。

胡伟武与导师夏培肃院士

虽然会议的主题是高性能计算机,但大家讨论后聚焦在CPU上。那时高性能计算机都是用国外芯片来做。金怡濂院士的一句话让我记住一辈子,他说,CPU这个东西一定要做,哪怕做个8086也得试试看。8086是英特尔在1978年推出的16位处理器。

我的导师夏培肃院士多次跟我说,我这辈子最大的心愿是搞好中国的计算机事业,我们这代人没搞好,你要搞得比我好。

与此同时,我的师兄李国杰院士,计算所第二代和柳传志并肩的牛人,在主持开发曙光机、以市场化手段发展服务器产业同时,又开始不断呐喊,倡导自主,给我们第三代以实际的支持,拉开了龙芯自主研发CPU的序幕。

所以,我们精神上传承自第一代计算机人,然后也要向第二代计算机人学习市场化的方法,由此在市场化条件下实现自主,创造一个独立于Wintel(微软-英特尔)和AA(安卓-ARM)的第三套体系。

远川 2006年,龙芯与很早提倡自主创新理论的北大教授路风,一同在科技部和中宣部举办的自主创新报告团演讲。路风的理论对龙芯产生了什么影响?是否从那个时候开始,中央层面上已经开始意识到,产业政策应该往自主创新的方向走?

胡伟武 :2006年的中央自主创新报告团,我和路风教授在一个组,听过他的报告,印象最深刻的就是技术创新能力。后来,我将其提炼为,高技术产品背后是技术,技术背后是技术能力,技术能力是最重要的,相当于自主创新的“枪杆子”。

2006年到2010年间,龙芯CPU各方面稍有起色,国外各主流CPU企业都找过龙芯,希望跟我们合作,他们说,你们不用这么辛苦,技术可以授权,用我的就行了,或者谈合资。坦率说,当时把他们的二流、甚至三流产品给我们,也比我们的一流产品好。

但是从技术能力的角度,不该要。我后来说,他们翻来覆去跟我讲技术合作,其实就是4个字,交枪不杀。我只要把枪杆子交出来了,放弃了,自主创新的实践就中断了,队伍就散掉了。

那么,是不是从2006年开始就转向了自主创新?应该说,那时是拉开了自主创新的序幕,或吹响了号角。2006年开全国科技大会,是第二次科学的春天,中央在科技理论上明确:科技要紧紧围绕经济社会发展的中心任务,解决制约经济社会发展的关键问题。随后召开十七大,明确了企业是技术创新的主体。

但是,究竟怎么创新呢?其实仍有争论。2006年开科技大会之前,对于应该叫自主创新还是开放创新,大家意见不一,有人说我们现在开放了,应该叫开放创新。虽然后来官方文件都表达为自主创新,但实际上做定义的时候有三种模式:原始创新、引进消化吸收再创新以及集成创新。政策真正落地执行的时候,客观上来讲,原始创新几乎没有支持或者不怎么支持,因为周期太长。

到了去年的十九届五中全会,有两句表述值得注意:“把科技自立自强作为国家发展的战略支撑”,以及“以改革创新作为根本动力”。这实际上终结了创新模式的争论,但在实践层面,估计至少还需要10~15年的时间,才能证明自主创新这条路是对的。

02 龙芯下海

题记:随着龙芯在研发上迅速取得十倍速进展,与国外CPU性能差距逐渐缩小,到了2008年,龙芯开始商业化尝试,并在2010年集体脱离计算所编制下海。取得多次胜利的龙芯团队,在这一过程中遭遇了“断粮”危机,直到2015年,龙芯成功闯过鬼门关,这是其创业的第二阶段。那么,龙芯这一时期困难的主要矛盾是什么?他们又是如何解决的?

远川 :龙芯为什么要下海?从课题组转向公司的过程中,遇到了哪些挫折?

胡伟武 :那时候到处是质疑,龙芯面临的压力很大。我印象最深刻的是,国外论坛有个人发帖说,龙芯CPU如果能卖出去一片,我从此倒立走。我们自己也感觉,龙芯在科学院的体制内、在计算所继续做下去,已经没有意义了,因为CPU不是用来开鉴定会用的,也不是评职称用的,而是必须在市场中让客户来评价。

2008年,我们在计算所成立了一个技术服务中心,几个人以非营利机构的方式来做。尝试两年后,龙芯整个团队在2010年集体下海。我们决心很大,2009年和2011年的时候,中科院计算所推荐我去报院士,我的导师也鼓励。但我的决定是不报了,并且说了一句豪言壮语:中国不缺院士,缺个像英特尔这样的企业。

当时,龙芯团队的基本盘是我自己培养的三、四十个博士。我的学生张戈中科大少年班毕业,18岁到我这里硕博连读,23岁博士毕业,25岁评副研究员,26岁辞职,还有我的5个在读博士都不读了,他们在计算所都是很优秀的,当时就这么大的决心。

但是,我们在下海办企业过程中还是遭遇了不少挫折。

2009年龙芯承接的“核高基”一个桌面CPU课题,目标是实现龙芯电脑的100万套销售,大概得到1.7亿元的支持,采用“后补助”的方式,也就是补助先给30%,如果完成百万套出货,才给付剩下的70%,这是一个典型的产业做法。

我们对此没有认识,觉得一个亿好多钱,应该什么都干得成了。实际上,产品从研发到样片至少两年,然后产品化一年,起码得三年打底。对CPU性能的理解存在偏差,把高性能机的专用性能当作桌面计算机的通用处理性能。可以说,“核高基”课题把龙芯导入市场,让我们看到差距,并“知耻而后勇”地结合市场需求进行团队思想改造。

2012年“核高基”对“十一五”课题结项的时候,高性能计算机CPU完成了,龙芯产业化没完成,大家对自主CPU失去了耐心,觉得自己的看来不行,还是要支持引进的,于是引进很多CPU项目。由此,龙芯顿时处于两难境地,国家支持没有了,市场上没起来,马上要断粮了。那时我走到很多地方,专家、领导都很同情龙芯,会安慰我几句,他们觉得龙芯肯定死了,但这个事情恰恰对龙芯有好处。

我们反思,龙芯下海之后,研发工作没有从实际出发,而是从本本出发:本本,是国家项目指南,是美国人的论文;实际,一是客户需求,二是龙芯自己处在什么阶段,从实际出发,就是将两者结合起来。

好在,我们有一支很好的团队,尽管我们没钱,薪酬很低,只有华为、阿里、腾讯百度的1/5到1/10,核心团队曾被他们以两三百万年薪挖过,但二三十个核心人员一个都没走。因为,龙芯的目标是建立第三套生态体系,而不仅仅是办个企业上市,如果我是用赚钱激励大家,人早就走光了。

到2020年,龙芯最新研发的3A5000处理器通用处理性能逼近市场主流产品水平。与龙芯CPU配套的软件生态初步建成。龙芯承担的“十一五”核高基课题也在2020年完成验收。

远川 :是什么时候意识到激励机制的问题?如果没有物质激励,应该怎么办?

胡伟武 :一开始做CPU,从前端到后端,我是每个步骤从头做到尾的,有两次是7天7夜不睡觉,团队其他人都得去休息,就我在忙。后来开党员先进性教育会议,大家都提意见,很简单,你什么都做了,我们做什么?

什么意思呢?在计算所这样一个科研院所里,什么是利益?不是房子,不是钱,是容易出成果的项目给谁做?谁来承担?我认识到这一点后,2005年之后把项目主要让学生们来承担,让他们做项目负责人,觉得有平台、有空间,而不是我自己当项目负责人。2005年以来,我自己牵头承担的科研项目不超过5个,主要是甲方指定要我牵头的。

胡伟武与学生技术攻关

正因为团队军心比较稳定,即便工资很低,龙芯也最终挺过了最低潮的2010年到2015年,最后在市场中找到活路。

信息产业有个特点,叫大尾效应,除10%的企业占据90%的市场,还有90%的企业占据10%的市场,这些企业还能活。2006年开始,龙芯开始在涉及安全的工控领域如轨交、电力拓展,原来这些场景根本不敢用龙芯,全是国外的,在我们慢慢做完几个项目后,逐渐取得了业界的信任。

工控领域从硬件到软件都是垂直独立的,没有被生态垄断,各种CPU都能用一点,即便你的产品品质差一点,也可通过贴身服务弥补。从2013年到2015年,我们至少做了几百个“小烟囱”项目。

到2015年,龙芯营收过亿,由于团队很省钱,达到盈亏平衡。所以我说,龙芯做工控,是种了一个盐碱地,虽然不好种,但你认真做一定不饿肚子。工控市场种好了,也就成了龙芯的根据地,没人争,也没人争得过。

远川 :这里有一个问题,工控市场为什么这么散?

胡伟武 :工控原本不是一个平台化的领域。

举个例子,在工控场景,如果你的内存控制器不是自己做的,就不能把内存颗粒调通。那如果你买别人的IP来做呢,买谁的就找谁帮你调,而工控特点是很散,你总不能100个都要别人帮你调,供应商只会帮你调一次,但不会帮你调很多次。

同样的,工控场景的内核也是五花八门,不是通用的,这个核跑这个操作系统,那个核跑那个操作系统,如果不是自己研发的,你是不会调的。这就是为什么工控市场要从头开始建立能力,才能做得出来。

所以,芯片不是核心技术,里面的IP、内核等才是核心技术。买IP然后做出一个芯片来,一两年肯定够了。但是要做出ARM这样的CPU核或者像龙芯这样自己做CPU核,没有10年是不可能的。

这就是掌握自主研发这个枪杆子的好处。工控市场需要5~10年才能进去,进去之后需要保障10~20年的服务。时间这么长,那么,龙芯就死不了。有了这个底牌,我们才敢说,龙芯是一只不死的队伍。

而且,因为龙芯进入工控市场很早,现在有能力抓住工控平台化的机遇。

工控有一个经常用的实时操作系统,是风河公司的VxWorks,高铁也好,大飞机也好,控制都用它的,可靠性强。但风河没有图形显示系统,而飞机要飞得快,仪表显示要保证实时性,Windows做图形是很容易的,但保证不了实时性。龙芯凭借在这方面的努力,在积累了大量客户经验后,做出了全世界最好的实时操作系统的图形系统。

基于工控实时操作系统,龙芯有能力进一步将其平台化。正如安卓把打车、购物等许多本地服务app化,龙芯也照样可以把飞机、高铁、工厂等工控场景app化。

03 找到规律那个“鸡蛋”

题记:2015年后,龙芯在电子政务市场取得很大的进展,凭借在这一市场的爆发式增长,最终实现了在十三五期间收入和性能“双十倍”增长的成绩。2021年4月,龙芯发布自主指令系统架构,迈出了向信息产业生态“三分天下有其一”的关键一步。在这一阶段,龙芯展现出对于产业规律的深刻认知和运用。

远川 :工控市场后,龙芯也在关乎PC生态核心的浏览器引擎、虚拟机等取得了进展,这些领域国内基础很薄弱,龙芯为什么要做这些事情?

胡伟武 :最早搞MIPS的时候,MIPS社区没有PC端浏览器所需的JavaScript核心引擎,也没有服务器端的Java虚拟机,而龙芯用户需要这些,我们就得把它做起来,不会就学,然后就学会了。十几年积累下来,除了内核,龙芯也把最难的“两个三”都搞定了:

三个编译器,包括GCC、LLVM、GOLANG,

三个虚拟机,包括Java、JavaScript、.NET。

在这个基础上龙芯才能推出自主指令系统LoongArch。在此基础上,我们还要做“第三个三”,即从X86、ARM、MIPS三个指令系统到龙芯指令系统LoongArch的三个高效的二进制翻译器。

弄通这些根本的东西,使我们最终能够构建好的软件生态。

举个简单的例子,电子政务领域的电脑要接好多打印机,Linux操作系统的只能认50%,而龙芯有望做到100%。因为打印机厂家的驱动,可能只提供给微软,那怎么办?龙芯可以凭借自己的能力搞定,但其他厂商如果不掌握操作系统的核心能力,是比较困难的。

又如Windows里的photoshop软件,国产电脑要在教育领域推离不开这个,因为中小学都要用它来考试。Linux平台上没有,只有一个替代效果较差的美图类应用,而在龙芯上可以在不跑Windows的情况下直接跑photoshop。

未来在龙芯平台上不跑Windows,但是能跑Windows应用,也不跑安卓,但是能跑安卓应用。

当然,这些都是过渡性的,我们的最终目标,是建立自己的应用生态。当应用开发商发现,越来越多的人在龙芯上用他们的产品,他们自然会聚集到基于龙芯自主指令系统架构的平台上。因而,二进制翻译永远是向死而生的过渡性技术,不成功是死,成功了也是死,因为应用迁过来了就不用翻了。在历史上,IBM和苹果都用过这招。

远川 :龙芯的二进制翻译是否类似于苹果的Rosetta?

胡伟武 :对,当然我们会比苹果做得好,因为苹果是arm授权,不能加指令,而龙芯可以。

远川 :刚才问了为什么,现在还有一个问题,为什么龙芯能够做成这些事情?

胡伟武 我们的目标是很明确的,就赌一件事:中国的产业发展需要第三个生态体系。

龙芯为什么要推自己的指令系统架构?我经常打个比方,指令集就像语言,我们可以用英文写文章,但中国的民族文化不可能基于英文,而是必须构建在汉语基础上。用别人的语言打造自己的文化,是没有希望的。

如果是基于别人的架构,有三个因素阻挡着对于核心技术的吸收,可以总结为:

客户没有经济意愿,放着现成的东西不用,非要自己重新做,那样成本很高;

自己缺乏主观能动性,在没有经济支持下,绝大部分厂商没有动力深入核心;

没有后续试错机会,因为没人用,所以也就没有反馈。

如此,永远没有人想着要做一个自主的架构,当丫鬟的拿了一辈子钥匙,还是个丫鬟,她一辈子也不会自己要当小姐。

因为掌握着指令集架构的国际大厂做了很多工作,反而使得那些引进厂商丧失了跟踪满足用户需求的能力。但龙芯不同,我们有人用,自己动力很强,使用过程中发现问题就去改,三年五年,系统渐趋稳定,内力不断增长,有朝一日总能实现质的超越。我有充分的信心,自主研发CPU一定会体现为最好的性能、最低的成本、最好的生态。

龙芯2021年新款芯片3A5000,支持自主指令系统架构

当然,在构建第三个生态体系的过程中,龙芯也真是运气非常好,在我们很弱的时候有试错机会,稍强一点,再给我们找个对手练,练完一个对手后,再来一个更强一点的,国内对手练三轮,龙芯就可以走向开放市场了。

远川 :刚才我们说了很多国外厂商,我们信息产业之前走弯路,是不是因为对于他们的成败,其实认识是不够深刻的?

胡伟武 :对,你说的很对。我们来简单比较一下现在居于统治地位的Wintel和AA体系,也研究一下英特尔和谷歌的模式。

首先来看英特尔,估计很少有人意识到,微软的一个操作系统,不管谁的主板都能装,那么多接口插上去都能认,甚至10年前的Windows今天还能装。这是因为,英特尔虽然打的inside,但其实outside做的很厉害。然后我们看谷歌,安卓系统其实基于开源的Linux开发,Linux一升级,原来的应用就不能用了,安卓不管怎么升级,老APP都能跑。

英特尔和谷歌的共通之处,是他们学会了怎么把生态系统管起来。而且英特尔的功力更胜一筹,安卓系统放到不同硬件设备上是不兼容的,但是英特尔可以做到主板级兼容,这个技术套路很深,需要研究很长时间才能弄通。

再放大到整个产业观察,我们会发现,总体而言,电脑是芯片赚钱、整机不赚钱,手机是芯片不赚钱、整机赚钱。如果手机芯片公司掌握着安卓,会是一个完全不同的格局。在产业现象的背后,就是规律,我们要找到那个规律,并且照其办事。只要按照规律来练,谁都不怕。

远川 :感觉按照规律来办事,的确是挺困难的。

胡伟武 :是的。任何现象背后都有规律,你要找到规律照着做才会赢。很多人受主观意愿牵制,但实际上违背规律。有人说,在风口上猪都会飞起来,大家听到这句话热血沸腾,但有没有想过,风停了,所有的猪都会摔死。

借用一句话,温度可以把鸡蛋变成小鸡,但是温度不能把石头变成小鸡,风就是温度,我们要找的是鸡蛋,而不是温度,这是最基本的东西。如果找不到,再好的概念都赔钱。

具体到龙芯的实践中,我们日常会做三件事:在研发实践中找到规律,上升为标准和流程;在管理实践中找到规律,上升为管理制度;在市场实践中找到规律,上升为商业模式。找到之后,在实践中反复运用,持续改进,螺旋上升。

但归根结底,龙芯要设立一个高于赚钱的目标,我们越是坚持为人民做龙芯,利润越会滚滚而来。我们越是坚持赚钱,利润就会离我们远去,这是辩证法的哲学。

远川 :龙芯的核心价值在哪?

胡伟武 :长期的积累。为什么是这个?也是一个比喻,这样你会很快搞清楚我们跟别人的区别。1000个人做一年,和100个人做10年,都是1000个人年,但工作效果会有天壤之别。

其中的差别,就是长期坚持的价值。龙芯的价值,就在于已经有20年了,任何人都比不过这个积累。并不是人人都可以体会这个优势。

04 龙芯和远川之间的思考题

在两个小时的长谈中,胡伟武提到了一个产业现象:

就行业总体而言,电脑是芯片赚钱、整机不赚钱,手机是芯片不赚钱、整机赚钱。

这种现象背后必然有深刻的产业规律,抓住这个现象背后的规律,国产CPU也就能学会如何在残酷的市场竞争中迎接竞争并打下胜仗。

这个规律他并没有直接讲出来,而是让我们去思考。现在,我们把这个问题交给读者朋友们,背后的规律是什么?欢迎留言区回复。


电话咨询
产品中心
解决方案
关于我们