本文引语:十二年雪满天山路,国产CPU正如在天险之路上踽踽独行的骆驼,谁能走到最后?
我现在还记得一个日子。
2020年12月29日,这一个多灾多难年份的倒数第三天,中国的北方迎来了三十年来最冷的冬天。在天津滨海的于家堡洲际酒店,八级大风刮过门口,人群鱼贯而入,本来排好的队形,立马往里缩了半截。出租车司机说着一口地道的天津相声,心情格外阳光:
国产CPU公司飞腾在今天举办生态大会,各路人马集齐了,一天的打车费可以多赚几百上千了。
发生在滨海的飞腾生态大会,是国产CPU近年发展状态的一个缩影。宏观环境愈是冷冽,国产CPU愈是烈火烹油,蒸蒸日上。
游走在展会的各个公司间,你肯定能感受到市场的这种热烈。
做电脑服务器整机的航天部某所市场人员说,年底了公司很忙,这么大的展位只有他一个人,长城与他们的竞争激烈,互相勘察样机,彼此知根知底,斜对角展位的联想公司可就尴尬了,他们没有进入“央采”的名单,不被信任,到展会来纯粹是打酱油的。
说起打酱油,做安防摄像头的大华算不算?还真不算。
展位工作人员说,大华上了美国的黑名单了,开始做电脑服务器的整机了,突出优势是视频监控。大华这种自带工厂buff的做起整机来,轻车熟路,快速上马。
更令人震惊的是国产操作系统。一位小哥讲到,国产操作系统现在已经有三十多家,领头的某麒麟系统人数从几百人增加到了几千人,足足有20倍的扩张!
而这多出来的几千号人员,主要是做软件适配的,用他们的话来说:软件适配工作两三年都做不完!考虑到360给两个软件搭建了100人的研发团队做国产化适配,这个规模和时间算不上稀奇。
国产CPU搞得好不好,就是看两条:一个是整机厂的生产意愿,一个是软件适配的积极性。没人搞生产,没人搞适配,国产CPU就是一个光杆司令。
光是看着飞腾CPU生态大会现场,我们便可以知道,国产CPU的确是搞起来了。展会上的整机、操作系统、软件、云服务和运维等厂商一条龙摆起来,撑起了滨海价值400亿的产业。
飞腾对外公布的数据也的确证明了国产CPU的火爆:2020年交付150万片,相比于2019年的20万片足足增长了6.5倍;营收从去年的2.1亿,增加到了13亿;约80%的出货,来自于政务市场。2021年,飞腾的收入突破20亿元大关,增速惊人!
除了飞腾,龙芯也赶在2020年的尾巴,在北京证监局官网公布了自己即将登陆科创板的消息:中信证券已对龙芯展开上市辅导。
一年半后的2022年6月底,龙芯成功上市,成为国产CPU第一股。这个上市速度,可以说很快了。
放到十年前,国产CPU还是一个遥远的神话。围绕国产CPU的争论在知乎上讨论激烈。汉芯事件在众多旁观者中的印象实在过于深刻,以至于“骗补”的标签打在身上难以逃脱。国产CPU瞄准英特尔的星辰大海,被当成大放厥词。
从十年前的被唱空、被揶揄到突然崛起,这十年间,国产CPU究竟发生了什么?
2010年的冬天,已成为龙芯公司董事长的胡伟武,遭遇了他职业生涯历史上的最大挫折:做了九年CPU,流了好几次片,最新回来的龙芯3B1000芯片,却连操作系统都启动不了。
龙芯3B1000采用65nm工艺,核又多、浮点峰值性能又高,放到全球学术界都是领先的。更为重要的是,这是十一五期间“核高基”支持的芯片项目。
国家正在展开国产CPU和操作系统的实际应用,主管部门催得紧,大家都很着急,龙芯流片完一上来测试却崩了,这怎么好?
之后,龙芯选定32nm工艺继续推进这款八核芯片项目。但芯片回来后却又是无尽的烦恼,把芯片装到实际环境后,问题像打地鼠一样层出不穷。
在实际应用密集攻关的2013年,龙芯的表现堪称是灾难级别的,上级部门和使用部门被磨得失去了信心。
同年爆发的斯诺登事件令环球皆惊,高层对于提高国家安保的需求更为急切。眼看走自主路线的国产CPU无望,拿来主义的路线被顺势提起,AMD、威盛等英特尔的昔日对手纷纷赴华,与中国的合作伙伴成立了海光、兆芯。龙芯被抛在了一旁,陷入了尴尬的境地。
龙芯之所以被打入冷宫,基于一个显而易见的原因。
2006年的时候,龙芯2E的单核性能与主流x86 CPU还只差一两倍,到了2013年,龙芯CPU的单核性能只提高了50%,而同期的x86 CPU则提高了五倍,算下来,龙芯与x86 CPU的差距被拉到了约十倍。
七年时间,虽然龙芯把核的数量搞的多多的,但单核不能打,基本满足不了实用需求。
2010到2013这三年,是走自主路线的国产CPU的滑铁卢。引进派与自主派交战激烈,走x86路线的引进派强烈要求把龙芯换下,在一些场景,龙芯被下马。痛定思痛,胡伟武总结了两大失误:
其一,龙芯前期搞研发,胡伟武作为总负责人从头盯到尾,项目组“人盯人”,仿佛一个紧密团结的小作坊,拧成一根很紧的麻花。
但公司化后,胡伟武忙于公司事务,无暇他顾,没有建立起“工业化”的严密流程,龙芯出了很多简单的问题,而这些简单的问题交缠到一起,便织成了一个难解的蜘蛛网。
其二,龙芯3B在开头的产品定义就错了,不是兄弟们不给力,而是被国际学术界给带弯了。
龙芯虽然已在2010年转为公司制运营,但一开始难以摆脱学院派的气质,急于追上多核CPU和浮点峰值性能的国际学术界热点,核数做的比国外同行还多。但一路狂飙下来,却发现英特尔等x86玩家不凑这个热闹,一心一意搞高单核。
沿着学术界划定的弯道,龙芯走到了一条CPU的死胡同:练就了两块很长的板子,但其他板子都短的很,一把水倒进去,都漏了。
一团乱麻应做何解?摆在胡伟武面前的两个问题都很严峻。一款CPU从设计到流片也就两年时间。如果两年内无法挽回战局,等待龙芯的,是十年努力的付诸东流。
为了解决龙芯面对的两大难题,胡伟武采取了三个举措:建立管理制度、纠偏研发路线、从低端市场颠覆做起。
首先,是工业化流程体系的建立。龙芯之所以频繁出现低级的流片问题,正是从科研产品原型量产落地的过程中出现了很大偏差,没有用制度取代“人治”。
研发制度的建立,一为分工,二为激励。
在分工上,胡伟武着手建立了“五步法”,确立了从立项、方案、签核、测试到结项的研制全流程,并详细规定了每个阶段的研发与审核内容,此后,效率大为提高,并且龙芯的流片再无出现严重的质量问题。
在激励上,龙芯在事业部和销售部建立与市场效益挂钩的绩效体系,两部门由此开始被引导关注,怎么服务好才能增收、研发成本如何分摊、立项是否应再多考量等诸多关切自身利益的问题。
分工明确,激励有规则可循,CPU的研发便不会陷入无序的盲乱状态。
制度捋清楚了,接下来是研发路线纠偏。CPU研发之所以出了问题,就在一开始的产品定义出了方向性错误,也就是没有搞清楚客户想要什么,应该怎么定义未来产品的形态,规划将来的工作。这种大的错误一旦犯下,便有可能导致随后两三年、乃至三五年的挫折。
2012年,龙芯意识到最大的问题不在于核不够多,而在于单核里面的微结构没吃精吃透。微结构没吃透,相当于CPU研发搞了一堆花架子,形似而神不似,遇上内力深厚的国际巨头,自然被打的满地找牙。
2013年,龙芯暂停了16核的流片,转向做精四核3A2000,大刀阔斧的完善微结构,并学习英特尔,设立了两条根本原则:引脚兼容、软件兼容。如此,老龙芯用户拿到新款芯片,便可换下直接用。
对于龙芯来说,研发路线不仅包括了最底层的芯片。
因为MIPS架构与主流计算机体系绝缘,龙芯研发的芯片仿佛一片荒原,如果龙芯自己不去做生态,芯片平台上只能生长出几根草木,这对于使用者来说是绝对不友好的。所以,龙芯的研发路线,必然天生包括了系统、中间件到最上层的应用。
在夯实完最底层的芯片后,龙芯的研发顺流而下,逐次围绕三个方面展开:
在系统层面,龙芯规定好从CPU、BIOS到操作系统的技术规范,统一系统架构,方便打印机、扫描仪等外设IO设备接入。
这样一来,在操作系统、软件应用商做适配的时候,一来按图索骥顾好自己的就好,二来不会出现一个问题找半天源头、却找发现是更底层的情况。
在中间件层面,龙芯抓住操作系统与软件应用的薄弱环节,API接口。以往,国内适应了微软和安卓建立起来的操作系统生态,中间件一般是遵循“拿来主义”,基本没有成建制的研发队伍。
但是,API对于在一个操作系统上面开发软件的应用商来说,便如搭乐高需要的积木颗粒。龙芯选择了一些最为关键的API接口加以构建,造好了一些关键的积木颗粒,操作系统不需要自己费力再行研发,软件开发商也可拿来即用,最后皆大欢喜。
在应用层面,针对目标市场,龙芯重点深入优化了浏览器、办公软件、版式文件等应用。
总之,龙芯对苹果公司有样学样。苹果为了建立一个封闭顺畅运行的系统,遵循一个原则:对整个系统进行深入分析,一个个应用挨着深化,一个个特征优化,一个个像素优化。而龙芯,也正是这样做的。
里三层,外三层,龙芯在研发路线上的纠偏最终取得了成效。龙芯放到实际中应用,总算极少出现要溯源到CPU等底层的问题。同时,经过芯片、系统、中间件和应用四层的紧密优化,龙芯建立了一个集约型的优化系统。
龙芯体系相比于x86 CPU体系,犹如乞丐之于龙王,但是作为一个独立于x86的体系,龙芯可以在各个层面消除冗余、提高效率。2016年中,在一次办公应用研讨会上,基于龙芯得到了“基本好用/好用”的认可。
研发路线完成拨乱反正,最后一个重要问题就是市场路线。
早在零几年的时候,一位承接了北斗项目的中科院同仁来找胡伟武,请求龙芯帮忙做嵌入式CPU。刚开始胡伟武还看不上,最后还是勉强答应了。
但实践证明,在龙芯为桌面和服务器CPU研发忙的手忙脚乱的时候,正是那些看起来低端的嵌入式CPU养活了龙芯。
嵌入式CPU有两个特点,一是软件单一省劲,恰好避开了龙芯市场化初期软件生态荒芜的软肋;二是进入门槛高,北斗等嵌入式CPU应用环境严苛,不是极寒高温,就是压力山大,认证周期长,更换供应商困难。
如此,嵌入式CPU在龙芯最艰难的几年,为其提供了稳定的现金流。
这也启发了胡伟武对于市场路线“三步走”的思考:先是单一软件应用的嵌入式CPU,然后是固定软件应用的政务桌面和服务器CPU,最后是复杂软件生态的商用CPU。
管理制度初步成型,产品研发面向市场定义,从嵌入式CPU逐级而上,龙芯逐渐渡过死亡之谷。
国产CPU最大的市场景气周期即将来临,在下一轮激战,最大赢家是谁呢?
从2013年开始,对于国产CPU,胡伟武提出了两个原则:
一,政策划定下的黑暗森林竞争。在通用CPU的黑暗森林里,政府围一个篱笆墙建一个小森林,把国外芯片挡在外面。进入篱笆墙内的公司,应该严格界定为真正自主可控的国产CPU。
小森林的环境内,各国产CPU遵循市场竞争法则,谁最后胜出了,那便踏着失败者的尸体走出这堵篱笆墙,然后与黑暗森林中的国外CPU展开竞争;
二,市场经济条件下的举国体制。这个机制包括了三个原则:首先是政府引导,在特定市场应用的牵引下形成一套产业链;其次是在政府组织下,通过性能评测、小批量供应、价格等市场手段优胜劣汰,而不再是以往那样通过传统的专家评审机制选择供应商;最后是央企发挥引领作用。
胡伟武提出的国产CPU的两大原则,几乎完全契合了日后市场的走向。
按照胡伟武在《龙芯的足迹》中的分类,真正完全意义上的自主可控的国产CPU,要么有自己的微结构,要么能基于别人的微结构改进提升,完成从模仿到自主设计的跨越。
如果遵循胡伟武的定义,龙芯和申威是当然符合的,两者分别享有对MIPS和Alpha指令集架构的所有权和自主权。
走x86架构的引进派,胡伟武称之为“O”派,也就是ODM路线。他认为,即便拿到国外CPU的源代码,每一行都看得明白,但把几百万行代码拼在一起就不知道在干什么,就像打开一头猪的大脑,却不知道在想什么。
走ARM架构的国产CPU,胡伟武称之为“攒”派。他认为,购买ARM内核与架构、GPU核以及各种接口IP,然后通过一定的设计流程搞出一个CPU,这个过程不涉及微结构的自主设计,无法形成能力,无法保证安全可控。
但是,这个标准明显过高了,三星和高通两大厂在历史上试图推出自己的微结构,但都不是很成功,三星最终砍掉了研发团队,高通的微结构则饱受诟病,被外界认为不如ARM自己设计的好。
就实际效果来看,三派路线各有千秋。
最为自主可控的龙芯,在某种程度上相当于中科院版本的申威,本质上,龙芯的崛起,是对于中科院在六七十年代军队计算机系统地位的一种恢复。
走x86架构的引进派,原本为救时之选,但时间愈长,愈是尴尬。引进的费用一般几十亿打底,但在此基础上重新设计出堪用的CPU,还需两三年时间,正好在这个当口,原有的自主团队已经推出了有竞争力的方案。
在自主可控含义愈加收窄的时况下,引进派路线在政务市场的开拓面临不利局面,如此,投入产出比堪忧,经济性越来越差。
而走ARM架构的飞腾和华为,获益非浅。
中兴事件后,来自官方的订单雪片一样飞往国产CPU各厂商手中,“爆单”成了最近几年的常态。
在政策性市场的压力下,采用ARM架构的国产CPU展现出了自主、生态与市场的双重弹性:一方面研发足够深入,另一方面自带ARM生态威力,别人吭哧吭哧几年才能实现的软件应用生态,ARM架构芯片是自带手机生态的几百万应用的。
而且,无论是华为还是飞腾,都享有很大的市场号召力。
华为研发ARM芯片已久,轻车熟路,久在ICT行业浸淫,政商网络强大;飞腾属中电旗下,这一电子工业体系历史悠久的巨无霸国企建立了“PK”体系,飞腾CPU和麒麟操作系统在天津滨海的办公地同在一个园区,两家公司配合紧密,甚至在一个食堂吃饭,再加上中电在中央政府采购市场的影响力,飞腾的市场优势十分明显。
由是,从2018年到现在的国产CPU市场,其实已经发生了巨大的结构性变化。
以龙芯为代表的全自主路线补足短板,市场的基本盘稳固,进而稳扎稳打;以飞腾为代表的ARM路线增长迅猛,充分受益于政府采购市场的爆发式增长。
x86路线,则要坎坷很多。近期,据财新报道,海光系几家企业不但被列入“实体清单”,而且属于28家额外受制于“外国直接产品”规则限制的企业。这一限制,已与华为受到的制裁类似,所有获得美国产品和特定外国产品都受到美国的出口管制限制。
国产CPU行业已经进入了一个扩军备战的阶段,软件适配成为工作的重中之重。龙芯联合数十家IT厂商,建立了一个适配联盟;飞腾近年扩张了近一倍的人马,新增的人员主要用于建设生态。
接下来,摆在国产CPU面前的有两大任务:
1. 建立全国产化的产线。早在2014年,胡伟武提出,应建设一条配备完整IP库和设计平台的8寸和12寸线,分别用于130nm和40nm。
出于防范风险的需要,胡伟武的这一建议无疑是先见之明。
2. 准备好进入商用市场。胡伟武曾说,龙芯在2019年的一个工作重点,是在2-3年政策性市场消失后,龙芯准备好成为有市场竞争力的货架产品。
在京东上,已经可以搜到龙芯、飞腾等装配国产CPU的电脑产品,在不远的将来,可以预见商用市场会有更多动静。
国产CPU的过去十年,是凤凰涅槃的十年,这十年很痛苦,也隐身于大众认知之外。
像CPU这样一个复杂系统的重建,起码需要三十年的时间,正是在骂声一片的头十年里,国产CPU终于痛定思痛,在第二个十年重新建立了一个完整的工业体系。
这个建立过程有很多问题是十分复杂的,包括从科研团队到公司的转轨,从专家评审到政府采购的市场化,等等。
国产CPU的历史进程远远不是一个技术追赶的问题,而是当技术追赶、科研体制转轨和政策性市场发展交杂在一起的时候,问题像蜘蛛网的丝一样交杂彼此勾连,难解难分。
当我们清楚了国产CPU重建是有多困难之后,或许会懂得马斯克曾经说过的一句话:技术不一定会自动进步,它需要有很多人不断努力。
与国产CPU类似,曾经跨过世界屋脊的国产运十大飞机在1986年被拆解,31年后,尚未全国产化的新一代C919大飞机才重新首飞。
在一个新时代的开端,形势显然在以肉眼可见的速度恶化,拜登在中期选举之前的日子里疯狂发禁令,国产CPU所面临的机遇,显然比挑战要多得多。