If interested, please send a message to:Telegram Me
【文/观察者网专栏作者 潘攻愚】
2015年3月19日,美国司法部在官方网站上发布了一则新闻稿:“旧金山一男子及其公司因向俄罗斯走私精密电子元件而被起诉。”
经查,已经入籍美国的俄罗斯裔Pavel Flider因通过第三方走私“受控的两用可编程计算机芯片”,涉案金额高达6000万美元而被旧金山联邦大陪审团起诉。
彼时,恰好是俄罗斯从乌克兰手中夺回克里米亚一周年。
以事后之见来看,克里米亚事件为七年后俄乌爆发全面军事冲突埋下了伏笔。可以说,Pavel Flider为俄罗斯储备了一批价值不菲的军用物资。
他所走私的6000万物品中,主要的品类是可编程计算机芯片即FPGA,号称“万能芯片”。在今天的俄乌战场上,FPGA甚至一度成为“战争芯片概念股”的主角。
根据好事者对战场遗址打扫和武器拆解,今年7月,在基辅 Okhmatdit,俄罗斯Kh-101火箭的导航系统使用了Xilinx(赛灵思)的FPGA芯片;类似但更先进的FPGA也出现在“柳叶刀”无人机中。俄罗斯Iskander和Calibre-PL巡航导弹的导航中大量使用全球两大FPGA巨头Xilinx和Altera的产品。
从柳叶刀无人机上拆卸下来的Xilinx的FPGA
对俄罗斯抱有敌意的媒体Insider报道,号称俄高科技工业心脏的米克朗Mikron Group其产品型号中只有两种FPGA型号,不得不高度依赖进口。
在以美国为首的西方对俄罗斯半导体全面断供的情况下,俄方通过中亚等第三方中转站和之前的库存依然可以维持战争所需的“工业粮食”的周转。从2022年到2024年,即战争开始后的两年里,Xilinx和Altera流向俄罗斯的FPGA总价至少分别为2.16亿美元和1.2亿美元。
俄罗斯“特种技术中心”公司发布的FPGA工程师招聘信息
战争形态可以检验一国关键物资储备的生产力和动员力。战场上厮杀后的余烬往往埋藏着胜负手的解码器。AI大潮汹涌澎湃之下,看似处境有些尴尬的FPGA以战立身,在某种层面上可以迫使业界重新思考CPU、GPU、FPGA\ASIC这些高算力芯片在各类型产品价值链中的地位,以及探讨如何进一步优化军工半导体生态,提升相关供应链的健康度。
FPGA的坐标系:非中心,但也绝非边缘
何谓FPGA?Field Programmable Gate Array,即现场可编程门阵列。现场和可编程是其称谓的两个关键词。
先说可编程。通过非门、与非门、或非门的有序堆叠,FPGA可实现任意功能的数字电路,所有组合电路都有对应的真值表,FPGA的可编程逻辑块中的LUT(查找表,Look Up Table),可以完成任意组合电路的功能。
再说“现场”。FPGA底层逻辑运算单元的连线及逻辑布局没有固化,这可以使得客户在拿到芯片后,通过本地或者远程配置的现场实现自己符合需要的功能。
FPGA于1985年由Xilinx创始人Ross Freeman发明,至今约有40年历史。FPGA和CPU、GPU同属于大型数字芯片序列。
这里请注意,FPGA的可编程特性是特指它的硬件可编程,这是其区别于CPU和GPU的显著特性。
通过对FPGA原理架构的拆解我们可得知,只需要改变FPGA中LUT的掩码,FPGA就可以承载另一个电路的功能,而且能无限次的修改。FPGA内部往往由数十万个可编程逻辑块可以同时独立工作,有效解决时钟频率高低起伏的问题,特别适合大型并行计算的场景。
我们可以用数学上著名的戴德金数来看看FPGA的威力。
在普通笔记本电脑上计算第八个戴德金数需要八分钟,但计算第九个则需要数十万年。帕德博恩大学的计算机科学博士生Lenart Van Hirtum在FPGA超级计算机的帮助下,这个问题在五个月内就得到了解决。
从架构上看,FPGA相比CPU和GPU,在某些领域的应用有着无可比拟的优势。
CPU的一项重大任务就是负责任务调度,在处理多线程任务时,不可避免地出现任务越多算的越慢的现象,所以任务率越高时延越长,而FPGA由于在布局布线阶段不需要重排执行顺序和指令调度,其处理时延和利用率大小基本是无关的,因此,FPGA非常适合低时延、需要现场可编程的场景。
生成式AI带火了GPU,让英伟达这个卖铲人市值一路水涨船高。业界普遍认为,更适合并行计算的GPU在AI训练和推理方面的负载难以被替代,取代了CPU,坐上了通用高算力处理类型芯片的头把交椅。但是任凭英伟达CEO黄仁勋无论怎样变换话术兜售GPU“买的越多越省钱,买的越多越节能”,GPU的功耗依然是个大问题,因其无法很好地利用片上内存,需要频繁读取片外的DRAM。
被GPU吹上产业风口的HBM(高带宽内存)恰恰说明了GPU需要HBM这样一个需要被封装在一起的“外挂”。而FPGA整个算法无需存储外挂,整个算法可以在片上完成,特别适用于小样本推理和边缘计算。
问题来了,既然FPGA相较CPU和GPU都有相当鲜明的优点,为何在PC时代和移动通信时代都没能成为处理器的主角?
从市场规模角度也能看出端倪。2022年FPGA全球市场规模区区80多亿美元,中国区市场不到210亿人民币。FPGA的产品特性决定了它无法完成像CPU那样的更通用性的调度安排处理功能,也无法像GPU那样做到大规模并行计算和AI训练。
而且,FPGA的地盘正在越来越受到ASIC——特定用途集成电路的侵蚀。和CPU、GPU、FPGA相比,ASIC的通用性和灵活性最差,但主打一个专精、高效和低功耗。
诚然,FPGA因为“现场”可用,相比ASIC,FPGA无需等待三个月至一年的流片周期,上市时间短,对于消费电子这类竞争激烈、迭代迅速的行业尤其重要。但ASIC更符合AI时代这种scale law的大力出奇迹模式,因此在技术非常成熟且利润率非常低的产品是杀手般的存在,只要保证设计上的技术成熟,就可以抵消一次性量产带来的流片昂贵(ASIC因其硬件不可编程,流片失败意味着一批产品都要废掉)的问题,可以大规模上量,有着更低的功耗,更丰富的封装选择和更优的TCO(芯片设计、制造总成本)性价比。
从现实市场层面上也可以看到FPGA的命运之坎坷。
2015年,英特尔以167亿美元收购当时的FPGA领域龙头企业Altera,随后形成了现在的PSG部门。2022年,AMD宣布以全股份交易的方式,完成对最大FPGA厂商Xilinx的收购,按当时双方股票价格,交易金额达到350亿美元。
今年FPGA再次成为媒体热议的焦点,一大原因是因为英特尔决定拆分PSG部门,让Altera重新单飞上市。当年在FPGA市场呼风唤雨的Altera被CPU大佬呼来唤去,聚而终散,根本原因在于当年的“CPU+FPGA”异构整合计算的野望无法达成预期,在数据中心和云计算方面未能发挥强强联手的优势,最终以英伟达GPU大获全胜收场。
此外,由于Altera在紧跟摩尔定律方面裹足不前,10nm工艺以下平台被Xilinx稳稳碾压,五年来市场份额从超过40%掉到了24%左右。
即便如此,AMD收购Xilinx虽然整合程度高于英特尔,也未达到当年在数据中心市场上的全面预期。大局形势所迫,Xilinx目前已经不是一个纯FPGA公司,还提供很多板级服务,尤其是高集成的SoC产品以进一步增强客户黏性。
从整体市场前景上看,我们也必须认识到,在AI产业炸裂的时代,FPGA依然无法“挑班”运营,反而让ASIC乘势迅速崛起。
目前半导体行业形成了一个基本的共识,未来芯片设计将更加专业化,专用芯片ASIC会得到更广泛的部署与应用,目前对英伟达GPGPU通用计算平台挑战最大的就来自LPU/TPU,一个典型的例子就是谷歌的TPUv4集群已经广泛进入到超算行业,并且让苹果的AI项目抛弃了英伟达高端AI加速器而选择了谷歌TPU。
作为一种ASIC的TPU,没有不必要的逻辑和路由开销,逻辑控制单元更小、更容易设计,只占整体芯片面积的2%,给片上存储器留下了更多的空间。
总之,FPGA虽然在各个时代的风口都无法站在的舞台的最中央,但它却像一个可隐可现的,内力十足的江湖豪侠守住自己的一亩三分地。可现场重构、灵活性、快速迭代、低延时,以及适合某单一应用场景的小批量生产,等等均是它的杀手锏,这也是其战略地位的最佳表达。
FPGA的绝招:军工市场与低延迟通信
FPGA虽然在AI算力领域只占据小份额的端侧推理市场,跟在GPU后面“喝汤”,但在低轨通信和太空竞赛中,它是绝对的王者。
以航空航天为代表的军工品类只占到全球FPGA 80亿美元整体市场的不到15%,却能以小见大,是大国重器不可或缺的硬件底座。
马斯克手下的全球最大的商业卫星运营商SpaceX屡屡成为媒体头条,除了主打卫星通信的星链计划之外,该项目还承担火星殖民的远景任务,已经成为代表科技创新之美国梦的偶像级项目。如果我们打开SpaceX官方网站,再点击其招募条块,就会发现SpaceX正在大量招聘FPGA工程师(如下图)。
FPGA动态可重构的特点可以防止逻辑可编程模块被宇宙射线造成物理损坏,而且航空航天的小批量多品种且需要不俗算力(宽带卫星通信处理数据的能力)也让FPGA可以大显身手。而且,航空航天所需的导航、通信芯片是一个长尾市场,客观上为FPGA建立了一个避免ASIC骚扰的护城河。
回到本文开头。Xilinx和Altera近两年在俄罗斯出货不过区区3亿多美元,但其承担的有效打击敌人,减少自身消耗的战略价值却是难以估算的。从Xilinx的Zynq UltraScale系列加持下相控阵雷达的波束指向,到保证导弹精确打击的云台控制,再到卫星上观测停靠在地面上的中型飞机等,均会大量用到FPGA品类。
在更加敏感的军民两用领域,FPGA也有广阔的施展空间。FPGA可以用于ADAS的传感器融合领域以及激光雷达信号处理主芯片,还能配合SoC完成座舱域信号桥接,以及车身的电机控制。目前我国领先的激光雷达厂商如速腾聚创、禾赛等均采用了Xilinx的Zynq FPGA系列。
2018年10月,华为联手Xilinx宣布开发中国第一款云端高效率视讯编码(HVEC)解决方案。
此外,在5G基站中,FPGA可以在杆上的射频单元中负责无线信号的波束赋形工作。多年前,诺基亚面对华为和中兴在5G基站中的不断扩大的领先优势,冒险采用了FPGA作为处理器进入核心网序列,就是看中了FPGA上市快,可以先占点踩位的优势。不过后来被华为的ASIC解决方案打的溃不成军,主要是管理和产品用户定位出了问题,那是后话了。
如何看待FPGA战略与市场地位的不对称性
目前,半导体行业与全球地缘政治的变化的锚定度越来越强,自主可控的呼声和国产替代焦虑并存。
全球80多亿美元的FPGA的大盘,中国仅占五分之一左右,而且高端FPGA,即12nm以下工艺制程至少落后Xilinx两个代差,虽然近年来涌现出了复旦微电、安路科技、紫光系等有相当市场竞争力的FPGA企业,在军工、电子消费和通信市场各自逐渐划定了势力范围,但90%的份额仍被Xilinx、Altera、Lattice和Microchip四大海外巨头把持。
发力赶超,步步逼近,“x道超车”等等媒体经常渲染的芯片市场竞争话术也许放在FPGA这里并不太合适。考虑到FPGA所能带来的关涉国防安全和重大战略利益的高附加值,以及有限的市场成长性,战略选择和差异化竞争也许比盲目的工艺节点赶超更重要。
须知,FPGA因其布局布线只能在对应的FPGA厂商自己的EDA中完成,越是大型的设计,重新走一遍布局布线的沉没成本就越高,而布局布线恰恰是FPGA软件最核心的领域,FPGA可以当ASIC的原型验证工具使用,其客户粘性特别高。
Xilinx、Altera几十年来通过不断的产品迭代,辅以料号的铺散吞食了一些散沙化的市场。FPGA和CPU一样,工艺节点就代表市场份额占有能力,海外巨头纷纷往12nm以下进发之时,国内领头的复旦微电、安路科技等SoC FPGA大多还停留在28nm这一“甜蜜节点”上,与其和其争夺存量客户,不如另辟蹊径寻找自身发展新动能。
笔者对国内FPGA生态建设有以下建议。
首先,加强与国内高校的合作,进一步打通产学研结合。半导体各个品类中,FPGA在产-学融合上并非是务虚之辞,有着相当强的话语权。海外两大巨头Xilinx和Altera通常与学界紧密合作,诸如多伦多大学等科研院所为FPGA的架构演进和算法迭代做了非常重要的贡献,毕竟,布局布线是集成电路学院人才培养的基本功;
第二,模拟战争的沙盘推演,盘点FPGA品类的自主可控性。航空航天和相控阵雷达、红外设备等制程多在55nm-90nm左右,看重其低延迟、可靠性,可以通过国家队投资平台牵头孵化战时FPGA项目;
第三,在某些极端状态下,必要时可以通过类似“平准基金”的方式调控FPGA市场价格。2021年“缺芯潮”肆虐之时,我们看到Xilinx携手Altera涨价好几倍,店大欺客,进一步挤压了国产FPGA市场上的议价空间;
第四,FPGA+EDA+IP协同作战。目前FPGA厂商的竞争主线从逻辑编程的门级数转向集成度竞争,先后将DDR接口、CPU、GPU等许多功能嵌入到FPGA中,出现了所谓的FPGA“SoC”化的特性,叠加FPGA本身带来的EDA属性,因此FPGA厂商需要接口IP厂和EDA厂商协同发展,以泛发展联盟的姿态对接上下游发展需求,以牛芯半导体为例,该公司研发的高速Serdes IP和DDR IP就是专门对应FPGA的IP产品,市场反馈良好。
总之,FPGA不仅是芯片前端设计(布局布线)的硬通货,还是战时状态下国家利益保障的必需品,它的高价值性不应被碎片化的、小批量生产的终端应用所稀释,需要产业界携手摒弃以量取胜,以规模平摊成本盈利的思维模式,重新评定其战略地位,在风起于青萍之末,浪成于微澜之间的微妙关节点上做好不时之需。