AI芯片制胜的关键因素是什么?
2021/2/23 09:40   商业数据派      关键字:AI 芯片 制胜 关键 因素      浏览量:
百度市值又一次站上了千亿美金。从400亿~1000亿美金,不过半年时间,这个拥有Apollo 、智能云、芯片等一系列业务的百度,终于摆脱了“水泥股”的10倍PE,让很多人再次谈起了“百度的时代”。
  百度市值又一次站上了千亿美金。从400亿~1000亿美金,不过半年时间,这个拥有Apollo 、智能云、芯片等一系列业务的百度,终于摆脱了“水泥股”的10倍PE,让很多人再次谈起了“百度的时代”。
  就在刚刚,据CNBC报道,百度正在为成立一个独立的AI芯片企业筹集资金。在我们看来,百度造芯背后,是国产自研AI芯片在2021年迎来一个关键节点:量产出货上到第一个台阶。
  造芯热几乎与人工智能的爆发处于同一个阶段,第一个吃螃蟹的是谷歌——2015年就推出自家AI芯片TPU,为优化自身的TensorFlow机器学习框架而打造,大名鼎鼎地AlphaGo系统便依托于此。
  人工智能的这一轮爆发是深度学习算法的兴起,而深度学习的基础就是需要更多的数据训练、更高的算力支撑。当传统芯片逐渐无法满足互联网爆发的算力需求时,拥有先进算法和强大计算能力的互联网公司成为了芯片自研的推动者,国内外企业几乎步调一致地各自开启了这一篇章。
  在海外,除了谷歌,亚马逊不仅在2018年推出自研AI芯片Inferentia,来挑战英伟达,还推出自研CPU芯片Graviton,目标直指英特尔。
  而在中国,除了算力需求的爆发,还增加了中美技术摩擦让芯片国产化速度加剧的因素,以及随着5G普及、人工智能应用场景逐渐落地,让科技公司有了更强的商业动力。
  阿里巴巴自研芯片含光800AI芯片发布于2019年9月,1颗含光800的算力相当于10颗GPU。淘宝拍立淘上地商品识别功能,借由含光800能将普通GPU花1小时完成的事在短短5分钟时间做到。华为同样在2019年公布了自研CPU芯片鲲鹏和AI芯片昇腾910,同时挑战英特尔和英伟达两个重量级对手。
  以上等等,让国产AI芯片处于一个百年不遇的机会窗口:
  市场广阔,容纳下许多巨头玩家;
  处于爆发期初期,大规模应用尚未到来;
  AI芯片制胜的关键因素是什么?
  应用场景分散、复杂度高,需要定制化;
  单独芯片不够,需要配套的解决方案支撑;
  在这片“芯”战场上厮杀,百度的对手并非传统芯片企业,因此相比延续性技术创新,更需要从0到1的突破性技术创新。目前,百度芯片有两把刀,一曰“昆仑”,一曰“鸿鹄”,它们与算法技术、系统平台、落地应用等共同撑起了其整体AI相关业务。
  百度造芯,能抓住其中的哪些机会,竞争力又有多少?
  昆仑、鸿鹄实力几何
  从技术结合场景的经验来看,新一批崛起的AI 芯片要针对不同的人工智能应用类型和场景,对于芯片的要求就不单单是要适合深度学习,需要兼顾计算能力、能耗和灵活性。
  云计算巨头纷纷布局云计算+FPGA芯片,首先因为FPGA作为一种可编程芯片,非常适合部署于提供虚拟化服务的云计算平台之中。FPGA的灵活性,可赋予云服务商根据市场需求调整FPGA加速服务供给的能力。
  作为国内前列的云计算公司,百度从2010年开始就启动了FPGA AI加速器项目,目前进展如何呢?
  2018年的百度AI开发者大会上,李彦宏宣布百度将推出自研AI芯片昆仑,2019年12月,百度和三星宣布,百度首款用于云计算和边缘计算的昆仑1代AI芯片已经完成研发,2020年12月17日,百度首席技术官王海峰透露,百度昆仑1量产已超过2万片,并实现了应用部署,预计昆仑2将在2021年上半年量产。
  “这种大型的、云端、高算力的AI芯片门槛非常高,国内只有百度、华为、寒武纪,这三家真的是能把产品做出来。”一位券商分析师向商业数据派透露。
  运算速度、功耗等性能是衡量一款芯片的核心指标。
  百度智能芯片总经理欧阳剑曾经在一次演讲中提到,现在传统处理器的发展速度像“挤牙膏”,每一年只提高10%或者20%,但AI时代的摩尔定律非常高,基本每两年就有量子级的提高要求,包括数据的提高、模型复杂度的提高。
  从技术来说,昆仑1代处理器采用14nm工艺,16GB HBM先进内存,提供高达512GB/s的内存带宽。在低于150瓦的功率下能够实现256TOPS的INT8处理能力,以及每秒260万亿次定数运算性能。而作为对比,英伟达开发的V100S芯片,其计算能力为130TOPS的INT8;寒武纪同期推出的思元270,算力128TOPS的INT8 ,可见昆仑1代处理器性能确实是在一流水平上。
  基于此芯片,百度推出了两款AI加速卡,K100和K200,由于采用标准PCIe Gen4接口,两款加速卡可被安装在不同类型服务器、小型工控机和边缘设备上,其高效能功耗比使云端计算高密度以及智能边缘稳定同时成为可能,而昆仑1代AI芯片的表现相比英伟达T4更加稳定,且延迟也有优势,被应用于大型服务器集群当中。
  云计算——服务器——云端AI芯片,可以看到,这是一个数据中心产业链条的深度绑定。而数据中心,正是这波AI芯片中市场容量最大的一块儿蛋糕。
  相对于高性能的昆仑,鸿鹄是一款面向消费电子终端及边缘计算的远场语音交互智能芯片。
  2019年7月,鸿鹄在百度AI开发者大会上首次亮相,有评测显示,其在唤醒、识别以及功耗等方面表现都超过了竞争对手,尤其高噪音下首次唤醒率提升了10%以上。要做到这一点,是因为百度利用“端到端”的深度学习建模技术,实现了直接提取声音特征传到云端,改变了智能音箱过去需要占用主芯片计算资源,处理速度慢的问题,也实现了高性能语音体验和极低成本智能硬件的统一。
  此外,低功耗也是芯片重要的指标,鸿鹄芯片在小度智能音箱上的平均待机功耗只有100毫瓦,这意味着任何一个国家认证的节能、环保绿色家电产品都能搭载鸿鹄芯片。
  另外,鸿鹄芯片是按车规标准打造,还可以运用于智能汽车上。2019年12月,Apollo智能车联正式推出,搭载的鸿鹄芯片成为百度首颗集成完整信号处理、语音唤醒、指令词识别于一体的车规级芯片,这为百度在新造车战场加码不少。
  造芯企业的中场战事
  除了性能,还有哪些因素是AI芯片制胜的关键?
  “性价比、生态,尤其是生态能力,在芯片产业中尤为关键”,一位芯片资深行业人士称。
  具体而言,一个物联网低功耗的AI芯片在几元~十几元的区间,嵌入到一台智能终端中,由于测试、开模等流程的增加,可能导致这台智能终端的成本增长几十到上百元。如果这台智能终端的出货量一年在百万台级别,就是一个非常大的数目,甚至有可能将原本薄利的产品,直接打到负盈利。“所以,几块钱的成本差别,对芯片企业来讲,有可能就是核心竞争力,直接决定了客户用不用。”
  放在自家产品上,性价比的优势就更能体现出来。特斯拉的故事就很具代表性,在尚未采用自研芯片时,特斯了若想实现其L5级自动驾驶功能需要搭配两套英伟达Xavier以及周边传感器,这不光意味着占用非常大的车内空间,更可怕的是仅这部分芯片成本就高达一万美元,若按三万美元价格的特斯拉计算,这成本是万万不能接受的。而在经过漫长的五年时间开发之后,特斯拉自研AI芯片不但实现了和英伟达同类产品相同甚至更好的效果,还大大降低了成本。
  在自研芯过程中,可以按照自己的需求进行专项定制,从而按照业务节奏进行更精细的布局,减少了一部分成本,后期量产后则可以进一步降低成本,实现更快速的市场普及,并完成自身产品的后续迭代。
  以鸿鹄芯片为例,同样身处智能音箱战场上,小度智能音箱在2020年销量上实现反超,很重要的一个因素,就在于芯片成本和性能平衡之后拥有的产品竞争力。
  百度2020年第三季度财报显示,2020年9月,小度助手第一方硬件设备月语音交互次数达27亿次,比上一年同期增长65%;小度助手月语音交互总次数达53亿次。小度助手技能商店提供4300个技能,开发者数量也已达到45000人。同时,百度旗下小度科技的分拆获得独立融资,小度当前估值200亿。
  完成性能和性价比上的优势积累,生态扩展也许才是大厂芯片战事成败的关键。
  如同护城河一般,互联网公司涉足芯片制造,目的是为了实现其生态由内而外的统一。过去采用其他厂商芯片,往往需要做出匹配、适配,模型也要重新训练,话语权在芯片巨头手中,没有掌握核心科技难免受制于人。
  但要自研AI芯片并不容易,不仅需要团队对硬件制造有深入研究,还要对AI软件算法熟练掌握。纯硬件背景团队来作芯片,可能导致AI算法包括软件栈前期的设计不理想。
  在昆仑芯片诞生前,2017年百度内部数据中心、自动驾驶系统等就已大规模使用部署了超过10000片FPGA加速器,这对跨行业跨场景测试昆仑芯片打下了初步基础。随后,在部署上线的微亿智造工业智能质检设备上,百度智能云以整机一体化方式,向微亿智造交付搭载百度昆仑芯片的百度云质检一体机。
  仅仅硬件远远不够,一个整体的解决方案对商业化落地也至关重要。
  百度提出了AI-Native的云计算架构,从基础设施的AI计算集群、AI芯片,到工程平台的飞桨、云原生,以及应用开发平台的视频云、区块链等,通过云智一体、端到端的方式,支持产业的智能应用。
  在芯片基础之上,百度飞桨深度学习平台上有265多万开发者、创造了34万多个模型,实现覆盖通信、电力、城市管理、民生、工业、农业、林业、公益等众多行业和领域,这种软硬结合在一体的AI大生产平台成为百度大脑核心,如今成为了赋能各行各业的AI新型基础设施。
  终局思维看AI芯,价值几何
  随着5G逐步落地,万物互联的物联网大市场处于爆发期前夜,还并未真正大规模量产应用,在未来到来之前,以当下的出货量和营收来计算其估值,显然就很容易显得PE、PS过高。
  无论是高瓴张磊的长期主义,还是目前市场上开始谈论更多的DCF估值或终值折现估值,可能都更适合AI芯的行业。
  目前AI芯片主要应用在云端(数据中心)、终端场景(智能驾驶、手机、平台、音箱等消费电子)、边缘计算(智能家居、可穿戴等)。
  根据 Tractica 的研究报告,全球人工智能芯片的市场规模将由 2018 年的 51 亿美元增长到 2025 年的 726 亿美元,年均复合增长率将达到 46%,行业增长迅速。
  目前,关于百度芯片量产的数据并不多:
  昆仑1已经量产超过2万片,在百度搜索引擎和百度智能云生态伙伴等场景广泛部署,应用在互联网、工业制造、科研、智慧城市、智能交通等领域。
  昆仑2将于2021年上半年实现量产,其性能比昆仑1再提升3倍。
  2万片是什么概念?目前,英伟达V100市场价格大约在5万元左右,如果百度昆仑1的价格按照2-4万元计算,仅昆仑1的收入就在4-8亿元级别。
  另外,鸿鹄芯片目前主要用在小度智能音箱上,仅2020年上半年音箱出货量就为863万台,这部分也是非常有市场竞争力的。
  再来看鸿鹄搭载在Apollo上的出货量,目前百度Apollo智能车联已与70多家国内外一线汽车品牌展开合作,拥有600多款合作上市车型,包括奔驰、宝马、福特、通用、凯迪拉克、雷克萨斯、吉利等。咨询公司 IHS Markit 发布的《中国智能车联市场发展趋势报告》显示,在2020年 1 到 7 月的新车销量占比中,百度实际搭载新车销量占比高达49%。
  2020年中国汽车销量2527万台,按上半年的比例粗略预估百度Apollo预装量在1238万台 ,鸿鹄芯片若在Apollo中的嵌入比例为50%,这个量级也在600万台以上,又是不小的收入。
  三者相加,整体的营收就已经约近于5-9亿元。
  而寒武纪在2019年三年营收为4.4亿元,预计2020-2022年收入分别为5.4亿元、6.51亿元和8.12亿元。目前,市场上对AI芯片的估值非常高,PS都在100倍以上,寒武纪截止2月10日的市值为590.15亿元人民币。
  目前地平线截止2020年11月,中国首款车规级AI芯片地平线征程2出货量已超10万,目前估值35亿美元,约合人民币245亿元人民币。
  也就是说,仅仅百度芯片目前发展的情况,就已经达到了比寒武纪营收更高的级别,如果未来独立运作(类似于造车业务),加上智能汽车的爆发,云计算、物联网市场的增长,估值应是百亿美金起,恐怕“百度的时代”真的又要来了。

微信扫描二维码,关注公众号。