1985年,英特爾雙巨頭格魯夫和戈登·摩爾經過一番討論后,做了一個“放棄祖業”的決定:
作為英特爾發家并成就公司當時地位的存儲芯片業務,已經持續被日本企業壓得喘不過氣,既然無法保持領導地位,那不如放棄存儲,開辟一個新天地,進軍當時微不足道的微處理器領域。
而英特爾和微處理器的緣分,也恰巧是日本企業促成的。日企Busicom給英特爾下了個訂單,這個訂單促成了世界*款商用計算機微處理器、“劃時代產品”Intel4004微處理器,在1971年誕生。也正是這個機緣,奠定了英特爾在十四年后毅然決然的大轉型。
也正是英特爾這個轉型,迎來了公司和CPU產業相得益彰、相互成就的偉業。但格魯夫和摩爾可能想不到的是,自己作為半導體龍頭的地位,在日后竟然會遭到當年跟風小弟“GPU”的挑戰。以及遠處還站著ASIC、FPGA、RSIC-V,在時不時地“窺探”。
CPU這個頂著“中央處理器”名號的龍頭地位、核心市場,是如何被一步步“瓜分”的呢?
前仆后繼:讓顯卡可以計算
英偉達已經成為GPU的代名詞,但在皮衣老黃創立公司之前,已經有諸多公司推動了顯卡一步步的發展:從圖形顯示適配器,到圖形加速器,繼而是英偉達的圖形處理器。
如今的GPU,堪稱算力天王,但在起初,顯卡不能計算,僅僅是CPU的跟班。當時圖形計算等工作,都由CPU承擔,而顯卡僅僅將CPU算好的數據處理為屏幕等顯示設備能識別的信號。所以也稱為圖形顯示適配器。
1981年,IBM推出了2D二維圖形加速卡,從而實現了從“顯示”到“計算”的跨越。
而隨著微軟視窗操作系統的快速普及,電腦對圖形處理的能力要求越來越高。這個趨勢吸引了眾多公司涌入,1993年黃仁勛也創立了英偉達,此時行業里也有三四十家公司,包括IBM、S3、ATi、Matrox、Trident、3Dfx、IGS等等。
其中,Trident的3D三維圖形加速卡,也是鼻祖產品,而且*次讓顯卡不再和CPU一起封裝,共用存儲,而是可以獨立存在。相當于有了自己的領地,發展空間更大。
據傳聞,黃仁勛創業之前給一個分析師打電話、咨詢產業,對方說,可別來了,玩家太多。但掛了電話,老黃就進來了。這個狠勁,當然離不開公司團隊的實力確實不弱。
但英偉達創業之初,也是差點被巨頭“碾壓”。
微軟發布的Direct 3D圖形標準,直接讓英偉達早期的圖像加速產品失去了市場。幸好還有日本電子游戲公司SEGA世嘉的訂單,公司的研發才沒有中斷。很快,英偉達的Riva128顯卡問世,為公司贏得了一定市場。
但在1995年,3Dfx公司發布的Voodoo以及Glide API接口,才是當時市場的主流,尤其在游戲領域基本是壟斷地位。一直到1999年,英偉達放了“大招”:Geforce256。
Geforce256的特色是整合了3D圖形處理的光影轉換(T&L)功能,從CPU接管了大量相關計算工作。也可以說,這是真正意義上的*個圖形處理器GPU,不再只是加速功能,而是重要的計算單元。
Geforce256性能*同行2-3倍,它的出現改變了競爭格局。2000年底,勁敵3Dfx就被英偉達收購(這其中一個因素也是3Dfx擴張業務、從設計進軍板卡制造領域,從而加大了財務壓力),而顯卡玩家也僅剩1985年創立的ATi還能抗衡。
英偉達也不斷提升GPU的計算能力,2001年具備頂點編程能力,這對于游戲開發人員而言,非常重要。2003年,可編程的GPU正式誕生。
此時的GPU和CPU在計算領域基本“涇渭分明”,CPU重在邏輯運算,GPU則可以并行處理大量單一的計算。業內經常用的比方就是,CPU是大學生計算高等代數,人數少但更高階;GPU就是大量小學生計算四則運算,題目簡單但是人多算得快。
隨后的故事,就是英偉達不斷提高“小學生”的計算能力:無論是更換更高效的架構、還是增加晶體管數量、改進功耗等方式提高性能,用一代代產品不斷沖擊對手。
而且還對照著CPU鼻祖摩爾提出的“摩爾定律”,提出了GPU領域要實現的“黃氏定律”:每6個月升級一次、功能翻番。野心、戰斗力可見一斑。
2006年,英偉達的老對手ATi也被AMD收購。但是AMD既要CPU領域抗衡英特爾,又要GPU領域抗衡英偉達,著實有些困難,雖然有過產品超越英偉達,但還是被聚焦GPU的老黃牢牢壓制。
看著英偉達在GPU領域越來越強,CPU老大英特爾也難免坐不住。2007年,英特爾高管就宣布將發布CPU與GPU融合的Larrabee架構,這將會讓顯卡在兩三年內消失。
老黃就立刻“回懟”:即使英特爾能夠在2010年將圖形計算能力提高10倍,仍然無法與目前英偉達的產品相匹敵。
結果就在2009年底,英特爾宣布將無限期推遲Larrabee架構發行。這是芯片巨頭罕見的產品研發失敗。
當然,在英偉達的發展途中,經歷過微軟砍單反而扶持對手、英特爾停止專利授權等等事件,股價也是一度跌去80%,但這些遭遇之后,正如老黃所說,英偉達依然堅持只做GPU。
*專注、耐心堅持,成就了行業護城河。當然,能堅持的人很多,就像大A的諸多散戶,但未必都能成功。而英偉達的成功,離不開自身奮斗,但也有歷史進程的影響。
歷史進程:迎來五波浪潮
人獲取外界信息的80%來自于視覺,因此,聚焦圖形處理,似乎是光偉正的選擇。但長期趨勢還是要靠一波波具體浪潮來落地。英偉達迎接的歷史進程可以說有五波:
*波是視窗系統的發展,這是發家的開始。從敲代碼操作電腦,到用鼠標點擊,這是電腦快速普及的重要原因。帶動了CPU邏輯運算需求的同時,也提升了GPU的必要性、并帶來出貨量。
第二波是游戲,這是從始至今的大潮。人們對游戲畫面質量的要求不斷提升,游戲玩家們對英偉達高價格高質量的顯卡,是又愛又恨。游戲業務是英偉達的大頭,但游戲畢竟不是時代發展的驅動力,也不滿足老黃對“GPU算力”地位的期待。
2015年的GTC大會上,黃仁勛就躊躇滿志地表示,英偉達將不再是一家純粹的游戲公司。
第三波是筆“橫財”,比特幣帶來的挖礦需求。中本聰憑空創造出了一個可以和“股票、黃金”較量的金融交易品,吸引無數人參與“挖礦”。“挖礦”的原理,就是粗暴的計算,顯然GPU比CPU更加適合。
早期“挖礦”基本是一些愛好者用CPU實現,但隨著比特幣越來越稀缺、價格越來越高,愛好者變成了專業投資者、投機者、團隊,GPU也開始大顯身手。
挖礦的火爆,一度導致電腦用戶買不到顯卡,抱怨極多。而挖礦,也不符合老黃對GPU算力的期待,英偉達也表示,用顯卡挖礦,對社會實際上沒有任何用處。
第四波是人工智能,熬來的風口。人工智能一波波浪潮的發展,自然是英偉達無法控制、只能享受的。但英偉達確實也在用芯片推動人工智能發展。
2007年英偉達推出了CUDA平臺,讓顯卡用于圖像計算意外的目的,并降低GPU編程門檻,而且還不計成本投入了6年。
CUDA讓GPU從圖像計算跨越到了“通用并行計算”,大幅擴產了GPU的適用范圍,尤其是可視化計算領域,例如地質勘探、氣象數據、流體力學、光線追蹤等等。甚至日后AI領域的深度學習,也是基于該平臺來不斷發展。
2010年,AI先驅吳恩達為了讓AI程序識別出一只貓,不得不花費了16000個CPU處理器,而換成GPU后,驚訝地發現只需要12個。2019年的GTC大會上,黃仁勛又一次公開提及了他對算力的信仰:“就算摩爾定律走向終結,GPU也將無所不能。”
這里要著重強調英偉達一次重要布局。2020年,面對英特爾的競爭,英偉達最終仍以近70億美金,完成了對美國加州Mellanox邁絡思公司的收購。
Mellanox成立于1999年,是服務器和存儲端到端連接方案的供應商,簡單理解,就是讓數據中心享受高帶寬、低時延的通信效果。在10GB以上高速網絡應用中,Mellanox市占率高達70%。
英偉達收購Mellanox后,相當于獲得進軍數據中心業務,將AI等趨勢落地的入口。而且協同效應很強,實現了“計算快”、“傳輸快”的結合。
于是,GPU在數據中心設備采購中,快速發展。全球Top500的超級計算機中,用英偉達服務的就有342臺。2021年,數據中心營收同比增長了124%,2022年*季度超越游戲,成為英偉達新的營收支柱。
2023年ChatGPT又掀起了AI巨浪,大家才發現2016年英偉達把全球*臺AI超級計算機DGX-1送給了OpenAI,這成為一次經典的“人情投資”。而老黃也興奮地喊道,AI 的「iPhone 時刻」已經到來。
第五波是XR,等待蘋果的發力。VR虛擬現實、MR增強現實等等領域,從2013年起,就一直被大家所期待。元宇宙火的時候,老黃也很興奮。
無奈的是,目前的產品力都不強,即使蘋果也還在探索,可以期待下半年的產品發布。而一旦硬件市場打開,各種應用疊加,必然是又一場“視覺需求”大爆炸。
這其中,智能駕駛也算是一次小浪潮,英偉達也收獲了不少客戶。不過,英偉達在手機芯片方面的嘗試,則以失敗告終。
在產業趨勢之外,其實還有一個隱線大浪潮:芯片制造的專業化。像微軟和英特爾合作,擊敗IBM一樣;GPU搶占CPU的過程中,也是強強聯合。
英特爾作為IDM公司,既要搞設計、又要搞制造,全靠自己。但英偉達作為設計公司,制造則依靠臺積電等專業制造公司,而且臺積電也是超級能打。
于是,結果就是2016年英特爾宣布Tick-Tock開發模式受到“阻礙”,研發周期延長。而英偉達和制造公司臺積電、光刻機ASML、EDA軟件新思科技合作的光刻計算庫 cuLitho,可以將計算光刻加速40倍以上,使得 2nm 及更先進芯片的生產成為可能。
既有一波波風口,還有生態伙伴,難怪老黃會興奮地表示,以后都是GPU天下。
虎視眈眈:只要浪夠大,玩家一定會更多
老黃感嘆GPU的能力之余,谷歌也放話了:
自研的TPU和同期的CPU、GPU相比,可以提供15-30倍的性能提升,以及30-80倍的效率提升。這一幕,頗有斷水流大師兄的“在座都是垃圾”的場景感。
2006年谷歌就開始考慮為神經網絡搭建專門的芯片架構,2016年,谷歌針對Tensorflow平臺開發了可編程AI加速器。
谷歌思路目標很明確:場景單一,不考慮復雜用途,就照著一個目標設計。但TPU的可編程性又可以加速許多不同類型的神經網絡模型,實現了高效和場景下通用的結合。
TPU的打法,就是GPU對CPU的路數。果真是江湖競爭不止,套路不再多,好用就行。
TPU代表的就是另一個對CPU虎視眈眈的路線:專用集成電路ASIC,計算能力和計算效率都可以根據特定需要進行定制,實現固定算法*化設計。
和其他路線相比,ASIC可以實現面積減小,功耗也進一步降低。但缺點是對算法依賴,它面向的場景特點是:固定、大量且重復。一旦下游場景變化,那么前期的投入也都會打水漂?梢哉f對眼光十分考驗,因此設計周期也很長。
ASIC的玩家也不少,谷歌的TPU張量處理器,地平線的BPU大腦處理器,IBM推出了TrueNorth芯片、英特爾也有Xeon系列芯片。但考慮到場景聚焦,又依賴算法,這些芯片要走向市場、實現普及,也許并不容易。因為你的客戶,也許就是你的對手。
另一條路線是FGPA現場可編程門陣列。和ASIC相比,配置FGPA的可編程架構來實現任意需要的數字功能組合。就像賽靈思Xilinx 是Kintex 7 Ultrascle芯片,也可以用于深度學習。FGPA的優勢是靈活,劣勢是必然有功能冗余、成本增加。
第三條路線是開源的RSIC-V路線。目前RISC技術的奠基人是2018年拿到圖靈獎的Patterson教授。據說2010年他帶著4個學生就搞出來了*代版本。果真是人才,不在于人數而在于才華。
更犀利的是,Patterson*地演繹了極客主義。不同于英特爾的封閉、ARM的高授權費用,Patterson把RISC技術進行了大尺度的開源,任何人都可以使用、修改,而不需要費用。
V代表的是第五代版本。RISC-V基金會會員已有高通、NVIDIA和Google等超過3000名成員。很多人認為,RISC-V有望創造繼x86、ARM之后的第三波芯片浪潮。美國、歐洲、印度,都在加大相關研發力度。<_u13a_p style="margin:0px;padding:0px;outline:0px;max-width:100%;box-sizing:border-box !important;overflow-wrap:break-word !important;">
RISC-V的靈活性,對定制化、碎片化場景的支撐力度良好;因此目前主要應用于物聯網等終端領域,但在電腦、服務器等領域也已經有了一些嘗試。要抗衡GPU路途還很遠很遠,但至少,從底層邏輯而言,這是一個可以實現“眾人拾柴火焰高”的路徑。
雖然目前來看,三條路線中也就TPU代表的ASIC還算能打一些。不過另一個趨勢就是,如果AI浪潮巨大無比,AI芯片又如此重要,那么就像蘋果會自研M1一樣,微軟等巨頭也會有自研AI芯片。但不管怎么說,CPU的天下,是繼續被瓜分了。
回溯CPU被瓜分的路徑來看,三個規律隱含其中:
一是,只要不出現人為的攔阻,分工依然是高效的。二是,隨著數據越來越大,邏輯讓位于“相關性”。就像大模型涌現能力一樣,大力出奇跡,怎么出來的,人們也不知道。
三是,只堅持并沒用,但不堅持肯定不行。在一個領域先做到*,有立足之本了再不斷拓展,而不是一開始就要吃個胖子。這一條對于我國芯片產業也許也是如此。
CPU被瓜分的故事,很精彩。但可惜,我們基本只是看客。幸運的,如今,我們的“中國版英偉達”、“中國版英特爾”,已經有了雛形。需要堅持的是,摒棄炒作思維、繼續夯實研發。就像老黃說的,時刻記住“記住,英偉達離倒閉只有30天”。而英特爾的表現,也和其緊迫感丟失有關。
時刻保持緊迫感,才不會有被卡脖子的危險感。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
Amazfit Falcon配備1.28英寸圓形AMOLED屏幕,藍寶石鏡面,擁有鈦金屬機身,重量為64克(不含表帶),15項軍標認證加身,輕盈與堅毅兼備,更耐高溫、不懼嚴寒。
三星作為全球排名第一的智能手機品牌,在安卓陣營中是絕對的佼佼者, 2月14日,三星在上海舉行了新品發布會,不僅帶來國行版的Galaxy S23系列,同時還宣布了與迪士尼的重磅合作計劃。
Amazfit Falcon配備1.28英寸圓形AMOLED屏幕,藍寶石鏡面,擁有鈦金屬機身,重量為64克(不含表帶),15項軍標認證加身,輕盈與堅毅兼備,更耐高溫、不懼嚴寒。