獨(dú)孤求敗,金庸《神雕俠侶》小說中的經(jīng)典人物,其墓前刻曰,縱橫江湖三十馀載,殺盡仇寇,敗盡英雄,天下更無(wú)敵手,無(wú)可奈何,惟隱居深谷,以雕為友。 嗚呼!生平求一敵手而不可得,誠(chéng)寂寥難堪也。
而在大洋彼岸的美國(guó),1993年成立的英偉達(dá)也是通過三十年時(shí)間,成了AI芯片領(lǐng)域的獨(dú)孤求敗。
(資料圖片)
美股5月25日,英偉達(dá)股價(jià)飆升,截止收盤英偉達(dá)漲24.37%,市值創(chuàng)下歷史新高。截至當(dāng)天美股收盤,英偉達(dá)市值上漲超過1800億美元,目前市值為9393億美元,——僅僅是這增長(zhǎng)的部分就已經(jīng)大約相當(dāng)于1個(gè)AMD(1938億美元市值)、1.5個(gè)英特爾(1143億美元市值)。
至于原因,無(wú)它,需求大增爾。英偉達(dá)Q2的業(yè)績(jī)指引成為該公司有史以來最高的季度營(yíng)收,超過華爾街預(yù)期的53.2%。其中數(shù)據(jù)中心營(yíng)收創(chuàng)下歷史新高,英偉達(dá)將此歸因于GPU,由于云計(jì)算平臺(tái)與大型科技公司競(jìng)相部署AI芯片,GPU需求水漲船高。
掌門人黃仁勛獨(dú)創(chuàng)黃氏定律,奠定顯卡江湖地位
正如羅馬不是一天建成的一般,英偉達(dá)的江湖地位自然也不是憑空得來,那么英偉達(dá)是如何取得現(xiàn)在的地位呢?
要回答這個(gè)問題,黃仁勛是繞不開的核心人物。
黃仁勛,祖籍浙江,1963年出生于臺(tái)灣。9 歲時(shí),他和哥哥被父母送到了美國(guó);16歲就考上了俄勒岡州立大學(xué)學(xué)習(xí)電子工程。隨后他在斯坦福取得了碩士學(xué)位。畢業(yè)之后,黃仁勛先后在AMD以及LSI Logic工作過,并取得了豐富的技術(shù)經(jīng)驗(yàn)。
1993年,到了而立之年的黃仁勛因?qū)ζ拮拥某兄Z,成立英偉達(dá)。兩年后便推出了第一款產(chǎn)品nv1,雖然nv1集成了很多功能,但工程師們經(jīng)常會(huì)犯的一個(gè)毛病是:做出一些宏大的設(shè)計(jì),引起技術(shù)圈的陣陣驚嘆,但未必能讓市場(chǎng)掏錢——“NV1”正是這樣一出驕傲的悲情劇。
之后黃仁勛看準(zhǔn)了圖形顯示芯片賽道,并堅(jiān)信終有一天PC會(huì)成為享受游戲和多媒體的消費(fèi)級(jí)設(shè)備(在當(dāng)時(shí)PC主要作為生產(chǎn)力設(shè)備而非消費(fèi)級(jí)設(shè)備)。
時(shí)間到了1999年,這一年對(duì)英偉達(dá)是極其特殊的一年。在這一年英偉達(dá)不僅成功上市,到了八月份英偉達(dá)發(fā)布了全球首款GPU(Graphics Processing Unit,即“圖形處理器”)——那款極具里程碑意義的GeForce256。
GeForce256的出現(xiàn),直接改變了業(yè)內(nèi)的競(jìng)爭(zhēng)格局。因?yàn)橹坝酶叨薈PU+顯卡才能完成的工作,如今只需用便宜點(diǎn)的CPU+GeForce256便能完成,而且流暢度還更好。
花更少的錢辦同樣的事,還更具效率,這么具有革命性的事情,就這樣被英偉達(dá)做到了。得益于這番優(yōu)異表現(xiàn),2000年三月份,英偉達(dá)成功拿到了微軟首款XBOX游戲機(jī)的圖形處理器訂單。
但誰(shuí)知道這時(shí)候的英偉達(dá)飄了,給的報(bào)價(jià)太高兩者鬧翻了,微軟轉(zhuǎn)身就把訂單送給了對(duì)頭ATI,直接讓英偉達(dá)的股價(jià)狂跌到2.64美元。
通過這件事,黃仁勛意識(shí)到必須打造自己的差異化競(jìng)爭(zhēng)優(yōu)勢(shì)。在2000年英偉達(dá)推出了黃氏定律,即業(yè)界的摩爾定律是每18個(gè)月推出新品,性能翻一番;而英偉達(dá)會(huì)投入三倍人力做同一件事,6個(gè)月就推出新品。用速度搶生意。
英偉達(dá)通過這一戰(zhàn)略逐漸把AMD的市場(chǎng)占有率壓縮在了20%以下,一舉坐穩(wěn)了顯卡之王的位置。
無(wú)心插柳柳成蔭,GPU成了AI天生的鏟子
如果說英偉達(dá)坐穩(wěn)顯卡地位靠的是卷死同行的黃氏定律,那么成為AI芯片的霸主則多多少少有運(yùn)氣的成分和時(shí)代的垂青。
其實(shí)很多經(jīng)典的深度神經(jīng)網(wǎng)絡(luò)架構(gòu)早在20世紀(jì)下半葉就已經(jīng)被提出,但因?yàn)槿狈τ?xùn)練它們的計(jì)算硬件,很多研究只能“紙上談兵”,發(fā)展長(zhǎng)期停滯。
GPU誕生之初也想不到自己會(huì)同AI的算力需求如此契合。打從一開始,GPU就不是為訓(xùn)練神經(jīng)網(wǎng)絡(luò)所生,而是圖像。更具體點(diǎn)說,是為了將CPU從圖像顯示的苦力活中解放出來而生。
轉(zhuǎn)折點(diǎn)出現(xiàn)了在2012年。這一年,全球人工智能和機(jī)器學(xué)習(xí)權(quán)威、華人科學(xué)家吳恩達(dá)領(lǐng)銜谷歌大腦,從1000萬(wàn)張圖片中,成功識(shí)別出一只貓,震驚業(yè)界。
但這個(gè)結(jié)果背后是耗資100萬(wàn)美元,集結(jié)1000臺(tái)電腦、16000個(gè)CPU的投入,這使他不得不思考有沒有一種更快、更省錢的方法?
他想到了英偉達(dá)(NVIDIA)。四年前,他首開先河,用英偉達(dá)的圖形處理芯片(GPU)代替英特爾的CPU,構(gòu)建了一個(gè)深度學(xué)習(xí)模型。這一次,他想再賭一把。結(jié)果出乎意料,他只用16臺(tái)電腦、64個(gè)GPU就搞定了同樣的事情。
這個(gè)足以讓吳恩達(dá)感到興奮的結(jié)果,也將GPU推上了關(guān)注的焦點(diǎn)。之后,深度學(xué)習(xí)大神Hinton及其弟子帶著卷積神經(jīng)網(wǎng)絡(luò)AlexNet又擊敗了谷歌貓。而這個(gè)需要1400萬(wàn)張圖片、總計(jì)262千萬(wàn)億次浮點(diǎn)運(yùn)算訓(xùn)練的神經(jīng)網(wǎng)絡(luò),一個(gè)星期的訓(xùn)練過程中僅用了四顆英偉達(dá)Geforce GTX 580。
這徹底震驚了業(yè)界,也奠定了英偉達(dá)GPU在AI深度學(xué)習(xí)領(lǐng)域的霸主地位。
AI深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)選擇了GPU
那么為什么GPU比CPU更適合AI深度學(xué)習(xí)訓(xùn)練呢?
這是因?yàn)樯疃葘W(xué)習(xí)的訓(xùn)練過程是對(duì)每個(gè)輸入值根據(jù)神經(jīng)網(wǎng)絡(luò)每層的函數(shù)和參數(shù)進(jìn)行分層運(yùn)算,最終得到一個(gè)輸出值,跟圖形渲染一樣都需要大量的矩陣運(yùn)算——這恰巧就是GPU最擅長(zhǎng)的東西。
CPU 通常有 4 個(gè)、8 個(gè)或 16 個(gè)強(qiáng)力 ALU 核心(arithmetic logic unit,算術(shù)邏輯單元),適合做復(fù)雜的通用串行任務(wù)。GPU 是圖形計(jì)算的重要元件,主要用來處理與圖形圖像相關(guān)的數(shù)據(jù);與CPU 不同的是,GPU 有數(shù)百甚至數(shù)千個(gè)簡(jiǎn)單 ALU 核心,單個(gè) ALU 處理能力相比 CPU 的更弱,但能夠?qū)崿F(xiàn)多個(gè) ALU 并行計(jì)算,適合做簡(jiǎn)單特定的并行任務(wù)。
因此,對(duì)于復(fù)雜的單個(gè)計(jì)算任務(wù)來說,CPU 的執(zhí)行效率更高,通用性更強(qiáng);而對(duì)于圖形圖像這種矩陣式多像素點(diǎn)的簡(jiǎn)單計(jì)算,更適合用 GPU 來處理,但通用性較弱。
打個(gè)比方,訓(xùn)練神經(jīng)網(wǎng)絡(luò)就相當(dāng)于調(diào)黑盒子上的旋鈕,調(diào)旋鈕是通過數(shù)學(xué)的算法調(diào)的,這些旋鈕動(dòng)輒幾十億個(gè),需要大量的計(jì)算。
傳統(tǒng)電腦用的是CPU,用CPU去調(diào)旋鈕相當(dāng)于調(diào)完第一個(gè)再調(diào)第二個(gè),一個(gè)一個(gè)按順序來,雖然CPU速度很快,但神經(jīng)網(wǎng)絡(luò)的旋鈕實(shí)在太多了,連CPU都招架不住了,這時(shí)候GPU的優(yōu)勢(shì)就出現(xiàn)了。
GPU和CPU不一樣的地方是它一次可以同時(shí)調(diào)成千上萬(wàn)個(gè)旋鈕,原來CPU幾年才能調(diào)完的活GPU幾天就干完了。
如果將CPU比作保時(shí)捷,GPU就是巨無(wú)霸卡車。前者雖然在速度上秒殺,后者卻能輕松裝載幾十噸貨物。這種巨大的差別,令GPU原本令人詬病的散熱問題也顯得不值一提。
今年震動(dòng)全球科技界的ChatGPT,就是依靠了超過萬(wàn)枚的英偉達(dá)高端GPU——單枚售價(jià)超過1萬(wàn)美元的A100/H100高性能芯片,所構(gòu)建的史上規(guī)模最大的AI算力集群。
英偉達(dá)的A100有多強(qiáng)勁,在2003年的科幻電影 《終結(jié)者3》里,那個(gè)差點(diǎn)毀滅人類的超級(jí)計(jì)算機(jī)“天網(wǎng)”,算力為60 TFLOPS(也就是每秒6萬(wàn)億次浮點(diǎn)計(jì)算),今天英偉達(dá)最先進(jìn)的數(shù)據(jù)中心GPU H100,在特定精度下,算力已經(jīng)達(dá)到了67 TFLOPS。
機(jī)會(huì)永遠(yuǎn)是留給有準(zhǔn)備的人的
其實(shí)做GPU芯片的也不是英偉達(dá)一家,那么為什么當(dāng)AI餡餅砸來時(shí),英偉達(dá)能吃到最大的那一口呢?
原因其實(shí)很簡(jiǎn)單,機(jī)會(huì)往往是留給有準(zhǔn)備的人的。
就像大家很容易遺忘在iPhone發(fā)布前,蘋果已經(jīng)在電腦上做了十幾年操作系統(tǒng)一樣,AI芯片公司們也在忘記英偉達(dá)是一家顯卡供應(yīng)商的同時(shí),它還一直在不斷打磨另一個(gè)殺器——CUDA。
除了GPU芯片設(shè)計(jì)能力,英偉達(dá)最寶貴的財(cái)富,是基于CUDA模型,孵化了大量的開發(fā)者和軟件生態(tài)。
這就如Android和iOS一樣,遇到挑戰(zhàn)者根本不怕,因?yàn)榧幢愫髞硐到y(tǒng)做得再好,但是沒有生態(tài)也是白搭。
英偉達(dá)發(fā)布CUDA后,先后推出居里、特斯拉、費(fèi)米、開普勒、麥克斯韋、帕斯卡、伏特、圖靈、安培、赫柏等一些列架構(gòu),用以支撐Graphics和Computing這兩大場(chǎng)景。
做生態(tài)系統(tǒng),逐步解決GPU與AI場(chǎng)景不匹配的問題,包括功耗、內(nèi)存、帶寬瓶頸等等。
這就是為什么,同樣做芯片,英偉達(dá)的市值是英特爾的好幾倍,這背后的邏輯是游戲、加密貨幣、云計(jì)算以及AI大模型,都離不開它的產(chǎn)品。
形勢(shì)一片大好,英偉達(dá)仍有隱憂
現(xiàn)在的英偉達(dá)就仿佛是第一個(gè)爬到山頂?shù)娜耍叛弁ィ瑤谉o(wú)對(duì)手。但就此說英偉達(dá)已經(jīng)高枕無(wú)憂還為時(shí)尚早。
首先是競(jìng)爭(zhēng)對(duì)手們正在奮起直追,每一個(gè)暴利行業(yè)都會(huì)引來一群嗜血的鯊魚,GPU行業(yè)自然也不例外。
在2022年的投資者會(huì)議上,英特爾首次公布了自研超算卡Ponte Vecchio(還沒有大規(guī)模商用)的性能參數(shù)。按照英特爾官方說法,該產(chǎn)品的性能領(lǐng)先英偉達(dá)的王牌產(chǎn)品7nm 安培卡皇A 100至少160%,被不少媒體冠以“芯片怪獸”的稱號(hào)。
即便相對(duì)冷靜克制的AMD和不在戰(zhàn)場(chǎng)中心的高通,在場(chǎng)外搶人大戰(zhàn)中也不乏戲份。
AMD從英偉達(dá)挖來高級(jí)技術(shù)市場(chǎng)經(jīng)理Sean Pelletier;高通的子公司高通技術(shù)則在去年年初高價(jià)收購(gòu)前蘋果SoC首席架構(gòu)師和ARM資深工程師Gerard Williams的初創(chuàng)公司NUVIA,連帶NUVIA旗下一眾有蘋果、英特爾工作經(jīng)歷的資深研發(fā)人員全部收歸麾下。
整體看幾個(gè)巨頭在不斷挖人、擴(kuò)張的過程中,早已模糊了原始邊界,切入對(duì)方腹地:英特爾要全力攻克獨(dú)立顯卡市場(chǎng),英偉達(dá)開始發(fā)力做CPU,AMD和高通在GPU這條賽道上也已經(jīng)越走越深入。
如果說行業(yè)內(nèi)的其他巨頭發(fā)力GPU還在預(yù)期之內(nèi),那么谷歌和微軟加入這場(chǎng)競(jìng)賽可能是更大的挑戰(zhàn)。畢竟谷歌和微軟是最前沿的應(yīng)用端。粗略統(tǒng)計(jì),微軟、谷歌、亞馬遜這3家公司已經(jīng)推出或計(jì)劃發(fā)布8款服務(wù)器和AI芯片。
其中,谷歌于四月初首次公布了AI超算的細(xì)節(jié)——TPU v4性能相較v3提升10倍,比A100快1.7倍,同時(shí)功耗少1.9倍。和H100對(duì)打的芯片,也已經(jīng)在研發(fā)中,它并非沒有勝出的機(jī)會(huì)。
并且,當(dāng)一個(gè)行業(yè)里出現(xiàn)一個(gè)絕對(duì)霸主時(shí),剩下的玩家往往會(huì)聯(lián)合起來抗衡。畢竟敵人的敵人就是朋友,這句話在半導(dǎo)體芯片產(chǎn)業(yè)的威力正在顯現(xiàn)。過去幾十年的“死對(duì)頭”英特爾和AMD此前宣布合作,組隊(duì)對(duì)抗更大的對(duì)手:英偉達(dá)。
其次是作為英偉達(dá)靈魂人物的黃仁勛已經(jīng)60歲,能否找到合適的跑第二棒的人依然還是個(gè)問號(hào)。
最后也是最大的問題就是如何不斷的革自己的命。
孔夫子說三十而立,英偉達(dá)通過三十年時(shí)間已經(jīng)儼然成為了顯卡和AI芯片領(lǐng)域的龐然大物,但商場(chǎng)是一個(gè)逆水行舟不進(jìn)則退的地方,即便目前英偉達(dá)的H100(H100算力水平是A100的九倍)還沒有出現(xiàn)可堪一戰(zhàn)的對(duì)手,但對(duì)于英偉達(dá)而言,如何讓自己永遠(yuǎn)領(lǐng)先是一個(gè)需要一直回答的問題。
這恰如成名已久的江湖絕頂高手,拔劍四顧,發(fā)現(xiàn)最大的對(duì)手不是別人,正是自己。
參考資料:
【1】 《家族·人物 | 英偉達(dá)創(chuàng)始人黃仁勛:十年臥薪嘗膽終迎來春天》,華商韜略
【2】 《英偉達(dá) (NVIDIA) 崛起的傳奇歷程——從顯卡霸主到AI王者》,真義科技
【3】 《英偉達(dá)的前世今生》,考拉湯員,雪球
【4】 《英偉達(dá)帝國(guó)的一道裂縫》,何律衡/戴老板 遠(yuǎn)川研究院
【5】 《暴漲1.3萬(wàn)億!老黃笑哈哈,谷歌要偷家》,萬(wàn)連山 格隆匯投資學(xué)苑
關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 供稿服務(wù)| 友情鏈接
咕嚕網(wǎng) www.fyuntv.cn 版權(quán)所有,未經(jīng)書面授權(quán)禁止使用
Copyright©2008-2023 By All Rights Reserved 皖I(lǐng)CP備2022009963號(hào)-10
聯(lián)系我們: 39 60 29 14 2@qq.com