撰文 | 古? ?芯
編輯 | 楊博丞
題圖 | IC Photo
ChatGPT的誕生是AI行業(yè)發(fā)展的一個(gè)里程碑,讓通用人工智能距離全面商用更進(jìn)一步。ChatGPT雖然屬于生成式人工智能技術(shù)(AIGC)的一種,卻可以訓(xùn)練其他AIGC產(chǎn)品,比如充當(dāng)AI畫圖模型Midjourney 的提示詞分析師。
由于ChatGPT的能力過(guò)于突出,其母公司2022年11月發(fā)布ChatGPT3.5版本后,迅速吸引大量用戶,同時(shí)也招來(lái)非議,最引人關(guān)注的莫過(guò)于全球首富馬斯克,聯(lián)合千人請(qǐng)?jiān)溉蛲V寡邪l(fā)類ChatGPT產(chǎn)品。
之所以說(shuō)馬斯克的呼吁吸引眼球,不是因?yàn)樗磳?duì)研發(fā)類ChatGPT產(chǎn)品,也不是因?yàn)樗蚴赘坏纳矸?,而是因?yàn)樗粲跬V寡邪l(fā)類ChatGPT產(chǎn)品之前,剛表態(tài)要自建團(tuán)隊(duì),自備資金研發(fā)類ChatGPT產(chǎn)品;其次才是作為世界首富雄厚的財(cái)力,稍微出手,便囤了10000塊GPU芯片。
馬斯克對(duì)ChatGPT的表態(tài)看似矛盾,但是考慮到馬斯克2015年還是ChatGPT母公司OpenAI的聯(lián)合創(chuàng)始人,2018年就被現(xiàn)任CEO“奧特曼”擠走,這種類似吃不到葡萄說(shuō)葡萄酸的心里也就容易理解了。更何況馬斯克一直站在新興技術(shù)風(fēng)口上,怎么可能容忍當(dāng)今最新潮的技術(shù)和自己沒(méi)關(guān)系?
只不過(guò)不止一次表態(tài)要切入人工智能(AI)賽道的馬斯克,為何成立AI部門之前先搶了一萬(wàn)塊GPU(圖形處理器)芯片?搶購(gòu)的又是什么型號(hào)的芯片?馬斯克買了這一萬(wàn)塊芯片,會(huì)不會(huì)影響行業(yè)供需關(guān)系,國(guó)內(nèi)AI企業(yè)會(huì)不會(huì)受到影響,最重要地的是,國(guó)內(nèi)有沒(méi)有能做GPU的企業(yè),做到什么地步了?
01.GPU如何攪動(dòng)人工智能行業(yè)
馬斯克購(gòu)買一萬(wàn)塊GPU芯片,主要是因?yàn)镚PU的性能決定了行業(yè)天花板,相比于通用的CPU(中央處理器),GPU在人工智能行業(yè)被細(xì)分到“AI芯片”領(lǐng)域,也就是針對(duì)AI算法做了特殊加速設(shè)計(jì)的芯片。
狹義的人工智能芯片,指的就是專門優(yōu)化過(guò)的顯卡。在人工智能剛駛?cè)肟燔嚨赖?012年,前谷歌計(jì)算機(jī)科學(xué)家Alex Krizhevsky,使用深度學(xué)習(xí)+GPU的方案在Image Net LSVRC-2010圖像識(shí)別大賽中,將識(shí)別成功率從74%提升至85%,在行業(yè)內(nèi)引起廣泛關(guān)注。
GPU行業(yè)龍頭英偉達(dá)(NVIDIA)受此啟發(fā),投入大量人力物力又優(yōu)化自家GPU的CUDA深度學(xué)習(xí)生態(tài)系統(tǒng),有消息稱短短3年內(nèi),公司GPU產(chǎn)品性能提升了65倍,甚至還推出了基于自家GPU,覆蓋后端訓(xùn)練至前端應(yīng)用的全套方案。
眾所周知,GPU通常被用于圖像處理任務(wù),因?yàn)閳D像是由多個(gè)像素組成,GPU想要高效完成圖像處理任務(wù),就需要大量可以完成獨(dú)立運(yùn)算的單元,廠商也會(huì)極盡可能,在芯片內(nèi)放入更多獨(dú)立計(jì)算核心,2018年發(fā)布的英偉達(dá)GTX2080TI有4352個(gè)CUDA核心,到2022年發(fā)布的4090顯卡CUDA核心增至16384個(gè)。本就具備同時(shí)大量獨(dú)立計(jì)算的能力,所以只需要CPU給出正確的指令,GPU自然可以迅速完成深度學(xué)習(xí)型AI產(chǎn)品所需要的超規(guī)模計(jì)算。
我們今天熟悉的ChatGPT已經(jīng)迭代至第四代。以第一代ChatGPT為例,2018年6月發(fā)布的GPT-1只在8個(gè)GPU上訓(xùn)練了一個(gè)月,當(dāng)年運(yùn)行TensorFlow單GPU深度學(xué)習(xí)研究,表現(xiàn)最佳的GPU是GTX2080TI,參數(shù)量約為1.17億,預(yù)測(cè)訓(xùn)練數(shù)據(jù)量?jī)H有5GB;2019年2月發(fā)布的GPT-2預(yù)訓(xùn)練數(shù)據(jù)量增至40GB,參數(shù)量達(dá)到了15億,此時(shí)需要256個(gè)Google Cloud TPU v3上訓(xùn)練一周。
到2020年5月發(fā)布的GPT-3,預(yù)訓(xùn)練數(shù)據(jù)量猛增至45TB,參數(shù)量達(dá)到1750億,需要在355個(gè)GPU上訓(xùn)練一年,且訓(xùn)練總成本達(dá)到1200萬(wàn)美元。GPT-3.5也就是我們現(xiàn)在熟悉的ChatGPT,和最新發(fā)布的ChatGPT4.0尚未公布相關(guān)數(shù)據(jù),可以肯定的是,這兩代ChatGPT均使用GPU訓(xùn)練。據(jù)華西證券數(shù)據(jù),ChatGPT母公司OpenAI已使用了約2.5萬(wàn)個(gè)英偉達(dá)的GPU。
雖然微軟已經(jīng)將OpenAI收入麾下,并提供代號(hào)為“雅典娜”的人工智能芯片,但由于英偉達(dá)芯片在人工智能行業(yè)深耕多年,新玩家短期內(nèi)很難對(duì)其形成威脅,未來(lái)需求仍將繼續(xù)上升。
更為人熟知的CPU,與GPU相比具有明顯短板。因?yàn)镃PU需要較高的通用性,較為高端的產(chǎn)品還需要在核心內(nèi)構(gòu)建3級(jí)緩存,所以單個(gè)核心會(huì)盡可能做的大而全,這就造成CPU可用于單獨(dú)計(jì)算的核心明顯少于GPU,無(wú)法專精處理某一項(xiàng)任務(wù),導(dǎo)致CPU在行計(jì)算、浮點(diǎn)計(jì)算以及矩陣運(yùn)算方面存在明顯的先天不足,這三個(gè)能力恰恰是完成ChatGPT這種深度學(xué)習(xí)型AI產(chǎn)品迫切需要的。
英偉達(dá)為了進(jìn)一步提升旗下產(chǎn)品對(duì)AI深度學(xué)習(xí)的適應(yīng)性,特意推出用于超級(jí)計(jì)算機(jī)的深度學(xué)習(xí)的Tesla顯卡,最新型號(hào)為A100,2022年由于不可抗力,已經(jīng)被禁止向中國(guó)出口,轉(zhuǎn)而推出減配版A800。
和消費(fèi)級(jí)顯卡相比,Tesla顯卡在完成圖像處理、語(yǔ)音識(shí)別、機(jī)器學(xué)習(xí)、物體檢測(cè)等任務(wù)時(shí)更快,根據(jù)相關(guān)測(cè)試,同樣是2020年推向市場(chǎng)的A100和3090,消費(fèi)級(jí)顯卡3090 的tensor core只有A100的四分之一。在深度學(xué)習(xí)領(lǐng)域,無(wú)論是常見(jiàn)的CNN還是ChatGPT使用的Transformer,大多數(shù)浮點(diǎn)計(jì)算量,都集中于依托tensor core計(jì)算的矩陣乘法上面,所以使用A100可以更快完成深度學(xué)習(xí)產(chǎn)品的開發(fā)。
基于上述分析,不難發(fā)現(xiàn)海外對(duì)中國(guó)禁運(yùn)A100的意圖,就是想要極大可能限制中國(guó)人工智能行業(yè)發(fā)展。
02.國(guó)產(chǎn)芯片露出微光
短期來(lái)看,中國(guó)人工智能行業(yè)可以選擇除A100外的次等GPU,但是長(zhǎng)期來(lái)看,必須要突破封鎖,實(shí)現(xiàn)人工智能芯片國(guó)產(chǎn)化。
聚焦人工智能芯片領(lǐng)域,除GPU外,可用于AI算法的芯片還包括CPU、FPGA、MLU、TPU,以及最新研究方向類腦芯片,后者由于概念較為先進(jìn),預(yù)計(jì)最快將于2023年成熟,尚不足以撼動(dòng)AI芯片競(jìng)爭(zhēng)格局。同時(shí)出于現(xiàn)實(shí)考慮,國(guó)內(nèi)廠商在GPU芯片上和英偉達(dá)或AMD、Intel正面硬鋼,毫無(wú)勝算。
CPU方面雖然有近期龍芯有所突破,但是如前所述,CPU并行算力不足,不適合應(yīng)用于AI深度學(xué)習(xí);FPGA雖然已經(jīng)用于AI算法訓(xùn)練,但是市場(chǎng)規(guī)模較?。蛔钣锌赡芴娲鶪PU的就是MLU、TPU通用AI芯片。
但根據(jù)ChatGPT發(fā)展歷程,Openai在開發(fā)GPT-2時(shí),曾經(jīng)使用過(guò)谷歌TPU芯片,這是一種以ASIC作為底芯片的計(jì)算單元,專注于神經(jīng)網(wǎng)絡(luò)所需的矩陣運(yùn)算的專用芯片,最先應(yīng)用于AlphaGo中。
但是鑒于使用ASIC技術(shù)的芯片需要定制化,用戶使用成本較GPU更高且更繁瑣,OpenAI開發(fā)GPT-3時(shí)重新選擇GPU,同時(shí)考慮到GPT-3模型參數(shù)量陡增,英偉達(dá)CUDA架構(gòu)較其他產(chǎn)品具有明顯優(yōu)勢(shì),間接體現(xiàn)了英偉達(dá)GPU在人工智能芯片領(lǐng)域絕對(duì)龍頭的位置,但這不代表其他產(chǎn)品就沒(méi)有開發(fā)和應(yīng)用價(jià)值。
首先是以谷歌TPU、寒武紀(jì)MLU為代表的通用AI芯片,憑借針對(duì)特定算法深度優(yōu)化和加速,可以在確定性執(zhí)行模型的應(yīng)用需求中發(fā)揮作用;FPGA芯片依靠靈活多變的通用性,再加上可編程性,適用于開發(fā)周期較短的AI產(chǎn)品、傳感器數(shù)據(jù)預(yù)處理工作以及小型開發(fā)試錯(cuò)升級(jí)迭代階段等。
?梳理國(guó)產(chǎn)芯片企業(yè)的格局,除寒武紀(jì)外,華為、國(guó)芯科技也布局了通用AI芯片(TPU\MLU);安路科技、紫光國(guó)微、復(fù)旦微電等企業(yè)布局FPGA芯片,試圖在這兩個(gè)領(lǐng)域突破海外對(duì)我國(guó)GPU芯片的封鎖。
目前寒武紀(jì)雖然尚未實(shí)現(xiàn)盈利,芯片市占率也不高,但芯片產(chǎn)品覆蓋了云端智能芯片及加速卡、訓(xùn)練整機(jī)、邊緣智能芯片及加速卡、終端智能處理器IP以及上述產(chǎn)品的配套軟件開發(fā)平臺(tái)。
另一個(gè)已經(jīng)被應(yīng)用于人工智能的算法訓(xùn)練的FPGA芯片領(lǐng)域,中國(guó)市場(chǎng)占有率最高的國(guó)產(chǎn)廠商是安路科技,目前公司在中低端產(chǎn)品線全面對(duì)標(biāo)海外龍頭企業(yè),考慮到建立FPGA芯片軟硬件生態(tài)體系行業(yè)壁壘較高,且用戶更換產(chǎn)品驗(yàn)證周期長(zhǎng),安路科技未來(lái)有望依托現(xiàn)有市場(chǎng)擴(kuò)大優(yōu)勢(shì)。
目前安路科技的產(chǎn)品廣泛應(yīng)于用網(wǎng)絡(luò)通信、消費(fèi)電子、工業(yè)控制和數(shù)據(jù)中心等領(lǐng)域均能保持穩(wěn)健的成長(zhǎng),正在拓展無(wú)人機(jī)、自動(dòng)駕駛、智慧城市等涉及人工智能的應(yīng)用領(lǐng)域。
不過(guò)目前最值得關(guān)注的國(guó)產(chǎn)AI芯片企業(yè)應(yīng)該是千芯科技,公司生產(chǎn)的存算一體AI芯片,通過(guò)自研存算一體技術(shù),可提供能效比超過(guò)10-100TOPS/W,在特定領(lǐng)域可以提供更大算力(1000TOPS以上),優(yōu)于其他類型AI芯片10-40倍的算力支持,應(yīng)用場(chǎng)景包括自然語(yǔ)言處理,一旦量產(chǎn),可用于類ChatGPT產(chǎn)品的研發(fā)。其他可以用于深度學(xué)習(xí)領(lǐng)域的國(guó)產(chǎn)芯片還包括北京君正的AI協(xié)處理器T02,燧原科技的邃思AI訓(xùn)練和推理芯片等。?
現(xiàn)階段,寒武紀(jì)、安路科技、千芯科技等國(guó)產(chǎn)AI芯片企業(yè)的產(chǎn)品,雖然尚不具備替代英偉達(dá)的能力,但是也給中國(guó)人工智能行業(yè)帶來(lái)一絲微光?;仡櫺酒袠I(yè)的發(fā)展,無(wú)論是芯片設(shè)備還是芯片產(chǎn)品,只要中國(guó)企業(yè)突破封鎖,就能迅速改變行業(yè)格局,這其中就包括一種最常見(jiàn)的AI芯片。
03.AI芯片領(lǐng)域唯一的突破
這種最常見(jiàn)的AI芯片就是存儲(chǔ)芯片,日前國(guó)產(chǎn)存儲(chǔ)芯片生產(chǎn)商長(zhǎng)江存儲(chǔ)憑一己之力,讓海外大廠三星等企業(yè)的固態(tài)存儲(chǔ)產(chǎn)品主動(dòng)降價(jià)超50%。長(zhǎng)江存儲(chǔ)芯片對(duì)三星帶來(lái)的危機(jī)感,是典型的彎道超車,也是國(guó)產(chǎn)芯片產(chǎn)業(yè)鏈尋求的最佳發(fā)力點(diǎn)。
過(guò)去很長(zhǎng)一段時(shí)間,存儲(chǔ)芯片占全球芯片市場(chǎng)規(guī)模的27%,但是競(jìng)爭(zhēng)格局較為固化,尤其是中國(guó)市場(chǎng),2018年中國(guó)進(jìn)口的3120億美元的芯片中,存儲(chǔ)芯片進(jìn)口額高達(dá)1150億美元,占比超36%。
到2020年,中國(guó)存儲(chǔ)芯片規(guī)模增至全球存儲(chǔ)芯片的31%,但是自給率不足1%,競(jìng)爭(zhēng)格局高度固化,韓國(guó)三星近乎壟斷高端存儲(chǔ)市場(chǎng)。
同時(shí)考慮到中國(guó)AI行業(yè)發(fā)展過(guò)于迅猛,有數(shù)據(jù)顯示,預(yù)計(jì)到2025年,中國(guó)人工智能核心市場(chǎng)規(guī)模有望達(dá)到4000億元,鑒于當(dāng)前國(guó)內(nèi)芯片行業(yè)發(fā)展現(xiàn)狀,CPU\GPU等產(chǎn)品研發(fā)周期太長(zhǎng),想要短期獲得國(guó)內(nèi)市場(chǎng)的話語(yǔ)權(quán)難度極高,所以在國(guó)家大基金的領(lǐng)導(dǎo)下,長(zhǎng)江存儲(chǔ)加快3D NAND存儲(chǔ)芯片研發(fā)進(jìn)度,2019年推出64層3D NAND后,于2022年順利推出192層3D NAND芯片。
反觀壟斷中國(guó)存儲(chǔ)市場(chǎng)的三星,自從2013年推出24層3D NAND閃存芯片后,直到2019年才推出96層V-NAND,雖然研發(fā)進(jìn)度慢有更換技術(shù)路線的原因,但是同期另一家老牌存儲(chǔ)長(zhǎng)海力士已經(jīng)推出128層4D NAND產(chǎn)品,三星此時(shí)已經(jīng)明顯落后于同業(yè)企業(yè),但仍領(lǐng)先長(zhǎng)江存儲(chǔ)。
現(xiàn)如今,長(zhǎng)江存儲(chǔ)不僅從技術(shù)層面實(shí)現(xiàn)趕超,還憑借中國(guó)特有的“量大管飽”生產(chǎn)模式,將產(chǎn)品售價(jià)一降再降,迫使三星在中國(guó)市場(chǎng)全面接受價(jià)格戰(zhàn),實(shí)現(xiàn)全系產(chǎn)品降價(jià)。
雖然目前有觀點(diǎn)認(rèn)為,三星存儲(chǔ)產(chǎn)品降價(jià),以及一季度出現(xiàn)3.3萬(wàn)億韓元的營(yíng)業(yè)虧損,主要是因?yàn)檫^(guò)去幾年芯片行業(yè)產(chǎn)能過(guò)剩,不得已降價(jià)去庫(kù)存并首次減產(chǎn),這種觀點(diǎn)不能說(shuō)錯(cuò),但確實(shí)很片面。
從市場(chǎng)角度出發(fā),目前在某電商平臺(tái)上,采用長(zhǎng)江存儲(chǔ)自研3D NAND閃存芯片的存儲(chǔ)產(chǎn)品,2TB規(guī)格產(chǎn)品單價(jià)最低到了479元,600元以下的選擇非常多,而三星雖然大幅降價(jià),但客單價(jià)依舊比致鈦高100元,比售價(jià)最低的近乎翻倍,如果三星不降價(jià),繼續(xù)采取之前2TB規(guī)格產(chǎn)品動(dòng)輒超2000元的單價(jià),等于直接宣告退出中國(guó)消費(fèi)級(jí)存儲(chǔ)市場(chǎng)的競(jìng)爭(zhēng)。
中國(guó)存儲(chǔ)市場(chǎng)這塊大蛋糕,三星可不會(huì)輕易放棄。上文提及,到2025年,中國(guó)人工智能核心市場(chǎng)規(guī)模將達(dá)到4000億元,按照存儲(chǔ)芯片27%的占比計(jì)算,AI芯片領(lǐng)域存儲(chǔ)芯片市場(chǎng)規(guī)?;?qū)⑦_(dá)到1080億元。考慮到當(dāng)前存儲(chǔ)產(chǎn)品售價(jià)大幅降價(jià),保守估計(jì)未來(lái)市場(chǎng)規(guī)模也有望超過(guò)500億。
而且在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的產(chǎn)生和運(yùn)算速度都在急速上升(參考GPT-3預(yù)訓(xùn)練數(shù)據(jù)量),所有云服務(wù)供應(yīng)商不僅需要更強(qiáng)的算力,還需要容量更大、讀取速度更快的存儲(chǔ)設(shè)備,所以即使未來(lái)存儲(chǔ)芯片還有降價(jià)的可能,更低的產(chǎn)品價(jià)格反而會(huì)催生行業(yè)內(nèi)固態(tài)存儲(chǔ)對(duì)機(jī)械存儲(chǔ)設(shè)備的替代。
這種行業(yè)趨勢(shì)其實(shí)從2019年就已經(jīng)開始顯露端倪。據(jù)民生證券數(shù)據(jù),2019年企業(yè)級(jí)SSD平均容量達(dá)到2.3TB,2020年將增長(zhǎng)至2.7TB,設(shè)備出貨量年均復(fù)合增速達(dá)到15.8%。三星即使降產(chǎn)斷臂,也會(huì)極力平衡存儲(chǔ)產(chǎn)品的供給關(guān)系,繼續(xù)搶奪中國(guó)市場(chǎng),只可惜三星再也沒(méi)機(jī)會(huì)躺平掙錢了。
因?yàn)殚L(zhǎng)江存儲(chǔ)的芯片制程普遍處于22nm,海外制裁不涉及該部分,且國(guó)產(chǎn)設(shè)備目前已經(jīng)逐步覆蓋該領(lǐng)域的芯片制造。再想通過(guò)制裁簡(jiǎn)單粗暴的限制中國(guó)芯片行業(yè)發(fā)展,只停留在理論層面,而一旦中國(guó)企業(yè)突破海外封鎖,將立刻改變行業(yè)競(jìng)爭(zhēng)格局,幫它們真正參與理解,什么才是“市場(chǎng)競(jìng)爭(zhēng)”。
- 美科技七巨頭遭特朗普關(guān)稅血洗 市值蒸發(fā)14萬(wàn)億
- 特斯拉市值一夜蒸發(fā)超6400億元,美股科技“七巨頭”陷入調(diào)整區(qū)間
- 阿里巴巴于上海新設(shè)智信普惠科技公司,布局多領(lǐng)域技術(shù)服務(wù)
- 馬化騰短暫登頂中國(guó)富豪榜,騰訊科技與股價(jià)雙輪驅(qū)動(dòng)成關(guān)鍵
- 本地生活賽道:2025年紅海變“血?!?,平臺(tái)競(jìng)逐白熱化
- 義烏哪吒小商品熱賣:緊跟《哪吒2》熱潮,一天賣幾百套
- 美恢復(fù)接收中國(guó)包裹,貿(mào)易政策突變引發(fā)物流界震蕩
- DeepSeek或再掀波瀾,可能對(duì)美股市場(chǎng)造成新一輪打擊
- 谷歌股價(jià)暴跌:收入增長(zhǎng)放緩,人工智能支出引投資者擔(dān)憂
- 華為去年銷售收入超8600億元:ICT基礎(chǔ)設(shè)施穩(wěn)健,新業(yè)務(wù)快速發(fā)展
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。