并行科技董事長陳健
出品 | 搜狐科技
作者 | 梁昌均
今年以來,AI算力持續(xù)緊缺。物以稀為貴,漲價也成了必然。自11月份以來,國內(nèi)不少算力服務(wù)公司開啟調(diào)價,漲價50%,甚至直接翻倍。
算力概念股也頗受資本市場關(guān)注,11月初在北交所掛牌的并行科技,作為第一家提供超算和智算服務(wù)的A股上市公司,股價也迎來暴漲。
近日,并行科技董事長陳健在與搜狐科技的獨家對話中認(rèn)為,算力漲價將是短期行為。“算力最終是靠成本定價,供需關(guān)系是局部因素。”他表示,算力成本未來會越來越低,核心在于制程和設(shè)計架構(gòu)的進步。
陳健判斷,當(dāng)計算需求的量足夠大的時候,訓(xùn)練和推理都會有專用芯片,GPU也許會被淘汰。“為什么英偉達還在瘋狂往前跑?因為有不少人在做專用芯片,這對它來說是很大的威脅。”
談及今年以來的算力荒,陳健最直接的感受是來尋求合作的企業(yè)變多。“算力需求爆發(fā)式增長,ChatGPT之后,算力需求出現(xiàn)了量級增長,導(dǎo)致已有算力不夠,供需關(guān)系失衡。”
不過,陳健強調(diào)稱,目前市場并不是所有的算力都缺,缺的只有大規(guī)模并行計算的算力需求。通用大模型訓(xùn)練即是標(biāo)準(zhǔn)的大規(guī)模并行計算,而這方面目前對國外芯片依賴較大。
今年10月底,美國收緊出口管制,A800/H800供應(yīng)被掐斷。早前報道稱,英偉達將為中國市場開發(fā)三款特供算力芯片——HGXH20、L20PCle和L2PCle,但何時量產(chǎn)還未確認(rèn)。
“這不會阻礙我們訓(xùn)練大模型的步伐,但可能不得不付出更高的成本去解決。”陳健表示,“我們肯定會往前走,相信差距會隨著時間而縮短。”
陳健認(rèn)為,目前市場頭部算力需求在變大,從千卡到萬卡,而國內(nèi)能跑萬卡規(guī)模的算力集群基本集中在頭部互聯(lián)網(wǎng)企業(yè),它們都是優(yōu)先供自己去訓(xùn)練通用大模型。不久前,阿里云就暫停對外提供A100云服務(wù)器的算力服務(wù)。
在陳健看來,通用大模型有看得見、摸得著的資金門檻,而行業(yè)模型、推理需求都在快速增長,未來算力需求也必然會從訓(xùn)練端轉(zhuǎn)向推理端。
“我們期待國產(chǎn)芯片盡快進入主流。”陳健在對話中呼吁。他認(rèn)為,目前國內(nèi)芯片在大模型大規(guī)模訓(xùn)練上尚有差距,而推理更多是性價比的競爭,對國內(nèi)來說不是卡脖子的地方。
在先進芯片受限的情況下,國內(nèi)也需要找到更多的突破點。陳健提到,國產(chǎn)芯片在軟件、算法等層面存在優(yōu)化機會。
“軟件和硬件的問題,其實都是時間問題。”陳健認(rèn)為,國產(chǎn)化現(xiàn)在遇到的最大問題是沒有市場,沒有機會去迭代。“這個是雞生蛋、蛋生雞的問題,這事有解但不好解決。”
英偉達如今的市場地位,正是得益于建立了完整的軟硬件生態(tài)。陳健強調(diào)稱,軟件跟硬件適配,一定要有人去做這件事,而華為在這方面最有希望勝出。
以下是對話精編:
搜狐科技:今年算力持續(xù)短缺,全球都在搶算力,您是什么樣的感受?現(xiàn)在最缺哪種算力?
陳健:從我們的角度來說,叫算力需求爆發(fā)式增長。算力荒跟供求失衡直接相關(guān),ChatGPT出現(xiàn)之后,尤其是2月爆火后,算力需求發(fā)生了量級的增長,可能不止十倍的增長,所以會顯得市場上缺算力。隨著時間推移,算力供給會持續(xù)上升。對我們來說,預(yù)示著大量的新的機會,這幾個月找我們合作的企業(yè)變多。
其實市場上也有大量閑置算力,小規(guī)模計算、大規(guī)模超算等還是供大于求,中小規(guī)模模型的訓(xùn)練不缺算力,現(xiàn)在只缺大規(guī)模并行計算的算力,有幾家訓(xùn)練大模型的企業(yè)需要上萬卡的規(guī)模,而現(xiàn)在全國范圍內(nèi)能跑萬卡的算力集群屈指可數(shù),都集中在頭部的互聯(lián)網(wǎng)企業(yè),但真的拿出來做算力服務(wù)的基本沒有。
搜狐科技:最近不少算力公司漲價,甚至翻倍,能持續(xù)嗎?算力高成本的情況能否緩解?
陳健:都是短期行為,原因就是供給變化。算力最終是靠成本定價,特別大量的東西是靠成本定價,供需關(guān)系永遠都是局部的因素。算力供給會持續(xù)上升,各種各樣的新算力也會不斷出現(xiàn),實現(xiàn)供需平衡很難,而且大概率最終是供大于求,因為供不應(yīng)求的時候,就有商業(yè)價值,會有無數(shù)人蜂擁而上。
隨著時間推移,算力成本越來越低,核心就是制程和設(shè)計架構(gòu)的進步。從CPU到GPU,到專用的FPGA,再到專用的AISC芯片,速度會迎來越快�,F(xiàn)在有很多企業(yè)在做訓(xùn)練和推理的專用芯片,GPU也許有一天會被淘汰。
當(dāng)計算需求的量足夠大的時候,用不了多久專用芯片就會出現(xiàn),市場足夠大就會有人用。但為什么英偉達還在瘋狂往前跑?因為已有不少人在做專用芯片,這對它來說是很大的威脅。
搜狐科技:現(xiàn)在很多大廠都說對外提供算力服務(wù),但阿里云前面暫停了A100服務(wù),怎么看大廠在算力市場中的角色?
陳健:頭部互聯(lián)網(wǎng)企業(yè)的算力實際上是優(yōu)先供自己去訓(xùn)練通用大模型。算力服務(wù)就像供水供電的基礎(chǔ)服務(wù),想象空間有多大?盈利空間是擠出來的,客觀來說不是特別高大上。但大模型太有想象空間,更具商業(yè)價值,所以對于大廠來說,算力為什么要給競爭對手用?這也可以算是一種競爭策略。
今天國內(nèi)還在瘋狂投入通用大模型的企業(yè),一年能投十億級別算力的基本就頭部這幾家。大家已經(jīng)看得很明白,誰有錢?大廠,還有幾家拿了幾十億的頭部創(chuàng)業(yè)公司,這就是看得見、摸得著的資金門檻,中部企業(yè)已經(jīng)知道在通用大模型競爭中沒有機會勝出,但行業(yè)模型、推理的算力需求還在快速增長。
搜狐科技:現(xiàn)在買不到高性能的芯片,英偉達稱會再推出合規(guī)芯片,這對國內(nèi)AI大模型的發(fā)展會有什么影響?
陳健:有比沒有好,英偉達通過這種方式,多掙好幾倍的錢,我們期待國產(chǎn)芯片盡快進入主流。禁售不會阻礙我們訓(xùn)練大模型的步伐,但可能不得不付出更高的成本,需要花更多的錢買更多的卡,比如原來100張就行,但現(xiàn)在可能要300張或500張才行。
搜狐科技:除了要買更多的卡,技術(shù)上有什么辦法能夠解決算力不夠的問題?
陳�。寒�(dāng)然有辦法,有很多軟件技術(shù)可以使用。性能是硬件上跑在軟件表現(xiàn)出來,硬件往前走,軟件往前走,算法也在往前走,這些共同組合后,達到最后的優(yōu)化效果�,F(xiàn)在有效計算比較低,還有大量優(yōu)化的空間,這是軟件工程師的機會。做大規(guī)模并行也有極限,到一定規(guī)模后加速比曲線到頂,這跟應(yīng)用程序直接相關(guān),取決于什么算法。
搜狐科技:國內(nèi)包括大廠和不少創(chuàng)業(yè)企業(yè)都在做AI芯片,您認(rèn)為替代水平如何?現(xiàn)在面臨的主要問題是什么?
陳�。捍竽P陀�(xùn)練是標(biāo)準(zhǔn)的大規(guī)模并行計算,對算力要求很高,是GPU超級計算機的綜合比拼,國內(nèi)在這塊差距比較明顯。千卡規(guī)模以上涉及到的技術(shù)點很多,還有失效率等很多問題需要解決。這已經(jīng)不是科學(xué)問題,更多是工程化方面的難題。中小規(guī)模的訓(xùn)練,海量小規(guī)模計算的推理,更多是性價比的競爭,不是卡脖子的地方,國內(nèi)替代都沒問題。
天下技術(shù),無堅不破,唯快不破,時間問題,人家做到3納米,我們?nèi)绻霾坏?納米,那就退到14納米。我們肯定會往前走,相信差距會隨著時間而縮短。對我們的封鎖,會讓我們更強大。
軟件和硬件的問題,我們肯定搞得定,是個時間問題�,F(xiàn)在國產(chǎn)化遇到的最大問題是沒有市場,沒有機會去迭代。這個就是雞生蛋、蛋生雞的問題,用的人多就會變得好用,好用的話用的人就多,這事有解但不好解決。
搜狐科技:從企業(yè)角度來看,這個問題應(yīng)該怎么解決?國內(nèi)誰能夠跑出來?
陳�。何以瓉碓谟⑻貭栕鲕浖こ處煟豢钚滦酒鰜碇�,在生態(tài)就緒的情況下,依然有1萬名工程師在推廣,去給所有軟件公司做適配。國內(nèi)誰有?我個人認(rèn)為華為有可能勝出。所有的能用、好用都是用出來的,軟件要跟硬件適配,一定需要有人去做這件事。
以前說花10億做一款芯片,但需要花100億解決推廣過程中的所有問題。大家準(zhǔn)備好了前面那10億,沒有準(zhǔn)備好后邊的100億。我個人認(rèn)為,華為準(zhǔn)備好了。我們也在2018年加入鯤鵬的凌云計劃,堅定不移支持國產(chǎn)算力發(fā)展。
搜狐科技:業(yè)內(nèi)呼吁建立全國算力一張網(wǎng),這能解決算力不足的問題嗎?對國家支持算力發(fā)展方面有什么樣的希望?
陳�。喝珖簧俚胤蕉荚诮ㄖ撬阒行模ブС肿约旱钠髽I(yè),因為看到大模型企業(yè)未來比較強的商業(yè)價值。但如果供給和市場需求脫節(jié),智算中心可能做不好,做好了也許能收回成本。
全國一張網(wǎng)肯定是對的,但很難解決頭部萬卡需求的問題,它更多還是技術(shù)問題。一個可能的解決辦法是聯(lián)合多家企業(yè)投資,共同投資運營,相當(dāng)于共享模式。如果國家想支持人工智能產(chǎn)業(yè)的發(fā)展,盡量投資到需求端,不要投到供給端,因為非常有可能增加的供給不是需求端需要的算力,要讓需求端用腳投票,誰做得好投給誰,市場自然就活了。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...