今年1月,DeepSeek發(fā)布的R1模型不僅是一次普通的AI公告,更被譽(yù)為科技行業(yè)的“分水嶺”,其影響力震動(dòng)了整個(gè)科技行業(yè),迫使行業(yè)領(lǐng)導(dǎo)者重新思考AI開(kāi)發(fā)的基本方法。DeepSeek的非凡成就并非源于新穎的功能,而是它以極低的成本實(shí)現(xiàn)了與科技巨頭相媲美的成果,這標(biāo)志著AI發(fā)展正沿著“效率”和“計(jì)算”兩條并行軌道快速前進(jìn)。
在約束中創(chuàng)新:低成本實(shí)現(xiàn)高性能
DeepSeek的異軍突起令人矚目,它展現(xiàn)了即使在重大限制下,創(chuàng)新也能蓬勃發(fā)展的能力。面對(duì)美國(guó)對(duì)尖端AI芯片的出口管制,DeepSeek被迫尋找AI發(fā)展的其他途徑。當(dāng)美國(guó)公司通過(guò)更強(qiáng)大的硬件、更大的模型和更優(yōu)質(zhì)的數(shù)據(jù)追求性能提升時(shí),DeepSeek則專(zhuān)注于優(yōu)化現(xiàn)有資源,以卓越的執(zhí)行力將已知理念付諸實(shí)踐,這本身就是一種創(chuàng)新。
這種效率至上的理念帶來(lái)了令人矚目的成果。據(jù)報(bào)道,DeepSeek的R1模型性能可媲美OpenAI,但運(yùn)營(yíng)成本僅為后者的5%到10%。更令人震驚的是,DeepSeek前身V3的最終訓(xùn)練運(yùn)行成本僅為600萬(wàn)美元,與美國(guó)競(jìng)爭(zhēng)對(duì)手動(dòng)輒數(shù)千萬(wàn)甚至數(shù)億美元的投入相比,這筆預(yù)算被特斯拉前AI科學(xué)家Andrej Karpathy稱(chēng)為“笑話(huà)”。據(jù)報(bào)道,OpenAI花費(fèi)5億美元訓(xùn)練其最新的“Orion”模型,而DeepSeek僅花費(fèi)560萬(wàn)美元就取得了卓越的基準(zhǔn)測(cè)試結(jié)果,不到OpenAI投資的1.2%。
值得注意的是,DeepSeek實(shí)現(xiàn)這些成果并非完全處于芯片劣勢(shì)。美國(guó)最初的出口管制主要針對(duì)計(jì)算能力,而非內(nèi)存和網(wǎng)絡(luò)——而內(nèi)存和網(wǎng)絡(luò)是AI發(fā)展的關(guān)鍵要素。這意味著DeepSeek使用的芯片具備良好的網(wǎng)絡(luò)和內(nèi)存功能,使其能夠在多個(gè)單元之間并行執(zhí)行操作,這是高效運(yùn)行大型模型的關(guān)鍵策略。再加上中國(guó)在人工智能基礎(chǔ)設(shè)施垂直堆棧上的大力推動(dòng),進(jìn)一步加速了這種創(chuàng)新。
實(shí)用主義數(shù)據(jù)策略:合成數(shù)據(jù)與模型架構(gòu)優(yōu)化
除了硬件優(yōu)化,DeepSeek的訓(xùn)練數(shù)據(jù)方法也獨(dú)具一格。據(jù)報(bào)道,DeepSeek并非僅僅依賴(lài)從網(wǎng)絡(luò)抓取的內(nèi)容,而是利用了大量的合成數(shù)據(jù)和其他專(zhuān)有模型的輸出,這正是模型蒸餾的經(jīng)典示例。盡管這種方法可能引發(fā)西方企業(yè)客戶(hù)的數(shù)據(jù)隱私和治理?yè)?dān)憂(yōu),但它凸顯了DeepSeek注重結(jié)果而非過(guò)程的務(wù)實(shí)作風(fēng)。
有效利用合成數(shù)據(jù)是DeepSeek的關(guān)鍵差異化因素。DeepSeek等基于Transformer且采用混合專(zhuān)家(MoE)架構(gòu)的模型在整合合成數(shù)據(jù)時(shí)更加穩(wěn)健,而傳統(tǒng)密集架構(gòu)的模型若過(guò)度使用合成數(shù)據(jù)可能導(dǎo)致性能下降甚至“模型崩潰”。DeepSeek的工程團(tuán)隊(duì)在最初規(guī)劃階段就專(zhuān)門(mén)設(shè)計(jì)了模型架構(gòu),將合成數(shù)據(jù)集成納入考量,從而在不犧牲性能的情況下充分利用合成數(shù)據(jù)的成本效益。
市場(chǎng)反響:重塑AI行業(yè)格局
DeepSeek的崛起已引發(fā)行業(yè)領(lǐng)導(dǎo)者的實(shí)質(zhì)性戰(zhàn)略轉(zhuǎn)變。例如,OpenAI首席執(zhí)行官Sam Altman近期宣布計(jì)劃發(fā)布公司自2019年以來(lái)首個(gè)“開(kāi)放權(quán)重”語(yǔ)言模型。DeepSeek和Llama的成功似乎給OpenAI帶來(lái)了巨大沖擊。DeepSeek推出僅一個(gè)月后,Altman便承認(rèn)OpenAI在開(kāi)源AI方面“站在了歷史的錯(cuò)誤一邊”。
面對(duì)每年高達(dá)70億至80億美元的運(yùn)營(yíng)成本,DeepSeek等高效替代方案帶來(lái)的經(jīng)濟(jì)壓力已不容忽視。正如人工智能學(xué)者李開(kāi)復(fù)所言,競(jìng)爭(zhēng)對(duì)手的免費(fèi)開(kāi)源模型正迫使OpenAI做出改變。盡管OpenAI進(jìn)行了400億美元的巨額融資,公司估值達(dá)到3000億美元,但其方法比DeepSeek耗費(fèi)更多資源的根本挑戰(zhàn)依然存在。
超越模型訓(xùn)練:邁向“測(cè)試時(shí)計(jì)算”和自主評(píng)估
DeepSeek還加速了向“測(cè)試時(shí)計(jì)算”(TTC)的轉(zhuǎn)變。隨著預(yù)訓(xùn)練模型對(duì)公共數(shù)據(jù)利用接近飽和,數(shù)據(jù)稀缺正在減緩預(yù)訓(xùn)練的進(jìn)一步改進(jìn)。為解決此問(wèn)題,DeepSeek宣布與清華大學(xué)合作,實(shí)現(xiàn)“自我原則性評(píng)論調(diào)優(yōu)”(SPCT),即AI開(kāi)發(fā)自己的內(nèi)容評(píng)判規(guī)則,并利用這些規(guī)則提供詳細(xì)評(píng)論,包含內(nèi)置的“評(píng)委”實(shí)時(shí)評(píng)估AI的答案。
這項(xiàng)進(jìn)展是AI系統(tǒng)自主評(píng)估和改進(jìn)運(yùn)動(dòng)的一部分,模型利用推理時(shí)間來(lái)改進(jìn)結(jié)果,而非簡(jiǎn)單地增大模型規(guī)模。DeepSeek將其系統(tǒng)稱(chēng)為“DeepSeek-GRM”(通用獎(jiǎng)勵(lì)模型)。然而,這種方法也伴隨著風(fēng)險(xiǎn):如果AI制定自己的評(píng)判標(biāo)準(zhǔn),可能偏離人類(lèi)價(jià)值觀、倫理道德,甚至強(qiáng)化錯(cuò)誤的假設(shè)或幻覺(jué),引發(fā)對(duì)AI自主判斷的深層擔(dān)憂(yōu)。盡管如此,DeepSeek再次在他人工作的基礎(chǔ)上,創(chuàng)建了可能是SPCT在商業(yè)上的第一個(gè)全棧應(yīng)用程序。這可能標(biāo)志著AI自主性的重大轉(zhuǎn)變,但仍需嚴(yán)格的審計(jì)、透明度和保障措施。
展望未來(lái):適應(yīng)與變革
綜合來(lái)看,DeepSeek的崛起預(yù)示著人工智能行業(yè)將朝著并行創(chuàng)新軌道邁進(jìn)。在各大公司持續(xù)構(gòu)建更強(qiáng)大的計(jì)算集群的同時(shí),它們也將重點(diǎn)關(guān)注通過(guò)軟件工程和模型架構(gòu)改進(jìn)來(lái)提升效率,以應(yīng)對(duì)AI能耗帶來(lái)的挑戰(zhàn)。微軟已停止了全球多個(gè)地區(qū)的數(shù)據(jù)中心建設(shè),轉(zhuǎn)向更加分布式、高效的基礎(chǔ)設(shè)施建設(shè),并計(jì)劃重新分配資源以應(yīng)對(duì)DeepSeek帶來(lái)的效率提升。Meta也發(fā)布了首次采用MoE架構(gòu)的Llama4模型系列,并將其與DeepSeek模型進(jìn)行基準(zhǔn)測(cè)試,這標(biāo)志著中國(guó)AI模型已成為硅谷公司值得參考的基準(zhǔn)。
頗具諷刺意味的是,美國(guó)原本旨在維護(hù)其AI主導(dǎo)地位的制裁,反而加速了其試圖遏制的創(chuàng)新。展望未來(lái),隨著行業(yè)在全球范圍內(nèi)的持續(xù)發(fā)展,所有參與者的適應(yīng)能力將成為關(guān)鍵。政策、人員和市場(chǎng)反應(yīng)將繼續(xù)改變基本規(guī)則,我們彼此之間如何學(xué)習(xí),以及如何應(yīng)對(duì),值得持續(xù)關(guān)注。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...