AI原生時(shí)代，大模型創(chuàng)業(yè)有“捷徑”

2023/11/16 10:22 DoNews

　　一年前ChatGPT橫空出世的時(shí)候，它之所以能引發(fā)圍觀人群的驚嘆，乃至把這輪已經(jīng)跌入情緒和現(xiàn)實(shí)雙重深淵的人工智能行業(yè)搶救過(guò)來(lái)，是因?yàn)樗啾却饲暗娜斯ぶ悄墚a(chǎn)品跨越式地產(chǎn)生了智能的“涌現(xiàn)”。

　　所謂“涌現(xiàn)”是指構(gòu)成復(fù)雜系統(tǒng)的多個(gè)個(gè)體組件，在相互作用的過(guò)程中，于系統(tǒng)層面產(chǎn)生了這些個(gè)體所不具有的新特性。例如像螞蟻這樣的生物，單個(gè)的個(gè)體表現(xiàn)不出任何高等的意識(shí)，但蟻群這個(gè)系統(tǒng)卻可以建造巨大的巢穴，在巢穴里塞滿食物，并通過(guò)明確的分工合作完成復(fù)雜的任務(wù)。有研究人員認(rèn)為，由神經(jīng)元構(gòu)成的大腦也是這樣通過(guò)這類局部作用，在個(gè)體層面“涌現(xiàn)”出意識(shí)的。

　　ChatGPT所涌現(xiàn)出的能力令OpenAI自身的開發(fā)者都感到意外，冥冥中似乎人類已經(jīng)隱約觸摸到了通向AGI的終極道路。這樣的前景很難不令從業(yè)者感到心潮澎湃，對(duì)于中國(guó)的互聯(lián)網(wǎng)企業(yè)尤其如此。一個(gè)保守的估計(jì)是，目前國(guó)內(nèi)研發(fā)的大模型總數(shù)已經(jīng)超過(guò)了200個(gè)。這個(gè)現(xiàn)象當(dāng)然首先反映出在人工智能領(lǐng)域，以及更廣泛的計(jì)算機(jī)科學(xué)和IT產(chǎn)業(yè)方面，我們已經(jīng)處于或者起碼非常接近世界領(lǐng)先水平。

　　然而，與制造大模型的狂熱相比，國(guó)內(nèi)對(duì)于在大模型之上構(gòu)建AI原生應(yīng)用的熱情似乎要冷淡得多。百度創(chuàng)始人李彥宏10月15日在西麗湖論壇上提到，中國(guó)目前的AI原生應(yīng)用很難說(shuō)出個(gè)一二來(lái)，而國(guó)外除了幾十個(gè)基礎(chǔ)大模型之外，已經(jīng)有上千個(gè)AI原生應(yīng)用，這是現(xiàn)在中國(guó)市場(chǎng)上所沒(méi)有的。

　　在《深渡》看來(lái)，基于大模型本身的特征和可能的發(fā)展路徑來(lái)說(shuō)，上述這種“爭(zhēng)模型輕應(yīng)用”的現(xiàn)象其實(shí)并不合理。更恰當(dāng)?shù)男袠I(yè)模式應(yīng)該轉(zhuǎn)過(guò)來(lái)：制造大模型需要理性慎重，而業(yè)界參與大模型浪潮的激情和狂熱，應(yīng)該導(dǎo)向?qū)ふ覒?yīng)用大模型這個(gè)出口上來(lái)。

　　制造大模型需“冷靜”

　　國(guó)內(nèi)的大模型從數(shù)量上講，應(yīng)該已經(jīng)確定性地超過(guò)了美國(guó)。

　　促成這個(gè)現(xiàn)實(shí)的最重要原因，是很多企業(yè)選擇建造專有大模型，這些專有大模型通常宣稱基于各自所在的行業(yè)，因而在特定場(chǎng)景下有著更好的表現(xiàn)。

　　然而實(shí)際情況是，這些專有大模型在智能“涌現(xiàn)”上往往跟頭部產(chǎn)品相差甚遠(yuǎn)，它們基本談不上創(chuàng)造多少真實(shí)價(jià)值，更多的作用體現(xiàn)在企業(yè)對(duì)自身技術(shù)實(shí)力的PR宣傳上面。

　　這些專有模型面臨的障礙主要就在大模型的“大”上面。

　　OpenAI在ChatGPT上取得成功的根本原因，并非理論上有重大突破，比如作為大模型關(guān)鍵支撐的Transformer架構(gòu)，早在2017年就由谷歌的科研團(tuán)隊(duì)提出了。ChatGPT的成功歸根結(jié)底是“暴力美學(xué)”的勝利，是量變引發(fā)的質(zhì)變。

　　這也意味著只有當(dāng)參數(shù)規(guī)模足夠大，訓(xùn)練的語(yǔ)料足夠多，模型才會(huì)在超過(guò)某個(gè)門檻后涌現(xiàn)出智能。但是對(duì)于今天國(guó)內(nèi)很多自制大模型的科技企業(yè)來(lái)說(shuō)，他們的技術(shù)實(shí)力和所能支配的資源，其實(shí)并不足以幫助他們邁過(guò)這個(gè)門檻。

　　比如，我們可以從最直觀的參數(shù)規(guī)模來(lái)考慮問(wèn)題。在今年五月底的中關(guān)村論壇上，有業(yè)內(nèi)機(jī)構(gòu)發(fā)布了《中國(guó)人工智能大模型地圖研究報(bào)告》。這份報(bào)告提到中國(guó)當(dāng)時(shí)有超過(guò)79個(gè)大模型，但使用的標(biāo)準(zhǔn)是“參數(shù)規(guī)模在10億以上”。一個(gè)自然的疑問(wèn)是，“10億參數(shù)”能達(dá)到智能涌現(xiàn)的門檻嗎?

　　合理的猜測(cè)，大概是不能的。

　　因?yàn)樵缭?019年OpenAI開源的GPT-2就使用了15億個(gè)參數(shù)，但當(dāng)時(shí)這個(gè)模型的最大用途是用來(lái)生成fake news。作為對(duì)比，去年底首次亮相的GPT-3.5，參數(shù)規(guī)模達(dá)到了1750億。也就是說(shuō)，在超過(guò)100倍的量變過(guò)后，GPT-3.5才真正產(chǎn)生了令人驚艷的“智能涌現(xiàn)”。

　　而從GPT-3.5到GPT-4，模型的參數(shù)規(guī)模甚至進(jìn)一步擴(kuò)張。七月份的一篇論文提到，GPT-4包含了1.8萬(wàn)億參數(shù)，相比GPT-3.5又增長(zhǎng)了一個(gè)數(shù)量級(jí)。對(duì)應(yīng)的，GPT-4的單次訓(xùn)練成本也從GPT-3的460萬(wàn)美元大幅增加到6300萬(wàn)美元。

　　即便是阿爾特曼，也曾在接受采訪時(shí)表示：“我們要成功完成任務(wù)所需的資金比我最初想象的要多得多”。根據(jù)《財(cái)富》的報(bào)道，去年OpenAI收入為3000萬(wàn)美元，但凈虧損總額超過(guò)5億美元。

　　在ChatGPT發(fā)布后，與大部分普通人的驚訝和雀躍相反，很多高校實(shí)驗(yàn)室里搞自然語(yǔ)言處理(NLP)的研究人員發(fā)出了“NLP已死”的感嘆。一方面，ChatGPT的問(wèn)世代表著NLP領(lǐng)域的突破性成果。但另一方面，大模型訓(xùn)練所需要的龐大開銷，也意味著大部分實(shí)驗(yàn)室今后不再有能力跟進(jìn)這個(gè)前沿領(lǐng)域的很多最新進(jìn)展。

　　毫無(wú)疑問(wèn)，對(duì)于絕大部分企業(yè)來(lái)說(shuō)，這個(gè)邏輯同樣成立，既沒(méi)有能力也沒(méi)有必要去“重復(fù)造大模型的輪子”。

　　從PC時(shí)代到移動(dòng)互聯(lián)網(wǎng)時(shí)代，再到如今由生成式大模型引領(lǐng)的AI時(shí)代，每個(gè)時(shí)代都有作為支撐的基礎(chǔ)技術(shù)底座。而一個(gè)越來(lái)越顯著的趨勢(shì)是，大模型正在取代Windows和后來(lái)的iOS/Android，成為AI時(shí)代的操作系統(tǒng)。

　　從商業(yè)模式上講，這的確又是一個(gè)締造世界上最偉大科技公司的絕妙機(jī)會(huì)。只是這一次的勝利者，絕對(duì)不會(huì)像當(dāng)初Apple起步一樣，從喬布斯的車庫(kù)里冒出來(lái)。

　　對(duì)于那些希望抓住大模型浪潮的絕大部分公司而言，登上這列火車的最好機(jī)會(huì)一定不是“買卡、囤芯片、建智算中心，從頭訓(xùn)練自己的專用大模型”。而是應(yīng)該像李彥宏說(shuō)的，將基礎(chǔ)大模型的通用能力和行業(yè)領(lǐng)域的專有能力相結(jié)合。這種“大模型套小模型”的產(chǎn)業(yè)化模式，能夠很好結(jié)合兩方面的優(yōu)點(diǎn)：專用的小模型反應(yīng)快，成本低;大模型更智能，可以用來(lái)兜底。

　　從行業(yè)發(fā)展態(tài)勢(shì)看，目前其實(shí)已經(jīng)有大批嗅覺(jué)靈敏的公司在這么做了。李彥宏在15日的演講中就提到，8月31號(hào)開放以來(lái)，文心大模型的API調(diào)用量，呈現(xiàn)指數(shù)級(jí)的增長(zhǎng)趨勢(shì)：“國(guó)內(nèi)有200多個(gè)大模型，很多上了這個(gè)榜單、那個(gè)排名，其實(shí)都沒(méi)有什么使用量。文心大模型一家的調(diào)用量恐怕比所有那200家加起來(lái)的調(diào)用量還大”。

　　AI原生應(yīng)用大模型要“狂熱”

　　在大模型出現(xiàn)之前的十年里，科技行業(yè)其實(shí)已經(jīng)經(jīng)歷過(guò)好幾輪的技術(shù)熱潮。盡管沒(méi)有像黃仁勛把大模型出現(xiàn)稱為人工智能行業(yè)的“iPhone時(shí)刻”這么夸張，但在每一輪這樣的技術(shù)浪潮中，總會(huì)有大批的投資人和創(chuàng)業(yè)者因?yàn)槟骋粋€(gè)新奇的概念，蜂擁而入賭上自己的金錢和時(shí)間。

　　當(dāng)然，這些浪潮來(lái)得快退得更快，最后留下一地雞毛，區(qū)塊鏈、元宇宙、云計(jì)算和各種花樣的O2O都是些典型的例子。某種程度上說(shuō)，無(wú)論投資人還是從業(yè)者在這次大模型到來(lái)后，明顯吸取了過(guò)去的經(jīng)驗(yàn)教訓(xùn)，從一開始就對(duì)大模型的落地給予了更多的關(guān)注。

　　但需要注意的是，如我們?cè)谏厦嬉徽玛U述過(guò)的，在追求大模型落地的過(guò)程中，我們不應(yīng)該走制造一堆行業(yè)專用大模型的路子，因?yàn)檫@些不夠大因而不夠智能的“專用大模型”，并不能實(shí)現(xiàn)名實(shí)相符的價(jià)值創(chuàng)造。更優(yōu)的落地路徑是在一個(gè)強(qiáng)大的基礎(chǔ)大模型上面，去調(diào)用它的各項(xiàng)能力，開發(fā)出豐富的AI原生應(yīng)用。

　　不過(guò)相較于制造大模型的熱情，國(guó)內(nèi)從業(yè)者對(duì)于應(yīng)用大模型的氛圍似乎要低一些，后面這項(xiàng)事業(yè)是需要加一把火的。這跟國(guó)外的情況恰恰相反，因?yàn)榧幢闶俏④涍@個(gè)量級(jí)的公司也沒(méi)有自己另起爐灶蓋大模型，而是在努力把OpenAI的大模型吸納進(jìn)Office這一套生產(chǎn)力工具里。

　　其實(shí)，我們國(guó)內(nèi)是有領(lǐng)先的基礎(chǔ)大模型的，而且如李彥宏所說(shuō)，強(qiáng)大的基礎(chǔ)大模型，一定能驅(qū)動(dòng)AI原生應(yīng)用爆發(fā)。

　　今年3 月16日，百度率先發(fā)布了基于文心大模型3.0的文心一言產(chǎn)品。而在一個(gè)月前的2023百度世界大會(huì)上，文心大模型4.0也正式問(wèn)世。當(dāng)時(shí)，李彥宏以《手把手教你做AI原生應(yīng)用》為主題發(fā)表演講，現(xiàn)場(chǎng)開啟邀請(qǐng)測(cè)試，實(shí)地展現(xiàn)百度在AI領(lǐng)域?qū)崿F(xiàn)多維度的持續(xù)突破。憑借參數(shù)規(guī)模全球第一，文心大模型4.0的綜合能力“與GPT-4相比毫不遜色”，全面領(lǐng)跑全球AI行業(yè)。

　　基于迄今為止最強(qiáng)大的文心大模型，在理解、生成、邏輯和記憶四大能力上，文心4.0都有明顯提升。比如，在生成能力上，文心一言除了生成文字內(nèi)容，更包括了圖片、視頻、數(shù)字人等多模態(tài)內(nèi)容，可實(shí)現(xiàn)的創(chuàng)作體裁超過(guò)200種，涵蓋了幾乎所有寫作需求。在邏輯和記憶能力上，相比之前的版本也有了成倍提升。

　　大模型在智能涌現(xiàn)后出現(xiàn)的理解、生成、邏輯和記憶四大能力，是AI時(shí)代到來(lái)后最本質(zhì)的生產(chǎn)力革新。而與制造大模型本身的高門檻不同，今天的創(chuàng)業(yè)者同樣可以極其容易地通過(guò)接入文心一言這樣的大模型，通過(guò)應(yīng)用這四大能力徹底重構(gòu)自身產(chǎn)品的用戶體驗(yàn)。

　　事實(shí)上，為了幫助各行各業(yè)的客戶盡早用上大模型，百度在文心一言正式亮相的同一個(gè)月，就推出了文心千帆。文心千帆是全球首款一站式企業(yè)級(jí)大模型平臺(tái)，既提供像文心一言這樣領(lǐng)先的基礎(chǔ)大模型，也包含了開發(fā)大模型需要的工具鏈和配套環(huán)境。在隨后不到半年的時(shí)間里，千帆大模型平臺(tái)上月活企業(yè)數(shù)已近萬(wàn)家，覆蓋金融、制造、能源、政務(wù)、交通等行業(yè)的400多個(gè)場(chǎng)景。

　　大模型和生成式人工智能作為堪比工業(yè)革命的巨大機(jī)遇，已經(jīng)成為公眾共識(shí)。但目前來(lái)說(shuō)，無(wú)論國(guó)內(nèi)國(guó)外都還沒(méi)有出現(xiàn)跨時(shí)代的AI原生應(yīng)用，這是一塊急需填補(bǔ)的“權(quán)力真空”。李彥宏在今天的演講中表達(dá)了同樣的遺憾和期待：

　　就像移動(dòng)時(shí)代誕生了像微信、抖音、Uber這樣的“mobile-native”的應(yīng)用一樣，AI原生時(shí)代一定會(huì)有優(yōu)秀的AI原生應(yīng)用是基于這些大模型開發(fā)出來(lái)的。

　　記住，是基于最好的基礎(chǔ)大模型去開發(fā)應(yīng)用，這是比制造大模型更容易成功的“捷徑”。

　　結(jié)語(yǔ)

　　在《深渡》看來(lái)，大模型掀起的這輪AI革命來(lái)得再恰當(dāng)不過(guò)。因?yàn)橄噍^于過(guò)去那些科技變革，以文心一言為代表的國(guó)內(nèi)基礎(chǔ)大模型，表明國(guó)內(nèi)的技術(shù)水平已經(jīng)站到了跟國(guó)外頂尖同行并駕齊驅(qū)的位置。對(duì)于那些腦袋靈光夢(mèng)想遠(yuǎn)大的龐大創(chuàng)業(yè)者群體而言，這在某種程度上是從未有過(guò)的“幸運(yùn)”。

　　當(dāng)然，前提是他們要選對(duì)切入這條賽道的方向，在制造大模型上多一點(diǎn)冷靜，而在應(yīng)用大模型上不妨狂熱一些。

　　榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn（把#換成@）。

海報(bào)生成中...

分享到微博分享到微信一鍵復(fù)制

標(biāo)題鏈接已成功復(fù)制

免费观看已满十八岁电视剧国语_人妻色综合网站_欧美大尺寸suv视频_成人免费高清在线观看_久久久成人毛片无码_老头解开奶罩吸奶头高潮视频_sm调教室论坛入口_欧美夫妻交换久久丫1000_一级黄色大片在线免费观看了

AI原生時(shí)代，大模型創(chuàng)業(yè)有“捷徑”

最新新聞

熱門新聞

新動(dòng)態(tài)

關(guān)注度

最話題

免费观看已满十八岁电视剧国语_人妻 色综合网站_欧美大尺寸suv视频_成人免费高清在线观看_久久久成人毛片无码_老头解开奶罩吸奶头高潮视频_sm调教室论坛入口_欧美夫妻交换久久丫1000_一级黄色大片在线免费观看了

AI原生時(shí)代，大模型創(chuàng)業(yè)有“捷徑”

相關(guān)閱讀

最新新聞

熱門新聞

新動(dòng)態(tài)

關(guān)注度

最話題

免费观看已满十八岁电视剧国语_人妻色综合网站_欧美大尺寸suv视频_成人免费高清在线观看_久久久成人毛片无码_老头解开奶罩吸奶头高潮视频_sm调教室论坛入口_欧美夫妻交换久久丫1000_一级黄色大片在线免费观看了