免费观看已满十八岁电视剧国语_人妻 色综合网站_欧美大尺寸suv视频_成人免费高清在线观看_久久久成人毛片无码_老头解开奶罩吸奶头高潮视频_sm调教室论坛入口_欧美夫妻交换久久丫1000_一级黄色大片在线免费观看了

首頁(yè) > 資訊 > 數(shù)字化

AI原生時(shí)代,大模型創(chuàng)業(yè)有“捷徑”

2023/11/16 10:22      DoNews


  一年前ChatGPT橫空出世的時(shí)候,它之所以能引發(fā)圍觀人群的驚嘆,乃至把這輪已經(jīng)跌入情緒和現(xiàn)實(shí)雙重深淵的人工智能行業(yè)搶救過(guò)來(lái),是因?yàn)樗啾却饲暗娜斯ぶ悄墚a(chǎn)品跨越式地產(chǎn)生了智能的“涌現(xiàn)”。

  所謂“涌現(xiàn)”是指構(gòu)成復(fù)雜系統(tǒng)的多個(gè)個(gè)體組件,在相互作用的過(guò)程中,于系統(tǒng)層面產(chǎn)生了這些個(gè)體所不具有的新特性。例如像螞蟻這樣的生物,單個(gè)的個(gè)體表現(xiàn)不出任何高等的意識(shí),但蟻群這個(gè)系統(tǒng)卻可以建造巨大的巢穴,在巢穴里塞滿食物,并通過(guò)明確的分工合作完成復(fù)雜的任務(wù)。有研究人員認(rèn)為,由神經(jīng)元構(gòu)成的大腦也是這樣通過(guò)這類局部作用,在個(gè)體層面“涌現(xiàn)”出意識(shí)的。

  ChatGPT所涌現(xiàn)出的能力令OpenAI自身的開發(fā)者都感到意外,冥冥中似乎人類已經(jīng)隱約觸摸到了通向AGI的終極道路。這樣的前景很難不令從業(yè)者感到心潮澎湃,對(duì)于中國(guó)的互聯(lián)網(wǎng)企業(yè)尤其如此。一個(gè)保守的估計(jì)是,目前國(guó)內(nèi)研發(fā)的大模型總數(shù)已經(jīng)超過(guò)了200個(gè)。這個(gè)現(xiàn)象當(dāng)然首先反映出在人工智能領(lǐng)域,以及更廣泛的計(jì)算機(jī)科學(xué)和IT產(chǎn)業(yè)方面,我們已經(jīng)處于或者起碼非常接近世界領(lǐng)先水平。

  然而,與制造大模型的狂熱相比,國(guó)內(nèi)對(duì)于在大模型之上構(gòu)建AI原生應(yīng)用的熱情似乎要冷淡得多。百度創(chuàng)始人李彥宏10月15日在西麗湖論壇上提到,中國(guó)目前的AI原生應(yīng)用很難說(shuō)出個(gè)一二來(lái),而國(guó)外除了幾十個(gè)基礎(chǔ)大模型之外,已經(jīng)有上千個(gè)AI原生應(yīng)用,這是現(xiàn)在中國(guó)市場(chǎng)上所沒(méi)有的。

  在《深渡》看來(lái),基于大模型本身的特征和可能的發(fā)展路徑來(lái)說(shuō),上述這種“爭(zhēng)模型輕應(yīng)用”的現(xiàn)象其實(shí)并不合理。更恰當(dāng)?shù)男袠I(yè)模式應(yīng)該轉(zhuǎn)過(guò)來(lái):制造大模型需要理性慎重,而業(yè)界參與大模型浪潮的激情和狂熱,應(yīng)該導(dǎo)向?qū)ふ覒?yīng)用大模型這個(gè)出口上來(lái)。

  制造大模型需“冷靜”

  國(guó)內(nèi)的大模型從數(shù)量上講,應(yīng)該已經(jīng)確定性地超過(guò)了美國(guó)。

  促成這個(gè)現(xiàn)實(shí)的最重要原因,是很多企業(yè)選擇建造專有大模型,這些專有大模型通常宣稱基于各自所在的行業(yè),因而在特定場(chǎng)景下有著更好的表現(xiàn)。

  然而實(shí)際情況是,這些專有大模型在智能“涌現(xiàn)”上往往跟頭部產(chǎn)品相差甚遠(yuǎn),它們基本談不上創(chuàng)造多少真實(shí)價(jià)值,更多的作用體現(xiàn)在企業(yè)對(duì)自身技術(shù)實(shí)力的PR宣傳上面。

  這些專有模型面臨的障礙主要就在大模型的“大”上面。

  OpenAI在ChatGPT上取得成功的根本原因,并非理論上有重大突破,比如作為大模型關(guān)鍵支撐的Transformer架構(gòu),早在2017年就由谷歌的科研團(tuán)隊(duì)提出了。ChatGPT的成功歸根結(jié)底是“暴力美學(xué)”的勝利,是量變引發(fā)的質(zhì)變。

  這也意味著只有當(dāng)參數(shù)規(guī)模足夠大,訓(xùn)練的語(yǔ)料足夠多,模型才會(huì)在超過(guò)某個(gè)門檻后涌現(xiàn)出智能。但是對(duì)于今天國(guó)內(nèi)很多自制大模型的科技企業(yè)來(lái)說(shuō),他們的技術(shù)實(shí)力和所能支配的資源,其實(shí)并不足以幫助他們邁過(guò)這個(gè)門檻。

  比如,我們可以從最直觀的參數(shù)規(guī)模來(lái)考慮問(wèn)題。在今年五月底的中關(guān)村論壇上,有業(yè)內(nèi)機(jī)構(gòu)發(fā)布了《中國(guó)人工智能大模型地圖研究報(bào)告》。這份報(bào)告提到中國(guó)當(dāng)時(shí)有超過(guò)79個(gè)大模型,但使用的標(biāo)準(zhǔn)是“參數(shù)規(guī)模在10億以上”。一個(gè)自然的疑問(wèn)是,“10億參數(shù)”能達(dá)到智能涌現(xiàn)的門檻嗎?

  合理的猜測(cè),大概是不能的。

  因?yàn)樵缭?019年OpenAI開源的GPT-2就使用了15億個(gè)參數(shù),但當(dāng)時(shí)這個(gè)模型的最大用途是用來(lái)生成fake news。作為對(duì)比,去年底首次亮相的GPT-3.5,參數(shù)規(guī)模達(dá)到了1750億。也就是說(shuō),在超過(guò)100倍的量變過(guò)后,GPT-3.5才真正產(chǎn)生了令人驚艷的“智能涌現(xiàn)”。

  而從GPT-3.5到GPT-4,模型的參數(shù)規(guī)模甚至進(jìn)一步擴(kuò)張。七月份的一篇論文提到,GPT-4包含了1.8萬(wàn)億參數(shù),相比GPT-3.5又增長(zhǎng)了一個(gè)數(shù)量級(jí)。對(duì)應(yīng)的,GPT-4的單次訓(xùn)練成本也從GPT-3的460萬(wàn)美元大幅增加到6300萬(wàn)美元。

  即便是阿爾特曼,也曾在接受采訪時(shí)表示:“我們要成功完成任務(wù)所需的資金比我最初想象的要多得多”。根據(jù)《財(cái)富》的報(bào)道,去年OpenAI收入為3000萬(wàn)美元,但凈虧損總額超過(guò)5億美元。

  在ChatGPT發(fā)布后,與大部分普通人的驚訝和雀躍相反,很多高校實(shí)驗(yàn)室里搞自然語(yǔ)言處理(NLP)的研究人員發(fā)出了“NLP已死”的感嘆。一方面,ChatGPT的問(wèn)世代表著NLP領(lǐng)域的突破性成果。但另一方面,大模型訓(xùn)練所需要的龐大開銷,也意味著大部分實(shí)驗(yàn)室今后不再有能力跟進(jìn)這個(gè)前沿領(lǐng)域的很多最新進(jìn)展。

  毫無(wú)疑問(wèn),對(duì)于絕大部分企業(yè)來(lái)說(shuō),這個(gè)邏輯同樣成立,既沒(méi)有能力也沒(méi)有必要去“重復(fù)造大模型的輪子”。

  從PC時(shí)代到移動(dòng)互聯(lián)網(wǎng)時(shí)代,再到如今由生成式大模型引領(lǐng)的AI時(shí)代,每個(gè)時(shí)代都有作為支撐的基礎(chǔ)技術(shù)底座。而一個(gè)越來(lái)越顯著的趨勢(shì)是,大模型正在取代Windows和后來(lái)的iOS/Android,成為AI時(shí)代的操作系統(tǒng)。

  從商業(yè)模式上講,這的確又是一個(gè)締造世界上最偉大科技公司的絕妙機(jī)會(huì)。只是這一次的勝利者,絕對(duì)不會(huì)像當(dāng)初Apple起步一樣,從喬布斯的車庫(kù)里冒出來(lái)。

  對(duì)于那些希望抓住大模型浪潮的絕大部分公司而言,登上這列火車的最好機(jī)會(huì)一定不是“買卡、囤芯片、建智算中心,從頭訓(xùn)練自己的專用大模型”。而是應(yīng)該像李彥宏說(shuō)的,將基礎(chǔ)大模型的通用能力和行業(yè)領(lǐng)域的專有能力相結(jié)合。這種“大模型套小模型”的產(chǎn)業(yè)化模式,能夠很好結(jié)合兩方面的優(yōu)點(diǎn):專用的小模型反應(yīng)快,成本低;大模型更智能,可以用來(lái)兜底。

  從行業(yè)發(fā)展態(tài)勢(shì)看,目前其實(shí)已經(jīng)有大批嗅覺(jué)靈敏的公司在這么做了。李彥宏在15日的演講中就提到,8月31號(hào)開放以來(lái),文心大模型的API調(diào)用量,呈現(xiàn)指數(shù)級(jí)的增長(zhǎng)趨勢(shì):“國(guó)內(nèi)有200多個(gè)大模型,很多上了這個(gè)榜單、那個(gè)排名,其實(shí)都沒(méi)有什么使用量。文心大模型一家的調(diào)用量恐怕比所有那200家加起來(lái)的調(diào)用量還大”。

  AI原生應(yīng)用大模型要“狂熱”

  在大模型出現(xiàn)之前的十年里,科技行業(yè)其實(shí)已經(jīng)經(jīng)歷過(guò)好幾輪的技術(shù)熱潮。盡管沒(méi)有像黃仁勛把大模型出現(xiàn)稱為人工智能行業(yè)的“iPhone時(shí)刻”這么夸張,但在每一輪這樣的技術(shù)浪潮中,總會(huì)有大批的投資人和創(chuàng)業(yè)者因?yàn)槟骋粋(gè)新奇的概念,蜂擁而入賭上自己的金錢和時(shí)間。

  當(dāng)然,這些浪潮來(lái)得快退得更快,最后留下一地雞毛,區(qū)塊鏈、元宇宙、云計(jì)算和各種花樣的O2O都是些典型的例子。某種程度上說(shuō),無(wú)論投資人還是從業(yè)者在這次大模型到來(lái)后,明顯吸取了過(guò)去的經(jīng)驗(yàn)教訓(xùn),從一開始就對(duì)大模型的落地給予了更多的關(guān)注。

  但需要注意的是,如我們?cè)谏厦嬉徽玛U述過(guò)的,在追求大模型落地的過(guò)程中,我們不應(yīng)該走制造一堆行業(yè)專用大模型的路子,因?yàn)檫@些不夠大因而不夠智能的“專用大模型”,并不能實(shí)現(xiàn)名實(shí)相符的價(jià)值創(chuàng)造。更優(yōu)的落地路徑是在一個(gè)強(qiáng)大的基礎(chǔ)大模型上面,去調(diào)用它的各項(xiàng)能力,開發(fā)出豐富的AI原生應(yīng)用。

  不過(guò)相較于制造大模型的熱情,國(guó)內(nèi)從業(yè)者對(duì)于應(yīng)用大模型的氛圍似乎要低一些,后面這項(xiàng)事業(yè)是需要加一把火的。這跟國(guó)外的情況恰恰相反,因?yàn)榧幢闶俏④涍@個(gè)量級(jí)的公司也沒(méi)有自己另起爐灶蓋大模型,而是在努力把OpenAI的大模型吸納進(jìn)Office這一套生產(chǎn)力工具里。

  其實(shí),我們國(guó)內(nèi)是有領(lǐng)先的基礎(chǔ)大模型的,而且如李彥宏所說(shuō),強(qiáng)大的基礎(chǔ)大模型,一定能驅(qū)動(dòng)AI原生應(yīng)用爆發(fā)。

  今年3 月16日,百度率先發(fā)布了基于文心大模型3.0的文心一言產(chǎn)品。而在一個(gè)月前的2023百度世界大會(huì)上,文心大模型4.0也正式問(wèn)世。當(dāng)時(shí),李彥宏以《手把手教你做AI原生應(yīng)用》為主題發(fā)表演講,現(xiàn)場(chǎng)開啟邀請(qǐng)測(cè)試,實(shí)地展現(xiàn)百度在AI領(lǐng)域?qū)崿F(xiàn)多維度的持續(xù)突破。憑借參數(shù)規(guī)模全球第一,文心大模型4.0的綜合能力“與GPT-4相比毫不遜色”,全面領(lǐng)跑全球AI行業(yè)。

  基于迄今為止最強(qiáng)大的文心大模型,在理解、生成、邏輯和記憶四大能力上,文心4.0都有明顯提升。比如,在生成能力上,文心一言除了生成文字內(nèi)容,更包括了圖片、視頻、數(shù)字人等多模態(tài)內(nèi)容,可實(shí)現(xiàn)的創(chuàng)作體裁超過(guò)200種,涵蓋了幾乎所有寫作需求。在邏輯和記憶能力上,相比之前的版本也有了成倍提升。

  大模型在智能涌現(xiàn)后出現(xiàn)的理解、生成、邏輯和記憶四大能力,是AI時(shí)代到來(lái)后最本質(zhì)的生產(chǎn)力革新。而與制造大模型本身的高門檻不同,今天的創(chuàng)業(yè)者同樣可以極其容易地通過(guò)接入文心一言這樣的大模型,通過(guò)應(yīng)用這四大能力徹底重構(gòu)自身產(chǎn)品的用戶體驗(yàn)。

  事實(shí)上,為了幫助各行各業(yè)的客戶盡早用上大模型,百度在文心一言正式亮相的同一個(gè)月,就推出了文心千帆。文心千帆是全球首款一站式企業(yè)級(jí)大模型平臺(tái),既提供像文心一言這樣領(lǐng)先的基礎(chǔ)大模型,也包含了開發(fā)大模型需要的工具鏈和配套環(huán)境。在隨后不到半年的時(shí)間里,千帆大模型平臺(tái)上月活企業(yè)數(shù)已近萬(wàn)家,覆蓋金融、制造、能源、政務(wù)、交通等行業(yè)的400多個(gè)場(chǎng)景。

  大模型和生成式人工智能作為堪比工業(yè)革命的巨大機(jī)遇,已經(jīng)成為公眾共識(shí)。但目前來(lái)說(shuō),無(wú)論國(guó)內(nèi)國(guó)外都還沒(méi)有出現(xiàn)跨時(shí)代的AI原生應(yīng)用,這是一塊急需填補(bǔ)的“權(quán)力真空”。李彥宏在今天的演講中表達(dá)了同樣的遺憾和期待:

  就像移動(dòng)時(shí)代誕生了像微信、抖音、Uber這樣的“mobile-native”的應(yīng)用一樣,AI原生時(shí)代一定會(huì)有優(yōu)秀的AI原生應(yīng)用是基于這些大模型開發(fā)出來(lái)的。

  記住,是基于最好的基礎(chǔ)大模型去開發(fā)應(yīng)用,這是比制造大模型更容易成功的“捷徑”。

  結(jié)語(yǔ)

  在《深渡》看來(lái),大模型掀起的這輪AI革命來(lái)得再恰當(dāng)不過(guò)。因?yàn)橄噍^于過(guò)去那些科技變革,以文心一言為代表的國(guó)內(nèi)基礎(chǔ)大模型,表明國(guó)內(nèi)的技術(shù)水平已經(jīng)站到了跟國(guó)外頂尖同行并駕齊驅(qū)的位置。對(duì)于那些腦袋靈光夢(mèng)想遠(yuǎn)大的龐大創(chuàng)業(yè)者群體而言,這在某種程度上是從未有過(guò)的“幸運(yùn)”。

  當(dāng)然,前提是他們要選對(duì)切入這條賽道的方向,在制造大模型上多一點(diǎn)冷靜,而在應(yīng)用大模型上不妨狂熱一些。

  榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。

海報(bào)生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復(fù)制
標(biāo)題鏈接已成功復(fù)制

最新新聞

熱門新聞