開源人工智能是過去一年最令人驚訝的科技之一。隨著OpenAI和谷歌(Google)等公司投入數(shù)十億美元打造更強大的人工智能,開發(fā)人員可以免費使用和調整的“開放”模型縮小了性能差距。
只有一個缺點:大多數(shù)開源系統(tǒng)都不是很開放。批評者指責他們的支持者“洗白開放”——試圖從開源的光環(huán)效應中獲益,因為它不受普通商業(yè)軟件產品的限制,但卻名不副實。
終于有動力創(chuàng)造一個真正開源版本的人工智能,但誰也不能保證它的進步會趕上開源軟件,在過去20年里,開源軟件在科技界發(fā)揮了關鍵作用。對于傳統(tǒng)的開源軟件,如Linux操作系統(tǒng),代碼是免費提供給開發(fā)人員檢查、使用和調整的。所謂的開源人工智能非常不同,尤其是因為大多數(shù)現(xiàn)代人工智能系統(tǒng)從數(shù)據(jù)中學習,而不是用代碼編程邏輯。
以Meta的Llama為例,只公開決定模型如何響應查詢的“權重”。用戶可以使用和調整它,但無法看到訓練它的底層數(shù)據(jù),也沒有足夠的信息從頭開始復制模型。
對于許多開發(fā)人員來說,這仍然有一些明顯的好處。他們可以根據(jù)自己的信息調整和訓練準開放模型,而無需將敏感的內部數(shù)據(jù)交給另一家公司。
但不完全開放是有代價的。Mozilla基金會(Mozilla Foundation)高級顧問阿亞 貝迪爾(Ayah Bdeir)表示,只有真正的開源技術才能讓人們全面了解那些開始影響我們生活方方面面的系統(tǒng),同時還能保證創(chuàng)新和競爭不會被少數(shù)幾家占主導地位的人工智能公司壓制。
其中一個回應來自開源促進會——它在20多年前就給出了開源軟件的定義。本周,它給出了一個接近最終的定義,可能有助于塑造該領域的發(fā)展方向。
這不僅需要釋放模型的權重,還需要足夠的關于訓練模型數(shù)據(jù)的信息,以允許其他人復制模型,以及系統(tǒng)背后的所有代碼。Mozilla和Linux基金會等其他組織也在推動類似的舉措。
諸如此類的舉措已經(jīng)導致人工智能領域出現(xiàn)了更大的細分。許多公司在使用術語時更加謹慎——也許是考慮到OSI擁有“開源”一詞的商標,并可能提起訴訟,以防止在其定義之外的人工智能模型上使用該術語。例如,Mistral將其Nemo稱為“開放權重”模型。
除了部分開放的系統(tǒng),完全開放的模型也開始出現(xiàn),比如艾倫人工智能研究所開發(fā)的Olmo大型語言模型。然而,這個版本在人工智能領域是否會像在傳統(tǒng)軟件領域那樣產生巨大影響,目前還遠不清楚。要做到這一點,需要做兩件事。
首先,這項技術需要滿足足夠大的需求,以吸引大量的用戶和開發(fā)人員。在傳統(tǒng)軟件方面,Linux服務器操作系統(tǒng)顯然是微軟Windows的替代品,為它贏得了大量用戶,并得到了包括IBM和甲骨文在內的微軟競爭對手的大力支持。在人工智能領域,Linux沒有對等物。市場已經(jīng)變得更加分散,許多用戶會發(fā)現(xiàn)像Llama這樣的準開放大型語言模型已經(jīng)足夠使用。
開源人工智能的支持者還需要更好地論證其安全性。這樣一種強大、通用技術的發(fā)布,任何人都可以使用,理所當然地引起了廣泛的關注。
艾倫人工智能研究所前負責人奧倫·埃齊奧尼表示,許多恐懼都被夸大了。當談到上網(wǎng)研究如何制造炸彈或生物武器時:“你從這些[人工智能模型]中真正能得到的并不比你從谷歌中得到的多。這些信息到處都是——只是以不同的方式打包了。”他承認,在某些領域,讓人工智能更自由地使用可能會造成傷害,例如自動化創(chuàng)建更多的在線虛假信息。
“封閉”的人工智能也有風險。但是,除非更徹底地研究了開源技術的額外邊際風險,以及潛在的好處,否則擔憂仍將存在。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...