艾媒網(wǎng)(iimedia.cn)獲悉,近期,Meta發(fā)布了一款開源人工智能(AI)工具AudioCraft(直譯為音頻技藝),該工具可以幫助用戶根據(jù)文本提示創(chuàng)作音樂和音頻。Meta表示,這款人工智能工具將AudioGen、EnCodec和MusicGen三種模型或技術(shù)融為一爐,可用文本內(nèi)容生成高質(zhì)量、逼真的音頻和音樂。Meta在官網(wǎng)介紹稱,MusicGen接受過Meta擁有的和特別授權(quán)的音樂訓練,可以從文本提示生成音樂,而AudioGen接受過公共音效訓練,可從文本提示生成音頻,比如模擬狗叫或腳步聲;再加上EnCodec編解碼器的改進版本,用戶可以更高效率地生成更高質(zhì)量的音樂。
2023年2月,Meta首席執(zhí)行官扎克伯格看到了人工智能的樂觀前景,并投入了大量資金開發(fā)相關(guān)技術(shù),宣布Meta將成立專注AIGC的頂級產(chǎn)品團隊。時隔半年,Meta交出了AudioCraft這一成果。
AIGC領(lǐng)域呈現(xiàn)內(nèi)容類型不斷豐富、內(nèi)容質(zhì)量不斷提升、技術(shù)的通用性和工業(yè)化水平越來越強等趨勢。從內(nèi)容形態(tài)來看,AIGC包括文本、音頻、圖像、視頻等內(nèi)容生成形式。
相較于AI在生成圖像、視頻、文本的應(yīng)用,AI生成音樂領(lǐng)域的發(fā)展相對落后。AIGC憑借較人工更高效的技術(shù)路徑,對規(guī)模化內(nèi)容的生產(chǎn)有較大沖擊,對初級、通用型內(nèi)容生產(chǎn)者具有取代性。當前,AIGC的內(nèi)容生成技術(shù)基本實現(xiàn)快速生成高質(zhì)量的營銷內(nèi)容,眾多國內(nèi)廠商也紛紛從內(nèi)容布局。
AIGC 應(yīng)用目前處于發(fā)展初期,已經(jīng)具備文字、圖片甚至視頻內(nèi)容的生成能力,在生成創(chuàng)意、內(nèi)容創(chuàng)作等方面對創(chuàng)作效率的提升非常顯著,可以應(yīng)用于多個場景。Meta并不是第一家AI生成音樂的公司。此前,OpenAI曾在2020年推出AI音樂生成器Jukebox,谷歌在今年發(fā)布的音樂生成模型MusicLM,其他常見的類似模型還有Riffusion、Mousai和Noise2Music等。隨著人工智能技術(shù)的不斷發(fā)展,AIGC技術(shù)也將日益成熟,未來將在更多領(lǐng)域得到廣泛應(yīng)用,巨大的應(yīng)用前景將推動AIGC市場規(guī)�?焖僭鲩L。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...