金磊 夢晨 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
“調(diào)教”一只機器狗學會新技能需要多長時間?
僅需5分鐘。
一個往左走的手勢,它就乖乖地向左挪了挪;一個“趴下”手勢,機器狗狗就立馬蹲了下去:
而且“狗狗”的視界也可以同步地展示出來。
這就是剛剛在Wave Summit+2021峰會現(xiàn)場中,百度飛槳秀出的AI新技能——自動高效的模型部署能力。
而這,只是這場年度深度學習開發(fā)者盛宴中的一隅。
但站在當下的時間節(jié)點,從現(xiàn)場種種的“技巧展示”中,無不在透露著人工智能技術(shù)發(fā)展的一種新信號——創(chuàng)新在融合,門檻在降低。
一方面,AI技術(shù)及產(chǎn)業(yè)的融合創(chuàng)新越來越多;另一方面,雖然AI技術(shù)越來越復雜,但AI開發(fā)與應用的門檻卻越來越低。
百度首席技術(shù)官、深度學習技術(shù)及應用國家工程實驗室主任王海峰在大會中所述:
深度學習推動人工智能進入工業(yè)大生產(chǎn)階段。面向技術(shù)和產(chǎn)業(yè)發(fā)展需求的AI大生產(chǎn)平臺可以讓AI技術(shù)以標準化、自動化和模塊化的方式輸出給千行百業(yè),實現(xiàn)規(guī)模化應用,同時以平臺為基礎促進融合創(chuàng)新、共同發(fā)展。
那么基于這樣的“信號”,AI的發(fā)展在現(xiàn)階段又呈現(xiàn)著怎樣一種趨勢?
對此,百度集團副總裁、深度學習技術(shù)及應用國家工程實驗室副主任吳甜表示:
全國各城市的AI開發(fā)者規(guī)模逐年增長,應用人工智能的企業(yè)數(shù)量,也呈現(xiàn)了多地開花、多行業(yè)繁榮的景象。
但正所謂“臺上一分鐘,臺下十年功”。那么具體而言,在這些能力的背后,到底是什么樣的AI技術(shù)在加持,又是如何發(fā)揮著作用?
接下來,老規(guī)矩,我們一文看盡WAVE SUMMIT+2021。
飛槳再升級,煉大模型不忘開源看家本領
百度飛槳,中國首個自主研發(fā)、開源開放的產(chǎn)業(yè)級深度學習平臺,便是“臺下十年功”的奧義之一。
這次飛槳公布了新版全景圖,值得一提的是,其中的產(chǎn)業(yè)級模型庫新增了百度剛剛新發(fā)布的產(chǎn)業(yè)級知識增強文心大模型,多年積累,讓大模型真正走進了生產(chǎn)應用。
在百度飛槳平臺上,開發(fā)者可以實現(xiàn)AI模型的便捷開發(fā)、高效訓練和多端多平臺部署。
對此,王海峰認為百度飛槳已經(jīng)成為典型的AI大生產(chǎn)平臺,這一點從最新公布的成績單中也可以得到驗證:
凝聚406萬開發(fā)者,創(chuàng)建47.6萬個模型,服務15.7萬家企事業(yè)單位,中國深度學習平臺綜合市場份額第一。
今天,飛槳開源框架也正式更新到2.2版本。
這次飛槳升級的方向正是進一步加強融合創(chuàng)新,在開發(fā)、訓練、部署全流程均有體現(xiàn)。
開發(fā)階段,飛槳API更加豐富、高效、兼容;
尤其是體系化新增了科學計算API,新增短時傅里葉變換API、Jacobian/Hessian API和高階自動微分等功能。
可支持計算流體力學、分子動力學等更廣泛的模型開發(fā),屬于跨學科、跨場景的融合創(chuàng)新。
像這樣的API,飛槳2.2版本新增了100多個。
訓練階段 ,全新發(fā)布端到端自適應大規(guī)模分布式訓練技術(shù)。
4天前百度剛剛發(fā)布的全球首個知識增強千億大模型鵬城-百度·文心,就是基于這項技術(shù)訓練出來。
端到端自適應,說的是把不同模型和硬件抽象成統(tǒng)一的分布式計算視圖和資源視圖,屬于軟件與硬件的融合創(chuàng)新。為了進一步提高訓練的穩(wěn)定性和資源利用率,飛槳還提供彈性調(diào)度模塊,能感知硬件資源變化,來自動重構(gòu)資源視圖,觸發(fā)各個模塊自動的發(fā)生變化。
部署階段,硬件適配是讓AI開發(fā)者最頭疼的問題,這次飛槳自研了3個硬件接入優(yōu)化方案:
Kernel Primitive API通過對算子計算與硬件的解耦,讓開發(fā)者能更加專注于實現(xiàn)計算邏輯本身,同時做到一處優(yōu)化可讓70多個算子同時受益。
NNAdapter統(tǒng)一適配層實現(xiàn)了實現(xiàn)了算子定義及框架調(diào)度執(zhí)行與硬件解耦,不僅降低框架和硬件適配的穩(wěn)定性,還降低了代碼的維護成本。
神經(jīng)網(wǎng)絡編譯器CINN (Compiler Infrastructure for Neural Networks),編利用基礎算子自動融合優(yōu)化實現(xiàn)復雜算子功能,降低適配成本的同時,優(yōu)化性能。
除了以上這些通用場景的技術(shù)升級,飛槳框架2.2還特別對文本任務做了從文本處理、訓練、解碼到部署的全面加速。
如果說技術(shù)上的融合創(chuàng)新是在降低門檻上邁出的第一步,那么工具上的融合創(chuàng)新能讓飛槳技術(shù)更廣泛的落地。
飛槳企業(yè)版升級帶來了自動高效的模型部署功能。
在推理性能方面,啟用了PaddleSlim根據(jù)不同模型和硬件的特點自動選擇最佳壓縮路徑,在常見模型硬件上做到精度損失控制在1%以內(nèi),性能提升3-5倍。
在推理芯片的適配上,飛槳平臺已完成9345種模型芯片的組合的真實測試和調(diào)優(yōu),可以覆蓋95%的需求場景,節(jié)省97%的適配和開發(fā)時間。
在智能邊緣控制臺上,你可以直接看到以上模型服務的部署和管理,對輸入設備、服務、事件進行實時監(jiān)控管理。
另外還有一個“彩蛋”——零門檻AI開發(fā)平臺飛槳EasyDL現(xiàn)在有了桌面版,一鍵極速安裝,本地高效建模。
這次一起獲得升級的還有飛槳產(chǎn)業(yè)級開源模型庫。
百度結(jié)合場景的需求痛點,推出13個結(jié)合場景應用深度優(yōu)化過的PP系列模型,實現(xiàn)精度和性能的平衡。
到目前為止,飛槳產(chǎn)業(yè)級開源模型庫已支持超過400個模型,涵蓋CV、NLP、推薦系統(tǒng)、語音等多種方向。
那么這些產(chǎn)業(yè)級的開源模型都用在了哪里呢?
已經(jīng)用在了你身邊
這樣的技術(shù),其實離我們的生活并不遙遠。
例如上海哲元科技發(fā)展有限公司在制造業(yè)上有著多年的經(jīng)驗,在數(shù)字化大浪潮之下,選擇采用百度飛槳的EasyDL來提高效率。
具體而言,他們基于飛槳EasyDL訓練出食品生產(chǎn)流水線數(shù)量清點及外觀檢測模型。
這樣就能夠做到從蛋卷皮外觀、巧克力噴涂、灌料、撒料、壓蓋、包裝全流程智能化檢測。
值得一提的是,今年9月,在上海哲元提供的智能化質(zhì)檢系統(tǒng)加持下,該冰淇淋品牌位于江蘇太倉的工廠被認證為世界級“燈塔工廠”,更是全球冰淇淋行業(yè)的第一家“燈塔工廠”。
而之所以他們選擇EasyDL,易上手和精度高是主要的原因。
公司2名研發(fā)從接觸EasyDL到訓練完成所需要的模型并實際應用僅花費二十多個工時,同時模型還可根據(jù)客戶需求靈活迭代優(yōu)化,快捷方便。
再如華夏天信機器人公司,專注于工礦企業(yè)智能硬件設備的研發(fā)、生產(chǎn)和實施。
而在中國近萬座礦山的生產(chǎn)環(huán)節(jié)中,輸煤用帶式輸送機是一種重要的煤炭運輸設備,礦區(qū)用量可達十幾臺至上百臺不等,是整體產(chǎn)業(yè)鏈中重要的一環(huán)。
但以往對此的監(jiān)控方式都采用的是人工,包括巡檢和安裝固定攝像頭等等。
這就非常的耗時耗力,以巡檢為例,一天頻率為2到3次,有時2人每組,重要的皮帶設備還需6人實施3班倒。
而現(xiàn)在,華夏天信基于飛槳的目標檢測工具套件PaddleDetection,開發(fā)出的輸煤膠帶智能巡檢機器人。
如此一來,不僅能實現(xiàn)高頻次、無間歇巡檢,還能通過攝像儀將實時視頻回傳并智能識別分析。
可以說是一次性解決了工作效率、惡劣環(huán)境、作業(yè)安全等多項難題。
為了更好助推AI產(chǎn)業(yè)應用落地,飛槳此次還推出業(yè)界首個產(chǎn)業(yè)實踐范例庫,從真實產(chǎn)業(yè)場景分析、完整代碼實現(xiàn),到詳細過程解析,直達項目落地,覆蓋數(shù)十個高頻應用場景,推動AI落地可復制和規(guī)�;�。
而對于百度飛槳來說,技術(shù)本身和產(chǎn)業(yè)應用固然重要,但還有一點也是百度要“狠抓”的。
這就是開發(fā)者和生態(tài)。
越發(fā)熱鬧的飛槳社區(qū)
在生態(tài)方面,百度飛槳這一次升級了“大航海”計劃,正式邁入2.0時代。
具體而言,就是在原有的啟航、護航、領航三大航道基礎上,新增“共創(chuàng)”計劃。
啟航計劃是飛槳將投入總價值5億元的資金與資源,支持全國500所高校,重點培訓5000位高校AI師資,聯(lián)合培養(yǎng)50萬AI學子。
護航計劃面向產(chǎn)業(yè)智能化。要達到的是智能升級,通過技術(shù)賦能、市場推廣和資源導入,縮短技術(shù)創(chuàng)新到商業(yè)落地的路徑。
而領航計劃的面向群體,則是核心開發(fā)者,目標是與社區(qū)開發(fā)者一起共建開源生態(tài),并探索前沿技術(shù)。
而此次新增的“共創(chuàng)”板塊,可以分三個方向來看:
聯(lián)合社區(qū)開發(fā)者:共創(chuàng)工具、模型、產(chǎn)業(yè)實踐經(jīng)驗
形成產(chǎn)業(yè)創(chuàng)新需求對接平臺:共創(chuàng)產(chǎn)學研用融合正循環(huán)
建設人工智能產(chǎn)業(yè)賦能中心:共創(chuàng)區(qū)域創(chuàng)新生態(tài)
至于其背后的緣由,吳甜解釋道:
建設飛槳需要抓住的關鍵點有三個,技術(shù)持續(xù)創(chuàng)新、功能體驗以開發(fā)者的需求為首位,以及廣泛地與生態(tài)共享、共創(chuàng)。
那么在“大航海”計劃的加持之下,百度飛槳的開發(fā)者都得到哪些益處?
在活動現(xiàn)場中,來自哈爾濱工業(yè)大學大三的學生曹志浩便分享了他的故事。
他從大一開始就接觸飛槳AI Studio學習與實訓社區(qū),一路上已經(jīng)是三載時光。
而在最初身為小白的他,最頭疼的便是不知如何入手,很難找到實踐的方法。
也花費過時間、精力在市面上的產(chǎn)品中“貨比三家”,還自掏腰包買算力。
但當曹志浩接觸飛槳開發(fā)者社區(qū)之后,這些問題便全部迎刃而解、煙消云散了:
飛槳平臺上面有著非常豐富的一些學習資源和開發(fā)環(huán)境,幫助我的一些數(shù)理基礎打得更扎實或者一些進階的都可以在里面找到。
還有一些產(chǎn)品級的應用、前沿的模型,包括算力開發(fā)的流程都會在上面有所展現(xiàn)。
我可以在飛槳AI Studio社區(qū)上面開源一些代碼,包括在上面也開源了一些3D點云的算法和基礎原理的實現(xiàn),還有一些趣味性的項目和實用性的項目,比如APP的開發(fā)。
不僅如此,曹志浩還認為在這條路上進階過程“不是一個人”,他在開發(fā)者社區(qū)里遇到了許多志同道合的小伙伴。
他們分享讀論文的經(jīng)驗、交流困惑,還組建團隊共同“打怪升級”,并肩作戰(zhàn)開源的3D點云模型倉庫,支持一系列算法。
曹志浩分享的故事,只是眾多飛槳開發(fā)者中的一例。
而類似的故事在持續(xù)不斷地譜寫著:
鐵路工人在工作之余自學AI,基于飛槳實現(xiàn)了鐵路貨運車號的自動識別,為所在鐵路段節(jié)省數(shù)十萬元成本。
吉林大學的師生團隊聯(lián)合飛槳,打造了已在生產(chǎn)線上應用的藥瓶自動化檢測系統(tǒng),并沉淀為教學課程,幫助更多師生學習AI技術(shù)和應用。
……
那么最后一個問題便是,百度飛槳為什么如此重視開發(fā)者和生態(tài)呢?
人才人才,還是人才
無論是技術(shù)發(fā)展、產(chǎn)業(yè)升級還是社區(qū)建設,歸根結(jié)底都要靠人來實現(xiàn)。
隨著AI與產(chǎn)業(yè)的深度融合,需要越來越多既懂AI,又具備產(chǎn)業(yè)經(jīng)驗的復合型AI人才。
百度飛槳在AI人才的培養(yǎng)上積累已久。面向高校,飛槳積極踐行的是“產(chǎn)教融合”的路徑:合作人工智能相關教材、提供人工智能教育資源,超過700所高校的3000多名AI專業(yè)教師從飛槳舉辦的深度學習師資培訓中受益,百余所高校的學生基于飛槳開發(fā)創(chuàng)意項目、參與各類AI技術(shù)競賽。
更深一步,則是探索產(chǎn)教融合協(xié)同育人路徑。
如吉林大學三創(chuàng)實驗室(創(chuàng)意、創(chuàng)新、創(chuàng)業(yè))團隊針對醫(yī)藥企業(yè)藥瓶缺陷檢測場景需求,基于飛槳平臺創(chuàng)新研發(fā)了一套全方位、高精度的自動化檢測系統(tǒng),并實現(xiàn)了產(chǎn)線落地。
吉林大學還與飛槳共建了CV及AI+質(zhì)檢課程體系,將課程資源全面開放,通過飛槳學習與實訓社區(qū)AI Studio,將這一實踐經(jīng)驗輸送給百萬開發(fā)者。
面向產(chǎn)業(yè),在復合型人才的培養(yǎng)上,深度學習技術(shù)及應用國家工程實驗室與百度聯(lián)合發(fā)起創(chuàng)辦了首席AI架構(gòu)師培養(yǎng)計劃 (AICA)。
首席AI架構(gòu)師培養(yǎng)計劃目前已舉辦到第5期,累計向業(yè)界輸送190名AI架構(gòu)師,遍布工業(yè)、農(nóng)業(yè)、金融、交通、能源等數(shù)十個行業(yè)。
吳甜從中觀察到,每期學員們提出的課題,越來越深入到行業(yè)的關鍵問題,專業(yè)度逐年提升。
縱觀整場Wave Summit+峰會,百度飛槳在產(chǎn)業(yè)、開源、人才培養(yǎng)方面下了這么大功夫,為什么?
答案依舊是王海峰在開場提到的融合創(chuàng)新與降低門檻的大趨勢。
除了多種技術(shù)之間、技術(shù)與場景的融合,產(chǎn)業(yè)界、學術(shù)界、AI企業(yè)和開源平臺之間也在進行更廣泛的融合。
隨著AI落地在更多如金融、醫(yī)療、制造、能源,乃至文娛體育這樣的傳統(tǒng)行業(yè),不斷降低技術(shù)門檻,打通產(chǎn)學研用形成正向循環(huán),就成了人工智能發(fā)展的關鍵。
其根本目的還是更好地讓技術(shù)本身和產(chǎn)業(yè)發(fā)展相結(jié)合,不斷為經(jīng)濟發(fā)展注入新的活力,促進產(chǎn)業(yè)升級和智能化轉(zhuǎn)型。
于是我們看到了由飛槳框架2.2新版本、飛槳產(chǎn)業(yè)級開源模型庫、大航海2.0共創(chuàng)計劃等項目共同組成的這份給開發(fā)者的“雙12大禮包”。
在峰會現(xiàn)場,飛槳生態(tài)里的開發(fā)者們也把這一天過成了開發(fā)者的節(jié)日,許多人帶著自己在飛槳平臺上開發(fā)的作品來“練攤”。
像開頭的機器狗在現(xiàn)場學習的新模型,就是一位個人開發(fā)者帶來展示交流,被選中后登上主舞臺的。
百度飛槳準備的這一份雙12大禮包,你還滿意么?
本文首發(fā)于微信公眾號:量子位
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...