2025/06/06 18:08 DoNews
6月6日上午,在2025北京智源大會(huì)上,北京智源人工智能研究院發(fā)布“悟界”系列大模型,展示其在物理AGI領(lǐng)域的最新科研成果與布局。該系列包含全球首個(gè)原生多模態(tài)世界模型“悟界·Emu3”、腦科學(xué)多模態(tài)通用基礎(chǔ)模型“悟界·見微Brainμ”、具身大腦RoboBrain 2.0及全原子微觀生命模型OpenComplex2。
其中,“悟界·Emu3”于2024年10月發(fā)布,通過研發(fā)新型視覺tokenizer,將圖像/視頻編碼為離散符號序列,構(gòu)建模態(tài)無關(guān)的統(tǒng)一表征空間,實(shí)現(xiàn)文本、圖像和視頻的任意組合理解與生成。
所謂世界模型,指讓AI像人類一樣認(rèn)知、理解世界并進(jìn)行推理的工具�;诖耍珹I可實(shí)現(xiàn)更智能的交互,例如智能客服中綜合分析語音、圖像和文本輸入,或智能教育中生成個(gè)性化教學(xué)內(nèi)容。
近日,斯坦福大學(xué)教授李飛飛在與硅谷投資人對話時(shí)指出,世界模型不僅能夠處理文字信息,還能理解3D物理世界的運(yùn)作規(guī)律,是通往AGI的重要路徑。
目前,造車新勢力在應(yīng)用端積極布局世界模型。在智能駕駛領(lǐng)域,其代表系統(tǒng)對物理世界的數(shù)字化理解與預(yù)測能力。競爭已從車端算力配置轉(zhuǎn)向云端構(gòu)建世界模型的能力。
華泰證券認(rèn)為,這將提升車載芯片算力與傳感器精度,對算法公司和主機(jī)廠提出更高要求。億歐智庫報(bào)告稱,盡管世界模型可通過云端訓(xùn)練和車端蒸餾提升泛化能力,但規(guī)模化落地仍受制于算力成本與數(shù)據(jù)質(zhì)量。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。