近兩三個月出現(xiàn)各種AI Agent項目,谷歌Deepmind推出了robotic agent,利用機械臂自動執(zhí)行各種工作;亞馬遜推出了Amazon Bedrock Agents,可以自動分解企業(yè)AI應(yīng)用開發(fā)任務(wù);AI獨角獸Inflection也在開發(fā)私人AI助理,可以幫助你完成訂酒店等私人任務(wù);哥倫比亞大學最近也公布了用于科研的AI Agent項目GPT Researcher。
有人說,至少有100個項目正致力于將AI代理商業(yè)化,近10萬名開發(fā)人員正在構(gòu)建自主Agent。這一輪的熱潮離不開OpenAI,有兩位關(guān)鍵人物發(fā)揮了重要作用。
簡單說,AI聊天機器人主要靠“說”來回答你的問題,而AI Agent則會“動”起來完成具體的任務(wù),就像人類助理一樣,在你忙不過來的時候替你完成一些工作,區(qū)別就是用AI來驅(qū)動而不是人腦驅(qū)動。
在國內(nèi),雖然AutoGPT早在4月份就與國外同步火了,但限于大部分人對其背后的AI Agent缺少了解,開始的反響并不是太熱烈。直到7月初OpenAI應(yīng)用人工智能研究負責人Lilian Weng那篇關(guān)于AI Agent的博文刷爆AI圈后,媒體圈、學研界、投資領(lǐng)域才真正開始熱烈討論AI Agent。
由此國內(nèi)真正開啟了探索與研究AI Agent的熱潮,并且也有一些廠商開始以AI Agent模式重構(gòu)產(chǎn)品架構(gòu)與商業(yè)模式。隨著AI Agent原理、模式以及構(gòu)建方式越發(fā)明朗,很多受困于技術(shù)、模式、生態(tài)乃至政策的創(chuàng)業(yè)者都是眼前一亮。
國內(nèi)已推出的AI Agent
(內(nèi)容引用自:王吉偉)
經(jīng)過持續(xù)探索與嘗試,國內(nèi)AI智能體相關(guān)的產(chǎn)品也開始嶄露頭角,下面介紹五款產(chǎn)品。
1、阿里云ModelScopeGPT
阿里云Mota社區(qū)推出的國內(nèi)首個大型模型調(diào)用工具魔搭GPT(ModelScopeGPT),通過這一款工具,使用者們可以通過一鍵發(fā)送指令調(diào)用Mota社區(qū)中的其他人工智能模型,從而實現(xiàn)大大小小的模型共同協(xié)作,進而完成復雜的任務(wù)。
ModelScopeGPT基于開源大語言模型(LLM)的AI Agent(智能體)開發(fā)框架ModelScope-Agent。這是一個通用的、可定制的Agent框架,用于實際應(yīng)用程序,其基于開源的大語言模型 (LLMs) 作為核心,包含記憶控制、工具使用等模塊。
開源 LLM 主要負責任務(wù)規(guī)劃、調(diào)度以及回復生成;記憶控制模塊,主要包含知識檢索以及 prompt (提示詞)管理;工具使用模塊,包含工具庫以及工具檢索和工具可定制化。
2、實在智能TARS-RPA-Agent
實在智能在超自動化領(lǐng)域首發(fā)的TARS-RPA-Agent,是一個基于“TARS+ISSUT(智能屏幕語義理解)”雙模引擎、有“大腦”,更有“眼睛和手腳”的超自動化智能體,是能夠自主拆解任務(wù)、感知當前環(huán)境、執(zhí)行并且反饋、記憶歷史經(jīng)驗的RPA全新模式產(chǎn)品。
TARS-RPA-Agent采用以TARS大模型和ISSUT智能屏幕語義理解為基座的技術(shù)框架。該技術(shù)框架分為兩層結(jié)構(gòu):底層是包括通用基礎(chǔ)模型和各個垂直行業(yè)基礎(chǔ)模型在內(nèi)的TARS系列大模型和智能屏幕語義理解技術(shù);上層是依托這兩項關(guān)鍵技術(shù)完成全面升級和改造的超自動化產(chǎn)品。
TARS-RPA-Agent的核心LLM是實在智能基于通用大模型基座的自研垂直“塔斯(TARS)”大模型,TARS大模型具備優(yōu)異的文本生成、語言理解、知識問答、邏輯推理等主流能力。
3、OmBot歐姆智能體
2023 世界人工智能大會上,聯(lián)匯科技發(fā)布了基于大模型能力的自主智能體(Auto AI Agent )——OmBot 歐姆智能體,并針對典型場景需求推出了首批應(yīng)用。
聯(lián)匯自主智能體包含了認知、記憶、思考、行動四大核心能力,作為一種自動、自主的智能體,它以最簡單的形式中在循環(huán)中運行,每次迭代時,它們都會生成自我導向的指令和操作。因此,它不依賴人類來指導命令,具備高度可擴展性。
4、瀾碼科技Ask XBot
瀾碼科技構(gòu)建的Agent平臺“Ask XBot”,平臺分兩層:第一層是專家賦能,專家通過拖、拉、拽以及對話交互的方式定義工作流程,教給機器,從而協(xié)助一線員工構(gòu)建更高效工作的方法論;第二層是員工使用Agent,一線員工可以通過自然語言和Agent溝通并下達指令,讓Agent協(xié)助完成數(shù)據(jù)分析、資料調(diào)取等工作。
該公司計劃將Ask XBo打造成一個兼具通用性和易用性的平臺,把這些API和Agent做好管理,讓Agent包裝不同的API,不同模型的Agent能夠在上面更好地協(xié)作,讓它們可以在平臺上更有效率、更智能地服務(wù)好客戶。
5、ChatDev
由清華大學、北京郵電大學、布朗大學聯(lián)合研究團隊推出的ChatDev,是一個生成式智能體。它基于聊天的端到端軟件開發(fā)框架,能夠利用大型語言模型(LLMs)促進軟件開發(fā)過程中多角色(ChatGPT 的 “gpt3.5-turbo-16k” 版本)之間的有效溝通和協(xié)作。
ChatDev的主要目的是通過聊天來進行游戲開發(fā)。用戶只需提出想法,從設(shè)計到測試的整個流程都由AI完成,整個過程只需七分鐘即可完成。
AI Agent不僅讓大家看到了大語言模型(LLM,Large language Model)落地的方向,讓更多創(chuàng)業(yè)者進一步燃起了LLM創(chuàng)業(yè)的希望,也讓廣大企業(yè)看到了高效應(yīng)用LLM的未來趨勢。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...