6月11日,中國信息通信研究院(以下簡稱“信通院”)公布可信AI代碼大模型首輪評估結(jié)果,商湯小浣熊獲得最高評級(4+級),在代碼通用能力、專用場景和應(yīng)用成熟度多個評估維度中表現(xiàn)優(yōu)秀。
信通院在2024上半年正式啟動可信AI代碼大模型評估,以《智能化軟件工程技術(shù)和應(yīng)用要求 第1部分:代碼大模型》標(biāo)準(zhǔn)為評估依據(jù),該標(biāo)準(zhǔn)也是業(yè)內(nèi)首個代碼大模型標(biāo)準(zhǔn),其涵蓋通用能力、專用場景能力和應(yīng)用成熟度三大部分,包括16個能力項、100多個能力要求,全面從輸入多樣性、任務(wù)多樣性、語言完備度、結(jié)果可接收性、結(jié)果準(zhǔn)確度等維度,考核代碼大模型的全棧技術(shù)能力。
圖片來源:中國信息通信研究院
商湯小浣熊是本次評分最高的代碼大模型之一,作為首批參評企業(yè)獲得4+級評級,信通院給出測評結(jié)論:
在通用能力方面,其代碼解釋、代碼轉(zhuǎn)換等方面表現(xiàn)突出;
在專用場景方面,其支持網(wǎng)站開發(fā)、桌面應(yīng)用開發(fā)、移動應(yīng)用開發(fā)、數(shù)據(jù)庫開發(fā)等多個場景的開發(fā)能力;
在應(yīng)用成熟度方面,其數(shù)據(jù)分類分級、模型性能、模型服務(wù)可維護(hù)性、風(fēng)險可控性等方面均表現(xiàn)優(yōu)秀。
「小浣熊家族」是基于商湯“日日新SenseNova”大模型體系打造的 AI Native 生產(chǎn)力系列工具,覆蓋軟件開發(fā)、數(shù)據(jù)分析、編程教育等多個場景,旨在通過先進(jìn)的人工智能技術(shù)優(yōu)化和提升工作效率。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...