商湯科技今日發(fā)布公告,擬配售 B 類股份,總籌 20.08 億港元(當(dāng)前約 18.71 億元人民幣)。據(jù)《科創(chuàng)板日?qǐng)?bào)》報(bào)道,商湯本次配售有多家戰(zhàn)略投資人及頭部海外基金入股,現(xiàn)有股東增持,募集資金將用于大模型研究及產(chǎn)品開發(fā)等。
報(bào)道稱,商湯將于 7 月 5 日世界人工智能大會(huì)上發(fā)布日日新 5.5 大模型。官方?jīng)]有透露關(guān)于日日新 5.5 大模型的更多信息,而此前有國(guó)內(nèi)媒體報(bào)道稱,商湯日日新大模型“近期”將迎來重大升級(jí)。在長(zhǎng)文本處理能力上,升級(jí)后的商湯大模型將最新支持 100 萬字以上超長(zhǎng)文本,同時(shí)最多一次支持 50 多個(gè)文件問題解析。
另外,商湯今年 4 月 23 日發(fā)布了日日新 5.0 大模型。據(jù)IT之家此前報(bào)道,該模型采用 MOE 混合專家架構(gòu),在知識(shí)、數(shù)學(xué)、推理和代碼能力方面大幅提升。該模型基于超過 10TB tokens 訓(xùn)練,具備 200K 推理上下文窗口(注:相當(dāng)于 36.5 萬個(gè)漢字),推理時(shí)上下文窗口達(dá)到 200K 左右,更號(hào)稱“全面對(duì)標(biāo) GPT-4 Turbo”。其提供自然語言處理、圖片生成、自動(dòng)化數(shù)據(jù)標(biāo)注、自定義模型訓(xùn)練等多種大模型及能力。
今年 5 月,商湯宣布將免費(fèi)向粵語區(qū)用戶推出粵語大模型 Web 版及 App 版,“商量語言大模型粵語版”及“商量多模態(tài)大模型粵語版”即日起向企業(yè)用戶開放 API。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...