據(jù)品玩引述 HuggingFace 頁面報道,微軟研究院聯(lián)手北京大學,共同發(fā)布了一款名為 PPTC 的大模型測試基準,可以用于測試大模型在PPT 生成方面的能力。
研究團隊表示,PPTC包含 279 個涵蓋不同主題的多回合會話和數(shù)百條涉及多模式操作的說明。研究團隊還提出了PPTX-Match評估系統(tǒng),該系統(tǒng)根據(jù)預測文件而不是標簽API序列來評估大語言模型是否完成指令,因此它支持各種LLM生成的API序列。
研究團隊表示,當前大語言模型在生成PPT 內(nèi)容方面主要存在三個方面的不足,包括多輪會話中的錯誤累積、長PPT模板處理和多模態(tài)感知問題。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...