12月31日消息,阿里云宣布本年度第三輪大模型降價,通義千問視覺理解模型全線降價超80%。其中Qwen-VL-Plus直降81%,輸入價格僅為0.0015元/千tokens,創(chuàng)下全網(wǎng)最低價格;更高性能的Qwen-VL-Max降至0.003元/千tokens,降幅高達(dá)85%。按照最新價格,1塊錢可最多處理約600張720P圖片,或1700張480P圖片。
阿里云百煉相關(guān)負(fù)責(zé)人表示,“此次降價主要得益于阿里云基礎(chǔ)設(shè)施和模型結(jié)構(gòu)的持續(xù)優(yōu)化,以及大模型調(diào)用量指數(shù)型增長帶來的規(guī)模效應(yīng),我們希望第一時間把技術(shù)紅利釋放給所有用戶。”
據(jù)網(wǎng)經(jīng)社云計算臺(CC.100EC.CN)獲悉,在推理效率層面,阿里云構(gòu)建了極致彈性的AI算力調(diào)度系統(tǒng),結(jié)合百煉分布式推理加速引擎,大幅壓縮了模型推理成本,并加快模型推理速度。據(jù)介紹,今年以來,隨著通義千問團(tuán)隊不斷優(yōu)化視覺理解效果,Qwen-VL已成長為百煉平臺增長最快的模型。
為進(jìn)一步降低用戶使用文本大模型API的成本,阿里云百煉還推出全新KV Cache計費(fèi)模式,新模式可通過自動緩存上下文避免重復(fù)計算,進(jìn)一步降低模型調(diào)用成本,適用于長文本、代碼補(bǔ)全、多輪對話、特定文本摘要等場景。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...