免费观看已满十八岁电视剧国语_人妻 色综合网站_欧美大尺寸suv视频_成人免费高清在线观看_久久久成人毛片无码_老头解开奶罩吸奶头高潮视频_sm调教室论坛入口_欧美夫妻交换久久丫1000_一级黄色大片在线免费观看了

首頁(yè) > 資訊 > 數(shù)字化

通義千問(wèn)QwQ能力直逼OpenAI o1,推理AI已然興起

2024/12/04 11:43      艾媒網(wǎng)


  艾媒網(wǎng)(iimedia.cn)獲悉,11月28日,阿里云通義團(tuán)隊(duì)發(fā)布全新AI推理模型QwQ-32B-Preview,并同步開(kāi)源。QwQ(Qwen with Questions)是通義千問(wèn)Qwen大模型最新推出的實(shí)驗(yàn)性研究模型,也是阿里云首個(gè)開(kāi)源的AI推理模型。阿里云通義千問(wèn)團(tuán)隊(duì)研究發(fā)現(xiàn),當(dāng)模型有足夠的時(shí)間思考、質(zhì)疑和反思時(shí),其對(duì)數(shù)學(xué)和編程的理解就會(huì)深化。

  作為推理大模型,QwQ在數(shù)學(xué)和編程方面表現(xiàn)強(qiáng)勁。在考察科學(xué)問(wèn)題解決能力的GPQA評(píng)測(cè)集上,QwQ獲得65.2%的準(zhǔn)確率,具備研究生水平的科學(xué)推理能力;在涵蓋綜合數(shù)學(xué)主題的AIME評(píng)測(cè)中,QwQ以50%的勝率證明其擁有解決數(shù)學(xué)問(wèn)題的豐富技能;在全面考察數(shù)學(xué)解題能力的MATH-500評(píng)測(cè)中,QwQ斬獲90.6%的高分,一舉超越o1-preview和o1-mini;在評(píng)估高難度代碼生成的LiveCodeBench評(píng)測(cè)中,QwQ答對(duì)一半的題,在編程競(jìng)賽題場(chǎng)景中也有出色表現(xiàn)。

  繼OpenAI發(fā)布推理模型o1后,國(guó)內(nèi)一眾大模型公司快馬加鞭緊跟人工智能技術(shù)前沿。11月16日,月之暗面在發(fā)布會(huì)上公開(kāi)了新模型k0 math,成為國(guó)內(nèi)首個(gè)摸索出并實(shí)現(xiàn)o1思路的公司。僅4天后,幻方量化旗下的Deepseek緊接著上線推理模型DeepSeek-R1-Lite,并毫無(wú)保留地放出了大模型思考的完整過(guò)程,且允許用戶(hù)每天體驗(yàn)50次對(duì)話。國(guó)產(chǎn)推理AI的接連上線讓中國(guó)在開(kāi)源大模型和AI推理上占據(jù)了先機(jī),體現(xiàn)了中國(guó)在人工智能領(lǐng)域的領(lǐng)先地位與強(qiáng)勁實(shí)力。

  無(wú)法回答strawberry(草莓)中有幾個(gè)r的人工智能正在成為過(guò)去,行業(yè)內(nèi)推理AI已然成為大勢(shì)所趨。曾經(jīng),推理能力一直是AI大模型的短板,小學(xué)生也能回答的“9.8和9.11誰(shuí)更大”的問(wèn)題卻能難倒ChatGPT-4o、字節(jié)豆包、月之暗面kimi等一眾科技巨頭研發(fā)的大模型。而如今,采用強(qiáng)化學(xué)習(xí)和思維鏈推理技術(shù)的大模型將開(kāi)始試圖模擬人類(lèi)的思考和反思過(guò)程,從而增強(qiáng)AI的數(shù)學(xué)推理能力。推理AI的發(fā)展與完善將幫助人類(lèi)解決復(fù)雜苦難的數(shù)學(xué)問(wèn)題,促進(jìn)知識(shí)的發(fā)展,進(jìn)一步推動(dòng)國(guó)際事務(wù)和科學(xué)技術(shù)等領(lǐng)域難題的解決,取得突破性進(jìn)展。

  榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。

海報(bào)生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復(fù)制
標(biāo)題鏈接已成功復(fù)制

最新新聞

熱門(mén)新聞