欧美午夜精品-免费在线观看高清影视网站-999免费视频-韩国久久久-在线中文av-1024欧美-在线啪-成人影片在线-秋霞在线观看秋-国产精品国产三级国产专区52-国产在线高清视频-国产999在线-国产白拍-毛片在哪里看-日韩视频h-欧美日韩一区精品-在线只有精品-插插插色综合-成年人看的毛片-毛片av免费

能戰勝行測圖形推理題目嗎?阿里推出QVQ-Max視覺推理模型

能戰勝行測圖形推理題目嗎?阿里推出QVQ-Max視覺推理模型

瀟湘 / 2025-03-28 14:2940846

今日凌晨,阿里旗下的通義千問推出了一款視覺推理模型——QVQ-Max,Qwen團隊稱該模型具備理解圖片與視頻內容的能力,并且還能根據所提供的信息展開分析推理。

我們目前所用到的常見大模型雖然也能上傳圖片,但是只能識別圖片里的文字,對畫面圖形則缺少概念,因此不能算作視覺推理模型,QVQ-Max則著重提升了這一點。

“例如,在一道幾何題中,它可以根據題目附帶的圖形推導出答案;在一段視頻里,它能根據畫面內容推測出接下來可能發生的情節。”

Qwen-logo-01.png

不過光看千問團隊的宣傳好像也感覺不出來到底有多厲害,不如咱們直接來給它上上強度。

熱點科技這里準備了幾道公務員行測的圖形推理模擬題,來看看QVQ-Max到底能不能給出正確答案。

首先我們在QWEN CHAT平臺選擇這一模型,將從網上收集到的題目圖片上傳,直接詢問答案。不過需要注意的是,或許是由于該模型今天才上線,在上傳題目圖片時總是提示網絡錯誤,稍后再試。大家可能需要耐心點多試幾次。

第一題如圖,QVQ-Max響應很快,但是想的好像有點多,思考了足足3500個漢字才給出答案D選項,但是回答錯誤,正確答案是B。

72e59bee-903c-40b6-8a98-85ac9a91132f_image.pngSnipaste_2025-03-28_14-05-52.png

Snipaste_2025-03-28_14-02-29.png

一題好像并不能證明實力,咱們又上傳了新的一題,看看QVQ-Max能不能一雪前恥。不過這一題對于QVQ-Max來說好像有點困難,竟然思考了多達6000個漢字才給出答案,仍然是D選項,仍然是錯誤的,正確答案是B。

24e4918c-08b0-4c64-86e2-e72c6593fc95_image.png

Snipaste_2025-03-28_14-06-07.png

Snipaste_2025-03-28_14-02-14.png

最后一次,再來一題。好在這次結果還算好,QVQ-Max給出了正確的答案B選項,但是思考時間實在太長,依然足足有6000個漢字,等待時間接近十分鐘,如果QVQ-Max去考試,恐怕沒做完題目就要收卷了。

Snipaste_2025-03-28_13-18-33.png

Snipaste_2025-03-28_14-06-51.png

看起來行測的圖形推理題目對于QVQ-Max來說有點超綱,本想試著上傳一段視頻,測測QVQ-Max的視頻能力,但是顯示一直上傳失敗,只得作罷。有興趣的朋友可以自行去測試一下QVQ-Max的其他能力噢。

根據Qwen團隊的解釋,QVQ-Max目前只是第一版,還有很多提升空間。希望Qwen團隊加把勁,讓QVQ-Max早日拿捏行測圖形推理。



發表評論注冊|