1月26日,阿里巴巴集團(tuán)旗下的千問科技發(fā)布了最新的旗艦推理模型Qwen3-Max-Thinking。該模型在多個(gè)關(guān)鍵維度上實(shí)現(xiàn)了顯著提升,包括事實(shí)知識(shí)、復(fù)雜推理、指令遵循、人類偏好對(duì)齊以及智能體能力。在19項(xiàng)權(quán)威基準(zhǔn)測試中,Qwen3-Max-Thinking的性能可與GPT-5.2-Thinking、Claude-Opus-4.5和Gemini3Pro等頂尖模型相媲美。模型總參數(shù)超過萬億,經(jīng)過更大規(guī)模的強(qiáng)化學(xué)習(xí)訓(xùn)練,并采用了一系列創(chuàng)新的推理技術(shù),實(shí)現(xiàn)了性能的大幅飛躍。
Qwen3-Max-Thinking在多項(xiàng)關(guān)鍵性能基準(zhǔn)測試中表現(xiàn)出色,特別是在科學(xué)知識(shí)(GPQADiamond)、數(shù)學(xué)推理(IMO-AnswerBench)和代碼編程(LiveCodeBench)等領(lǐng)域達(dá)到了國際領(lǐng)先水平。模型現(xiàn)已上線QwenChat,用戶可以直接與模型及其自適應(yīng)工具調(diào)用功能進(jìn)行交互。同時(shí),Qwen3-Max-Thinking的API也已開放,模型名稱為qwen3-max-2026-01-23。該模型擁有兩項(xiàng)核心創(chuàng)新:自適應(yīng)工具調(diào)用能力和測試時(shí)擴(kuò)展技術(shù)。自適應(yīng)工具調(diào)用能力允許模型在對(duì)話中自主選擇并調(diào)用內(nèi)置的搜索、記憶和代碼解釋器功能,而測試時(shí)擴(kuò)展技術(shù)則通過在推理階段分配額外計(jì)算資源來提升模型性能。


來源:一電快訊
返回第一電動(dòng)網(wǎng)首頁 >
以上內(nèi)容由AI創(chuàng)作,如有問題請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)溝通,AI創(chuàng)作內(nèi)容并不代表第一電動(dòng)網(wǎng)(www.cbbreul.com)立場。
文中圖片源自互聯(lián)網(wǎng)或AI創(chuàng)作,如有侵權(quán)請(qǐng)聯(lián)系郵件刪除。