1月29日,商湯科技宣布開源其多模態(tài)自主推理模型SenseNova-MARS,提供8B和32B兩個版本。該模型是業(yè)界首個支持動態(tài)視覺推理和圖文搜索深度融合的AgenticVLM模型,能夠在多模態(tài)搜索與推理的核心基準(zhǔn)測試中超越Gemini-3-Pro和GPT-5.2,取得69.74分的優(yōu)異成績。SenseNova-MARS能夠自主規(guī)劃步驟、調(diào)用工具,輕松完成各種復(fù)雜任務(wù),使AI具備真正的“執(zhí)行能力”。
SenseNova-MARS在多個基準(zhǔn)測試中取得了開源模型中的SOTA成績,甚至超越了一些頂級閉源模型。它能夠識別賽車服上的微小logo、查詢公司成立年份、匹配車手出生年月,并計算差值等復(fù)雜任務(wù),無需人工干預(yù)即可完成閉環(huán)解答。此外,該模型還能從產(chǎn)品和行業(yè)峰會的照片中識別企業(yè)標(biāo)志,搜集產(chǎn)品、企業(yè)信息,輔助分析行業(yè)情況和格局。SenseNova-MARS還能從賽事照片中識別logo、人物等信息,追溯比賽或人員背景信息,幫助快速補充重要細節(jié)。



來源:一電快訊
返回第一電動網(wǎng)首頁 >
以上內(nèi)容由AI創(chuàng)作,如有問題請聯(lián)系admin#d1ev.com(#替換成@)溝通,AI創(chuàng)作內(nèi)容并不代表第一電動網(wǎng)(www.cbbreul.com)立場。
文中圖片源自互聯(lián)網(wǎng)或AI創(chuàng)作,如有侵權(quán)請聯(lián)系郵件刪除。