国产精品在线视频资源|av人人人人操爱香蕉视频|AAA黄色片子黄色a级片视频|亚洲综合视频网2|成人免费网站观影|国产天堂AV在线播放资源|成人无码精品一区二区黑寡妇在线|论理聚合视频一区二区三区|在线无码视频一区二区|淫荡人妻不卡av

  1. 首頁(yè)
  2. 資訊
  3. 阿里千問(wèn)發(fā)布DeepPlanning:AI規(guī)劃能力新挑戰(zhàn),頂尖模型仍需提升

阿里千問(wèn)發(fā)布DeepPlanning:AI規(guī)劃能力新挑戰(zhàn),頂尖模型仍需提升

1月30日,阿里千問(wèn)在公眾號(hào)平臺(tái)宣布推出新一代Agent基準(zhǔn)測(cè)試DeepPlanning。DeepPlanning與傳統(tǒng)推理任務(wù)不同,要求AI在面對(duì)現(xiàn)實(shí)世界的復(fù)雜規(guī)劃時(shí)通盤考慮,不能只專注于局部。例如,在多日旅行規(guī)劃中要精確到分鐘級(jí)排期,同時(shí)守住時(shí)間、預(yù)算的硬上限;在復(fù)雜購(gòu)物場(chǎng)景中要懂得疊加優(yōu)惠券、動(dòng)態(tài)組合商品以實(shí)現(xiàn)整體價(jià)格最優(yōu)。這些“硬要求”必須貫穿整個(gè)計(jì)劃始終。

實(shí)測(cè)結(jié)果顯示,即使是目前頂尖的GPT-5.2、Claude4.5、Gemini以及Qwen3模型,在全局優(yōu)化以及長(zhǎng)周期一致性上仍存在部分短板,距離真正成為擁有100%自主決策能力的“行動(dòng)派”還有一定距離。阿里千問(wèn)還在HuggingFace和ModelScope平臺(tái)開源了這款基準(zhǔn),以促進(jìn)AI規(guī)劃能力的提升和優(yōu)化。

來(lái)源:一電快訊

返回第一電動(dòng)網(wǎng)首頁(yè) >

4點(diǎn)贊
發(fā)表評(píng)論
熱文榜
第一電動(dòng)網(wǎng)官方微信

反饋和建議 在線回復(fù)

您的詢價(jià)信息
已經(jīng)成功提交我們稍后會(huì)聯(lián)系您進(jìn)行報(bào)價(jià)!

第一電動(dòng)網(wǎng)
Hello world!