今日,小米技術(shù)宣布開(kāi)源一項(xiàng)名為SVOR(Stable Video Object Removal)的視頻消除技術(shù),該技術(shù)能夠移除視頻中的路人。小米指出,現(xiàn)有的視頻消除技術(shù)多在理想條件下設(shè)計(jì),而真實(shí)世界的視頻處理更為復(fù)雜,存在掩碼邊緣識(shí)別不準(zhǔn)確、物體消除后陰影殘留、快速移動(dòng)目標(biāo)處理不穩(wěn)定等問(wèn)題。為此,小米提出的SVOR框架專(zhuān)門(mén)針對(duì)這些問(wèn)題設(shè)計(jì)了解決方案,包括MUSE窗口化聯(lián)合策略、DA-Seg去噪感知分割以及課程式兩階段訓(xùn)練,以處理陰影和反射殘留。
SVOR在多個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集和退化遮罩基準(zhǔn)上達(dá)到了新的SOTA(State of the Art)水平,并在CVPR2026物理感知視頻實(shí)例消除挑戰(zhàn)賽中獲得第一名。小米還表示,其在視頻消除的評(píng)測(cè)方案上也做了大量工作,包括評(píng)測(cè)數(shù)據(jù)收集整理和創(chuàng)新性評(píng)測(cè)方法,計(jì)劃在適當(dāng)時(shí)機(jī)開(kāi)源。相關(guān)論文已發(fā)布,項(xiàng)目代碼也已開(kāi)源,Skill供直接調(diào)用。

來(lái)源:一電快訊
返回第一電動(dòng)網(wǎng)首頁(yè) >
以上內(nèi)容由AI創(chuàng)作,如有問(wèn)題請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)溝通,AI創(chuàng)作內(nèi)容并不代表第一電動(dòng)網(wǎng)(www.cbbreul.com)立場(chǎng)。
文中圖片源自互聯(lián)網(wǎng)或AI創(chuàng)作,如有侵權(quán)請(qǐng)聯(lián)系郵件刪除。