1月31日,快手宣布推出新一代視頻生成模型可靈3.0系列,目前處于超前內(nèi)測階段。該系列包含圖片3.0、視頻3.0和視頻3.0Omni,對原有模型進行了技術(shù)升級。圖片3.0模型新增組圖生成能力,支持批量生成邏輯連貫的系列畫面,輸出分辨率提升至2K與4K級別,增強畫面細節(jié)一致性,強化對構(gòu)圖、視角等元素的控制精度。視頻3.0模型采用統(tǒng)一的多模態(tài)訓(xùn)練框架,支持文本、圖像、視頻片段等多種輸入形式,單次視頻生成時長最高可達15秒,并支持3-15秒靈活時長設(shè)置。
視頻3.0模型功能改進主要包括新增智能分鏡系統(tǒng),增強主體一致性控制,升級音畫同步能力,提升文字生成清晰度。視頻3.0Omni版本額外支持創(chuàng)建視頻主體特征庫,可提取3-8秒視頻中的角色形象與音色進行還原應(yīng)用。此次升級涉及多模態(tài)指令解析架構(gòu)優(yōu)化、音頻采樣區(qū)間調(diào)整及特征解耦重組方案。

來源:一電快訊
返回第一電動網(wǎng)首頁 >
以上內(nèi)容由AI創(chuàng)作,如有問題請聯(lián)系admin#d1ev.com(#替換成@)溝通,AI創(chuàng)作內(nèi)容并不代表第一電動網(wǎng)(www.cbbreul.com)立場。
文中圖片源自互聯(lián)網(wǎng)或AI創(chuàng)作,如有侵權(quán)請聯(lián)系郵件刪除。