12月16日消息,阿里阿里式推出新一代通義萬相2.6系列模型,發(fā)布針對專業(yè)影視制作與圖像創(chuàng)作場景實現(xiàn)突破性升級。電影
作為國內(nèi)首個支持角色扮演功能的頻模視頻生成模型,其創(chuàng)新性地融合音畫同步、型萬相首多鏡頭生成、次支持角聲音驅(qū)動等核心技術(shù),色扮構(gòu)建了當(dāng)前全球功能最完整的演功視頻生成解決方案。
通義萬相在模型結(jié)構(gòu)上集成了多項創(chuàng)新技術(shù),阿里可對輸入?yún)⒖家曨l進行多模態(tài)聯(lián)合建模與學(xué)習(xí),發(fā)布參考具有時序信息的電影主體情緒、姿態(tài)和多角度全面視覺特征。頻模
同時提取音色、型萬相首語速等聲學(xué)特征,次支持角在生成階段作為參考條件控制,色扮實現(xiàn)從畫面到聲音的全感官全維度一致性保持與遷移,目前萬相可支持單人和多人的表演。
此次發(fā)布的萬相2.6進一步提升了畫質(zhì)、音效、指令遵循等能力,單次視頻時長實現(xiàn)國內(nèi)最高的15s。
萬相2.6還新增了角色扮演和分鏡控制功能,不僅能一鍵完成單人、多人、人與物合拍的視頻,還能自動實現(xiàn)多鏡頭切換等專業(yè)任務(wù),滿足專業(yè)影視級場景需求。
萬相官網(wǎng):
https://tongyi.aliyun.com/wan/
作者:休閑







