12月16日消息,阿里阿里式推出新一代通義萬相2.6系列模型,發布針對專業影視制作與圖像創作場景實現突破性升級。電影
作為國內首個支持角色扮演功能的頻模視頻生成模型,其創新性地融合音畫同步、型萬相首多鏡頭生成、次支持角聲音驅動等核心技術,色扮構建了當前全球功能最完整的演功視頻生成解決方案。
通義萬相在模型結構上集成了多項創新技術,阿里可對輸入參考視頻進行多模態聯合建模與學習,發布參考具有時序信息的電影主體情緒、姿態和多角度全面視覺特征。頻模
同時提取音色、型萬相首語速等聲學特征,次支持角在生成階段作為參考條件控制,色扮實現從畫面到聲音的全感官全維度一致性保持與遷移,目前萬相可支持單人和多人的表演。
此次發布的萬相2.6進一步提升了畫質、音效、指令遵循等能力,單次視頻時長實現國內最高的15s。
萬相2.6還新增了角色扮演和分鏡控制功能,不僅能一鍵完成單人、多人、人與物合拍的視頻,還能自動實現多鏡頭切換等專業任務,滿足專業影視級場景需求。
萬相官網:
https://tongyi.aliyun.com/wan/
作者:時尚






