12月16日消息,阿里阿里式推出新一代通義萬(wàn)相2.6系列模型,發(fā)布針對(duì)專業(yè)影視制作與圖像創(chuàng)作場(chǎng)景實(shí)現(xiàn)突破性升級(jí)。電影
作為國(guó)內(nèi)首個(gè)支持角色扮演功能的頻模視頻生成模型,其創(chuàng)新性地融合音畫(huà)同步、型萬(wàn)相首多鏡頭生成、次支持角聲音驅(qū)動(dòng)等核心技術(shù),色扮構(gòu)建了當(dāng)前全球功能最完整的演功視頻生成解決方案。
通義萬(wàn)相在模型結(jié)構(gòu)上集成了多項(xiàng)創(chuàng)新技術(shù),阿里可對(duì)輸入?yún)⒖家曨l進(jìn)行多模態(tài)聯(lián)合建模與學(xué)習(xí),發(fā)布參考具有時(shí)序信息的電影主體情緒、姿態(tài)和多角度全面視覺(jué)特征。頻模
同時(shí)提取音色、型萬(wàn)相首語(yǔ)速等聲學(xué)特征,次支持角在生成階段作為參考條件控制,色扮實(shí)現(xiàn)從畫(huà)面到聲音的全感官全維度一致性保持與遷移,目前萬(wàn)相可支持單人和多人的表演。
此次發(fā)布的萬(wàn)相2.6進(jìn)一步提升了畫(huà)質(zhì)、音效、指令遵循等能力,單次視頻時(shí)長(zhǎng)實(shí)現(xiàn)國(guó)內(nèi)最高的15s。
萬(wàn)相2.6還新增了角色扮演和分鏡控制功能,不僅能一鍵完成單人、多人、人與物合拍的視頻,還能自動(dòng)實(shí)現(xiàn)多鏡頭切換等專業(yè)任務(wù),滿足專業(yè)影視級(jí)場(chǎng)景需求。
萬(wàn)相官網(wǎng):
https://tongyi.aliyun.com/wan/







