感謝IT之家網友 Hi_World 的國首個頭緒投遞!IT之家 4 月 27 日音訊,模型生數科技今日到會中關村論壇未來人工智能先鋒論壇 ,發布攜手清華大學正式發布我國首個長時長、可生高一致性 、成最長秒高動態性視頻大模型 ——Vidu ,最高被媒體和業內人士認為是國首個國內首個 Sora 等級的視頻大模型。
依據官方描繪,模型Vidu 模型交融 Diffusion 與 Transformer ,發布開創性創建了 U-ViT ,可生
支撐一鍵生成長達 16 秒 、成最長秒分辨率高達 1080P 的最高高清視頻內容。官方宣揚材料中演示了“畫室中的國首個一艘船駛向鏡頭” 、其波浪 、模型船的發布作用十分傳神 。
官方表明 Vidu 不只可以模仿實在物理世界 ,還具有豐厚想象力 ,具有多鏡頭生成 、時空一致性高級特色 。
Vidu 是自 Sora 發布之后,全球首先獲得重大打破的視頻大模型 ,功能全面臨標世界頂尖水平,并在加快迭代提高中 。
Vidu 的快速打破源自于團隊在貝葉斯機器學習和多模態大模型的長時刻堆集和多項原創性效果。
其核心技術 U-ViT 架構由團隊于 2022 年 9 月提出,早于 Sora 選用的 DiT 架構 ,是全球首個 Diffusion 與 Transformer 交融的架構。
2023 年 3 月,團隊開源了全球首個根據 U-ViT 交融架構的多模態分散模型 UniDiffuser ,首先完成了 U-ViT 架構的大規模可擴展性驗證 。
IT之家附上參閱地址 。
我國首個長時長、高一致性、高動態性視頻大模型,Vidu 上臺 !
廣告聲明 :文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等方式),用于傳遞更多信息,節約甄選時刻,成果僅供參閱,IT之家一切文章均包括本聲明 。