Wan2.1-VACE merupakan bagian dari large model pembuat video seri Wan2.1. Model ini menjadi yang pertama di industri yang menawarkan solusi terpadu untuk berbagai tugas pembuatan dan penyuntingan video dalam satu platform. Model ini mendukung pembuatan video dengan input multi-modal, termasuk teks, gambar, dan video.
Selain itu, VACE juga menyediakan kemampuan penyuntingan video yang lengkap, memungkinkan kreator untuk menggunakan referensi gambar atau frame, melakukan video repainting, modifikasi area tertentu dalam video, dan perluasan spatio-temporal.
Salah satu fitur unggulan dari Wan2.1-VACE adalah kemampuannya untuk menghasilkan video yang menampilkan subjek-subjek yang berinteraksi hanya dengan menggunakan contoh gambar.
Gambar statis pun dapat "dihidupkan" dengan menambahkan efek gerakan alami. Fitur lanjutan seperti mengganti pose, mengatur gerakan, kedalaman gambar, serta mengubah warna pada video juga tersedia. Pengguna juga dapat menambahkan, memodifikasi, atau menghapus area tertentu dalam video tanpa mempengaruhi bagian sekitarnya.
Model ini memanfaatkan teknologi inovatif, termasuk interface terpadu Video Condition Unit (VCU) yang mampu memproses berbagai jenis input secara bersamaan, seperti teks, gambar, video, dan masking dalam satu sistem terintegrasi.
Struktur Context Adapter juga memungkinkan model untuk mengatur berbagai jenis tugas pembuatan video dengan lebih fleksibel dan efisien. Wan2.1-VACE menawarkan fleksibilitas luar biasa yang memungkinkan pengguna menggabungkan berbagai fungsi secara mulus.
Pengguna dapat mengubah gambar diam menjadi video sambil mengatur arah gerak objek secara spesifik, mengganti karakter atau objek dengan referensi tertentu, menganimasikan karakter yang direferensikan, mengontrol pose, serta memperluas gambar vertikal menjadi video horizontal sambil menambahkan elemen baru melalui referensi.
Alibaba Cloud menyediakan model Wan2.1-VACE dalam dua versi open-source: parameter 14 miliar dan parameter 1,3 miliar. Model-model ini dapat diunduh secara gratis di Hugging Face, GitHub, dan ModelScope, komunitas open-source Alibaba Cloud. Hingga kini, model-model Wan2.1 telah diunduh lebih dari 3,3 juta kali di Hugging Face dan ModelScope.
Dengan peluncuran Wan2.1-VACE, Alibaba Cloud berharap dapat menurunkan hambatan bagi lebih banyak bisnis untuk memanfaatkan AI dalam menciptakan konten visual berkualitas tinggi secara cepat dan hemat biaya, terutama dalam produksi video singkat untuk media sosial, konten iklan dan pemasaran, serta produksi film dan televisi.
Cek Berita dan Artikel yang lain di
Google News