JAKARTA – Perkembangan teknologi pembelajaran mesin yang canggih telah meningkatkan kekuatan kecerdasan buatan secara signifikan. Model AI terbaru Microsoft, misalnya, dapat menganimasikan gambar diam orang.
Microsoft telah memperkenalkan model AI yang dapat menganimasikan gambar menggunakan suara. Ini adalah penemuan yang luar biasa tetapi ada potensi risikonya.
Diberitakan Essanews, Rabu (24/4/2024) model yang dikenal dengan nama Microsoft VASA-1 ini mampu membuat gambar berbicara, menyinkronkan gambar orang dengan rekaman suara. Teknologi ini secara ajaib mengubah foto biasa menjadi gambar bergerak berupa ucapan atau nyanyian
Hapus gambarnya
Diuji menggunakan potret yang diproduksi oleh Microsoft dan tidak dibuat dengan Stylegun 2 dan Dal-E3. Fitur ini bekerja dengan baik untuk potret kehidupan nyata dan avatar animasi, termasuk tes animasi Mona Lisa yang terkenal.
Model VASA-1 tidak hanya menyinkronkan gerakan bibir, tetapi juga menangkap seluruh ekspresi alami wajah dan gerakan kepala, sehingga membuat animasi terlihat realistis.
Model ini mendukung pembuatan animasi dengan resolusi 512 x 512 piksel pada frame rate 45 frame per detik dalam mode offline. Dapat menghasilkan perekaman real-time hingga 40 frame per detik dengan latensi minimum 170 ms pada komputer desktop yang dilengkapi kartu grafis NVIDIA GeForce RTX 4090.
Potensi ancaman AI
Microsoft berfokus pada pembuatan animasi visual dalam skenario ini. Namun, mereka mengakui bahwa teknologi ini dapat disalahgunakan dalam kejahatan seperti peniruan identitas.
Microsoft telah secara terbuka menyatakan penolakannya terhadap pembuatan model VASA-1 untuk tujuan penipuan atau konten berbahaya yang berisi gambar orang sungguhan. Akibatnya, perusahaan memutuskan untuk tidak merilis versi demo, API, atau produk lengkapnya ke publik. Microsoft terus menggunakan teknologi ini untuk meningkatkan deteksi konten palsu.
MG/Maulana Kusumadewa Iskandar



