ByteDance, perusahaan di balik TikTok, baru aja ngenalin teknologi AI keren bernama OmniHuman-1. Dengan alat ini, kamu bisa bikin video realistis dari cuma satu foto! Bayangin, fotomu bisa berubah jadi video di mana kamu bisa ngomong, gerak, nyanyi, atau bahkan main alat musik—semuanya tanpa harus bikin video sendiri!
Menurut penelitian yang mereka rilis di arXiv, OmniHuman bisa bikin animasi manusia yang lebih realistis dibandingkan teknologi lain yang udah ada. Bahkan, AI ini bisa ngejalanin foto dalam berbagai format—dari potret wajah, setengah badan, sampai foto full-body—dan hasilnya tetap mulus serta tampak nyata.
Di halaman resmi proyek OmniHuman, ada contoh videonya yang cukup mind-blowing. Salah satunya, Albert Einstein yang terlihat seperti benar-benar sedang mengajar di depan papan tulis. “Apa jadinya seni tanpa emosi? Pasti terasa kosong,” kata Einstein versi AI sambil menggerakkan tangan dan menampilkan ekspresi wajah yang hidup. Rasanya kayak melihat cuplikan kuliah nyata dari masa lalu, tapi dengan kualitas video zaman sekarang!
Teknologi ini bikin ByteDance (dan TikTok) makin kuat di persaingan AI untuk bikin manusia digital super realistis. Sekarang aja kita udah sering lihat influencer virtual yang promosi produk, avatar pejabat yang bantu pelayanan publik, sampai versi AI dari seleb yang bisa ngobrol sama fans. Tapi di sisi lain, ada juga kekhawatiran soal penyalahgunaannya—misalnya buat hoaks politik atau endorse palsu.
Freddy Tran Nager, seorang profesor di University of Southern California, bilang kalau OmniHuman bisa berguna buat pendidikan. “Bayangkan kalau Marilyn Monroe yang ngajarin statistik,” katanya bercanda. Tapi dia juga melihat kemungkinan lain, seperti kreator TikTok yang udah capek bisa bikin versi AI diri mereka sendiri buat ngeposting konten. Atau malah TikTok sendiri yang bikin konten tanpa perlu manusia sama sekali?
Samantha G. Wolfe, pakar teknologi dari NYU, juga menyoroti potensi bahaya AI ini. “Kalau ada versi palsu dari pemimpin bisnis atau politik yang ngomong hal yang sebenarnya nggak pernah mereka katakan, dampaknya bisa besar,” ujarnya. Semakin realistis videonya, semakin banyak orang yang percaya tanpa sadar itu buatan AI.
ByteDance sendiri melatih OmniHuman dengan lebih dari 18.700 jam video manusia, menggunakan kombinasi teks, suara, dan gerakan tubuh. Tapi, mereka belum menjelaskan detail lebih lanjut soal sumber datanya.
Yang jelas, OmniHuman bukan AI pertama yang bisa bikin video dari foto, tapi yang bikin beda adalah jumlah data pelatihan yang mereka punya. Nager bahkan berkelakar, “Kalau kamu pernah bikin video di TikTok, mungkin sekarang kamu udah masuk database yang bakal dipakai buat bikin manusia virtual.”