Stanford Üniversitesi, Max Planck Enformasyon Enstitüsü, Princeton Üniversitesi ve Adobe Research ortaklığında gerçekleştirilen çalışma, tekrar tekrar yapılacak pahalı yeniden çekimlerin önüne geçmeyi hedefliyor.

Algoritma, bir yüzü 40 dakika kadar inceleyerek yeni görüntüleri ve sesi nasıl ekleyeceğine dair gözlemler yapıyor.  Bu 40 dakikalık video, algoritmaya, öznenin orijinal senaryoda, her fonetik hecede yüzü tam olarak çözme şansı veriyor.

Algoritma gerekli yeni şekilleri yapan yüzün bir 3D modelini oluşturabilir. Ve oradan, Neural Rendering adlı bir makine öğrenme tekniği gerçek modelden temelde ayırt edilemez görünmesi için foto-gerçekçi dokular ile 3B modele boyayabilir. Program şimdilik kendi kendine ses dosyası üretemiyor ve o konuda yardıma ihtiyaç duyuyor.

Konuşmacının sesini ve videoyu oluşturmak istiyorsanız VoCo gibi yazılımlar da kullanılabilirsiniz

Ekip, yazılımının etik dışı kullanım için sahip olduğu potansiyelin farkında. Dünya henüz büyük bir Deepfake skandalıyla sarsılmadı. Ancak bir kişi aldatıcı bir video ile ortalığı karıştırabilir.

Paylaş