İnsan beynine benzer şekilde ‘düşünen bir bilgisayar’ türü olan sinir ağı Speech2Face, bilim insanları tarafından yaklaşık 100 bin farklı kişinin konuşma videoları kullanılarak eğitildi.

Speech2Face, bu veri kümesinden yararlanarak vokal ipuçları ile insan yüzündeki bazı fiziksel özellikler arasındaki ilişkiyi öğrendi. Sonraki adımda ise yapay zeka, dinletilen farklı ses kayıtlarında konuşan kişilerin yüz modellemelerini yaptı.

Çalışmayı gerçekleştiren bilim insanları Speech2Face’in, bireyin yalnızca sesini temel alarak neye benzediğini henüz tam olarak belirleyemediğini ancak cinsiyet, yaş ve etnik köken gibi özellikleri ayırt edebildiğini belirttiler.

Speech2Face, henüz yolun başında olmasına rağmen kimi zaman gerçeğe oldukça yakın modellemeler yapmayı da başardı. ABD merkezli internet güvenlik şirketi Cloudflare’in kriptografi uzmanı Nick Sullivan, Speech2Face’i eğitmek için kullanılan örneklerden biri olduğunu, yapay zekanın modellediği yüzleri arasında kendi yüzünü görünce öğrendi.
Yapay zeka sesten yararlanarak ortalama görünüşte yüzler çizebiliyor. Speech2Face’in önden görünen, nötr ifadeli yüzler modellediğini ifade eden bilim insanlarına göre daha detaylı çizimler için çalışmanın ilerletilmesi gerekiyor.

Paylaş