Google artık dudak okuyor!

Google'ın yapay zeka bölümü Deep Mind ve Oxford Üniversitesi'nden araştırmacılar, piyasanın en iyi dudak okuma yazılımını geliştirdiler.

BBC'den binlerce saatlik video ile eğitilen sinir ağı, videolardaki konuşmaları yüzde 46,8 isabetle algılayabildi. Ses kaydından yapılan algılamaya göre bu oranın pek etkileyici görünmediği doğru. Ancak profesyonel bir insan dudak okuyucusunun ancak yüzde 12,4 isabet kaydedebildiğini söyleyelim.

Oxford Üniversitesi'nden benzer bir araştırma sürdüren bir başka grup, testlerde yüzde 93,4 isabete ulaşan LipNet adlı bir program geliştirmişti. Bu testlerde insanların sağladığı isabet ise yüzde 52,3 idi. Ancak LipNet'in testi, sadece özel kaydedilmiş, sabit ifadelerden oluşan cümlelerden oluşuyordu. DeepMind'ın yazılımı ise çok daha zor videolarla test edildi.



DeepMind araştırmacıları, programın duyma zorluğu çeken kişilere yardımcı olabileceğini, sessiz filmlere açıklamalar yazmakta kullanılabileceğini veya Siri, Alexa gibi dijital asistanları kontrol etmekte kullanılabileceğini söylüyor. Bu tür teknolojiler elbette gizlilik endişeleriyle de geliyor – dudak okuyan yazılımlar, gelecekte günlük hayatta konuştuklarımızı kaydetmekte kullanılabilir. Bununla birlikte araştırmacılar, parlak, iyi aydınlatılmış yüksek çözünürlüklü videolarla karlı, kare oranı düşük görüntülerde kaydettikleri isabet arasında halen büyük farklar olduğunu söylüyorlar. Yine de bu fark, giderek kapanıyor gibi görünüyor.

İlgili Galeriler
Avatar
Adınız
Yorum Gönder
Kalan Karakter:
Yorumunuz onaylanmak üzere yöneticiye iletilmiştir.×
Dikkat! Suç teşkil edecek, yasadışı, tehditkar, rahatsız edici, hakaret ve küfür içeren, aşağılayıcı, küçük düşürücü, kaba, müstehcen, ahlaka aykırı, kişilik haklarına zarar verici ya da benzeri niteliklerde içeriklerden doğan her türlü mali, hukuki, cezai, idari sorumluluk içeriği gönderen Üye/Üyeler’e aittir.