Singapur Teknoloji ve Tasarım Üniversitesi’nden (SUTD) araştırmacılar, karmaşık hareket dizaynını anlamak için tasarlanmış destekli öğrenme ve faz değişim belleği etrafında şekillenen yeni bir yazılım geliştirdi.
Daha evvelki çalışmalar bu çeşit derin öğrenmeyi satranç yahut Go üzere öbür oyunlara uygulamıştı, fakat araştırmacılar bunun yerine D-PPO algoritmasını Street Fighter Champion Edition II’nin zorluğuna karşı test etmeye karar verdi. SUTD araştırmacıları, SF-R2 yapay zeka oyuncusunu, bilgisayara karşı iki gün üst üste oynayarak eğitti. Daha sonra yapay zeka, bir Street Fighter şampiyonunu yenmeyi başararak kendisinden bekleneni yerine getirdi.
Araştırma makalesine nazaran, bu çalışma hareket bilimi için daha geniş kapsamlı sonuçlar içeriyor. Örneğin robotik ve otonom araçların geliştirilmesinde kıymetli bir rol oynayabilir. Ayrıyeten makinelerin insan normlarını gözlemleyebileceği ve bunları taklit etmeye ve daha uygun performans göstermeye çalışabileceği alanlarda geniş çapta uygulanabilir eğitimin de önünü açıyor.
Yapay zeka araştırmacılarının geliştirdikleri sistemlerin aktifliğini ölçmek için kullandıkları en yaygın yollardan biri, bu sistemleri farklı oyun cinslerinde insan oyuncularla yarıştırmak. 2017 yılında DeepMind tarafından geliştirilen bir Alpha Go yapay zekası, bir evvelki yıl Fan Hui’ye karşı kazandığı birinci zaferin akabinde ikinci sefer dünyanın bir numaralı insan Go oyuncusunu yendi. Microsoft’un yapay zekası Haziran ayında dünyanın birinci kusursuz Ms. Pac-Man skorunu elde etti ve Ağustos ayında bir OpenAI motorunun zamanın en yeterli Dota 2 oyuncularını yendiğini gördük.
Bir Street Fighter şampiyonunu yenerek elde edilen bu son muvaffakiyet, destekli öğrenmenin yanı sıra faz değişimli bellek sayesinde mümkün oldu. Birinci olarak HP tarafından geliştirilen bu bellek, kalkojenit cam üzerindeki alanları değiştirmek için elektrik yükleri kullanılarak elde edilen bir cins uçucu olmayan bellek çeşidi. Yani yaygın olarak kullanılan Flash bellekten çok daha süratli.
Baş araştırmacı Desmond Loke TechXplore’a yaptığı açıklamada “Yaklaşımımız eşsiz zira en âlâ insan oyuncularınkinden daha uygun performans gösteren hareketler yaratma konusunu çözmek için destekli öğrenmeyi kullanıyoruz. Bu, evvelki yaklaşımları kullanarak mümkün değildi ve yaratabileceğimiz hareket cinslerini dönüştürme potansiyeline sahip” dedi.