COVID-19 ile alakalı derlenmiş bilgiler
Open AI
OpenAI kâr amacı gütmeyen bir araştırma şirketi olup yapay zeka alanında herkes için iyi olan yapılar oluşturmak hedefindedir. Elon Musk ve Sam Altman tarafından bulunmuştur.
OpenAI Gym Pekiştirmeli Öğrenme (RL) algoritmalarının geliştirilmesi ve karşılaştırılması için kullanılan bir araçtır.
Çeşitli öğrenme ajanlarını destekler ve bunlar robotların yürümesi, oyunların oynanması gibi görevleri yerine getirir. Gym açık kaynaklı bir pekiştirmeli öğrenme ara yüzüdür. Gym bir çevre sunar ve neler yapılacağı geliştiricilere bırakılmıştır. Geliştiriciler TensorFlow veya Theano gibi sayısal hesaplama kütüphanelerine ajan geliştirebilirler.
Neden Gym (2016)
Pekiştirmeli Öğrenme (RL) makine öğrenmeye dahil olan bir alt gruptur. Daha çok karar verme ve motor kontrolleri için kullanılır. Ajanların nasıl öğrendiği ve görevleri tamamlamak için neler yaptığını inceler bu işlemler genelde belirsiz veya karmaşık ortamlarda gerçekleşir (dünyaya bırakılan bir robotun kendi kendine öğrenmesi gibi). 2 sebepten ötürü gerçekten heyecan vericidir:
RL çok genel, tüm sorunları kapsayan ve bunların dahil olduğu bir seri kararlar genelidir. Örneğin Robot motorlarının kontrol edilmesi ile yürüyebilmesi ve koşabilmesi, fiyat ve depo yönetimi gibi iş kararları vermek veya video oyunları oynamak gibi. RL gözetimli öğrenme yöntemleri için de kullanılabilir.
RL algoritmaları zorlu ortamlarda çok iyi sonuçlar elde etmeyi başarmaya başladı. RL geçmişi çok uzundur, fakat derin öğrenmeye ulaşması henüz yeni gerçeklemiştir, sorun temelli çokça mühendisliğe ihtiyacı vardır. DeepMind’ın Atari sonuçları, AlphaGo RL algoritmaları kullanarak hedeflerine ulaşmışlardır.
Ancak RL araştırmaları iki sebepten dolayı yavaşlamıştır:
Daha iyi sonuç karşılaştırmaları ihtiyacı. Gözetimli Öğrenmede işlemler çok büyük veri setleri ile yürütülmekteydi ImageNet gibi. RL’de ise, buna en yakın ortam çok veri içeren ve çeşitli ortamalar barındıran bir yapı olmalıydı. Ancak mevcut açık kaynaklı RL çözümleri bunlara sahip değildi.
Ortamların standart olmayışı. Problemlerin tanımlanması, ödül sistemi veya aksiyon alma mekanizmalarının farklılık göstermesi işleri daha da zor hale getiriyordu. Bu sorunlar ise sonuçların karşılaştırılmasını daha da zorlaştırıyordu.
Gym ise bu sorunların ikisine de çözüm getirdi.