DeepMind, Kendi Kendine Öğretilen Bir A.I. İnsanları Zekâsı Olabilir

$config[ads_kvadrat] not found

Kendi Kendine

Kendi Kendine

İçindekiler:

Anonim

Bilgisayarlar kırılgan insan kıçımızı birkaç on yıldır satrançta tekmeliyorlar. Bu ilk kez gerçekleşti, 1996’da, IBM’in Deep Blue’su dünya şampiyonu Gary Kasperov’u devraldı. Fakat Alfabe’deki A.I.’den yeni bir çalışma. Kıyafet DeepMind, ilk zaferin gerçekte ne kadar sınırlı olduğu konusunda ışık tutuyor.

Birincisi, Kasperov hemen geri sıçradı, üç maç kazandı ve eski başına altı maçta iki kez çizim yaptı. Günlük Haberler rapor.

Fakat DeepMind araştırmacısı Julian Schrittwieser'in söylediği gibi çok daha önemli Ters Deep Blue gibi uygulamalar da manuel olarak programlandı. Bu, insanların A.I.'yi öğretmesi gerektiği anlamına gelir. akla gelebilecek her acil durumla nasıl başa çıkılacağı hakkında bilmesi gereken her şey. Başka bir deyişle, yalnızca programladığı insanlar kadar iyi olabilirdi. Ve Deep Blue açıkçası satrançta oldukça iyi olabiliyordu; Go benzeri bir oyun daha benzer, benzer bir oyun verdim ve ipucu yoktu.

Alfa Sıfır tamamen farklı. Bugün dergide yayınlanan yeni bir çalışmada Bilim Yazarlar, Alpha Alpha'ya sadece satrançta insanları nasıl yeneceklerini öğretmediklerini, Alpha Zero'ya nasıl öğretileceğini de açıkladılar. kendine öğret Birden fazla oyunda ustalaşmak için.

A.I. Kendisini Öğretmek

Alfa Sıfır, derin takviye öğrenme denilen bir teknik kullanılarak geliştirilmiştir. Temel olarak, bu A.I. temel satranç kuralları gibi, çok basit bir şey ve daha sonra bu basit şeyi tekrar tekrar yapmak, strateji ve teknikler gibi daha ilginç, ilginç şeyler öğrenene kadar tekrar tekrar yapın.

“Geleneksel olarak… insanlar oyun hakkındaki bilgilerini alır ve kurallara göre kodlamaya çalışırlar” diyor Alpha Zero'da yaklaşık dört yıldır çalışmakta olan Schrittwieser. “Yaklaşımımız rastgele başlatılıyor ve sonra kendi aleyhinde oyun oynamasına izin veriyoruz ve bu oyunların kendisinden hangi stratejilerin işe yaradığını öğrenebiliyor.”

Alfa Sıfır'ın aldığı tüm temel kurallardır ve oradan kendi kendine oynayarak nasıl kazanılacağını öğrenir. Yeni bulgulara göre, Alpha Zero'nun satrançta ustalaşması, dokuz saat Shogi'de ustalaşması ve Go'da ustalaşması için yaklaşık 13 günü aldı. Çünkü kendi kendine oynuyor, aslında kendi kendine öğretildi. Tüm dünya şampiyonu insan güdümlü algoritmaları kıymetli hale getirerek, 2017 dünya şampiyonunu Shogi'de yüzde 91 mağlup etti.

Schrittwieser “Oyunla ilgili ilginç bilgileri bağımsız olarak keşfedebilir” diyor. “Daha çok insan gibi çalışan programlara öncülük ediyor.”

Stili insan gibi ve yaratıcı olsa da, Alpha Zero'nun mevcut tüm bilgilere ulaşabileceği herhangi bir oyunda baskın olması için yeterince optimal olduğunu söylüyor. Aslında, Alfa Sıfır çok sofistike, A.I.'nın sınırlarını zorlamak için tamamen farklı bir oyun sınıfına geçmemiz gerekebilir. problemleri çözer.

Neden Alpa Zero Çok İyi

A. I. Araştırmacılar, bu oyunları, birkaç nedenden ötürü daha karmaşık algoritmalar için test alanı olarak kullanmayı seviyor. Zarifler ve insanlar yüzlerce yıldır oynuyorlar, birincisi, algoritmanızı test etmek için birçok potansiyel meydan okumanız var. Fakat aynı zamanda karmaşık ve karmaşıktırlar, yani A.I. Bu gerçek dünyada problemleri çözebilir. Schrittwieser, bir sonraki araştırma alanının kusurlu bilgilerle en iyi kararları verebilen Alpha Zero gibi bir algoritma oluşturduğunu söylüyor.

“Tüm bu oyunlarda, olan her şeyi biliyorsunuz” diyor. “Gerçek dünyada, bilginin sadece bir kısmını biliyor olabilirsiniz. Kendi kartlarını biliyor olabilirsin, ama rakibinin durumunu bilmiyorsun, kısmi bilgin var. ”

Alpha Zero gibi algoritmalar da bu tür bir meydan okuma için verebilecek çok sayıda oyun tahtası var.

“Daha da karmaşıklaştığımız sorunları daha karmaşık hale getirmek istiyoruz” diyor. “Ama her zaman bir boyut her zaman”

Aynı zamanda, Deep Mind’in yeni nesil bilgisayarlı problem çözücüler, oyun dünyasından gerçek dünyaya geçme potansiyeli olduğunu gösteriyor. Bu haftanın başlarında, bir protein sekansını 3B yapısını doğru bir şekilde tahmin edebilecek duruma getirebilen AlphaFold adlı başka bir algoritmayı duyurdu.Bu, onlarca yıldır şaşırmış bilim adamlarının problemidir ve Alzheimer’den kistik fibrozlara kadar çeşitli hastalıkların tedavisi için kapının açılmasına yardımcı olabilir.

$config[ads_kvadrat] not found