MIT'in Yeni Algoritması, Garipleşmeden Önce İnsan Etkileşimlerini Tahmin Edebilir

$config[ads_kvadrat] not found

MIT изнутри - Массачусетский Технологический Институт

MIT изнутри - Массачусетский Технологический Институт
Anonim

Başkalarını okuyamamamız, destansı bir beşlikten beşinin başarısız olmasına ve öpüşmelere neden oldu. Yaşam boyu süren bir deneyimin ardından bile, insan etkileşimlerinin tahmin etmesi zor. Ancak MIT'in Bilgisayar Bilimi ve Yapay Zeka Laboratuvarı araştırmacıları, yardım edebileceklerini düşünüyorlar: İki insanın ne zaman sarılacağını, öpüleceğini, el sıkışacağını veya beşinciyi ne zaman olacağını tahmin edebilen yeni bir derin öğrenme algoritması ile geleceğe doğru büyük bir adım attılar. bu tuhaf anlardan yoksun kutsanmış olarak.

Yeni algoritmalarını ümit ediyorlar - 600 saatlik YouTube videoları ve TV şovlarında eğitildiler. Ofis, Scrubs, Big Bang Teorisi, ve Umutsuz Ev Kadınları - Daha az sosyal açıdan garip robotlar programlamak ve hatta kaçırmak için şansımız olmadan önce bize eylem önermek için Google Glass tarzı kulaklıklar geliştirmek için kullanılabilir. Geleceklerini hayal ediyorlar, bir daha asla iş arkadaşınızla birlikte yüksek beşlik hava yapma şansını bulamayacaksınız.

Robotların bizim yaptığımız gibi sosyal olmayı öğrendiğini anlamak algoritmanın başarısının anahtarıydı. CSAIL Ph.D. “İnsanlar otomatik olarak deneyimleriyle eylemleri önceden tahmin etmeyi öğreniyorlar; bu da bizi aynı türden sağduyulu kullanmaya çalışmakla ilgilendi” dedi. İlgili bir makalenin ilk yazarı olan öğrenci Carl Vondrick, bu hafta Uluslararası Bilgisayarla Görme ve Örüntü Tanıma Konferansında sunuldu. “Sadece büyük miktarlarda video izleyerek, bilgisayarların çevreleri hakkında sürekli olarak öngörülerde bulunabilmeleri için yeterli bilgi edinebileceklerini göstermek istedik” dedi.

Vondrick ve ekibi bu durumda, Jim ve Pam’in beşinci saatlerinin beşinci saatlerini ve Mike ve Susan’ın gizemli öpücüklerini kendi başlarına analiz etmek için algoritmanın çoklu “sinir ağlarını” öğrettiler. Uzatılmış kollar, yükseltilmiş bir el veya uzun bir bakış gibi faktörler göz önüne alındığında, sinir ağlarının her biri, bir sonraki saniyede ne olacağını tahmin etti ve ağların genel görüş birliği, son olarak “tahmin” olarak alındı. ders çalışma.

Algoritma zamanın yüzde 43'ünü doğru buldu. Günlük etkileşimlerimizin daha az garip olacağını garanti etmek için yeterince yüksek görünmese de, sadece yüzde 36 hassasiyete sahip mevcut algoritmalar üzerinde büyük bir gelişme var.

Ayrıca, insanlar sadece eylemlerin zamanın yüzde 71'ini tahmin edebiliyorlar. Alabileceğimiz her türlü yardıma ihtiyacımız var.

Çalışmanın ikinci bölümünde, algoritma beş saniye sonra olay yerinde hangi nesnenin - evsel telsizler, uzaktan kumandalar, bulaşıklar ve çöp tenekeleri gibi - görüneceğini tahmin etmek için öğretildi. Örneğin, bir mikrodalga kapı açılırsa, bir kupa daha sonra görülme ihtimali oldukça yüksektir.

Algoritmaları henüz Google Glass için yeterince doğru değil ancak ortak yazar Antonio Torralba, Ph.D. - Google fakülte araştırma ödülü ve Google Doktora ile çalışan Vondrick tarafından finanse edildi. Arkadaşlık - oraya gideceğine bahse girebiliriz. Algoritmanın gelecekteki sürümleri Vondrick, robotlarla insanlarla etkileşime geçmek için program yapmak ve hatta bir kişi düştüğünde veya yaralandığında kayıt yapmayı güvenlik kameralarına öğretebileceğini öngörüyor.

Vondrick, “Bir video, tüm potansiyel yolları görebileceğiniz“ Kendi Maceranızı Seçin ”kitabına benzemez” diyor. “Gelecek doğal olarak belirsiz, bu yüzden tüm olasılıkları tahmin etmek için bu temsilleri kullanan bir sistem geliştirmek için kendimize meydan okumak heyecan verici.”

$config[ads_kvadrat] not found