Microsoft Research, İnsandan Daha İyi Konuşma Tanıma'yı Keşfediyor

Hande Ünsal – Daha İyi

Hande Ünsal – Daha İyi
Anonim

Microsoft, insanlardan daha doğru konuşma tanıma yazılımı geliştiren dünyanın ilk şirketi oldu. Pazartesi günü yayınlanan “Konuşmalı Konuşma Tanımada İnsan Paritesinin Ulaşılması” adlı makalede, yazılım, insanların konuşmayı anlamada ne kadar iyi olduklarını dikkate almanın inanılmaz olduğu, insan çabalarından yüzde yarım daha az hata içeren transkriptler üretti. Atılım, yeni A.I. her zamankinden daha doğru asistanlar.

Teknolojinin bu kadar kısa bir sürede ne kadar ulaştığı etkileyici. Çok uzun zaman önce, bilgisayar konuşma tanıma, umutsuzca uzak görünen garip bir niş oldu. Windows Vista’nın konuşma yazılımının bu gösterimini 2006’dan itibaren izleyin:

Ekip, konuşma transkripsiyonlarının güvenilirliğini ölçmek için endüstride kullanılan Ulusal Standartlar ve Teknoloji Enstitüsü (NIST) 2000 testini kullandı. Telefon üzerinden iki katılımcı arasında bir konuşma gerçekleşir, sonuçtaki komut dosyası karşılaştırılmadan ve sözlük yazımlarına karşı denetlenmeden önce, sırayla sırayla çevrilir.

İki yabancının ilk kez konuştuğu santral bölümünde, insan hata oranı yüzde 5,9 civarındadır, ev arama bölümünde, birbirini tanıyan iki kişinin konuştuğu yerde, hata oranı yüzde 11,3 civarındadır. Microsoft’un yazılımı yüzde 0,4 daha düşük hata oranına ulaştı.

Atılım, yeni sürükleyici A.I. formlarının getirilmesine yardımcı olacak. Ağustos ayında, öğrenci Joshua Browder, evsizlerin ücretsiz yasal tavsiye almalarına yardımcı olabilecek DoNotPay chatbot'unu tamamladı. Tanıma gelişmeleriyle birlikte insanların sanal bir asistandan bilgisayarlarıyla düzenli olarak konuşarak konut konusunda yardım istemesini istedikleri bir geleceği görmek kolaydır.

Bu aşamada araştırmacılar, A.I. destekli konuşma tanımanın nasıl daha akıllı tepkiler verebileceğini düşünüyorlar. Sensay, bir öfke algılayıcı A.I. Siri'nin arkasındaki laboratuardan, kullanıcının kızgın mı yoksa kafası karışmış mı olduğunu saptamak için gelişmiş tanıma yetenekleri kullanıyor ve cevaplarını duruma göre değiştiriyor. Hataya açık ses tanıma engelini kaldırmak, sanal yardım için heyecan verici yeni fırsatlar yaratır.