Neden A.I. Arapça'yı Anlamak için Mücadele Edebilir

$config[ads_kvadrat] not found

NEDEN ARAPÇA ÖĞRENİYORUM | NASIL ARAPÇA ÖĞRENİLİR?

NEDEN ARAPÇA ÖĞRENİYORUM | NASIL ARAPÇA ÖĞRENİLİR?
Anonim

Yapay zeka dünyasında, veriler kraldır. Ne kadar çok sahipseniz, araçlar o kadar iyi hale gelir, sistemler ne olacağını daha fazla “öğrenebilir”. Ancak platforma bağlı olarak A.I. Yahoo Labs'ın bir araştırma bilimcisi olan Miriam Redi'ye göre, bazı dillerden veri çekiyor, bazı diller diğerlerinden daha iyi temsil edilebiliyor.

“Mesela verilerimizi aldığımız Flickr gibi, bazı diller çok az temsil ediliyor” dedi Redi, Perşembe günü Londra’daki Derin Öğrenme Zirvesi’nde. “Yani İngilizcemiz, İngilizcemiz için milyonlarca imge var, ancak Arapça için belki 100.000'imiz var.”

Redi’nin ekibi kültürel değerler ve duygusal çağrışımlar gibi görsellere görünmeyen unsurları tanımlayabilecek bir araç üzerinde çalışıyor. Araç, Flickr'da halka açık görüntülere iliştirilmiş metni analiz eder. Zamanla, A.I. Birisinin neden “mutlu parti” veya “garip an” imajını etiketleyebileceğini anlamaya başlar, ancak araç daha fazla görüntü analiz ettikçe bu fikirler daha da doğrulanacaktır.

Redi, “Ne yazık ki, Arapça dillerinde görüntülerde duyarlılık algılamanın doğruluğu daha düşük olma eğilimindedir çünkü yeterli veriye sahip değiliz” dedi.

Daha büyük miktarda veriye sahip dillerde Redi’nin ekibi birkaç ilginç örüntü fark etti. Fransızca ve İspanyolca gibi romantizm dilleri kendilerini benzer yollarla ifade etme eğilimindeyken, İtalyanca, kullanıcıların “vergi kaçakçılığı” terimiyle görüntüleri tanımladığı tek dil olarak ortaya çıktı.

Dil engelleri hala A.I. için bir sorun olmaya devam ediyor. Araştırmacılar. Google Çeviri’yi kullanan herkes, dil değiştirmenin hiçbir zaman göründüğü kadar basit olmadığını bilir. Bununla birlikte, yeni gelişmeler bir şeyleri değiştiriyor, Facebook bu yaz bir tek dilli sosyal ağ hayaline yaklaştığını duyuruyor, kullanıcılar için metinleri otomatik olarak çeviriyor.

Dil engellerinin kaldırılmasındaki gelişmeler uluslararası iletişimin gelişmesine yardımcı olabilir, ancak Redi’ler gibi projeler için insan tarafından üretilen duyarlılık verilerinin gerçek bir alternatifi yoktur.

$config[ads_kvadrat] not found