- Katılım
- 1 May 2020
- Mesajlar
- 15,741
- Çözümler
- 1
- Tepkime puanı
- 42,766
- Puanları
- 113
Yapay Zeka Sistemlerinde Gerek Duyulan Veri Setlerini Azaltabilecek Bir Yöntem Bulundu
Waterloo Üniversitesi’nden bir çift istatistikçi, yapay zeka(YZ) sistemlerinin derin öğrenmede gerek duyduğu büyük veri setlerini azaltmak için, yeni bir matematiksel çözüm yolu olabileceğini öne sürdü. Ilia Sucholutsky ve Matthias Schonlau’nun fikirlerini tarif ettiği makale arXiv’de yayınlandı. Günümüzde derin öğrenme ağlarının genişlemesiyle bir çok yeni uygulama alanı doğdu. Sahte videolar, masa oyunları ve otomatik tıbbi teşhis koyma gibi bir çok alanda YZ teknolojisi kullanılabiliyor. Derin öğrenme ağları büyük veri setleri gerektirdiğinden, verilen görevi gerçekleştirmek için çıkarılacak şablonları belirlemek gerekiyor örneğin; kalabalıktaki birinin yüzünü seçmek gibi. İşte bu yeni çalışmada, araştırmacılar bu veri setlerini küçültmenin bir yolu olabileceğini düşündüler. Mesela, çocukların bir hayvanın diğer örneklerini hatırlaması için birkaç resmine bakması yetiyor. İstatistikçiler olarak bunu çözmenin bir yolunun matematiksel yöntemlerden geçebileceğini hayal ettiler.
Araştırmacılar MIT ekibinin(Massachusetts Institute of Technology) daha önce yaptığı bir çalışmayı yeniden oluşturdu. Sonra veri setinde el yazısıyla yazılmış rakamları(MNIST olarak da biliniyor) tanımlamak için en alakalı bilgilerin süzülerek gruplandırılmasıyla, YZ sisteminin yeni veri setindeki harfleri tanıması için gereken sayısal karakter sayısının önemli ölçüde azaldığını keşfetti. Kanada’daki ekip bunun nedenini şöyle açıklıyor: sistem rakamları algılamak için yeni bir yöntemle eğitildiğinden daha az veriye ihtiyaç duyuyor. Örneğin, sadece 3 sayısını binlerce kez göstermek yerine, onu 8 gibi bir sayıya benzeyen(%30) bir sayı gibi tanıttı ve diğer rakamlarda da benzeri şekilde aynı şekilde devam etti. Bu ipuçlarına yumuşak etiketler (soft labels) adını verdiler. Sonra, bu fikri makine öğrenmesine uygulayarak k-en yakın komşusunu (k-nearest neighbor -kNN) kullanarak grafik yaklaşımlara transfer etti. İşte bu yumuşak etiketler veri setlerine uygulayarak, XY grafiğindeki koordinatları tanımlayabiliyorlar. Sonuç olarak, YZ sistemi büyük veri setlerine ihtiyaç duymadan, grafiğe kolayca noktaları yerleştirebildi. İşte araştırmacılar bu yaklaşımı “tek seferlik öğrenmeden daha azı” (LO-shot) olarak adlandırıyor ve kullanım alanının daha genişletilebileceğini düşünüyor. Yine de sistemin savurma(winnowing) işlemini başlatması için halen büyük veri setlerine ihtiyaç duyacağı belirtiliyor.
...Copyright (C) Gerçek Bilim kaynağını göstermeden paylaşmak ve yayınlamak yasaktır,
.
Waterloo Üniversitesi’nden bir çift istatistikçi, yapay zeka(YZ) sistemlerinin derin öğrenmede gerek duyduğu büyük veri setlerini azaltmak için, yeni bir matematiksel çözüm yolu olabileceğini öne sürdü. Ilia Sucholutsky ve Matthias Schonlau’nun fikirlerini tarif ettiği makale arXiv’de yayınlandı. Günümüzde derin öğrenme ağlarının genişlemesiyle bir çok yeni uygulama alanı doğdu. Sahte videolar, masa oyunları ve otomatik tıbbi teşhis koyma gibi bir çok alanda YZ teknolojisi kullanılabiliyor. Derin öğrenme ağları büyük veri setleri gerektirdiğinden, verilen görevi gerçekleştirmek için çıkarılacak şablonları belirlemek gerekiyor örneğin; kalabalıktaki birinin yüzünü seçmek gibi. İşte bu yeni çalışmada, araştırmacılar bu veri setlerini küçültmenin bir yolu olabileceğini düşündüler. Mesela, çocukların bir hayvanın diğer örneklerini hatırlaması için birkaç resmine bakması yetiyor. İstatistikçiler olarak bunu çözmenin bir yolunun matematiksel yöntemlerden geçebileceğini hayal ettiler.
Araştırmacılar MIT ekibinin(Massachusetts Institute of Technology) daha önce yaptığı bir çalışmayı yeniden oluşturdu. Sonra veri setinde el yazısıyla yazılmış rakamları(MNIST olarak da biliniyor) tanımlamak için en alakalı bilgilerin süzülerek gruplandırılmasıyla, YZ sisteminin yeni veri setindeki harfleri tanıması için gereken sayısal karakter sayısının önemli ölçüde azaldığını keşfetti. Kanada’daki ekip bunun nedenini şöyle açıklıyor: sistem rakamları algılamak için yeni bir yöntemle eğitildiğinden daha az veriye ihtiyaç duyuyor. Örneğin, sadece 3 sayısını binlerce kez göstermek yerine, onu 8 gibi bir sayıya benzeyen(%30) bir sayı gibi tanıttı ve diğer rakamlarda da benzeri şekilde aynı şekilde devam etti. Bu ipuçlarına yumuşak etiketler (soft labels) adını verdiler. Sonra, bu fikri makine öğrenmesine uygulayarak k-en yakın komşusunu (k-nearest neighbor -kNN) kullanarak grafik yaklaşımlara transfer etti. İşte bu yumuşak etiketler veri setlerine uygulayarak, XY grafiğindeki koordinatları tanımlayabiliyorlar. Sonuç olarak, YZ sistemi büyük veri setlerine ihtiyaç duymadan, grafiğe kolayca noktaları yerleştirebildi. İşte araştırmacılar bu yaklaşımı “tek seferlik öğrenmeden daha azı” (LO-shot) olarak adlandırıyor ve kullanım alanının daha genişletilebileceğini düşünüyor. Yine de sistemin savurma(winnowing) işlemini başlatması için halen büyük veri setlerine ihtiyaç duyacağı belirtiliyor.
...Copyright (C) Gerçek Bilim kaynağını göstermeden paylaşmak ve yayınlamak yasaktır,
Ziyaretçiler için gizlenmiş link, görmek için
Giriş yap veya üye ol.