Tahmin ve Çıkarım 4 - Boyut Küçültme

Ders
Genel
Tahmin ve Çıkarım
Yapay öğrenme
Author

İlker Birbil

Published

June 19, 2018

Aramızda kalsın ama yapay öğrenme için çoğu zaman o kadar da fazla veriye ihtiyaç yok. Hatta bazen sıkı bir temizlik gerekiyor. Evet, yüzlerce değişkenden oluşan bir veri kümesi tutmak artık çocuk oyuncağı.  Fakat sonuçlar çok iyi olsa da, değişken sayısı artınca modeli yorumlamak ve çıkarım yapmak güçleşiyor. Belki de birkaç değişkeni modelden atmak hiç fena olmayabilir. İyi de atılacak değişkenleri nasıl seçeceğiz?

Bazı durumlarda ise örnek sayımız, değişken sayısının altında kalıyor. Mesela insanların hastanede yaptırdıkları 50 farklı test sonucunu (kan değeri, şeker ölçümü, vb.) değişkenleriniz olarak kullandığınızı düşünün. Öte yandan bu bilgi mahrem olduğu için sadece 30 kişi bu değerlerini sizinle paylaşmış olsun. Bu durumda kullandığımız öğrenme modelinin, örneğin bir önceki derste gördüğümüz doğrusal bağlanım yaklaşımının, sonuçlarına güvenebilir miyiz?

Her iki soru da modellerin boyutları, yani değişken sayısı  üzerine. Bu sorulara verilebilecek bazı cevapları bu derste anlattım. Ders boyunca yapay öğrenme yöntemi olarak doğrusal bağlanım kullanıldığını varsaydım. Ancak bu derste anlatılanlar, ileride konuşacağımız diğer yöntemlere de kolayca uygulanabilir.

Sunum dosyasını ve videoyu aşağıda bulabilirsiniz.

 

Boyut Küçültme

Renkli PDF

Siyah-Beyaz PDF