Karar ağacı algoritmasını hatırlarsak bir tane ağaç yapısı oluşturuyorduk. Daha sonra ağaç yapısı için bir kök ve değişkenlerin değerlerine göre dallar oluşturulup sonuca ulaşmaya çalışıyorduk. Elimizde olan veri setindeki değerleri random olarak kullanarak, bu ağaçlardan n tane oluşturuyorsak buna rassal orman algoritması deniyor. Yani rasgele değerlere göre oluşturulmuş dalları olan ağaçlar bütünüdür. Buna da haliyle orman deniyor. Hem sınıflandırma, hem de regresyon için kullanılabilinir. Aşağıdaki resim biraz daha açıklayıcı olabilir.

Random Forest

Algoritma o kadar çok ağaç yapısı oluşturur ki, çıkan sonuçlardan en iyi sonuçları elde etmeye yarar. Çıkan sonuçlar içinde oylama yapılır ve doğru dallar oluşturulur.

Rassal orman algoritması topluluk öğrenmesi (ensemble learning) metodlarından biri olarak geçer. Farklı algoritmaların sonucunda en uyumlu sonucu üretmek gibi düşünebilirsiniz.

Random Forest

Yukarıda görüldüğü gibi n tane üretilen ağaçların oluşturduğu ormanın ağaçlarındaki en uygun yollar izlenerek en verimli sonuçlar elde edilir. Bunu daha büyük bir ağaç algoritmasına benzetebilirsiniz.

kaynaklar

etiketler

makineogrenmesi randomforest