Denetimli öğrenme (Supervised learning)

Makine öğrenmesi daha önce bahsettiğimiz gibi elimizdeki veriyi kullanarak anlamlı bir veri çıkarmak diyebiliriz.

Veri setinin içinde sonuçlarda var diyelim. Bu verilere göre oluşturduğumuz modele göre de yeni verilerin tahmin ediliyorsak bu öğrenme biçimine denetimli öğrenme denir.

Kısaca örneklemek gerekirse elimizde böyle bir veri olduğunu varsayalım;

yas	boy	kilo	cinsiyet
20	185	85	erkek
30	164	55	kadın
40	170	80	erkek
25	170	57	kadın
23	175	73	erkek
60	160	60	erkek
17	170	80	erkek
28	172	62	kadın
44	166	58	kadın

Bunlar tamamen rastgele yazdığım veriler. Elimizdeki yaş, boy, kilo verilerine göre cinsiyet tahmini yapabilmesini istiyoruz diyelim. Karar ağacı(decision tree) algoritmasını kullandığımızı varsayalım. Böyle bir veri setini makineye öğrenmesi için verdiğimizde genel itibari ile veriyi iki parçaya bölmemiz gerekiyor(partitioning).

Eğitim Verisi: Makinenin öğrenmesi için verinin bir kısmını al ve bunları karar ağacı algoritmasına göre incele. Daha sonra bir tahmin de bulunması gerekirse bu veriler üstünden tahmin yürütmüş olacaktır.
Test Verisi: Eğitim verisini karar ağacı algoritmasından geçirdikten sonra tahminlerin doğruluğunu test etmek için bir kısım veriyide bu bölüme ayırırız. Örnek eğitim verisi için %70 kısım ayrılıyorken test için %30’luk bir kısım ayrılır. Ve makine öğrenimi tamamladıktan sonra bu test verisiyle testini yapıp doğruluk oranını yükseltmeyi amaçlar.

Denetimli öğrenme problemleri ikiye ayrılır;

Regresyon (Regression)
Sınıflandırma (Classification)

Regresyon (Regression)

Sayısal çözümleme yapılır. Sayısal değerler verilir ve bu sayısal değerler arasındaki ilişkiye göre bir matematiksel fonksiyon oluşturulur. Daha sonra gelen verilere göre sonuç tahmin edilir. Regresyon eldeki verileri görselleştirdiğimizde verilerin arasındaki ilişkinin eğrisini çizmek olarak da düşünebiliriz.

Örnekler;

Bir evin büyüklüğü ve lokasyonu verildiğinde fiyatının tahmini.
Bir firmanın reklam giderleri satışları nasıl etkilediği

Bazı regresyon algoritmaları;

Doğrusal Regresyon (Linear Regression)
Çoklu doğrusal Regresyon (Multilinear Regression)
Polinomsal Regresyon (Polynominal Regression)
Lojistik Regresyon (Logistic Regression)
Karar Ağacı Regresyonu (Decision Tree Regression)
Rastgele Ormanlar Regresyonu (Random Forest Regression)
Destek Vektör Regresyonu (Support Vector Regression)

Sınıflandırma (Classification)

Verilerin algoritmalar sayesinde sınıflandırması veya kategorilere ayrılması işlemine denir.

Örnekler;

Elma, portakalları rengi ve büyüklüğüne göre ayırt edilmesi
Sıcaklık, nem, rüzgârı değerleri verilerek havanın güneşli, yağmurlu vs. tahmin edilmesi
Bir mailin spam veya spam olmadığını çözümlemek

Bazı sınıflandırma algoritmaları;

Naif Bayes Sınıflandırılması (Naive Bayes Classifier)
Kara Ağacı Sınıflandırılması (Decision Tree Classifier)
KNN / K - En Yakın Komşu (K-nearest neighborhood)
Destekçi Vektör Makinesi (Support Vector Machine)

kaynaklar

etiketler

makineogrenmesi denetimliogrenme

Regresyon (Regression)

Sınıflandırma (Classification)

kaynaklar

etiketler

Subscribe