ing. machine learning. dijital olarak bulunan herhangi bir veriden istatistiki ve matematiksel yontemler kullanarak oruntu* bulmaya yarayan, ya da buldugu oruntuyu kullanarak tahminde bulunabilen algoritmalardir. yapay zekanin bir alt dalidir.
kendi arasinda cesitli sekillerde gruplara ayrilir. ama bunlari aciklamadan once bazi kelimeleri aciklamam gerekir.
training: yaratilan modeli egitme islemidir. egitim verisi* uzerinde yapilir. egitim verisinde veri ve verinin aldigi deger bellidir. model bu belli degerler yardimiyla ogrenmeye calisir (yani kayip fonksiyonunu sifirlamaya calisir).
validation: modelin performansini test etme islemidir. validation set uzerinde yapilir. eger degistirilmesi gereken hiperparametre filan varsa, bu islem sirasinda alinan performansa gore degistirilebilir. overfitting, underfitting gibi istenmeyen durumlar bu asamada fark edilir. ve yaratilan modelde, kullanilan verilerde ya da hiperparametrelerde degisiklik yapilmasi gerektigini kendisini gelistiren insana belli eder. bu acidan onemlidir.
test: modelin performasini gercekten test etme islemidir. test set uzerinde yapilir. bu islemde modelin kullanilacak veriyi ilk kez gormesi onemlidir. o yuzden validation sirasinda modelin performansinin istenilen duzeyde duzeltildiginden tam olarak emin olmadan test islemine gecilmemelidir.
kullanilan paradigmaya gore makine ogrenmesi ikiye ayrilir.
ınductive machine learning:
normalde makine ogrenme tanimi verilirken bunun tanimi verilir. klasik anlamdaki, makine ogrenmesi bilen herkesin bildigi makine ogrenmesidir. egitim verisi uzerinde ogrenilen oruntunun* test setindeki verilere uygulanmasidir. aslinda bu birazdan yazacagim supervised learning'in ta kendisidir.
transductive machine learning: inductive'in tersine, butun veriyi (egitim ve test) beraber gozlemleyen makine ogrenmesi paradigmasi. tabii ki test verisinin sonuclari* maskeli sekilde verilir modele. model egitim verisine, onun sonuclarina ve test verisine bakarak bir oruntu olusturur. klasik makine ogrenmesi anlamda kullanimina dair bir ornek bilmiyorum ama derin ogrenmede thomas kipf tarafindan gelistirilen graph convolutional networks, transductive bir modeldir.
bu iki paradigma arasindaki diger farklar neler derseniz; inductive, generic bir model uretir ve yeni veriler verilse bile tahmin edebilir. transductive ise, her yeni veri eklenmesinde yeniden baslatilmak zorundadir o yuzden hesapsal acidan maliyetlidir.
unsupervised learning (gozetimsiz ogrenme): herhangi bir veri uzerinde egitim yapmadan, verinin icindeki oruntuleri ve kumelenmeleri kendi kendine bulan ogrenme cesidi. verinin maliyetli (buradaki maliyetten kastim sadece para degil. ingilizcedeki cost kelimesinin cevirisi ama tam uymuyor. zahmetli diyebiliriz belki) oldugu donemlerde kullanisliydi ama su gunlerde buyuk sirketler sag olsun her taraf veri kayniyor. ama supervised learning ve unsupervised learning'in kullanim alanlari arasinda da farklar vardir (aslinda hic birbirlerinin yerlerine kullanilabilirler mi diye dusunmemistim.). unsupervised learning, genelde kumeleme ve birliktelik* gibi problemlerde kullanilir. en meshur ornekleri k-means algoritmasi ve principal component analysis'dir. 'marketten A urununu alan birisinin b urununu de almasi yuksek olasiliklidir' seklindeki cikarimlar birliktelik problemidir.
reinforcement learning (pekistirmeli ogrenme ya da takviyeli ogrenme): ben bunun ne oldugunu kabaca biliyorum ama iki satirlik bir tanimla gecmek istemeyecegim kadar buyuk bir konu. zaten bu yuzden de ukde olarak vermistim. o yuzden bir gun birisi doldurursa ukdeyi, direkt girdi linki yazacagim buraya.
Edit: lelouch nickli yazar sag olsun guzel bir sekilde doldurdu. Reinforcement learning icin bakiniz: #207403
Edit 2: soz konusu yazar, reinforcement learning'le alakali yazdigi girdi de dahil butun girdilerini silmis gibi gorunuyor. tekrar ukde verip, doldurulunca gunceleyecegim.
bunlar disinda simdi girdiyi doldururken hatirladigim birkac ogrenme cesidi daha var. ve haklarinda pek bilgim yok. zaten pek de populer olan seyler degiller ama bilmekte fayda var. onlarin da bakinizlarini birakacagim, eger basligi acilmamissa ukde olarak verecegim.
eger sadece klasik makine ogrenmesi modelleri uzerine bir seyler ogrenmek istiyorsaniz, okuma onerisi olarak christopher bishop tarafindan yazilmis pattern recognition and machine learning adli kitabi onerebilirim. hatta kitabin ismini google'a yazinca ucretsiz pdf'i cikiyor zaten ilk sayfada.
not: yabanci kelime kullanimi icin kusura bakmayin. bazi kelimelerde turkcesi zorlama duruyor, bazilarinda turkce'deki karsiligini bilmiyorum