İnternette rasgele bir siteden başlayıp, yine rasgele şekilde linklere tıklayarak ilerleyen bir kullanıcının (bkz: random surfer) belli zaman sonra bir sitede bulunma ihtimali ile siteyi değerlendiren algoritma. Bu şekilde sadece çok link alan değil, aynı zamanda diğer yüksek skorlu sayfalardan link alan sayfalar yüksek skorlar elde ederler.
İlgilisi için: Webi her her sayfa bir düğüm, her link bir kenar olacak bir graf olarak modelleyince oluşan markov zincirinin stasyoner dağılımına tekabül eder.
google'in kurucularindan larry page ve sergey brin tarafindan stanford'daki doktora egitimi * ortaya atilan siralama/ derecelendirme algoritmasi. Zaten ismi de buradan gelir.
pagerank, sarhOs birisinin yuruyusune benzetilebilir. zaten daha once de belirtildigi gibi random walkS ile ve daha bircok stokastik surec ile iliskisi vardir.
daha sonralari 2004 yilinda rada mihalcea bir haber metni veri setindeki cumleler uzerinde random walks yaparak textrank adli calismayi yayinladi. bu calismada mihalcea hem en onemli cumleleri secerek haberi ozetleyebildi, hem de her cumleden anahtar kelimeleri cikartabildi. varsayimi pagerank ile ayni sekilde; en onemli cumlenin diger cumlelerden daha cok baglanti almasinin yuksek ihtimal olmasiydi.
Yine ayni sekilde citation networks gibi alanlarda kullanildi. ama gerek mihalcea'nin calismasinda, gerekse diger calismalarda cumlelerin ( ya da dugumlerin) neye gore kime gore onemli oldugunu belirleyen fonksiyon cok sigdi ve insan eliyle yazilmisti. dusunun mesela; "entry'lerinde 'Mesela' yazanlara 5 puan fazla ver" diye bir fonksiyon yazsam ne kadar dogru olur. insan eliyle hazirlanan her fonksiyon bir sekilde tarafli oluyordu.
Peki cozumu neydi? cozum dugumlerin onemlerini derin ogrenmeye maruz kalmis modelin kendisinin belirlemesiydi. daha dogrusu soz konusu fonksiyonu egitile egitile ogrenmesiydi. Su anda google'da calisan bryan perozzi 2013-2014 yilinda deep random walks ile bilinen anlamda ilk graph neural networks'u ortaya atti. aslinda daha onceden yapilmis calismalar vardi ama GPU'nun derin ogrenme calismalarinda yer edinmesiyle populer olan calisma bu oldu. daha sonra gelsin gcn'ler, gitsin grnn'ler seklinde 2020 yilina kadar cesit cesit graph Neural Networks modeli ortaya atildi.
ilgilenenler icin makaleler:
1) The pagerank citation algorithm: bringing order to the Web (Larry Page, Sergey Brin, et al.) 2) textrank: Bringing order into texts (Rada Mihalcea, Paul Tarau) 3) deepwalk: Online Learning of Social Representations (Bryan Perozzi et al.)