Google PageRank to algorytm stworzony przez Larry’ego Page’a i Sergeya Brina, współzałożycieli Google, podczas ich studiów na Uniwersytecie Stanforda. Algorytm ten został wprowadzony w 1996 roku i stanowi jedną z podstawowych technologii, na której zbudowana jest wyszukiwarka Google. Jego głównym celem jest ocena wartości i ważności strony internetowej w kontekście jakości i liczby linków prowadzących do niej.
PageRank bierze pod uwagę nie tylko liczbę odnośników, ale również ich jakość. Link ze strony o wysokim PageRank ma większą wartość niż odnośnik z witryny o niskim wskaźniku.
W kolejnych latach po wprowadzeniu, algorytm PageRank został rozbudowany i zintegrowany z innymi algorytmami i technologiami używanymi przez Google. Chociaż nie jest już jedynym czynnikiem wpływającym na pozycjonowanie stron w wynikach wyszukiwania, wciąż jest jednym z istotnych elementów algorytmu.
Obliczanie PageRank
Oryginalne równanie PageRank, opracowane przez Larry’ego Page’a i Sergeya Brina, można przedstawić w następujący sposób:
Gdzie:
- 𝑃𝑅(𝐴)PR(A) to PageRank strony A.
- 𝑃𝑅(𝑇1),𝑃𝑅(𝑇2),…,𝑃𝑅(𝑇𝑛)PR(T1),PR(T2),…,PR(Tn) to PageRank stron, które linkują do strony A.
- 𝐶(𝑇1),𝐶(𝑇2),…,𝐶(𝑇𝑛)C(T1),C(T2),…,C(Tn) to liczba linków wychodzących z każdej z tych stron.
- 𝑑d to współczynnik tłumienia (damping factor), który zwykle przyjmuje wartość około 0.85.
- (1−𝑑)(1−d) to prawdopodobieństwo, że użytkownik trafi na stronę A bez kliknięcia w link (np. poprzez wpisanie adresu bezpośrednio w przeglądarce).
Objaśnienie równania
- Współczynnik tłumienia 𝑑:
- Współczynnik tłumienia 𝑑d (najczęściej ustawiany na 0.85) odzwierciedla prawdopodobieństwo, że użytkownik podąży za linkiem na stronie. Pozostałe 0.15 to prawdopodobieństwo, że użytkownik trafi na stronę losowo, bez korzystania z linków. Wartość 𝑑d pomaga zapewnić, że każda strona internetowa otrzymuje pewną minimalną wartość PageRank.
- Linki prowadzące do strony 𝐴:
- PageRank strony A zależy od PageRank stron, które do niej linkują (𝑇1,𝑇2,…,𝑇𝑛T1,T2,…,Tn). Jeśli strona A jest linkowana przez strony o wysokim PageRank, to sama również będzie miała wysoki PageRank.
- Liczba linków wychodzących 𝐶(𝑇𝑖):
- Każda strona, która linkuje do strony A, przekazuje część swojego PageRank do strony A. Jednakże, wartość PageRank przekazywana przez link jest podzielona przez liczbę linków wychodzących z tej strony. Oznacza to, że link z strony, która ma wiele linków wychodzących, przekazuje mniejszą część swojego PageRank niż link z strony, która ma mało linków wychodzących.
- Suma wszystkich tych wartości:
- Całkowity PageRank strony A jest sumą PageRank przekazywanego przez wszystkie strony linkujące do A, pomnożonego przez współczynnik tłumienia 𝑑d, plus niewielka stała wartość (1−𝑑)(1−d).