Czym jest PageRank? Algorytm, na którym stało Google

PageRank

PageRank to algorytm oceniający ważność stron internetowych na podstawie analizy linków, stanowił on fundament oryginalnej wyszukiwarki Google. Opublikowany został w 1998 roku przez Larry’ego Page’a i Sergeya Brina na Uniwersytecie Stanforda. Nazwa PageRank pochodzi od nazwiska Larry’ego Page’a (a nie od ang. pagestrona).


Festiwal SEO 2025 Katowice

Główny pomysł algorytmu opiera się na traktowaniu hiperłączy jako głosów zaufania. Strona internetowa zdobywa wyższą „rangę”, jeśli prowadzi do niej wiele innych stron, zwłaszcza tych uznawanych za jakościowe i autorytatywne. W czasach powstania PageRank było to przełomowe podejście, bo wcześniej wyszukiwarki bazowały głównie na dopasowaniu tekstu, a nie strukturze linków. To właśnie PageRank w dużej mierze pozwolił Google wyprzedzić konkurentów (jak AltaVista czy Infoseek), którzy szybko zaadaptowali podobne rozwiązania.

Jak działa algorytm PageRank?

Larry Page, szukając tematu pracy doktorskiej, zauważył, że sieć WWW posiada cechy wielkiego, rosnącego grafu, w którym strony są węzłami, a odnośniki – krawędziami. Tę strukturę porównał do bibliometrii naukowej, w której cytowania są odnośnikami, a adnotacje – opisami tych cytatów. Tak jak w nauce ranga publikacji zależy od liczby i jakości cytowań, tak w sieci wartość strony można powiązać z liczbą i jakością linków prowadzących do niej. Wczesny system BackRub gromadził odnośniki w sieci, analizował je i na tej podstawie oceniał strony.

Z tej idei narodził się PageRank, uwzględniający nie tylko liczbę odnośników do strony, ale też wartość stron linkujących i liczbę ich linków wychodzących. Problem prostego zliczania odnośników rozwiązano poprzez przypisanie większej wagi pojedynczemu linkowi z wartościowej witryny (np. znanego uniwersytetu) niż wielu linkom z mało istotnych stron.

PageRank można zilustrować za pomocą modelu tzw. losowego surfera. Wyobraź sobie użytkownika, który wędruje po sieci. Z bieżącej strony z pewnym prawdopodobieństwem klika losowy link, a czasem znudziwszy się przeskakuje na zupełnie dowolną stronę w internecie. PageRank strony odpowiada wtedy prawdopodobieństwu, że taki przypadkowy internauta znajdzie się akurat na niej.

W praktyce oznacza to, że strona uzyskuje wysoką wartość PageRank, jeśli prowadzą do niej liczne linki z innych stron, zwłaszcza tych z wysokim PageRank, bo zwiększa to szansę „trafienia” na nią. Oznacza to, że link z popularnej, cenionej strony znaczy więcej niż link z mało znanej witryny.

Przykładowy schemat działania algorytmu PageRank. Na ilustracji węzły (ID 1–7) reprezentują strony internetowe, a strzałki – linki prowadzące między nimi wraz z przekazywanymi „udziałami” PageRank (liczby na strzałkach). Wielkość każdego węzła obrazuje względną wartość PageRank danej strony (np. strona ID 1 ma najwyższy PageRank = 0,304). Strona otrzymuje tym większy przyrost PageRank, im wyższy PageRank mają strony linkujące do niej oraz im mniej zewnętrznych linków posiadają (ponieważ linkując do wielu adresów, dzielą się swoją „mocą” na wszystkie).

Formalnie, oryginalny wzór PageRank z pracy Page’a i Brina przedstawia się następująco:

Wzór PageRank: 

PR(A) = (1 – d) + d * Σi=1n ( PR(Ti) / C(Ti) )

gdzie:

  • PR(A) – PageRank strony A,
  • d – współczynnik tłumienia (zwykle 0,85),
  • T₁…Tₙ – strony linkujące do A,
  • C(Tᵢ) – liczba linków wychodzących ze strony Tᵢ.

Współczynnik tłumienia (ang. damping factor) przyjmuje zwykle wartość 0,85 (85%). Oznacza to, że algorytm w ~85% opiera się na „głosach” z linków, zaś pozostałe 15% to bazowa wartość przyznawana każdej stronie (można ją interpretować jako szansę na losowe trafienie na stronę nawet bez żadnych linków). Dzięki temu nawet strony bez linków otrzymują minimalny PageRank, a sumarycznie PageRank wszystkich stron tworzy rozkład prawdopodobieństwa (suma PageRank w całej sieci jest stała).

Algorytm oblicza PageRank iteracyjnie. Na początku wszystkim stronom przypisuje równą wartość startową, a następnie wielokrotnie przelicza powyższe równanie dla każdej strony, aż wartości się ustabilizują (osiągnięty zostaje stan stacjonarny modelu).

W praktyce, Google wykorzystuje do tego zaawansowaną algebrę liniową i techniki przetwarzania rozproszonego, aby obliczyć PageRank dla miliardów stron w rozsądnym czasie. Każda strona ostatecznie otrzymuje swoją wartość PageRank – wewnętrznie jest to liczba rzeczywista (np. 0,304 jak w powyższym przykładzie), ale Google przez wiele lat udostępniało uproszczoną skalę od 0 do 10 jako publiczny wskaźnik PageRank danej strony.

Historia PageRank

PageRank od początku był integralną częścią sukcesu Google, a w początkowych latach firma udostępniała jego wyniki publicznie. W 2000 roku Google wprowadziło Google Toolbar – pasek narzędziowy do przeglądarki, który pokazywał wskaźnik PageRank dla każdej odwiedzanej strony. Był to zielony pasek z wartością PR0–PR10, gdzie 0 oznaczało najniższą ocenę, a 10 najwyższą. Należy podkreślić, że skala ta była logarytmiczna, zatem różnice na wyższych poziomach były ogromne.

Przykładowo strona PR4 mogła być około 25 razy „ważniejsza” niż strona PR2. Publiczny PageRank szybko stał się oczkiem w głowie branży SEO. Właściciele stron i marketerzy zaczęli ścigać się o zdobywanie linków podnoszących PageRank. Zauważono, że witryna z PR7–8 jest bardzo cenna, bo przekazuje dużo „mocy” stronom, do których linkuje. Stąd narodził się cały przemysł pozycjonowania opartego na linkach.

Linki przychodzące (backlinki) stały się na wiele lat najważniejszą walutą SEO. Niestety, doprowadziło to do eksplozji manipulacji, czyli masowego spamowania linkami i tworzenia sztucznych farm linków.

Jak wspominają specjaliści, w szczytowym okresie rzeźnienia PageRanku, pozycjonerzy skupiali się prawie wyłącznie na linkach, a to powodowało że powstawały tysiące stron zapleczowych, katalogów i wpisów służących jedynie generowaniu linków, często kosztem jakości treści. Linki bywały też kupowane na stronach o wysokim PR za duże pieniądze, gdyż uchodziły za szczególnie wartościowe dla podbicia pozycji.

Google musiało zareagować, aby chronić jakość wyników wyszukiwania. Już w 2005 roku wprowadzono atrybut rel=“nofollow dla linków, aby webmasterzy mogli oznaczać odnośniki, które nie przekazują PageRank (np. w komentarzach lub reklamach). Trochę to posłużyło walce ze spamem w linkach.

Google zaczęło również oficjalnie ostrzegać przed schematami wymiany lub sprzedaży linków manipulujących PageRank. Witryny przyłapane na takich praktykach zostawały ukarane (np. obniżeniem pozycji lub usunięciem z indeksu).

W kolejnych latach algorytm rankingowy Google stał się dużo bardziej złożony, integrując setki, a potem tysiące czynników rankingowych poza samym PageRank. Mimo to, linki i ich jakość pozostały jednym z najważniejszych czynników, bo PageRank w pewnej formie nadal zasilał algorytm, choć już nie jako jedyna gwiazda.

Stopniowo Google wycofywało się z upubliczniania PageRank. W 2009 usunięto informacje o PageRank z narzędzi dla webmasterów (wtedy Google Webmaster Tools, obecnie Search Console).

Po 2013 roku przestano aktualizować widoczne wartości PageRank (ostatni update toolbaru miał miejsce w grudniu 2013 ).

Wreszcie, w 2016 roku Google całkowicie wyłączyło z publicznego użytku wskaźnik PageRank i zniknął on z Toolbarów i wszelkich oficjalnych kanałów.

Jak przyznała firma, jedną z przyczyn była nadmierna koncentracja SEO-wców na tym jednym parametrze. Od tego momentu dane PageRank stały się niejawne i Google nie udostępnia już wartości rankingu stron publicznie .

Warto zauważyć, że sam algorytm PageRank nadal funkcjonuje wewnątrz Google. Zostało to potwierdzone przez przedstawicieli Google, mimo wyłączenia „zielonego paska” PageRank w 2016, czynnik ten wciąż jest wykorzystywany przy ustalaniu rankingu wyników.

Nawet ujawnione w 2024 roku wewnętrzne dokumenty Google wskazują, że PageRank pozostaje częścią infrastruktury wyszukiwania.

Oczywiście dzisiejszy PageRank to już znacznie ulepszona i zmodyfikowana wersja względem oryginału z 1998 (Google posiada różne patenty i usprawnienia, np. koncepcję ”seed sites” i reasonable surfer model zastępujące prosty schemat losowego surfera). Niemniej fundament, czyli analizowanie struktury linków w celu oceny autorytetu stron, pozostał ważny.

Czy PageRank ma znaczenie dla SEO dzisiaj?

Dla marketerów i właścicieli małych firm istotne jest zrozumienie, że PageRank to wciąż rdzeń idei oceniania jakości strony na podstawie linków, choć obecnie ukryty pod maską wielu innych czynników.

Nie można już sprawdzić oficjalnej wartości PageRank swojej strony (Google od 2016 nie pokazuje tych danych), ale znaczenie linków nie zniknęło. Google nadal traktuje linki z wiarygodnych, tematycznie powiązanych stron jako sygnał jakości. Jak ujął to jeden z ekspertów: „PageRank stał się mniej istotny sam w sobie dla SEO, ale obecność backlinków z popularnych witryn wciąż pcha stronę wyżej w rankingach”. Link building jest nadal ważny, choć nie należy skupiać się na dawnym wskaźniku liczbowym, którego już nie zobaczymy.

Co zatem robić? Skup się na zdobywaniu naturalnych, wysokiej jakości linków. Tworzenie wartościowych treści, które inni chcą linkować, współpraca z autorytetami w branży, wpisy gościnne na renomowanych portalach, to wszystko przekłada się na „ukryty PageRank” Twojej strony.

Unikaj natomiast sztucznego pozyskiwania linków poprzez spam czy zakup linków, bo Google potrafi wykryć nienaturalne schematy i może nałożyć kary. Warto pamiętać, że algorytm bierze pod uwagę wiele różnych czynników rankingowych (jak słowa kluczowe, jakość treści, szybkość strony, dopasowanie mobilne, sygnały użytkowników i inne). Z tego powodu PageRank (linki) to tylko jeden z elementów układanki SEO, ważny, ale działający w synergii z resztą.

Choć oficjalnego PR już nie sprawdzimy, w branży funkcjonują zamienniki wskaźników autorytetu strony. Firmy takie jak Majestic, Ahrefs czy Semrush oferują własne metryki (np. Trust Flow, Domain Rating, Authority Score), które starają się oszacować „potencjał linkowy” strony na podstawie liczby i jakości jej backlinków.

Nie są to wartości PageRank od Google, ale mogą pomóc ocenić względną siłę profilu linków naszej strony lub konkurencji. Przykładowo, Semrush oblicza Authority Score, który koreluje z jakością linków i ogólną widocznością strony.

Przykład metryki Authority Score w narzędziu Semrush (85/100). Semrush i inne narzędzia SEO oferują wskaźniki oceny jakości strony bazujące m.in. na profilu linków, a to pomaga w analizie konkurencji i monitorowaniu własnego autorytetu.

Majestic podaje dwie główne metryki którymi są Trust Flow i Citation Flow.

Ahrefs wylicza Domain Rating i URL Rating.

Zastosowania algorytmu PageRank poza wyszukiwarką

PageRank zapoczątkował całą rodzinę algorytmów do oceny ważności w sieci i to nie tylko sieci WWW. W kolejnych latach jego koncepcje znalazły zastosowanie w różnych dziedzinach nauki i technologii.

Algorytmy oparte na PageRank wykorzystano m.in. do oceny wpływu publikacji naukowych i dorobku badaczy (powstał nawet tzw. PageRank-index jako potencjalnie lepsza alternatywa dla indeksu Hirscha), do wyznaczania impact factor czasopism w nowych metrykach (np. Eigenfactor w bazie SCImago opiera się na modyfikacji PageRank), a także w biologii, na grafach białek czy genów, by odkrywać kluczowe elementy sieci biologicznych.

Algorytm PageRank posłużył do wskazywania gatunków kluczowych w ekosystemach, przewidywania wyników leczenia nowotworów oraz znajdowania genów powiązanych z działaniami niepożądanymi leków. W dziedzinie sportu stosowano PageRank do rankingu drużyn NFL, piłkarzy czy lekkoatletów, otrzymując nieraz ciekawsze wyniki niż tradycyjne statystyki.

Nawet w mediach społecznościowych idea PageRank żyje dalej – np. X (Twitter) wykorzystuje spersonalizowany PageRank, by polecać użytkownikom konta warte obserwowania (na podstawie sieci follow między profilami).

Jak widać, PageRank to coś więcej niż tylko historyczna ciekawostka z początków Google. To koncepcja, która przetrwała próbę czasu i znalazła wszechstronne zastosowania.

Dla marketerów internetowych najważniejsze jest jednak praktyczne przesłanie płynące z PageRank: linki mają znaczenie. Zdobywanie dobrych linków to zdobywanie „głosów zaufania” w oczach algorytmów wyszukiwarek.

Mimo że nie pogonimy już za widoczną cyferką PageRank, filozofia stojąca za tym algorytmem powinna kierować naszymi działaniami SEO, czyli twórzmy treści, które inni zechcą linkować, budujmy relacje i autorytet, a algorytmy z pewnością to wynagrodzą wysoką pozycją w wynikach wyszukiwania.

PageRank był rewolucyjnym algorytmem Google, który uporządkował Internet według jakości stron. Dziś nie jest już jawnie pokazywany, ale nadal wpływa na rankingi. Znajomość jego działania pomaga zrozumieć, dlaczego link building jest tak ważny w SEO i dlaczego jakościowe, tematyczne odnośniki są warte więcej niż setki przypadkowych linków.

PageRank uczy nas, że internet to sieć powiązań, a w sieci tej warto być dobrze oplecionym wartościowymi linkami, bo wtedy nasza strona będzie postrzegana jako bardziej wartościowa, zarówno przez algorytmy, jak i przez użytkowników.

Źródła: Oryginalne publikacje Brina i Page’a i o algorytmie PageRank

Brin, S., i Page, L. (1998). The anatomy of a large-scale hypertextual web search engine. Computer networks and ISDN systems, 30(1-7), 107-117. http://ilpubs.stanford.edu:8090/361/1/1998-8.pdf

Page, L., Brin, S., Motwani, R., i Winograd, T. (1999). The PageRank citation ranking: Bringing order to the web. Stanford infolab. http://ilpubs.stanford.edu:8090/422/1/1999-66.pdf

The following two tabs change content below.

Artur Strzelecki

Niezależny specjalista, który upowszechnia wiedzę o marketingu w wyszukiwarkach internetowych. Zazwyczaj uczy studentów, a w wolnych chwilach doradza jak odnaleźć własną ścieżkę w Google.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *