Google PageRank berekening
Over de werking van Google's belangrijkste ranking criterium
is veel geschreven. Ik neem de vrijheid om de originele Google PageRank
berekening in - hopelijk - simpele bewoordingen samen te vatten.
Ter verduidelijking geef ik een voorbeeld
waarmee ik de berekening van de Google PageRank illustreer.
De Google PageRank (PR) wordt voor elke webpagina, die
in de Google database is opgenomen, berekend. De waarde kan varieren
tussen 0,15 en oneindig, maar om representatieve redenen wordt de
PR omgezet naar een getal tussen 0 en 10 (van laag naar hoog). Als
basis voor de PR berekening gelden de kwantiteit en vooral de kwaliteit
van de pagina's die naar uw site wijzen. Volgens Sergey Brin en
Lawrence (Larry) Page, Co-founders van Google, wordt de PR van een
pagina als volgt berekend:
PR(A) = (1 - d) + d * SOM ((PR(I->A)/C(I))
Hierbij is:
- PR(A) de PageRank van uw pagina A.
- d de dempingsfactor die gewoonlijk 0,85 bedraagt. Als een pagina
met een PR van 10 slechts 1 link naar een andere pagina heeft
dan geeft deze pagina 'slechts' een waarde van 8,5 door. Op deze
manier wordt een gelinkte pagina lager gerankt dan zijn verwijzer.
De PR wordt als het ware gedempt.
- PR(I->A) de PageRank van pagina I die naar uw site wijst.
- C(I) het aantal links die vanaf pagina I naar andere pagina's
verwijzen.
- PR(I->A)/C(I) de waarde die uw pagina A van pagina I krijgt
doorgegeven in de PageRank berekening.
- SOM (PR(I->A)/C(I)) de som van alle doorgegeven waarden van
pagina's die naar uw pagina A verwijzen.
Met andere woorden: De PageRank van uw pagina
wordt bepaald door de PageRank van elke pagina die naar uw pagina
A verwijst. Per verwijzende pagina wordt diens PageRank gedeeld
door het aantal uitgaande links, en die uitkomsten worden bij elkaar
opgeteld en vermenigvuldigd met 0,85. Tenslotte wordt daarbij nog
0,15 opgeteld om de PageRank van uw pagina A te bepalen. Deze formule
wordt door Google meerdere malen uitgevoerd (iteraties), om tot
de uiteindelijke individuele PageRank van alle geindexeerde pagina's
te komen.
Elke maand rekent Google de PageRank uit voor miljarden
pagina's. Om u te laten zien hoe dat gaat hebben we een simpel voorbeeld
uitgewerkt.
Voorbeeld:
In dit voorbeeld gaan we uit van een Google database
met slechts vier pagina's (A t/m D). De pagina's zijn, zoals weergeven
in het eerste plaatje, met elkaar gelinkt.

De pagina's hebben allen een initiele PR-waarde van 1,
want de bovenstaande formule werkt alleen indien er startwaarden
worden aangenomen. Ook wordt de formule niet een keer maar een aantal
malen uitgevoerd (iteraties). Deze noodzaak ontstaat door link structuur.
Na 1 berekening zijn de uitgangswaarden veranderd, en kun je de
berekening herhalen. In dit voorbeeld stabiliseren de PageRanks
pas na 20 iteraties.

Bekijk onze (engelstalige) spreadsheet
om te zien hoe deze waarden zijn berekend.
Dmoz.org en Yahoo
Tenslotte zijn er nog een tweetal bijzondere sites die
de Google PageRank van uw site positief beinvloeden. Op dit moment
zijn opnames in de Open Directory Project en Yahoo! directories
(www.dmoz.org en www.yahoo.com)
belangrijke factoren voor een boost in de PageRank calculatie.
Wat precies hun invloed is niet bekend, maar het valt op dat er
in de top-10 lijst van willekeurige zoekresultaten een groot aantal
sites staan met een Google Directory notering. Deze Google directory
is een directe kopie van de Dmoz.org database. Ik wil u dus aanraden
uw site bij deze belangrijke directories aan te melden.
Hierbij wil ik het laten. Er is veel bekend, maar ook
veel onbekend over de werking van het ranking mechanisme in Google.
Het is het geheime ingredient van de zoekmachine dat waarschijnlijk
net als het volledige recept van Coca Cola nooit zal worden onthuld.
Ik vertrouw er echter op dat u met deze informatie een
stap verder komt. Uiteraard zijn commentaar of aanvullingen op deze
tekst en berekeningen van harte welkom.
Dirk Giesen
Whitelines Communications
PS: Met behulp van de Google
toolbar kunt u de PR van een willekeurige pagina vaststellen.
|