Der Effekt eingehender Links:
Es wurde bereits gezeigt, dass ein jeder eingehender
Link auf ein Webseite deren Pagerank stets erhöht. Bei
oberflächlicher Betrachtung des ursprünglichen PageRank-Algorithmus:
PR(A) = (1-d) + d (PR(T1)/C(T1) + ...
+ PR(Tn)/C(Tn))
möchte man meinen, ein zusätzlicher eingehender
Link erhöht den PageRank der verlinkten Seite um:
d × PR(X) / C(X)
wobei PR(X) der PageRank der verlinkenden
Seite X und C(X) deren Anzahl ausgehender Links ist. Bei genauerer
Betrachtung zeigt sich allerdings, dass eine Webseite, die einen
zusätzlichen eingehenden Link erhält, selbst auch auf
andere Webseiten verlinken kann. Diese erhalten nunmehr ebenfalls
einen höheren PageRank, den sie gegebenfalls wiederum
über Links an unsere Seite mit dem zusätzlichen eingehenden
Link zurückgeben.
Die einzelnen Effekte zusätzlicher eingehender
Links sollen nun anhand eines Beispiels beschrieben werden.
Wir
betrachten eine kleine Website aus den Seiten A, B, C und D, die
im Kreis verlinkt sind und nicht selbst auf andere Webseiten verlinken.
Ohne eingehende Links von externen Seiten ergibt sich ganz offensichtlich
ein PageRank von 1 für jede der betrachteten Seiten.
Wir wählen nunmehr eine Seite X, für die ein PageRank
PR(X) von 10 angenommen wird. Seite X verlinkt auf Seite A und sonst
auf keine andere Seite. Bei einem willkürlich gewählten
Dämpfungsfaktor von 0.5 ergibt sich das folgende Gleichungssystem
für den PageRank der einzelnen Seiten unserer Site:
- PR(A) = 0.5 + 0.5 (PR(X) + PR(D)) = 5.5 + 0.5 PR(D)
- PR(B) = 0.5 + 0.5 PR(A)
- PR(C) = 0.5 + 0.5 PR(B)
- PR(D) = 0.5 + 0.5 PR(C)
Da die Anzahl der ausgehenden Links jeder Seite
gleich 1 ist, müssen diese hier nicht berücksichtigt werden.
Die Lösung des Gleichungssystems ergibt folgende Werte für
den PageRank der einzelnen Seiten:
- PR(A) = 19/3 = 6.33
- PR(B) = 11/3 = 3.67
- PR(C) = 7/3 = 2.33
- PR(D) = 5/3 = 1.67
Der unmittelbare Effekt des zusätzlichen Links auf Seite A
in Höhe von:
d × PR(X) / C(X) = 0,5 × 10 / 1 = 5
setzt sich also über die Verlinkung der einzelnen Seiten untereinander
fort.
Der Einfluss des Dämpfungsfaktors:
Der Grad der Weitergabe von PageRank ist
vor allem auch abhängig von der Höhe des Dämpfungsfaktors
d. Wird für diesen beispielsweise ein Wert von 0.75 angenommen,
ergibt sich für das obige Beispiel das folgende Gleichungssystem:
- PR(A) = 0.25 + 0.75 (PR(X) + PR(D)) = 7.75 + 0.75 PR(D)
- PR(B) = 0.25 + 0.75 PR(A)
- PR(C) = 0.25 + 0.75 PR(B)
- PR(D) = 0.25 + 0.75 PR(C)
Die Lösung dieses Gleichungssystems ergibt
folgende Werte für den PageRank der einzelnen Seiten:
- PR(A) = 419/35 = 11.97
- PR(B) = 323/35 = 9.23
- PR(C) = 251/35 = 7.17
- PR(D) = 197/35 = 5.63
Es zeigt sich zunächst ein wesentlich höherer
unmittelbarer Effekt des zusätzlichen eingehenden Links auf
den PageRank von Seite A in Höhe von:
d × PR(X) / C(X) = 0.75 × 10 / 1 =
7.5
Dieser Effekt setzt sich nun aber noch verstärkt
durch die interne Verlinkung der Seiten fort, so dass der PageRank
von Seite A bei einem Dämpfungsfaktor von 0.75 beinahe doppelt
so hoch ist wie bei einem Dämpfungsfaktor von 0.5. Ist der
PageRank von Seite A bei einem Dämpfungsfaktor von 0.5
noch beinahe viermal größer als der Pagerank von
Seite D, so ist er bei einem Dämpfungsfaktor von 0.75 nur noch
etwas mehr als doppelt so groß. Je höher der Dämpfungsfaktor
ist, um so stärker ist einerseits der Effekt auf den PageRank
der den Link erhaltenden Seite und um so gleichmäßiger
verteilt sich andererseits der PageRank auf die anderen Seiten
der Site.
Der tatsächliche Effekt eingehender
Links:
Die Summe der PageRank-Werte aller Seiten
bei einem Dämpfungsfaktor von 0.5 beträgt in unserem Beispiel:
PR(A) + PR(B) + PR(C) + PR(D) = 14
Dadurch, dass eine Seite mit einem PageRank
von 10 mit ihrem einzigen Link auf eine Seite der Beispiel-Site
verlinkt, erhöht sich also deren aufaddierter PageRank
um 10. (Vor Erhalt des Links hatte jede Seite einen PageRank
von 1.) Bei einem PageRank von 0.75 beträgt die Summe der PageRank-Werte:
PR(A) + PR(B) + PR(C) + PR(D) = 34
Der aufaddierte PageRank erhöht sich
also um 30. Es zeigt sich, dass sich die Summe des PageRanks stets
um:
(d / (1-d)) × (PR(X) / C(X))
erhöht, wenn X die verlinkende Seite, PR(X)
deren PageRank und C(X) die Anzahl der ausgehenden Links von
Seite X ist. Dieser Wert ist allerdings daran gebunden, dass die
Verlinkung in ein geschlossenes Sytem von Webseiten, also etwa eine
Website ohne ausgehenden Link erfolgt. Sofern von der Website Links
auf andere, externe Webseiten gesetzt sind, verringert sich der
Faktor entsprechend.
Die Begründung für den oben angegebenen
Wert liefert uns Raph Levien und sie bezieht sich auf das Random
Surfer Modell. Die Länge eines Surf-Vorgangs des Zufalls-Surfers
ist eine Exponentialverteilung mit einem Mittel von (d/(1-d)). Wenn
also der Zufalls-Surfer einen Link auf ein geschlossenes System
von Webseiten verfolgt, besucht er im Schnitt genau (d/(1-d)) Seiten
innerhalb dieses geschlossenen Systems. Und genau so viel mehr PageRank
der ursprünglich verlinkenden Seite - gewichtet nach der Anzahl
der ausgehenden Links - muss damit an das geschlossene System übertragen
werden.
Lawrence Page und Sergey Brin geben regelmäßig
einen Dämpfungsfaktor von 0.85 für die tatsächliche
PageRank-Berechnung an. Damit ergibt sich ein Faktor für
die Erhöhung des aufaddierten PageRanks einer geschlossenen
Site durch einen zusätzlichen eingehenden Link von Seite X
in Höhe von:
(0.85 / 0.15) × (PR(X) / C(X)) = 5.67
× (PR(X) / C(X))
Eingehende Links haben also einen weitaus größeren
Effekt auf den PageRank als man bei oberflächlicher Betrachtung
annehmen mag.
Die PageRank-1 Regel:
Viele Nutzer der Google Toolbar stellen fest,
dass oftmals Seiten mit einem bestimmten Toolbar-PageRank
eine darauf verlinkende Seite mit einem Toolbar-PageRank aufweisen,
der um den Wert 1 höher ist als der der verlinkten Seite. Diese
Beobachtung dient vielfach dazu, den hier präsentierten PageRank-Algorithmus
in Frage zu stellen. Dagegen soll an dieser Stelle gezeigt werden,
dass die Beobachtung vollkommen im Einklang mit dem hier präsentierten
PageRank-Algorithmus steht.
Zuallererst stützt die PageRank-1 Regel
das grundlegende Konzept des PageRank-Verfahrens. Webseiten
sind genau dann bedeutsam, wenn andere bedeutsame Webseiten auf
sie verweisen. Es ist nicht erforderlich, dass eine Website viele
eingehenden Links erhält, um einen hohen PageRank zu
bekommen. Ein einzelner Link von einer Website mit einem hohen PageRank
reicht hierzu aus.
Dafür, dass die PageRank-1 Regel auch
mit dem hier präsentierten PageRank-Algorithmus in Einklang
steht, sind mehrere Faktoren verantwortlich. Zunächst ist Toolbar-PageRank
eine logarithmisch skalierte Version des tatsächlichen PageRank.
Wenn der PageRank einer verlinkenden Seite im Sinne der Toolbar
um eins höher ist als derjenige der verlinkten Seite, so kann
ihr tatsächlicher PageRank immer mindestens um einen
Faktor höher sein, der der Basis des für die Skalierung
eingesetzten Logarithmus entspricht. Ist also die Basis des Logarithmus
gleich 6, und der Toolbar-PageRank der verlinkenden Seite
gleich 5, so kann der tatsächliche PageRank der verlinkten
Seite immer mindestens 6 Mal kleiner sein, damit diese in jedem
Fall noch einen Toolbar-PageRank von 4 erreicht.
Der Basis des Logarithmus wirkt nun die Anzahl
der ausgehenden Links auf der verlinkenden Seite entgegen, da deren
PageRank praktisch unter allen verlinkten Seiten aufgeteilt
wird. Es wurde allerdings oben auf dieser Seite bereits gezeigt,
dass der über einen Link an eine Seite weitergegebene PageRank
weitaus größer sein kann, als der im Algorithmus erscheinenden
Term d(PR(Ti)/C(Ti)) vermuten lässt. Dies hängt damit
zusammen, dass intern in der Regel weitere Seiten auf die von außen
verlinkte Seite verlinken und somit weiteren PageRank auf
diese Seite verteilen. Gehen wir nun etwa davon aus, dass die logarithmische
Basis für die Skalierung 6 beträgt und weiterhin bei einem
hohen Dämpfungsfaktor das doppelte des nach ausgehenden Links
gewichteten PageRank der verlinkenden Seite auf die verlinkte
Seite übertragen wird, so könnte die verlinkende Seite
mindestens 12 ausgehende Links haben, damit die verlinkte Seite
immer noch einen Toolbar-PageRank aufweist, der maximal um
1 kleiner ist als derjenige der verlinkenden Seite.
Eine Zahl von 12 ausgehenden Links erscheint an
dieser Stelle zugegebenermaßen sehr gering. Allerdings ist
es in aller Regel so, dass wenn eine Webseite von außen verlinkt
wird, dies nicht nur von einer einzelnen Seite geschieht, und der
betrachteten Seite somit noch weiterer PageRank übertragen
wird. Falls sich Beispiele finden, bei der eine Seite durch einen
einzigen externen Link ein PageRank übertragen wird,
der der PageRank-1 Regel entspricht, und die verlinkende Seite
eine hohe Zahl ausgehender Links hat, so ist dies vor allem ein
Indiz dafür, dass der PageRank der verlinkenden Seite
sich im oberen Bereich ihres Toolbar-PageRank-Wertes befindet.
Schließlich könnte die verlinkende Seite aus unserem
Beispiel eine "hohe" 5 und die verlinkte Seite eine "tiefe" 4 sein.
In diesem Falle könnte die verlinkende Seite bis zu 72 ausgehende
Links aufweisen. Diese Zahl würde sich weiter erhöhen,
wenn wir von einer größeren logarithmischen Basis für
die Skalierung des Toolbar-PageRanks ausgehen.
|