Der Effekt eingehender Links
Es wurde bereits gezeigt, dass ein jeder eingehender Link auf ein Webseite
deren Pagerank stets erhöht. Bei oberflächlicher Betrachtung des ursprünglichen
PageRank-Algorithmus
PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))
möchte man meinen, ein zusätzlicher eingehender Link erhöht den PageRank der
verlinkten Seite um
d × PR(X) / C(X)
wobei PR(X) der PageRank der verlinkenden Seite X und C(X) deren Anzahl
ausgehender Links ist. Bei genauerer Betrachtung zeigt sich allerdings, dass
eine Webseite, die einen zusätzlichen eingehenden Link erhält, selbst auch auf
andere Webseiten verlinken kann. Diese erhalten nunmehr ebenfalls einen höheren
PageRank, den sie gegebenfalls wiederum über Links an unsere Seite mit dem
zusätzlichen eingehenden Link zurückgeben.
Die einzelnen Effekte zusätzlicher eingehender Links sollen nun anhand eines
Beispiels beschrieben werden.
Wir betrachten eine kleine Website aus den Seiten A, B, C und D, die im Kreis
verlinkt sind und nicht selbst auf andere Webseiten verlinken. Ohne eingehende
Links von externen Seiten ergibt sich ganz offensichtlich ein PageRank von 1 für
jede der betrachteten Seiten. Wir wählen nunmehr eine Seite X, für die ein
PageRank PR(X) von 10 angenommen wird. Seite X verlinkt auf Seite A und sonst
auf keine andere Seite. Bei einem willkürlich gewählten Dämpfungsfaktor von 0.5
ergibt sich das folgende Gleichungssystem für den PageRank der einzelnen Seiten
unserer Site:
PR(A) = 0.5 + 0.5 (PR(X) + PR(D)) = 5.5 + 0.5 PR(D)
PR(B) = 0.5 + 0.5 PR(A)
PR(C) = 0.5 + 0.5 PR(B)
PR(D) = 0.5 + 0.5 PR(C)
Da die Anzahl der ausgehenden Links jeder Seite gleich 1 ist, müssen diese
hier nicht berücksichtigt werden. Die Lösung des Gleichungssystems ergibt
folgende Werte für den PageRank der einzelnen Seiten:
PR(A) = 19/3 = 6.33
PR(B) = 11/3 = 3.67
PR(C) = 7/3 = 2.33
PR(D) = 5/3 = 1.67
Der unmittelbare Effekt des zusätzlichen Links auf Seite A in Höhe von
d × PR(X) / C(X) = 0,5 × 10 / 1 = 5
setzt sich also über die Verlinkung der einzelnen Seiten untereinander fort.
Der Einfluss des Dämpfungsfaktors
Der Grad der Weitergabe von PageRank ist vor allem auch abhängig von der Höhe
des Dämpfungsfaktors d. Wird für diesen beispielsweise ein Wert von 0.75
angenommen, ergibt sich für das obige Beispiel das folgende Gleichungssystem:
PR(A) = 0.25 + 0.75 (PR(X) + PR(D)) = 7.75 + 0.75 PR(D)
PR(B) = 0.25 + 0.75 PR(A)
PR(C) = 0.25 + 0.75 PR(B)
PR(D) = 0.25 + 0.75 PR(C)
Die Lösung dieses Gleichungssystems ergibt folgende Werte für den PageRank
der einzelnen Seiten:
PR(A) = 419/35 = 11.97
PR(B) = 323/35 = 9.23
PR(C) = 251/35 = 7.17
PR(D) = 197/35 = 5.63
Es zeigt sich zunächst ein wesentlich höherer unmittelbarer Effekt des
zusätzlichen eingehenden Links auf den PageRank von Seite A in Höhe von
d × PR(X) / C(X) = 0.75 × 10 / 1 = 7.5
Dieser Effekt setzt sich nun aber noch verstärkt durch die interne Verlinkung
der Seiten fort, so dass der PageRank von Seite A bei einem Dämpfungsfaktor von
0.75 beinahe doppelt so hoch ist wie bei einem Dämpfungsfaktor von 0.5. Ist der
PageRank von Seite A bei einem Dämpfungsfaktor von 0.5 noch beinahe viermal
größer als der Pagerank von Seite D, so ist er bei einem Dämpfungsfaktor von
0.75 nur noch etwas mehr als doppelt so groß. Je höher der Dämpfungsfaktor ist,
um so stärker ist einerseits der Effekt auf den PageRank der den Link
erhaltenden Seite und um so gleichmäßiger verteilt sich andererseits der
PageRank auf die anderen Seiten der Site.
Der tatsächliche Effekt eingehender Links
Die Summe der PageRank-Werte aller Seiten bei einem Dämpfungsfaktor von 0.5
beträgt in unserem Beispiel
PR(A) + PR(B) + PR(C) + PR(D) = 14
Dadurch, dass eine Seite mit einem PageRank von 10 mit ihrem einzigen Link
auf eine Seite der Beispiel-Site verlinkt, erhöht sich also deren aufaddierter
PageRank um 10. (Vor Erhalt des Links hatte jede Seite einen PageRank von 1.)
Bei einem PageRank von 0.75 beträgt die Summe der PageRank-Werte
PR(A) + PR(B) + PR(C) + PR(D) = 34
Der aufaddierte PageRank erhöht sich also um 30. Es zeigt sich, dass sich die
Summe des PageRanks stets um
(d / (1-d)) × (PR(X) / C(X))
erhöht, wenn X die verlinkende Seite, PR(X) deren PageRank und C(X) die
Anzahl der ausgehenden Links von Seite X ist. Dieser Wert ist allerdings daran
gebunden, dass die Verlinkung in ein geschlossenes Sytem von Webseiten, also
etwa eine Website ohne ausgehenden Link erfolgt. Sofern von der Website Links
auf andere, externe Webseiten gesetzt sind, verringert sich der Faktor
entsprechend.
Die Begründung für den oben angegebenen Wert liefert uns Raph Levien und sie
bezieht sich auf das Random Surfer Modell. Die Länge eines Surf-Vorgangs des
Zufalls-Surfers ist eine Exponentialverteilung mit einem Mittel von (d/(1-d)).
Wenn also der Zufalls-Surfer einen Link auf ein geschlossenes System von
Webseiten verfolgt, besucht er im Schnitt genau (d/(1-d)) Seiten innerhalb
dieses geschlossenen Systems. Und genau so viel mehr PageRank der ursprünglich
verlinkenden Seite - gewichtet nach der Anzahl der ausgehenden Links - muss
damit an das geschlossene System übertragen werden.
Lawrence Page und Sergey Brin geben regelmäßig einen Dämpfungsfaktor von 0.85
für die tatsächliche PageRank-Berechnung an. Damit ergibt sich ein Faktor für
die Erhöhung des aufaddierten PageRanks einer geschlossenen Site durch einen
zusätzlichen eingehenden Link von Seite X in Höhe von
(0.85 / 0.15) × (PR(X) / C(X)) = 5.67 × (PR(X) / C(X))
Eingehende Links haben also einen weitaus größeren Effekt auf den PageRank
als man bei oberflächlicher Betrachtung annehmen mag.
Die PageRank-1 Regel
Viele Nutzer der Google Toolbar stellen fest, dass oftmals Seiten mit einem
bestimmten Toolbar-PageRank eine darauf verlinkende Seite mit einem
Toolbar-PageRank aufweisen, der um den Wert 1 höher ist als der der verlinkten
Seite. Diese Beobachtung dient vielfach dazu, den hier präsentierten
PageRank-Algorithmus in Frage zu stellen. Dagegen soll an dieser Stelle gezeigt
werden, dass die Beobachtung vollkommen im Einklang mit dem hier präsentierten
PageRank-Algorithmus steht.
Zuallererst stützt die PageRank-1 Regel das grundlegende Konzept des
PageRank-Verfahrens. Webseiten sind genau dann bedeutsam, wenn andere bedeutsame
Webseiten auf sie verweisen. Es ist nicht erforderlich, dass eine Website viele
eingehenden Links erhält, um einen hohen PageRank zu bekommen. Ein einzelner
Link von einer Website mit einem hohen PageRank reicht hierzu aus.
Dafür, dass die PageRank-1 Regel auch mit dem hier präsentierten
PageRank-Algorithmus in Einklang steht, sind mehrere Faktoren verantwortlich.
Zunächst ist Toolbar-PageRank eine logarithmisch skalierte Version des
tatsächlichen PageRank. Wenn der PageRank einer verlinkenden Seite im Sinne der
Toolbar um eins höher ist als derjenige der verlinkten Seite, so kann ihr
tatsächlicher PageRank immer mindestens um einen Faktor höher sein, der der
Basis des für die Skalierung eingesetzten Logarithmus entspricht. Ist also die
Basis des Logarithmus gleich 6, und der Toolbar-PageRank der verlinkenden Seite
gleich 5, so kann der tatsächliche PageRank der verlinkten Seite immer
mindestens 6 Mal kleiner sein, damit diese in jedem Fall noch einen
Toolbar-PageRank von 4 erreicht.
Der Basis des Logarithmus wirkt nun die Anzahl der ausgehenden Links auf der
verlinkenden Seite entgegen, da deren PageRank praktisch unter allen verlinkten
Seiten aufgeteilt wird. Es wurde allerdings oben auf dieser Seite bereits
gezeigt, dass der über einen Link an eine Seite weitergegebene PageRank weitaus
größer sein kann, als der im Algorithmus erscheinenden Term d(PR(Ti)/C(Ti))
vermuten lässt. Dies hängt damit zusammen, dass intern in der Regel weitere
Seiten auf die von außen verlinkte Seite verlinken und somit weiteren PageRank
auf diese Seite verteilen. Gehen wir nun etwa davon aus, dass die logarithmische
Basis für die Skalierung 6 beträgt und weiterhin bei einem hohen Dämpfungsfaktor
das doppelte des nach ausgehenden Links gewichteten PageRank der verlinkenden
Seite auf die verlinkte Seite übertragen wird, so könnte die verlinkende Seite
mindestens 12 ausgehende Links haben, damit die verlinkte Seite immer noch einen
Toolbar-PageRank aufweist, der maximal um 1 kleiner ist als derjenige der
verlinkenden Seite.
Eine Zahl von 12 ausgehenden Links erscheint an dieser Stelle
zugegebenermaßen sehr gering. Allerdings ist es in aller Regel so, dass wenn
eine Webseite von außen verlinkt wird, dies nicht nur von einer einzelnen Seite
geschieht, und der betrachteten Seite somit noch weiterer PageRank übertragen
wird. Falls sich Beispiele finden, bei der eine Seite durch einen einzigen
externen Link ein PageRank übertragen wird, der der PageRank-1 Regel entspricht,
und die verlinkende Seite eine hohe Zahl ausgehender Links hat, so ist dies vor
allem ein Indiz dafür, dass der PageRank der verlinkenden Seite sich im oberen
Bereich ihres Toolbar-PageRank-Wertes befindet. Schließlich könnte die
verlinkende Seite aus unserem Beispiel eine "hohe" 5 und die verlinkte Seite
eine "tiefe" 4 sein. In diesem Falle könnte die verlinkende Seite bis zu 72
ausgehende Links aufweisen. Diese Zahl würde sich weiter erhöhen, wenn wir von
einer größeren logarithmischen Basis für die Skalierung des Toolbar-PageRanks
ausgehen.
Der Effekt ausgehender Links
PageRank und Google sind geschützte Marken der Google Inc.,
Mountain View CA, USA. Das PageRank Verfahren unterliegt dem US Patent
6,285,999.
Sämtliche Inhalte dieser Website können im WWW wiedergegeben
werden, sofern im unmittelbaren Zusammenhang Angaben zum Copyright erfolgen und
ein direkter HTML-Link auf die entsprechende Seite unter
pr.efactory.de gesetzt wird.