Das Thema ‚themenrelevante Verlinkung’ wird in SEO-Kreisen zum Teil kontroverse diskutiert. Während die einen die feste Meinung vertreten, das thematisch passende Links von Google höher bewertet werden stempeln andere dies als absoluten Quatsch ab - Link ist Link. Eines der Argumente der Kontraseite ist meistens: Wo soll die Grenze sein? Wann gilt ein Link als thematisch passend und wann nicht?

Ich selbst verlinke i.d.R. nur themenrelevant. Ob Google dies in der Bewertung mit einfließen lässt oder nicht ist mir in diesem Zusammenhang relativ egal. Ich erstelle Seiten in erster Linie für menschliche Besucher. Dies gilt nicht nur für den Content, sondern auch für die dort verlinkten Seiten. Deshalb muss für mich ein Link von meiner Seite zu einer anderen für den Besucher auch irgendeinen Sinn ergeben. Nennt es von mir aus ‚Altersstarrsinn’. Aus diesem Grund möchte ich mir auch nicht anmaßen zu beurteilen, ob themenrelevante Links derzeit einen höheren Stellenwert genießen als thematisch unpassende. Dazu fehlt es an Erfahrungswerten und selbst wenn, wäre die Beurteilung höchstwahrscheinlich sehr subjektiv geprägt.

Wo die Grenze zwischen einem themenrelevanten Link und einem themenfremden Link ist, lässt sich hingegen relativ objektiv beantworten: Es gibt keine Grenze. Und warum dies so ist wird jedem klar werden, sobald man weis, wie ein Algorithmus zwei Seiten thematisch miteinander vergleichen kann.

Ein klein wenig Vorarbeit ist dazu allerdings nötig. Im ersten Schritt definiert man ein gutes Duzend Kategorien, in die man die Webseiten unterteilen kann, ähnlich wie bei einem Webkatalog. Danach sucht man möglichst viele Textdokumente, die man eindeutig einem der Kategorien zuordnet. Im letzten Schritt werden für jede Kategorie die Wortverteilungen ermittelt d.h. welche Worte kommen wie oft in den einzelnen Kategorien vor. Damit wären die Vorbereitungen abgeschlossen.

Um ein Dokument später mit einem anderen Dokument vergleichen zu können, wird auch hier wieder die Wortverteilung ermittelt und anschließend mit der Wortverteilung der einzelnen Kategorien verglichen. Das Ergebnis ist ein Wert zwischen 0% und 100% für jeden der vorhandenen Kategorien. Das Ganze nennt sich übrigens: Termvektor.

Mit einem Termvektor kann man für sich alleine relativ wenig anfangen, aber man kann hübsche Sachen mit Vektoren anstellen. Jeder Vektor hat eine Länge und eine Richtung und wenn zwei Dinge eine Richtung haben, dann kann man den Winkel dazwischen relativ einfach berechnen. Und genau dieser Winkel ist es, der die thematische Verwandtschaft zweier Dokumente angibt. Je größer der Winkel zwischen den Termvektoren umso weiter sind die Themen der beiden Dokumente voneinander entfernt.

Um die Themenrelevanz eines Links, d.h. die Themenverwandtschaft der verlinkten Webseiten zu bestimmen bedarf es ein bischen Wörter zählen, diese ins Verhältnis zu setzen und ein Blick in die Formelsammlung Gymnasium 12. Schuljahr.

SEO News