In diesem Artikel wird ein Teilaspekt des Themas "Google-Suchmaschinen-Optimierung" oder "Google-PageRank" behandelt. Feedback und Kritik ist erwünscht (sofern immer ein Verbesserungsvorschlag gemacht wird). Fragen, Anmerkungen und Diskussionen zu diesem Test gibt es hier: Forum-Diskussion (auch für unregistrierte Nutzer!)

Dynamische URLs in Google

oder

Welche Link-Arten werden von Google erkannt und indiziert?

Zweiter Test Februar 2006

Ok, Feedback zum ersten Test war vor allem Kritik an einer Menge methodischer Fehler. Diesmal will ich eigentlich nur die PR-Vergabe testen... womit ich mich wieder auf unbekanntes Gebiet begebe, dafür werde ich versuchen, rechtzeitig vor dem nächsten Google-PR-Update Feedback einzuholen und entsprechend den Test zu verbessern.

Was soll getestet werden?

Ich habe einige statische PHP Seiten die alle zum gleichen Zeitpunkt einen PR 4 bekommen haben. Alle hatten nur einen Ingoing Link und keine Outgoing Links. Jetzt möchte ich verschiedene Seiteninhalte mit verschiedenen Ingoing- und Outgoing-Link-Kombinationen testen. Es ist klar, daß die Ergebnisse nicht 1:1 in die "Real-World" übersetzt werden können (2 shceinbar gleiche PR4 können ja sehr unterschiedliche Google-Interne Werte haben), aber unter Umständen bringt dies ein paar neue Ideen.

Hier eine Tabelle, welche Seite welchen Inhalt/Link bekommt.

Legende:
[x] Domains: Diese Seite wird direkt von einer domain.tld/index.php verlinkt.
BR-Artikel-Nav: Seiten-interne Links fast aller Seiten, die für diesen Test genutzt werden (es fehlen die, die keine incoming Links durch andere Artikel bekommen sollen). Dies beinhaltet auch jeweils einen Link zum Impressum auf www.levelrating.com

URLLinks rein von:Links raus zu:PR
/artikel_baby.php 2 Domains
BR-Artikel-Nav
BR-Artikel-Nav4
/artikel_pandora.php 2 Domains
BR-Artikel-Nav
2 Domains
BR-Artikel-Nav
4
/artikel_dvd.php BR-Artikel-Nav
BR-Artikel-Nav4
/finance/finance.php 1 PR 5 Domain
04
/artikel_backen.php 1 PR 5 Domain
04
/artikel_kochen.php PR 4 (levelrating.com/impressum.html)04
/artikel_bank.php 1 PR 3 Domain04
/artikel_buecher.php 1 PR 5 Domain
1 PR 3 Domain4
/artikel_dedektiv.php 1 PR 3 Domain
1 PR 5 Domain4
Impressum 5 Domains
BR-Artikel-Nav
11 Domains
BR-Artikel-Nav
4
/artikel_formel1.php 2 Domains
BR-Artikel-Nav
11 Domains
BR-Artikel-Nav
4

Alte PR Tests:

Ab hier historisch alte Tests :)

Inhalt:

Art und Datum des Testlaufs

Mit diesem Test wollte ich verschiedene Methoden testen, wie dynamische URLs benutzt und "codiert" werden können. Zusätzlich habe ich einfache Standard-Files eingesetzt, um einen direkten Vergleich der Ergebnisse zu "normalen" URLs zu bekommen.
  1. Alle Files wurden zur gleichen Zeit (Anfang 2005) angelegt. Sie beinhalten zerstückelten Text, den ich aus einem meiner Projekte wahllos kopiert habe.
  2. Alle Files sind ausschliesslich über die Startseite der Domain www.levelrating.com angelinkt. Diese Domain ist ca. 5 (?) Jahre alt.
  3. Die Domain www.bombrat.com verweist auf die gleiche Startseite. Diese Domain ist ca. 6 Monate alt.
  4. Die Links auf die Files sind ohne Domain gesetzt (also nur ...href="/test_...")
  5. Die Links zu den Files beinhalten keine keywords. Sie sind am Ende der Startseite der Domain einfach als a | b | c etc... verlinkt.
  6. Jedes File beinhaltet ein eindeutiges Keyword, dass nur auf dieser Seite eingesetzt wird.

Erläuterung der verwendeten URLs

Da ich zu diesem Zeitpunkt viel mit C# gecodet habe, habe ich überall *.aspx Files eingesetzt. Sie beinhalten jedoch reines HTML und enthalten/benutzen keinerlei Script-Sprache.

Ich habe folgende URLs eingesetzt:
  1. test_gSpider01.aspx
    Standard-File, sollte sich verhalten wie jede normale HTML Seite.
  2. test_gSpider02.aspx/0/775/723/62/
    Dies ist speziell mit .NET Servern machbar: wenn eine Datei gefunden wird (in dem Fall "test_gSpider02.aspx"), so wird der Rest der URL ignoriert. In diesem Fall kann man also alles nach dem *.aspx direkt aus der URL auslesen und von Hand in einzelne Parameter zerlegen. Meine Befürchtung bei dieser URL war, dass Suchmaschinen solche URLs als Seiten interpretieren, die sehr weit unten in der Seitenhirachie stehen.
  3. test_gSpider03.aspx/0-775-723-62
    Gleiches Prinzip, doch als Trenner der Parameter sollten Bindezeichen benutzt werden (um eine falschen Seiten-Tiefe-Eindruck zu vermeiden.
  4. test_gSpider04.aspx?xx=0-775-723-62
    Standard-Methode für dynamische Parameter. Da jedoch angeblich Sumas nur einen oder 2 Parameter akzeptieren, ermöglicht diese URL mehrere Parameter, die von Sumas (theoretisch) nur als ein Parameter verstanden werden.
  5. test_gSpider05.aspx?xx=0/775/723/62/
    Wieder gleich wie vorheriger Link, jedoch mit "/" statt "-" als Trenner.

Ergebnisse

Um den 16.7.2005 herum wurde ein Google-Dance durchgeführt. Bei dieser Neu-Berechung der PageRanks (PR) kam die Domain www.levelrating.com (wieder) auf einen PageRank 5. Am 21.7. (nachdem Google wohl komplett "durchindiziert" hatte) testete ich obige Links darauf, ob sie im Google Suchergebniss über das jeweilige eindeutige Keyword zu finden war, und wie der PR aussieht.
  1. test_gSpider01.aspx
    Keyword: LevelratingSpiderTest01
    Google's Page-Rank: 3
    In Google über das Keyword zu finden: Ja
  2. test_gSpider02.aspx/0/775/723/62/
    Keyword: LevelratingSpiderTest02
    Google's Page-Rank: 3
    In Google über das Keyword zu finden: Ja
  3. test_gSpider03.aspx/0-775-723-62
    Keyword: LevelratingSpiderTest03
    Google's Page-Rank: 3
    In Google über das Keyword zu finden: Ja
    Seltsam: Die Seite http://www.opuo.de/...suchbegriffe=url%20spider wird bei der Suche nach dem Keyword als Suchergebnis angezeit und hat anscheinend den Text der gSpider03.aspx als Inhalt.
  4. test_gSpider04.aspx?xx=0-775-723-62
    Keyword: LevelratingSpiderTest04
    Google's Page-Rank: 0
    In Google über das Keyword zu finden: Nein
  5. test_gSpider05.aspx?xx=0/775/723/62/
    Keyword: LevelratingSpiderTest05
    Google's Page-Rank: 0
    In Google über das Keyword zu finden: Ja

Fazit

Es ist sehr seltsam, dass ein Link a la ?xx=0-775-723-62 nicht indiziert wird, der Link mit ?xx=0/775/723/62/ aber schon. Generell ist es aber bemerkenswert, daß das Fragezeichen so einen erheblichen Einfluss auf PageRank hat. Dies erklärt aber, warum auf vielen Projekten die Foren, die nur einen Parameter hinter dem Fragezeichen haben, trotzdem einen viel geringeren PageRank haben als (scheinbar) nicht-dynamische Seiten.

Schlußfolgerungen für dynamische Links:

Auch wenn viele Seiten von Google indiziert werden, nur einen Parameter haben, so ist dies keine Garantie, dass diese auch wirklich in den Google-Index aufgenommen werden. Man sollte also auf unter allen Umständen versuchen, Fragezeichen in URLs zu vermeiden.

Ja, mir ist bekannt, dass viele Seiten (gerade Foren) auch indiziert werden, obwohl sie einen oder manchmal auch mehrere Parameter hinter dem "?" haben. Es gibt aber auch etliche Fälle (siehe myWBB Forum auf Bombrat.com) die eben nicht indiziert werden.

Schlußfolgerungen für den Page-Rank:

Offensichtlich genügt ein Backlink von einer PR 5 Seite um einen PR 3 zu erreichen... sofern beide betroffene Seiten unter der gleichen Domain liegen. Ob dies auch zutrifft, wenn die Seiten auf unterschiedlichen Domains liegen, kann ich (noch) nicht beurteilen.

Es gibt einige stark umstrittene Seiten, die genau dies behaupten: ein Backlink würde automatisch einen Pagerank minus 2 vererben (also ein PR 8 bringt mind. PR6 etc). Dies ist hiermit zumindest für Seiten unter einer Domain belegt.
Beispiel für eine solche Tabelle: http://www.compar.com/.../PR-calculation.html

Anmerkungen

Dazu fällt mir gerade nichts ein... ich habe garantiert etwas vergessen :).

Autor

Dieser Artikel mit seinem unglaublich clever ausformuliertem Satzbau *würg* entstammt der Tastatur von:
Michael 'Smoerble' Stock
smoerble@smoerble.de
www.smoerble.de
Hey, ich bin Programmierer... syntaktische Feinheiten sind nicht mein Job :).

Dieser Text ist für alle gedacht, die sich für diese Themen interessieren. Ich würde mich freuen, wenn die Qualität dieser Aussagen gut genug ist, dass Ihr sie zitiert. Wenn Ihr dies macht, verweist bitte auf diese Seite als Quelle, danke.

Da viele Nasen "da draussen" aber gerne kompletten Inhalt klauen und als eigenen ausgeben: "Iceman" (Anwalt in der PC-Spieler-Szene) freut sich über jede Seite, die dies versucht :).
Links:


Hmmm... das ist noch so leer hier... Wer einen Link tauschen möchte, der möge mir eine E-Mail "droppen" :).
Nette Leute:
daumen-druecken - wünsch Dir was