In diesem Artikel wird ein Teilaspekt des Themas "Google-Suchmaschinen-Optimierung" oder "Google-PageRank" behandelt. Feedback
und Kritik ist erwünscht (sofern immer ein Verbesserungsvorschlag gemacht wird).
Fragen, Anmerkungen und Diskussionen zu diesem Test gibt es hier: Forum-Diskussion (auch für unregistrierte Nutzer!)
| |
Dynamische URLs in Google
oder
Welche Link-Arten werden von Google erkannt und indiziert?
|
Zweiter Test Februar 2006
Ok, Feedback zum ersten Test war vor allem Kritik an einer Menge methodischer Fehler. Diesmal will ich eigentlich nur die PR-Vergabe testen... womit ich mich wieder auf unbekanntes Gebiet begebe, dafür werde ich versuchen, rechtzeitig vor dem nächsten Google-PR-Update Feedback einzuholen und entsprechend den Test zu verbessern.
Was soll getestet werden?
Ich habe einige statische PHP Seiten die alle zum gleichen Zeitpunkt einen PR 4 bekommen haben. Alle hatten nur einen Ingoing Link und keine Outgoing Links. Jetzt möchte ich verschiedene Seiteninhalte mit verschiedenen Ingoing- und Outgoing-Link-Kombinationen testen. Es ist klar, daß die Ergebnisse nicht 1:1 in die "Real-World" übersetzt werden können (2 shceinbar gleiche PR4 können ja sehr unterschiedliche Google-Interne Werte haben), aber unter Umständen bringt dies ein paar neue Ideen.
Hier eine Tabelle, welche Seite welchen Inhalt/Link bekommt.
Legende:
[x] Domains: Diese Seite wird direkt von einer domain.tld/index.php verlinkt.
BR-Artikel-Nav: Seiten-interne Links fast aller Seiten, die für diesen Test genutzt werden (es fehlen die, die keine incoming Links durch andere Artikel bekommen sollen). Dies beinhaltet auch jeweils einen Link zum Impressum auf www.levelrating.com
|
Alte PR Tests:
Ab hier historisch alte Tests :)
| |
|
Art und Datum des Testlaufs
Mit diesem Test wollte ich verschiedene Methoden testen, wie dynamische URLs benutzt und "codiert" werden können.
Zusätzlich habe ich einfache Standard-Files eingesetzt, um einen direkten Vergleich der Ergebnisse zu "normalen" URLs zu bekommen.
- Alle Files wurden zur gleichen Zeit (Anfang 2005) angelegt. Sie beinhalten zerstückelten Text, den ich aus einem meiner Projekte wahllos kopiert habe.
- Alle Files sind ausschliesslich über die Startseite der Domain www.levelrating.com angelinkt. Diese Domain ist ca. 5 (?) Jahre alt.
- Die Domain www.bombrat.com verweist auf die gleiche Startseite. Diese Domain ist ca. 6 Monate alt.
- Die Links auf die Files sind ohne Domain gesetzt (also nur ...href="/test_...")
- Die Links zu den Files beinhalten keine keywords. Sie sind am Ende der Startseite der Domain einfach als
a | b | c etc... verlinkt.
- Jedes File beinhaltet ein eindeutiges Keyword, dass nur auf dieser Seite eingesetzt wird.
|
Erläuterung der verwendeten URLs
Da ich zu diesem Zeitpunkt viel mit C# gecodet habe, habe ich überall *.aspx Files eingesetzt. Sie beinhalten jedoch reines HTML und enthalten/benutzen keinerlei Script-Sprache.
Ich habe folgende URLs eingesetzt:
- test_gSpider01.aspx
Standard-File, sollte sich verhalten wie jede normale HTML Seite.
- test_gSpider02.aspx/0/775/723/62/
Dies ist speziell mit .NET Servern machbar: wenn eine Datei gefunden wird (in dem Fall "test_gSpider02.aspx"), so wird der Rest der URL ignoriert.
In diesem Fall kann man also alles nach dem *.aspx direkt aus der URL auslesen und von Hand in einzelne Parameter zerlegen. Meine
Befürchtung bei dieser URL war, dass Suchmaschinen solche URLs als Seiten interpretieren, die sehr weit unten in der Seitenhirachie stehen.
- test_gSpider03.aspx/0-775-723-62
Gleiches Prinzip, doch als Trenner der Parameter sollten Bindezeichen benutzt werden (um eine falschen Seiten-Tiefe-Eindruck zu vermeiden.
- test_gSpider04.aspx?xx=0-775-723-62
Standard-Methode für dynamische Parameter. Da jedoch angeblich Sumas nur einen oder 2 Parameter akzeptieren, ermöglicht diese URL
mehrere Parameter, die von Sumas (theoretisch) nur als ein Parameter verstanden werden.
- test_gSpider05.aspx?xx=0/775/723/62/
Wieder gleich wie vorheriger Link, jedoch mit "/" statt "-" als Trenner.
|
Ergebnisse
Um den 16.7.2005 herum wurde ein Google-Dance durchgeführt. Bei dieser Neu-Berechung der PageRanks (PR) kam die Domain www.levelrating.com (wieder)
auf einen PageRank 5. Am 21.7. (nachdem Google wohl komplett "durchindiziert" hatte) testete ich obige Links darauf, ob
sie im Google Suchergebniss über das jeweilige eindeutige Keyword zu finden war, und wie der PR aussieht.
- test_gSpider01.aspx
Keyword: LevelratingSpiderTest01
Google's Page-Rank: 3
In Google über das Keyword zu finden: Ja
- test_gSpider02.aspx/0/775/723/62/
Keyword: LevelratingSpiderTest02
Google's Page-Rank: 3
In Google über das Keyword zu finden: Ja
- test_gSpider03.aspx/0-775-723-62
Keyword: LevelratingSpiderTest03
Google's Page-Rank: 3
In Google über das Keyword zu finden: Ja
Seltsam: Die Seite
http://www.opuo.de/...suchbegriffe=url%20spider wird bei der Suche nach dem Keyword als Suchergebnis angezeit und hat
anscheinend den Text der gSpider03.aspx als Inhalt.
- test_gSpider04.aspx?xx=0-775-723-62
Keyword: LevelratingSpiderTest04
Google's Page-Rank: 0
In Google über das Keyword zu finden: Nein
- test_gSpider05.aspx?xx=0/775/723/62/
Keyword: LevelratingSpiderTest05
Google's Page-Rank: 0
In Google über das Keyword zu finden: Ja
|
Fazit
Es ist sehr seltsam, dass ein Link a la ?xx=0-775-723-62 nicht indiziert wird, der Link mit ?xx=0/775/723/62/ aber schon.
Generell ist es aber bemerkenswert, daß das Fragezeichen so einen erheblichen Einfluss auf PageRank hat. Dies erklärt aber,
warum auf vielen Projekten die Foren, die nur einen Parameter hinter dem Fragezeichen haben, trotzdem einen viel geringeren
PageRank haben als (scheinbar) nicht-dynamische Seiten.
Schlußfolgerungen für dynamische Links:
Auch wenn viele Seiten von Google indiziert werden, nur einen Parameter haben, so ist dies keine Garantie, dass diese auch
wirklich in den Google-Index aufgenommen werden. Man sollte also auf unter allen Umständen versuchen, Fragezeichen in
URLs zu vermeiden.
Ja, mir ist bekannt, dass viele Seiten (gerade Foren) auch indiziert werden, obwohl sie einen oder manchmal auch mehrere
Parameter hinter dem "?" haben. Es gibt aber auch etliche Fälle (siehe myWBB Forum auf Bombrat.com) die eben nicht indiziert werden.
Schlußfolgerungen für den Page-Rank:
Offensichtlich genügt ein Backlink von einer PR 5 Seite um einen PR 3 zu erreichen... sofern beide betroffene Seiten unter der
gleichen Domain liegen. Ob dies auch zutrifft, wenn die Seiten auf unterschiedlichen Domains liegen, kann ich (noch) nicht
beurteilen.
Es gibt einige stark umstrittene Seiten, die genau dies behaupten: ein Backlink würde automatisch einen Pagerank minus 2 vererben (also ein PR 8 bringt mind. PR6 etc).
Dies ist hiermit zumindest für Seiten unter einer Domain belegt.
Beispiel für eine solche Tabelle: http://www.compar.com/.../PR-calculation.html
|
Anmerkungen
Dazu fällt mir gerade nichts ein... ich habe garantiert etwas vergessen :).
|
Autor
Dieser Artikel mit seinem unglaublich clever ausformuliertem Satzbau *würg* entstammt der Tastatur von:
Michael 'Smoerble' Stock
smoerble@smoerble.de
www.smoerble.de
Hey, ich bin Programmierer... syntaktische Feinheiten sind nicht mein Job :).
Dieser Text ist für alle gedacht, die sich für diese Themen interessieren. Ich würde mich freuen, wenn die Qualität dieser Aussagen
gut genug ist, dass Ihr sie zitiert. Wenn Ihr dies macht, verweist bitte auf diese Seite als Quelle, danke.
Da viele Nasen "da draussen" aber gerne kompletten Inhalt klauen und als eigenen ausgeben:
"Iceman" (Anwalt in der PC-Spieler-Szene) freut sich über jede Seite, die dies versucht :).
|
|
Links:
Hmmm... das ist noch so leer hier... Wer einen Link tauschen möchte, der möge mir eine E-Mail "droppen" :).
|
Nette Leute:
|
|