URLs sind ebenfalls ein wichtiges Kriterium der OnPage Optimierung. Sie lokalisieren eine Webseite eindeutig und können wertvolle Informationen über die Seite, die sie repräsentieren, enthalten. Suchmaschinen werten den Text aus, der sich in einer URL befindet. Diese Auswertung kann zum Beispiel daran erkannt werden, dass Suchbegriffe bei der Darstellung der SERPs innerhalb der URL fett markiert sind. Deshalb sollten sich die Keywords, für die die Seite ranken soll, auch in der URL befinden. Es hat sich in der Praxis eingebürgert, eine ähnliche Wortwahl wie bei dem Titel zu benutzen, wobei jedoch Stoppwörter wie zum Beispiel „und“, „der“, „die“, etc. vermieden werden sollten. Generell gilt auch hier die Regel: So kurz wie möglich und so lang wie nötig.
Trennzeichen in URLs
In URLs können allerdings im Gegensatz zum Titel nicht alle Zeichen verwenden werden. Stattdessen dürfen URLs nur die in Uniform Resource Identifier (URI): Generic Syntax definierten Zeichen enthalten. Wenn in einer URL verschiedene Wörter getrennt werden sollen, dann empfiehlt Google die Verwendung des Minusszeichen, wobei jedoch auch unter anderem die folgenden Zeichen als Trennungszeichen erkannt werden: !, ‚, (, ), *, +, [Komma], /, :, =, @.
Minus/Bindestrich oder Unterstrich – was ist besser für SEO Urls?
Am häufigsten werden als Trennzeichen das Minuszeichen (-) oder der Unterstrich (_) in URLs verwendet. Letzteres sollte vermieden werden, weil dieser nicht als Trennzeichen von Google erkannt wird. Das liegt daran, das Unterstriche für Variablennamen in Programmiersprachen verwendet werden und Google die Suche danach explizit ermöglich möchte. Das Ganze ist also in gewisser Weise „historisch gewachsen“. Interessant ist jedoch der Hinweis, dass bestehende Projekte, die bereits die Unterstrichvariante für URLs einsetzen, nicht zwingend geändert werden sollten, weil der Einfluss generell recht gering ist. Diese Infos gab Matt Cutts in dem Folgenden Video vom 16. August 2011 bekannt:
URL Parameter
Bei einigen Content Management Systemen werden die Inhalte von Webseiten in einer Datenbank gespeichert und die URLs zu diesen Seiten werden dynamisch erzeugt. Dabei wird dann häufig die ID des jeweiligen Datenbankeintrages in der URL als Paramater übergeben, was zum Beispiel zu folgenden URLs führt:
- http://www.example.com/artikel.php?id=123
- http://www.example.com/forum/thread.php?tid=5
- http://www.example.com/index.php?category=5&subcategory=3
Gerade am letzten Beispiel sieht man sehr deutlich, dass eine Suchmaschine aus solchen URLs keinerlei Informationen extrahieren kann. Um dieses Problem zu lösen ohne dabei auf den Komfort dynamisch erzeugter Inhalte zu verzichten, gibt es grundsätzlich zwei Ansätze.
Definition eines Slugs
Zum einen kann man einen sogenannten Slug definieren. Damit ist eine Zeichenkette gemeint, die einen Datensatz eindeutig identifiziert. Dadurch kann nun statt der numerischen ID eine Zeichenkette übergeben werden. Diese Methode hat jedoch zwei Nachteile, denn zum einen sind auf Strings basierende Suchoperationen in Datenbanken langsamer als solche mit numerischer Basis und zum anderen führt eine Veränderung des Slugs im Nachhinein zur Nicht-Erreichbarkeit der Seite über eine ehemals bekannte URL.
Einsatz von mod_rewrite
Der andere Ansatz basiert auf dem Apache Modul mod_rewrite Dieses Modul ermöglicht die Auswertung von URLs anhand regulärer Ausdrücke, mit deren Hilfe eine URL auf bestimmte Parameter geparst wird, so dass diese dann an eine Webseite übergeben werden können. Dadurch ist es zum Beispiel möglich redundante Zeichen in einer URL unterzubringen.
Unter der Annahme, dass http://www.example.com/artikel.php?id=123 einen Artikel zum Thema Suchmaschinenoptimierung enthält, wäre es sinnvoller, wenn die URL http://www.example.com/artikel/suchmaschinenoptimierung.html (oder ähnlich) lauten würde. Diese Form lässt sich nicht ganz erreichen, da zumindest die ID des Datenbankeintrages enthalten sein muss. Eine resultierende URL könnte aber beispielsweise http://www.example.com/artikel/suchmaschinenoptimierung,123.html lauten. Es bietet sich hier an die ID hinten zu nennen, da die Gewichtung der Keywords wie auch beim Titel von vorne nach hinten abnimmt.
Um dieses Beispiel lauffähig zu machen muss eine .htaccess Datei angelegt werden, die das mod_rewrite aktiviert und eine entsprechende Regel definiert. Der folgende Quellcodeausschnitt zeigt dies für das oben genannte Beispiel.
#Modul aktivieren
RewriteEngine On
#Regel definieren
RewriteRule ^artikel/.*,(.*) artikel\.php?id=$1[QSA]
Das einzige Problem dieser Lösung besteht darin, dass eine Webseite nun über mehrere URLs zugreifbar ist, denn jedes Zeichen nach dem Vorwärts-Slash und vor dem Komma ist hier beliebig. Für Suchmaschinen ist eine andere URL allerdings gleichbedeutend mit einer anderen Webseite, so dass hier eine Duplicate Content Problematik entsteht.
«« Titel