Sitemaps – Ein bisschen SEO muß sein

Die letzten Tage habe ich vor allem unter der Haube von WordPress und anderen Seiten von mir herumgefrickelt. Ein bisschen SEO – Search Engine  Sptimization (neudeutsch für Suchmaschinenoptimierung) – mußte sein. Das hat nur einen Grund, man möchte sich bei den Suchmaschinen – gerade bei Google – beliebt machen und die Seite übersichtlicher gestalten. Dazu gehören eben auch XML-Sitemaps. 🙂

Was sind Sitemaps? :scratch:

Sitemaps sind im Prinzip nur  Übersichtskarten für die Struktur der Webseite. Es ist kein Inhaltsverzeichnis für eine Webseite, eher eine hierarchische Struktur aller Übersichtsseiten einer Web-Präsens. Firmen und Unternehmen bauen soetwas ganz gern ein, um für Leser die Übersicht zu erhöhen.

XML-Sitemaps selbst bekommt der Leser ersteinmal nicht zu sehen, diese sind nur für Suchmaschinen sichtbar. Wie eine solche Sitemap aussieht, kann man sich bei der Medienspürnase anschauen. Solche auf XML basierenden Sitemaps sind für die Suchmaschinenoptimierung recht wichtig, gerade für Seiten, die mit Adobe Flash generiert wurden oder JavaScript-Menüs aufweisen, das heißt für Seiten mit Barrieren.

Außerdem folgen die meisten Suchmaschinen nur einer bestimmten Anzahl von Links. Bei Umfangreichen Seiten, dienen XML-Sitemaps hauptsächlich dazu, daß Suchmaschinen den gesamten Webauftritt im Blick haben.

Ist eine Webseite wirklich nutzerfreundlich ausgelegt – das heißt, daß die Navigation klar und übersichtlich strukturiert ist – entfällt eine Sitemap. Allerdings kann sich dadurch der Verwaltungsaufwand für den Webseitenbetreiber erhöhen, wenn er denn auf Sitemaps verzichtet.

Was gibt es zu beachten? :unsure:  

Eine Sitemap erstellt einen Index über die gesamte Struktur eines Webauftritts. Dazu gehören die Links zu allen Artikeln, Kommentaren und nicht nur auf der Startseite, sondern auch in den Kategorien. Jetzt ist es wichtig zu wissen, daß Suchmaschinen doppelte Inhalte abstrafen. Findet Google einen Artikel auf der Startseite des Blogs und gleichzeitig in der Kategorienübersicht, so gibts Minuspunkte beim Ranking. Also muß man den Suchmaschinen sagen, was genau sie in ihren Suchindex aufnehmen können. Das geschieht mit Hilfe der robots.txt

Besonderheiten bei WordPress :mail:

WordPress liefert die robots.txt nur virtuell aus, das heißt, das Programm generiert diese nur auf Anfrage. Allerdings ist es möglich, diese via Plugins oder eben auch manuell zu ändern. Erstellt man eine solche Datei händisch, kann man die im Wurzelverzeichnis des eigenen WordPress-Blogs deponieren, man sollte nur darauf achten, daß der komplette Dateiname aus Kleinbuchstaben besteht. Der Inhalt meiner robots.txt folgt sogleich.

# global
User-agent:
Disallow: /cgi-bin/
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-content/plugins/
Disallow: /wp-content/cache/
Disallow: /wp-content/themes/
Disallow: /trackback/
Disallow: /comments/
Disallow: */trackback/
Disallow: */comments/
Disallow: wp-login.php
Disallow: wp-signup.php
Allow: /wp-content/uploads

# Google Image
User-agent: Googlebot-Image
Disallow:Allow: /*

# Google AdSense
User-agent: Mediapartners-Google*
Disallow:
Allow: /*

# Internet Archiver Wayback Machine
User-agent: ia_archiver
Disallow: /

# digg mirror
User-agent: duggmirror
Disallow: /
Sitemap: http://www.medienspuernase.de/sitemap.xml

Info: Der Link zur Sitemap ist natürlich auf die eigene Domain anzupassen. Die XML-Sitemap liegt im Wurzelverzeichnis wie die robots.txt

Und wie generiere ich nun die Sitemap? :wacko:

Dazu gibts ein einfaches Plugin mit dem grandiosen Namen Google XML Sitemaps, welches man sich direkt aus dem Installationsmenü von WordPress heraus installieren kann. Wer das gerne manuell erledigt lädt sich Google XML Sitemaps auf seinen Rechner herunter, entpackt das Plugin und transferiert es via FTP in den Pluginordner des WordPress-Blogs. Anschließend muß das Plugin noch aktiviert werden. Im Einstellungsmenü des Dashboards befindet sich nun ein Eintrag mit XML-Sitemap für die Einstellungen des Plugins

Die meisten dieser Einstellungen kann man so belassen. Allerdings habe ich die Option Sitemap in virtueller robots einfach deaktiviert, da eine manuell erstellte Robots-Datei im Wurzelverzeichnis des Blogs liegt. Das gilt für jede manuell erstellte Robots-Datei.

Links

Google XML Sitemaps