XML-Sitemap
Inhaltsverzeichnis
Unter einer Sitemap versteht man die Auflistung von Webadressen, sogenannter URLs, die von einer Webseite existieren. Eine Sitemap kann entweder alle Seiten einer Webseite umfassen (Startseite + Unterseiten) oder nur einen beliebigen Ausschnitt enthalten. Die sogenannte XML-Sitemap ist eine Sitemap in einem maschinenlesbaren Format. XML steht für Extensible Markup Language und ist eine Auszeichnungssprache zur Darstellung hierarchisch strukturierter Daten im Format einer Textdatei. Sie richtet sich zwar vornehmlich an Suchmaschinen, kann aber auch vom Menschen gelesen werden.
Bedeutung der XML-Sitemap in der Suchmaschinenoptimierung
Die XML-Sitemap unterstützt Webmaster dabei, den Suchmaschinen alle Seiten einer Webseite zu übermitteln, die in den Suchindex aufgenommen werden sollen. Indem man den Suchmaschinen die XML-Sitemap zur Verfügung stellt, erhöht man die Crawling-Chancen einer Webseite und somit die Chance zügig in den Index aufgenommen zu werden.
Normalerweise hangelt sich der Crawler einer Suchmaschine von Link zu Link und durchkämmt auf diese Weise systematisch das Internet – stets auf der Suche nach neuen Seiten. Theoretisch reicht es also aus, dass eine neue Unterseite von irgendeiner anderen Seite, die Google bereits bekannt ist, verlinkt wird. Mit der XML-Sitemap kann dieser Indexierungsprozess aber unter Umständen beschleunigt werden, insbesondere wenn es sich um schwach vernetzte Seiten handelt.
Entgegen mancher anderslautender SEO-Legende gibt es allerdings keine Garantie dafür, dass in der Sitemap enthaltene URLs auch tatsächlich in den Index aufgenommen werden. Die XML-Sitemap ist deshalb vielmehr ein Hilfsmittel für Webmaster und SEOs. Sie hat keinerlei Einfluss auf das Ranking, sondern höchstens auf die Indexierung. In der Regel erfolgt auch ohne eine solche Sitemap früher oder später die Aufnahme in den Suchindex und auch ohne sie ist eine gute Position in den Suchergebnissen möglich.
Trotzdem bringt die XML-Sitemap einige Vorteile mit sich und sollte deshalb bei den meisten Webseiten im Rahmen der Suchmaschinenoptimierung Beachtung finden. So wird insbesondere die Indexierung von dynamischen und schwer zugänglichen Seiten und Dateien erleichtert. Dazu zählen beispielsweise auch Bilder und Videos, für die eigene Sitemaps angelegt werden können.
Aufbau einer XML-Sitemap
Jede XML-Sitemap beginnt mit einer einleitenden Codezeile ①, die die XML-Version und Dateicodierung angibt. Sitemap-Dateien müssen gemäß der Google Richtlinien im UTF-8-Format codiert sein und für URLs müssen entsprechende Escape-Codes verwendet werden.
In der folgenden Zeile wird das <urlset>-Tag ② geöffnet, das konkrete Informationen darüber enthält, welcher Typ von Sitemap hier vorliegt. In unserem Beispiel handelt es sich um eine Standard-Sitemap. Unterhalb des <urlset>-Tags ③ erfolgt die Angabe der einzelnen URLs. Jede Adresse wird in einen <url>-Tag eingefasst. Die URL selbst steht in einem <loc>-Tag ④, der für Location steht.
Neben den URLs selbst kann eine XML-Sitemap weitere Informationen über die einzelnen Webadressen enthalten, die ebenfalls innerhalb des <url>-Tags ③ platziert werden:
- <lastmod>
⑤
- gibt das letzte Änderungsdatum an
- Angabe im Format: JJJJ-MM-TT
- Die korrekte Implementierung erleichtert das Crawling vor allem nach Änderungen und ermöglicht den effizienteren Einsatz des Crawling-Budgets. Die Angabe wird deshalb empfohlen.
- <changefreq> ⑥
- gibt die Änderungsfrequenz des Contents der Seite an
- mögliche Angaben: always, hourly, daily, weekly, monthly, yearly, never
- Da der Aufwand einer korrekten Implementierung in keinerlei Verhältnis zum Nutzen steht, sollte auf diese Angabe verzichtet werden.
- <priority> ⑦
- gibt die Priorität der Seite im Gesamtkonstrukt an
- Maximalwert: 1.0
- Da die Priorität des Dokuments von Google ignoriert wird, kann auf die Angabe verzichtet werden.
Nachdem alle Zusatzangaben zu einer URL getätigt wurden, wobei die Reihenfolge übrigens keine Rolle spielt, wird das geöffnete Tag mit </url> ⑧ geschlossen. Es können prinzipiell beliebig viele weitere <url>-Tags folgen, wobei Google eine Grenze festgelegt hat (siehe unten). Nach Angabe aller URLs wird das geöffnete <urlset> ② mit </urlset> ⑨ geschlossen.
Beispielhafte XML-Sitemap:
Allgemeine Richtlinien für XML-Sitemaps
- Es müssen vollständige und konsistente URLs angegeben werden. Wenn die Seite beispielsweise unter http://www.beispiel.de/unterseite.html erreichbar ist, darf weder auf das www verzichtet werden, noch sollte eine relative URL wie /unterseite.html angegeben werden.
- Auf übersetzte Versionen einer Seite sollte mit Angabe der kanonischen URL und der hreflang-Annotationen hingewiesen werden.
- Die XML-Datei muss UTF-8 codiert sein.
- In der XML-Datei müssen folgende Escape-Codes verwendet werden:
- Kaufmännisches Und-Zeichen: & → &
- Einfaches Anführungszeichen: ‚ → '
- Doppeltes Anführungszeichen: “ → "
- Größer als: > → >
- Kleiner als: < → <
- Eine XML-Sitemap darf bei Google maximal 50.000 URLs enthalten (News-Sitemaps ausgenommen) oder 50 Megabyte groß sein.
- Größere Sitemaps müssen geteilt werden. Sie werden in einer Sitemap-Indexdatei aufgelistet, die statt der einzelnen Sitemaps bei Google eingereicht wird.
- Große Sitemaps können mittels gzip komprimiert werden. Eine xml.gz wird von den Suchmaschinen genauso wie eine unkomprimierte sitemap.xml behandelt.
Automatisierung einer XML-Sitemap
Mit einem Texteditor kann die relativ einfach aufgebaute XML-Sitemap ohne Hilfsmittel und weitreichende Vorkenntnisse von Jedermann erstellt werden. Das ist bei kleinen Seiten durchaus praktikabel. Aber spätestens bei Webseiten mit einer dreistelligen Anzahl an Unterseiten wird dies zu einer Fleißaufgabe. Vor allem wenn in hoher Frequenz neue Unterseiten hinzukommen, dessen Aufnahme in die Sitemap gern vergessen wird. Da die XML-Sitemap selbst kein Rankingfaktor ist, ist der manuelle Aufwand in der Regel nicht gerechtfertigt und Webmaster sollten versuchen diesen Prozess zu automatisieren.
Bei der automatischen Erstellung einer XML-Sitemap können Online-Tools helfen, von denen es mittlerweile eine ganze Reihe gibt. Beispielhaft soll hier XML-Sitemaps.com empfohlen werden. Nach Angabe der Domain wird innerhalb von wenigen Sekunden bis Minuten eine vollständige XML-Sitemap erstellt. Für kleine Webseiten mit bis zu 500 Unterseiten ist der Generator kostenlos.
Größere Webseite arbeiten häufig mit einem Content Management System (CMS). Viele dieser Systeme spucken je nach Bedarf eine Sitemap für Menschen wie Maschinen aus. Ideal sind Programme, die für jede Unterseite individuelle Einstellungen ermöglichen. Zum Beispiel ob diese überhaupt in die Sitemap aufgenommen werden soll und mit welchen Detailangaben.
Für WordPress, das beliebteste kostenfreie Content Management System, gibt es eine Vielzahl an Plugins, die bei der Erstellung eines XML-Sitemaps behilflich sind und dieses stets aktuell halten. Denn nur eine gepflegte Sitemap ist eine gute Sitemap. Hier kann zum Beispiel Google XML Sitemaps von Arne Brachhold empfohlen werden. Das bekannte Yoast SEO-Plugin besitzt ebenfalls einen Sitemap-Generator.
Einreichung einer XML-Sitemap
Nachdem die XML-Sitemap erstellt wurde – ganz gleich auf welchem Wege – muss sie den Suchmaschinen zur Verfügung gestellt werden. Dafür gibt es zwei Möglichkeiten. Am gängigsten ist die Methode, die Sitemap in der Search Console (Google) bzw. den Webmaster Tools (Bing) zu hinterlegen. Für beides ist ein eigener Account notwendig.
Zuvor muss die XML-Sitemap auf dem eigenen Server hochgeladen werden. Empfehlenswert ist es sie im Hauptverzeichnis (Root) abzulegen. Das ist allerdings nicht zwingend notwendig. Sie kann auch in einem Unterverzeichnis liegen. Wichtig ist lediglich, dass die URL bei der Suchmaschine korrekt hinterlegt wird. Wird der Ablageort geändert, muss die URL aktualisiert werden.
Bis eine Suchmaschine die eingereichte Sitemap verarbeitet, kann es einige Tage dauern. Man wird allerdings relativ schnell feststellen, dass sich die Differenz zwischen der Anzahl der URLs in der Sitemap und der Anzahl der indexierten URLs verringert. Da es keine Garantie für die Aufnahme in den Suchindex gibt, sind kleine Abweichungen normal. Nur bei einer größeren Diskrepanz sollte man sich auf Fehlersuche begeben.
Die zweite Möglichkeit zur Einreichung ist die robots.txt. Dafür wird in die Datei lediglich folgende Zeile eingefügt:
Sitemap: http://www.beispiel.de/sitemap.xml
Idealerweise nutzt man die Synergien untereinander und trägt die URL zur XML-Sitemap auf beide Weisen ein. In die Sitemap sollten übrigens alle Seiten aufgenommen werden, die in der robots.txt nicht gesperrt werden. Seiten die nicht im Index erscheinen sollen, wie zum Beispiel das Impressum oder Serviceseiten in einem Onlineshop (Zahlungsmethoden, Batterieverordnung, etc.) sollten nicht in die Sitemap aufgenommen werden.
Zusätzliche Besucher-Sitemap?
Da die XML-Sitemap sich an Suchmaschinen richtet, stellt sich abschließend die berechtigte Frage, ob zusätzlich eine Sitemap auf der Webseite selbst Sinn macht. Schließlich stellen viele CMS eine solche Sitemap ebenfalls zur Verfügung.
Matt Cutts von Google beantwortet die Frage im nachfolgenden Video mit einem klaren ja. Denn schließlich bezweckt beides dasselbe. Allerdings betont er, dass es sich nicht unbedingt um eine klassische Sitemap mit tausenden Links auf einer Seite handeln muss. Stattdessen ist es wichtig den Besuchern einen strukturierten Überblick über alle Kategorien und Unterseiten zur Verfügung zu stellen.
In (WordPress-)Blogs ist beispielsweise die oft in der Sidebar untergebrachte Archivierung der Beiträge nach Monaten im Grunde nichts anderes als eine Sitemap. Sie ermöglicht es Besuchern und Suchmaschinen gleichermaßen alle bisher erschienen Blogbeiträge aufzurufen – und zwar auf eine sehr benutzerfreundliche Art und Weise.
Eine an Besucher gerichtete Sitemap verbessert das Ranking zwar ebenso wenig wie eine XML-Sitemap, kann die Indexierung allerdings fördern und ist vor allem für die Besucher ein einfaches Mittel zur besseren Orientierung. Und was dem Besucher nützt, das wird von Google meist ebenfalls honoriert.