Videos eBook Forum Kontakt

jetzt Videos kaufen
zum Lernen von HTML,
CSS und Webdesign

Jetzt das HTML-Seminar bestellen als
Video-Tutorial mit über 210 Videos:
von den Grundlagen bis zur fertigen Website
Video-Kurs HTML5, CSS & Webdesign

Video-Kurs bestellen HTML5, CSS & Webdesign
Video-Kurs bestellen HTML5, CSS & Webdesign

Sitemaps für Menschen – sitemap.xml für Suchmaschinen

Das Wort Sitemap ist eine schöne Verkürzung von dem sperrigen „Übersicht über alle Einzelseiten eines Internetauftritts“. Allerdings gibt es sowohl für Menschen wie auch für Suchmaschinen eine Sitemap. Der technische Aufbau dabei ist grundverschieden – der Zielsetzung ist dieselbe.

Zielsetzung der Sitemap

Über die Sitemap möchte man einen schnellen Überblick aller verfügbaren Seiten ermöglichen. Als Beispiel nehmen wir die Sitemaps vom HTML-Seminar.

Die Sitemap für Menschen findet sich unter:
https://www.html-seminar.de/sitemap.htm

Sitemap für Menschen – Überblick über kompletten Inhalt
Sitemap für Menschen – Überblick über kompletten Inhalt

Im Gegensatz muss die Sitemap für Suchmaschinen gut von diesen Lesbar sein! Dazu wird das XML-Format gewählt. Standardmäßig bekommt diese Sitemap den Dateinamen „sitemap.xml“ und befindet sich im Hauptverzeichnis. In unserem Beispiel mit dem HTML Seminar ist dies somit die URL https://www.html-seminar.de/sitemap.xml

Schaut man sich diese XML-Datei im Browser an, sieht das wenig spannend aus, kann aber optimal von Maschinen ausgelesen werden:

Datei sitemap.xml für Suchmaschinen
Datei sitemap.xml für Suchmaschinen

Im Aufbau sieht man das wohlgeformte XML – im Klartext: der kleinste Fehler im Aufbau rächt sich bitterlich! Für jeden öffnenden XML-TAG benötigt man auch den entsprechend schließenden und wehe es fehlt einer. Dann bekommt man die Datei um die Ohren gehauen. Daher ist hier absolut sauberes Arbeiten notwendig! Nach dem Erstellen der XML-Datei diese unbedingt validieren lassen!

Es ist auch genau diese URL der sitemap.xml Datei, über die sich das Sitemap-Modul der „Google Search Console“ freut. Somit unterstützt man Google und andere Suchmaschinen, dass diese einfach den Inhalt indizieren können. Das hilft für ein besseres Ranking bzw. bei einer umfangreichen Website dazu, dass auch sehr tief geschachtelte versteckte Seiten von Suchmaschinen im Suchindex aufgenommen werden.

Zum Aufbau der XML-Datei findet man alle Informationen unter https://www.sitemaps.org/de/protocol.html und es gibt zahlreiche sitemap-Generatoren online und Dienste, die eine bestehende XML-Sitemap kontrolliert, ob alles in Ordnung und wohlgeformt ist.

Grundsätzlich benötigt man die Angabe von <xml ..., welche die XML-Version und das Encoding festlegt.

Erforderlich sind die Anweisungen und die Schachtelung von <urlset … >, <url> und <loc>. Die Angabe <urlset verweist auf aktuellen Protokollstandard, <url> fasst die Einzelangaben wie <loc>, <lastmod> und <changefreq> und <priority>

  • loc = URL der Seite mit Protokoll (http:// oder https://) (sprich die Location)
  • lastmod =(Optional) Änderungsdatum in W3C Datetime-Format
  • changefreq =(Optional) die Häufigkeit der Änderungen (ist mehr ein Hinweis als eine Anweisung
  • priority =(Optional) die Wichtigkeit der Seite von 1 (maximal) zu 0

Grenzen der Datei sitemap.xml

Auch die sitemap.xml hat ihr Grenzen. Will man mehr als 50.000 URLs in einer Sitemap aufnehmen, dann benötigt man mehrere Sitemaps. Genauso darf die Dateigröße der Sitemap nicht 10 Mbyte überschreiten.

Das wird erst einmal große Websites betreffen, aber der Vollständigkeit halber hier: Hat man mehrere Sitemaps, dann werden diese in der „robots.txt“ Datei einfach aufgeführt.

sitemap.xml und die robots.txt

Möchte man mehrere Sitemaps für seine Website verwenden, werden die verschiedenen Sitemap-Dateinamen in der robots.txt aufgenommen:

In der robots.txt steht dann:

# robots.txt
User-agent: *
Disallow:

Sitemap: https://www.html-seminar.de/sitemap.xml
Sitemap: https://www.html-seminar.de/sitemap-2.xml
weitere eigene Projekte: