Sitemap.xml von Website einlesen



Einlesen und verarbeiten eine sitemap.xml Datei einer Website.


Dieser Flow zeigt, wie man eine beliebige sitemap.xml einer Website (z.B. einem Wordpress Blog) einlesen kann und die URLs weiterverarbeiten kann.


Installiert folgende Komponenten:
  • 1 Projekt mit Beispielflows, welche Sie an Ihre Anforderungen anpassen können.
Registrieren und diese Vorlage nutzen

Flows

Hier sehen Sie eine Vorschau der Flows, die mit dieser Vorlage installiert werden.

sitemap.xml einlesen

Dieser Flow zeigt, wie man eine beliebige sitemap.xml einer Website (z.B. einem Wordpress Blog) einlesen kann und die URLs weiterverarbeiten kann. z.B. kann man jede URL mit dem SpreadsheetUrlDownload Step aufrufen, um den Website Cache "aufzuwärmen". Vorstellbar wäre auch, dass man sich auch über neue Einträge einer Website benachrichtigen lassen kann. Die Möglichkeiten sind vielfältig. Dieser Flow zeigt deshalb auch nur den Einlese-Prozess und das Parsing der XML Datei. 

Mehr Informationen über den Aufbau einer sitemap.xml Datei unter: http://www.sitemaps.org/de/protocol.html

UrlDownload

XML2Spreadsheet - XML file parsing

SpreadsheetMapper - Adjust columns if needed

SpreadsheetCSVWriter - write CSV file