« Kategorien von Weblog - Formaten | Hauptseite | Die verschiedenen Typen von Weblogs »

Technische Grundlagen von Weblogs


Verbreitung von Inhalten mittels RSS

RSS ist derzeit der Standard zur sogenannten „Content Syndication“, also der Verbreitung von Inhalten. Hierbei handelt es sich um ein XML-Format. RSS steht je nach Auslegung für „RDF Site Summary“, „Rich Site Summary“ oder „Really Simple Syndication“. Es wird zum Verteilen von Inhalten benutzt, so können z.B. Webmaster fremde Nachrichten in ihre Seite mit einbinden und sie sogar in ihrem Layout erscheinen lassen. Alle großen Nachrichtenwebsites wie auch die meisten Weblogsysteme bieten die Generierung von RSS-Feeds an. Im Folgenden sollen die Grundlagen von RSS dargestellt werden, die bei der Verwendung von Weblogs zum Einsatz kommen. Weiterführende Literatur ist z.B. [2].




Feeds und die verschiedenen RSS-Versionen

Feeds beinhalten den Content, der übertragen werden soll. Dabei kann es sich um eine komplette Seite (von ihrem Layout getrennt) handeln oder aber nur um die Überschriften und eventuell eine Kurzzusammenfassung. Darüber hinaus kann der Content mit sogenannten Metadaten versehen werden. Metadaten sind Daten über Daten, die den Zweck haben, die übermittelten Daten zu beschreiben.

RSS wurde ursprünglich von Netscape beim Start ihres Portals „My Netscape Network“ eingeführt. Der Grundstein zu RSS wurde von Ramanathan V. Guha gelegt, der das MCF (Meta Content Framework) entwickelte. Hiermit wurden Beziehungen zwischen Objekten und deren Attributen beschrieben. Der größte Vorteil von RSS für den User war, dass er sich seine Startseite beliebig mit ihn interessierenden Nachrichtenkanälen (den Feeds) bestücken konnte und damit alles aus einem Guß bekam. Die Notwendigkeit, mehrere Websites zu besuchen, um alle gewünschten Informationen zu bekommen, entfiel hiermit. Netscape hatte den Vorteil, dass die User länger auf der Seite verweilten und die Werbeeinblendungen somit wertvoller wurden.

Nachdem die erste Version 0.91 herausgegeben und das „My Netscape Network“ geschlossen wurde, wurde die Weiterentwicklung des Standards in die Hände der Community gelegt. Hier entstand schnell ein erster Fork, also eine Aufsplittung der Versionen. Es gab das an 0.91 angelehnte 0.92 und die Version 1.0, die durch die Hinzunahme des RDF-Standards weitaus komplexer war und den Einsatz von Modulen propagierte. Bis dahin konnten jedoch alle Parser mit beiden Versionen umgehen. Am 16.9.2002 erschien die zur Zeit aktuelle Version 2.0, die auch von Wordpress verwendet wird.




Vorteile eines RSS-Feeds für den Anbieter

Nun stellt sich natürlich die Frage, was ein Anbieter davon hat, seinen hart erarbeiteten Content anderen kostenfrei zur Verfügung zu stellen. [2] listet dazu 8 Gründe auf, von denen 3 sicherlich auf den ersten Blick einleuchtend sind.

Darunter fallen:


  • 1.) die Steigerung des Traffics auf seiner eigenen Seite

  • 2.) die daraus folgende Verbesserung im Ranking der großen Suchmaschinen

  • 3.) die Herstellung von Verbindungen zwischen einer Handvoll Seiten, deren RSS-Feeds gegenseitig abonniert werden

Denn natürlich sind Informationen immer nur dann etwas wert, wenn sie auch gesehen werden.



Ein Ausflug in die technische Spezifikation von RSS

Zur Einführung der wichtigsten RSS-Tags benutzen wir ein von Wordpress erstelltes RSS 2.0 Feed, welches von einem Weblog stammt und einen Testeintrag enthält.

<?xml version="1.0" encoding="UTF-8"?>
<!-- generator="wordpress/2.0.3" -->
<rss version="2.0"
   xmlns:content="http://purl.org/rss/1.0/modules/content/"
   xmlns:wfw="http://wellformedweb.org/CommentAPI/"
   xmlns:dc="http://purl.org/dc/elements/1.1/" >

Zunächst wird neben der XML-Version und der verwendeten Zeichencodierung die RSS-Version spezifiziert. Danach wird die Art und Weise bestimmt, in der die Daten in den Content-Tags gespeichert werden. Im Beispiel ist dieser Teil blau markiert. Die Kommentare werden ebenfalls mittels eines RSS-Feeds ausgeliefert. Der Ersteller des Weblogeintrages wird im Dublin Core2-Stil angegeben. Der Dublin Core ist eine Metadateninitiative, die 1994 ins Leben gerufen wurde und nach dem Ort der Konferenz, auf der die Spezifikation verabschiedet wurde benannt ist.

<channel>
   <title>Hier steht der Titel der Website</title>
   <link>http://www.mustersite.net/blog</link>
   <description>Hier steht der Titel des Weblogs</description>
   <pubDate>Tue, 01 Aug 2006 10:20:54 +0000</pubDate>
      <generator>http://wordpress.org/?v=2.0.3</generator>
      <language>de</language>
      <item>
      <title>Ein Artikel, der die Trackback-Funktion testet</title>
      <link>http://www.mustersite.net/blog/?p=28</link>
      <comments>http://www.mustersite.net/blog/?p=28#comments</comments>
   <pubDate>Wed, 14 Jun 2006 07:07:58 +0000</pubDate>
      <dc:creator>Michael Schantin</dc:creator>
      <category>Web</category>
      <guid isPermaLink="false">http://www.mustersite.net/blog/?p=28</guid>
   <description>
   <![CDATA[Hier passiert nicht viel mehr, als dass die Trackback-Funktion zum 
      Weblog von Matthias getestet wird. Mehr über Trackback gibt es z.B. hier
      zu lesen.
      Hier befindet sich der besagte Artikel:
      http://www.hallenmitte.de/weblog/2006/06/visual_studio_2005_runtime_err.html
      Und hier der Trackback-Link darauf:
      http://www.hallenmitte.de/cgi-bin/mt/mt-tb.cgi/4 ]]>
   </description>
      <content:encoded>
      <![CDATA[<p>Hier passiert nicht viel mehr, als dass die Trackback-
      Funktion zum Weblog von Matthias getestet wird. Mehr über Trackback gibt
      es z.B. 
   <a title="Die Sache mit dem Trackback" target="_blank"
href="http://www.journal.kylaloo.net/2004-08/trackback">hier</a> zu lesen.</p>
   <p>Hier befindet sich der besagte Artikel:</p> 
<p>http://www.hallenmitte.de/weblog/2006/06/visual_studio_2005_runtime_err.html</p>
<p>Und hier der Trackback-Link darauf:
http://www.hallenmitte.de/cgi-bin/mt/mt-tb.cgi/4</p>]]>
      </content:encoded>
   <wfw:commentRSS>http://www.mustersite.net/blog/?feed=rss2&p=28</wfw:commentRSS>
   </item>
</channel>


Prinzipiell gliedern sich die Daten in einem Channel in Items (von denen in der Version 0.91 15 Stück maximal existieren dürfen, in dieser Version jedoch beliebig viele), die im Beispiel die folgenden Tags enthalten: Titel, Link zum Artikel, Beschreibung, Veröffentlichungsdatum, Ersteller, Kategorie, GUID, Beschreibung, Content, CommentRSS. Der Content (blaue Markierung) ist der eigentliche Text, der von Feedreadern bzw. von anderen Websites verarbeitet wird.




Automatische Feederkennung auf Websites

<link rel="alternate" type="application/rss+xml" title="RSS 2.0"
href="http://www.mustersite.net/blog/?feed=rss2" />


Es besteht für jede Person die Möglichkeit, die RSS-Feeds durch kopieren der Feed-URL weiterzuverwenden. Diese wird z.B. benötigt, um den Aggregator zu füllen. Sollen nun aber größere Feed-Verzeichnisse automatisch erstellt werden, so besteht die Möglichkeit, einen (für den Benutzer unsichtbaren) Hinweis für Suchmaschinen auf seiner Website zu den Feeds zu setzen. Dies geschieht in der obigen Art und Weise. Dieser Codeausschnitt stammt aus dem Header der Startseite (und jeder beliebigen Unterseite) eines Wordpress-basierten Weblogs. Hiermit wird der Suchmaschine ermöglicht, den URL des Feeds automatisch zu erfassen.


Darüber hinaus profitieren auch Browser, wie der beliebte Firefox von dieser Option. Dieser unterstützt von Haus aus die RSS-Feeds also sogenannte „Dynamische Lesezeichen“ oder kann mittels Plug-Ins zum RSS-Reader mit zusätzlichen Funktionen umfunktioniert werden. Hierzu kann man die Google-Toolbar oder ein entsprechendes Plug-In benutzen. Sogar Chat-Clients wie Miranda IM können mittlerweile RSS-Feeds verarbeiten.


Firefox zeigt bei Websites, die einen RSS-Feed bereitstellen, in der Adressleiste am rechten Rand das RSS-Logo an, welches durch hinzufügen als Favorit auftaucht, der sich bei Neueinträgen automatisch erweitert.



Trackback

Bei Trackback handelt es sich um eine Funktion, die zwischen verschiedenen Weblogs dafür sorgt, dass ein Autor eines Artikels, dessen Artikel von einem zweiten Autor referenziert wird von der Referenz Kenntnis bekommt und zwar in der Form, dass die Weblogsoftware des ersten Autors durch ein sogenanntes Trackback (meist automatisch) darüber informiert wird, dass ein neuer Artikel mit Bezug auf diesen Artikel erstellt wurde. Hierbei wird ein Ping an den Artikel gesendet (der mittels Permalink eindeutig spezifiziert ist) mit Übermittlung des Titels und eines Exzerpt des neu erstellten Artikels. Im Erstartikel wird nun der Zweitartikel (in Auszügen) anzeigt und der Autor und alle Leser wissen um die Existenz Bescheid. Die Trackback Spezifikation findet sich auf der Website des Herstellers Six Apart.6 Diese Funktion wurde ursprünglich von Six Apart entwickelt, ist jedoch ein offener Standard und wird von den gängigen Weblogsystemen unterstützt.

trackback.gif

TrackBack

TrackBack-URL zu diesem Eintrag:
http://www.hallenmitte.de/cgi-bin/mt35/mt-tb.cgi/13

Kommentar schreiben

(Wenn Sie auf dieser Site bisher noch nicht kommentiert haben, wird Ihr Kommentar eventuell erst zeitverzögert freigeschaltet werden. Vielen Dank für Ihre Geduld.)

Über diese Seite

Diese Seite enthält einen einzelnen am 13.09.06 09:29 erschienenen Blogeintrag.

Zuvor erschien in diesem Blog Kategorien von Weblog - Formaten.

Danach erschien Die verschiedenen Typen von Weblogs.

Viele weitere Einträge finden Sie auf der Hauptseite und im Archiv.

Powered by
Movable Type 3.35