Schlagwort: XML

Das World Wide Web Teil 3

Vom statischen Web zum semantischen Web

Trotz all dieser Entwicklungen bleibt das Web wieder und vor allem eine gigantische Bibliothek statischer HTML-Seiten online. Wenn jedoch einerseits der HTML-Standard mit seiner Einfachheit zur Bestätigung des Webs beigetragen hat, hat er andererseits die große Einschränkung, sich nur mit der Formatierung von Dokumenten zu befassen und die Struktur und Bedeutung des Inhalts wegzulassen.

Dies wirft erhebliche Schwierigkeiten beim Abrufen und Wiederverwenden von Informationen auf. Um dies zu realisieren, reicht es aus, eine Suche mit einer der vielen im Internet verfügbaren Suchmaschinen durchzuführen, und Sie werden feststellen, dass von den Tausenden von Dokumenten, die sich aus der Abfrage ergeben, oft nur ein kleiner Prozentsatz für die Forschung von Interesse ist, die durchgeführt werden sollte. Beispielsweise gibt es für jede Suchmaschine keinen Unterschied zwischen dem Begriff Rot im Kontext Mr. Red und dem Begriff Rot im Kontext Rote Haare, was die Suche sehr schwierig macht.

XML-Datei

Die Antwort auf dieses Problem kam erneut vom englischen Physiker Tim Berners-Lee, der nach seinem Ausscheiden aus dem CERN das W3C-Konsortium gründete, das die Rolle der Regierung bei der Entwicklung von Standards und Protokollen für das Internet übernahm. 1998 definierte er den XML-Standard (eXtensible Markup Language), eine von SGML abgeleitete Metasprache, die die Erstellung neuer Markup-Sprachen ermöglicht (z. B. wurde HTML selbst in XML als XHTML neu definiert). Seine innovative Funktion ist die Möglichkeit, semantische Informationen zu Inhalten hinzuzufügen, indem geeignete Tags definiert werden.

Die Hauptziele von XML, die in der ersten offiziellen Spezifikation (Oktober 1998) angegeben sind, sind wenige und explizite: Verwendung der Sprache im Internet, einfache Erstellung von Dokumenten, Unterstützung für mehrere Anwendungen, Klarheit und Verständlichkeit. Mit diesen einfachen Funktionen bietet XML eine gängige Methode zur Darstellung von Daten, sodass Softwareprogramme Informationen, die im Kontext verborgen sind, besser suchen, anzeigen und bearbeiten können.

Aus diesem Grund ist XML trotz seines jungen Alters die Grundlage aller neuen technologischen Spezifikationen, die vom W3C vertrieben werden, und wurde von der gesamten Computerindustrie (von Anwendungskonfigurationsdateien bis zur Definition) als Standard für die Datendarstellung übernommen von Datenaustauschformaten).

Die XML-Spezifikationen weisen jedoch eine sehr wichtige Lücke auf: Sie definieren keinen eindeutigen und gemeinsamen Mechanismus zum Festlegen von Beziehungen zwischen Informationen, die im Web für ihre automatische Verarbeitung ausgedrückt werden (z. B. mehrere Dokumente, die sich auf dasselbe Thema, dieselbe Person, Organisation, dasselbe Objekt beziehen) sehr schwierig, Informationen zu teilen.

Auch in diesem Fall kam die Lösung des Problems vom W3C von Berners-Lee durch die Formalisierung des Semantic Web. Das W3C betrachtet die ideale Entwicklung des Webs von maschinell darstellbar zu maschinenverständlich. Die Idee ist, Dokumente zu generieren, die nicht nur von Menschen gelesen und geschätzt werden können, sondern auch von automatischen Agenten für die Suche nach Inhalten zugänglich und interpretierbar sind.

Zu diesem Zweck wurden einige Sprachen definiert, z. B. das Resource Description Framework (RDF) und die Web Ontology Language (OWL), die beide auf XML basieren und es ermöglichen, die Beziehungen zwischen Informationen auszudrücken, die sich auf die Logik von Prädikaten beziehen, die aus künstlicher Intelligenz entlehnt wurden. Diese Standards sind bereits verfügbar, werden jedoch zusammen mit Formalismen und Tools weiterentwickelt, um das Web mit Inferenzfunktionen auszustatten.

Der gerade beschriebene Prozess ist nur scheinbar technisch, aber in seinem Umfang klar sichtbar. Ziel ist die Landung auf der gemeinsamen Intelligenz des Webs, die kurzfristig die effizienteste und längerfristig effizienteste Nutzung von Websites verspricht. , eine echte Veränderung in der Natur von Software und Diensten.

Ein großes Interesse an diesen Technologien zeigt sich darin, dass jeder (Benutzer, Hersteller von Software sowie kleine und große Dienste) von der vollständigen Verbreitung dieser Standards profitieren kann. Die Bildung eines riesigen „semantischen“ Netzwerks im Körper des Netzes ist in der Tat die Schlüsselbedingung für den Start einer neuen Art des Verstehens und der Nutzung des Netzes.