Direkt zum Inhalt

News: Die neue Sprache fürs Netz

Stellen Sie sich vor, Sie könnten die Seite hochheben, die gerade aus dem World Wide Web eingetroffen ist, um nachzuschauen, wie die Computer dahinter ihre Übertragungen im Internet bewerkstelligen. Sie würden sehen, wie diese sich in vier verschiedenen Sprachen unterhalten. Drei der Sprachen sind äußerst karg und unflexibel, sie werden nur von Maschinen gesprochen. Allein die vierte, die HyperText Markup Language (HTML), macht das Web zu etwas so phänomenalem. HTML ist dem Englischen ähnlich genug, daß Unmengen von Leuten ihre Texte damit versehen und fast jede Art von Computer sie darstellen kann. Aber HTML ist immer noch starr - ein Komitee muß jede Erweiterung seines eingeschränkten Vokabulars genehmigen.
Im Februar wurde nun eine fünfte Sprache für die Benutzung auf dem Web zugelassen – eine, die fast so weitreichende Folgen nach sich ziehen dürfte wie vor sieben Jahren die Entwicklung von HTML. Extensible Markup Language (XML) ist – wie HTML – für Menschen überraschend einfach zu lesen und zu schreiben, wenn man bedenkt, daß es von einer internationalen Gruppe aus 60 Ingenieuren entwickelt wurde. Aber XML ist wesentlich flexibler als HTML: Jeder kann seine eigenen Worte in dieser Sprache bilden. Außerdem werden Geräte, die XML verstehen (in wenigen Jahre dürften dies wohl fast alle Maschinen sein, die mit dem Internet verbunden sind), fähig sein, intelligentere Dinge zu tun, als einfach nur Informationen auf einer Web-Seite anzuzeigen. XML gibt Computern in gewisser Weise die Möglichkeit, das zu begreifen, was sie auf der Web-Seite lesen.

Um zu verstehen, wie das möglich ist, stellen Sie sich einmal vor, Sie wollen für die Ferien eine Datscha an der Schwarzmeerküste mieten. Sie sprechen jedoch kein Wort Russisch. Ein Freund in Odessa schickt Ihnen per E-Mail die Auflistung der Kleinanzeigen mit Vermietungsangeboten aus der lokalen Zeitung. Selbst wenn er Beschreibungen einfügt, wie die Anzeige in der Zeitung erschienen ist (dort war eine Linie, dieses Wort war fett gedruckt, ...) wird Ihnen das kaum helfen. Was aber, wenn er den russischen Text mit Anmerkungen versieht, die sagen, welche der Zahlen sich auf Preise und welche auf Schlafzimmer beziehen? Oder wenn er jede Bemerkung zum Ausblick hervorhebt und anmerkt, daß diese Wortfolge "sehr gut" und jene "Sommerferien" heißt? Plötzlich wäre die Liste nützlich.

Für Browser-Programme sind Web-Seiten heute typischerweise lange Aneinanderreihungen von Kauderwelsch (wie uns Deutschen chinesische oder russische Texte vorkommen) mit ein paar verständlichen HTML-Wörtern, die beschreiben, wie die Brocken Kauderwelsch auf der Seite anzuordnen sind und welche Schriftart zu setzen ist. Verleger können HTML nutzen, um Web-Seiten schöner zu gestalten, aber die Seite etwas halbwegs Intelligentes machen zu lassen – z.B. eine Grundstücksliste nach Preisen zu sortieren –, erfordert ein eigenes Programm. Der Leser müßte warten, bis dieses Programm eine volle neue Seite auf einem weit entfernten und überlasteten Server aufgebaut und an ihn zurückgeschickt hat. Dieser kostspielige und ineffizente Weg ist es, der das Web so schwerfällig und langsam macht bei der Bereitstellung von Diensten wie Reisereservierungen, auf den Nutzer zugeschnittene Nachrichten oder nützliche Suchhilfen – und weshalb einige Firmen solche Dienste online anbieten.

XML sollte diese Probleme beheben. Es erlaubt Autoren, ihre Seiten mit Anmerkungen zu versehen, die beschreiben, was die Textstücke sind, statt nur zu sagen, wie sie erscheinen sollen. Die Odessa-Rundschau könnte zum Beispiel ihre Kleinanzeigen mit solchen Markierungen ausstatten, die Web-Browsern erlauben, Anzeigen für Wodka von denen für Datschas zu unterscheiden und in jeder Datscha-Auflistung den Preis, die Größe des Besitzes und den Ausblick zu identifizieren.

Nun da XML als Web-Standard zertifiziert wurde, haben sowohl Microsoft als auch Netscape angekündigt, daß die nächsten Hauptreleases ihrer Browser die neue Sprache verstehen werden. Indem sie sogenannte Style Sheets benutzen, werden die Programme XML-Dokumente genauso leicht anzeigen können, wie sie jetzt bereits HTML-Seiten formatieren. Wenn aber Programm-Schnipsel, also Scripts oder Applets, in eine XML-Seite eingebettet sind, können Browser auch die darin enthaltenen Informationen bearbeiten. Die Odessa-Listen könnten so arrangiert werden, daß Besitzungen, die mehr als 2000 Rubel kosten, aussortiert werden und mit Datscha-Listen aus fünf anderen Online-Zeitungen verknüpft werden.

XML bietet im wesentlichen den ersten universellen Datenbankübersetzer, also einen Weg, um Informationen in wirklich jedem Speicher in eine Form zu bringen, die beinahe jeder andere Computer bearbeiten kann. So sollte es die Internet-Suche in zweierlei Hinsicht dramatisch effizienter gestalten.

  • Erstens könnten Internet-Surfer ihre Suche auf ausgewählte Web-Seiten beschränken, zum Beispiel auf Rezepte oder Zeitungsberichte oder Produktbeschreibungen.
  • Zweitens sind viele der nützlichen Informationen auf dem Web in Datenbanken versteckt, die den Suchmaschinen verborgen bleiben. Diese durchkämmen das Netz auf der Suche nach Text für ihre Stichwortverzeichnisse. Mit XML könnte Medline seine Datenbank mit Zusammenfassungen medizinischer Fachartikel so offenlegen, daß jedes Programm sie durchsuchen könnte. General Motors könnte dasselbe mit seinem Ersatzteilkatalog machen.
XML ist universell, da Autoren die Möglichkeit haben, neue Worte zu definieren, welche die Struktur ihrer Daten beschreiben. Eine solche Freiheit könnte zum Chaos führen, wenn jeder sich seinen eigenen Jargon zurechtbastelt. Aber Nutzer und Firmen haben ein gemeinsames Interesse und damit einen starken Antrieb sich auf wenige ausgewählte Ausdrücke zu einigen. Die Chemiker haben zum Beispiel XML bereits genutzt, um ihre eigene Chemical Markup Language neu zu definieren. Diese erlaubt es einem Browser, die Spektren eines Moleküls und seine chemische Struktur anzuzeigen, indem man nur eine einfache Textbeschreibung der Verbindung angibt. Mathematiker haben den Standard genutzt, um eine Math Markup Language zu entwerfen, die es einfach macht, Gleichungen darzustellen, ohne sie in Bilder umzuwandeln. Wichtiger noch ist, daß MathML-Formeln direkt für Rechnungen in Algebra-Software eingespeist werden können.

Die bisher vielleicht eindruckvollste Demonstration der Flexibilität von XML ist MusicML, eine einfache Ansammlung von Bezeichnungen für Noten, Takte und Pausen, die es erlaubt, Kompositionen als Texte zu speichern, aber durch XML-fähige Web-Browser in Form von Notenblättern darzustellen. Mit etwas mehr Programmierung könnten Browser wahrscheinlich MusicML auf synthetischen Instrumenten spielen. Nun, da das Web Daten lesen kann, könnte es vielleicht auch lernen, Musik zu lesen.

Schreiben Sie uns!

Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.

Partnerinhalte

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.