Smart Content

Seit den 1990er Jahren wurden mutige Versprechen zu XML und dazu gemacht, was es im Bereich der Wiederverwendung von Inhalten und des automatisierten Publishing ermöglichen könnte.

Seit den 1990er Jahren wurden mutige Versprechen zu XML und dazu gemacht, was es im Bereich der Wiederverwendung von Inhalten und des automatisierten Publishing ermöglichen könnte. In einigen Bereichen wie beispielsweise Tech Pubs ist dies geschehen, aber wenn es um das Erstellen von Inhalten für die Allgemeinheit durch Unternehmensanwender und Fachexperten geht, ist XML heute genauso wenig verbreitet wie vor zwanzig Jahren. Es ist an der Zeit, XML zum universellen Format für die Erstellung von Inhalten zu machen. Und hier kommt Smart Content ins Spiel.

 

Was sind intelligente Inhalte?

Smart Content ist die Grundlage der Content-Automation-Platform von Quark. Es ist ein offenes XML-basiertes Inhaltsschema, das vom Kunden konfiguriert werden kann und es nichttechnischen Autoren ermöglicht, wiederverwendbare Inhaltskomponenten in einer vertrauten und intuitiven Umgebung zu verfassen. Diese Komponenten können dann für das Publishing über mehrere Kanäle, einschließlich Print, Web und Mobil, dynamisch zusammengestellt werden.

Intelligente Inhalte werden am besten eingesetzt, wenn die Art des Inhalts über eines oder mehrere der folgenden Merkmale verfügt:

  • Große Mengen ähnlicher Dokumente
  • Viele Überarbeitungen
  • Häufig wiederholtes Erstellen
  • Gesetzlich oder vom Unternehmen regulierte Dokumente
  • Hohe Wahrscheinlichkeit der Wiederverwendung von Inhalten für mehrere Dokumente
  • Integration von Daten in den Inhalt
  • Übersetzung in mehrere Sprachen
  • Ausgabe in mehreren Formaten
  • Ausgabe mit mehreren unterschiedlichen Präsentationsstilen

Welche anderen XML-Schemata gibt es?

Es gibt auf dem Markt viele XML-Schemata für das Verfassen und Veröffentlichen. Einige sind sehr allgemein und einige sind branchenspezifisch. Interessanterweise sind sogar HTML4 und spätere Versionen Implementierungen eines XML-Schemas namens „XHTML“. Andere beliebte XML-Schemata sind:

  • DITA
    Eines der beliebtesten XML-Schemata für das Verfassen und Veröffentlichen von technischen Dokumenten. Es wurde ursprünglich bei IBM entwickelt und wechselte als Branchenstandard für technische Publikationen zu OASIS. Im weiteren Verlauf erfahren Sie mehr über DITA.
  • SPL − Structured Product Labeling ‒ strukturierte Produktetikettierung
    Wird in den USA zum Einreichen von Daten zur Medikamentenetikettierung an die FDA zur Genehmigung vor der Veröffentlichung eines neuen Medikaments oder einer neuen Verpackung auf dem Markt verwendet. Unterstützung für das Verfassen durch SPL Accelerator für Quark XML Author.
  • MSP
    Wird in den USA, in Australien und in anderen Partnerländern zum Erfassen und Mitteilen von Erkenntnissen im Ministerium für Heimatschutz und in beinahe allen Ministerien der US-amerikanischen Regierung eingesetzt. Unterstützung für das Verfassen durch Quark Pubs-XML Accelerator.
  • Docbook
    Ein Vorgänger von DITA und häufig für technische Publikationen und Fachbücher eingesetzt.

Und es gibt viele andere Schemata. Einige Unternehmen definieren ihre eigenen spezifischen Schemata von Grund auf, was VIEL Arbeit bedeutet und schwierig und teuer ist, wenn es gut werden soll.

Wenn es schon viele XML-Dokumentenschemata gibt, warum hat dann Quark ein neues Smart-Content-Schema entwickelt? Die Antwort beginnt mit einem kurzen Überblick der Geschichte von XML.

Was stimmt nicht mit XML?

XML zur Herstellung von Dokumenten wurde zunächst von der Branche der technischen Publikationen übernommen. Es wird stark bei der Dokumentation für Computersoftware und -hardware, komplexer Fertigung und bei Prozessfertigung eingesetzt, wenn der Inhalt letztlich als Print und PDF, HTML und in mehreren Formaten für Hilfesysteme wie HTMLHelp, MSHelp, EclipseHelp, WebHelp und anderen Ausgabeformaten veröffentlicht wird. Die am häufigsten verwendeten XML-Schemata für Dokumente, einschließlich des sehr beliebten DITA-Schemas, wurden von und für die technischen Verlage entwickelt.

Das Ergebnis ist, dass diese Schemata sehr leistungsstarke, aber auch sehr komplexe Tools sind. Um ein Zitat von einem Quark Partner für professionelle Dienstleistungen zu nutzen: „DITA ist toll, wenn die Autoren wie Programmierer denken können.“ Das ist ideal für technische Autoren, die aufgrund der Natur ihrer Arbeit technisch sehr begabt und gut geschult sind. Und bei ihnen handelt es sich um Vollzeitautoren.

Aber bei unternehmenskritischer Kommunikation, beispielsweise bei Dokumenten, die von Finanz- oder Rechtsanalysten oder Produktmarketingteams verfasst werden, kann man nicht annehmen, dass diese Teilzeitautoren „wie Programmierer denken“ können oder wollen.

Weshalb sind diese Authoring-Schemata schwierig? Sie sind oft übermäßig restriktiv. Bei Quark haben viele der frühen Anwender eines dieser Schemata darüber geklagt, dass die einfache Aufgabe, Inhalte aus einem Dokument auszuschneiden und es in einen anderen Bereich eines Dokuments einzufügen, von der Anwendung blockiert wurde. Warum wurde der Inhalt blockiert? Nehmen wir das folgende einfache Beispiel für einen Titel und einen Absatz (wir zeigen die XML-Tags, aber denken Sie daran, dass die meisten XML-Authoring-Tools versuchen, die Tags auszublenden).

<title>So macht man das</title>
<para>Beginnen Sie mit den Zutaten aus dem <keyword>Erntedankrezept</keyword>.</para>

Wenn der Anwender den Satzteil nach dem <keyword>Erntedankrezept</keyword>. auswählt, kopiert und nach dem macht man das im <title> einfügt, dann könnte das Authoring-Tool das Einfügen blockieren, denn das Kontrollschema erlaubt kein <keyword> innerhalb eines <title> Elements. Das ist frustrierend, und noch schlimmer, der Grund für den Fehlschlag beim Einfügen wird dem Anwender oft nicht angezeigt − er versteht nicht, warum er den Text nicht einfügen konnte, und denkt deshalb, die Software hätte einen Fehler.

Dieses Beispiel zeigt eine der größeren Herausforderungen für alle Anbieter von XML-Authoring-Tools, und vor allem für Quark, denn das Unternehmen wendet sich an nichttechnische Autoren: das Einführen von Regeln und Inhaltsstrukturen für Anwender, die über jahrelange Erfahrung bei der Verwendung von Freiform-Tools verfügen.

Darüber hinaus ist es extrem schwierig, ein Anwendererlebnis zu schaffen, das diese Regeln verwaltet und dem Anwender gegenüber darstellt − ohne dass das Tool zu komplex wird. Deshalb ähnelt die Anwendererfahrung so vieler Softwareprodukte für das XML-Authoring stärker der Entwicklungsumgebung eines Programmierers als einer Textverarbeitungssoftware.

Diese Herausforderung ist es wert, bewältigt zu werden, denn die Automatisierung von Inhalten unternehmenskritischer Kommunikationsmittel ist unglaublich wertvoll. Im Allgemeinen ist das Nutzenversprechen durch die Automatisierung einfach zu beschreiben:

  • Die Automatisierung verringert die Kosten, steigert die Qualität und verkürzt die Markteinführungszeit.
  • Damit die Automatisierung erfolgreich ist, müssen die Eingaben gültig und erwartet sein: „Schrott rein, Schrott raus“, wie man sagt.

Damit also die Automatisierung der Inhalte gelingt, müssen die Eingaben − dies sind die verfassten Inhalte im Fließtext − erwartet und gültig sein. Hier ist XML leistungsstark, denn es ist einfach zu validieren und zwingt die Autoren, nur erwartete Inhalte zu erstellen. Aber hier verursachen XML-Authoring-Tools auch die meisten Probleme, denn sie bedeuten den Abschied von Freiform-Textverarbeitungstools.

Unternehmensanwender, Teilzeitautoren und Fachleute, die ihr ganzes Leben lang Freiform-Tools zur Textverarbeitung verwendet haben, beispielsweise Microsoft Word oder Google Docs, haben bestimmte Erwartungen an ihre Eingabegeschwindigkeit und die Freiheit (häufig vollständige Freiheit) bei der Art der Eingabe in das Dokument. Wenn Autoren dieser Gruppen zu einem Authoring-Tool für kontrollierte, „strukturierte“ Inhalte wechseln müssen, das ihre Freiheit einschränkt, stellt dies für sie eine große Herausforderung dar. Je vorschreibender und einschränkender das XML-Schema ist, desto größer ist die Lücke zwischen den Erwartungen des Autors und seiner Erfahrung mit dem Erstellen von XML. Und das Bewältigen dieser Herausforderung brachte Quark dazu, das Smart Content Schema zu entwickeln.

Das Bewältigen dieser Herausforderung brachte Quark dazu, das Smart-Content-Schema zu entwickeln.

Details zum Smart-Content-Schema

Für mit XML vertraute Personen ist offensichtlich, dass das Smart Content Schema Ideen von vielen anderen XML-Implementierungen entnimmt, einschließlich − dies ist das Wichtigste − der Vorstellung von Inhaltsarten. Sie werden manchmal auch als Inhaltsklassen oder Formen der Informationsarchitektur bezeichnet. Die Grundidee ist relativ einfach: es gibt eine Reihe grundlegender Inhaltsarten, und alle anderen Inhalte können als einer dieser Grundklassen zugehörig beschrieben werden. Für mit DITA vertraute Personen könnte dies auch als die „Spezialisierung“ einer dieser Grundklassen beschrieben werden. Das Konzept der Grundklassen und der Klassenhierarchien ist bei der Computerprogrammierung und in Biologie, Physik, Mathematik und weiteren Disziplinen verbreitet.

Der Wert von Grundklassen und Klassenhierarchien besteht darin, dass ein System, das weiß, wie die Grundelemente verarbeitet werden, alle Spezialisierungen dieser Grundklasse grundlegend bearbeiten kann, ohne zuvor Kenntnisse über die spezifische Spezialisierung zu haben.

Dies ist nicht so kompliziert, wie es sich zunächst anhört. Ein einfaches Beispiel: Wenn das System weiß, dass alle <para>-Elemente mit einer vorausgehenden und einer nachfolgenden Leerzeile dargestellt werden sollen, und das System dann einen Inhalt verarbeitet, der <para type="Blockzitat"> enthält, wird zumindest richtig erkannt, dass ein Blockzitat mit einer vorausgehenden und einer nachfolgenden Leerzeile dargestellt wird. Es gibt viele andere Verarbeitungsregeln, Darstellungsregeln und Anwenderinteraktionen, die auf alle Inhalte ähnlicher Arten angewandt werden können. Die „Spezialisierung“ wird erschaffen, weil ein System auch eine neue und einzigartige Verarbeitung hinzufügen könnte, beispielsweise eine Einrückung rechts und links für ein Blockzitat.

Welches sind diese Grundklassen? Smart Content stellt diese Klassen in unterschiedlichen Kategorien dar, und die folgende Tabelle vergleicht einige der von Smart Content, DITA und HTML verwendeten Begriffe:

Inhaltsart Smart Content HTML DITA
Bereiche section div topic
Blöcke p p p
Inlines tag em, strong, etc. phrase
Listen ul, ol ul, ol list type="Art"
Tabellen tables table table
Bilder image img image
Medien Media video, object object
Metadaten XML meta fragment tag attribute = "Wert" tag attribute = "Wert"

Einer der wichtigen Unterschiede besteht darin, wie die Spezialisierung dieser Grundinhaltsarten in den einzelnen Markup-Sprachen gehandhabt wird:

In HTML, wird die Spezialisierung eines Grund-HTML-Tags im Allgemeinen durchgeführt, um die CSS Formatierung zu fördern oder um tag-spezifische Javascript-Funktionen auszulösen, es wird meistens mit dem Merkmal „class“ codiert, beispielsweise:

<div class="Navigation">…</div>

Doch in HTML, gibt es sehr wenige Regeln dazu, wie und wo man >div< einsetzen kann, und es gibt keine Regeln zum Wert des Merkmals „class“, also ist HTML tatsächlich sehr informell und eignet sich nicht zum Verfassen von hochwertigen Kommunikationsinhalten − obwohl es für die Darstellung auf einer Webseite oder in einer Mobil-App sehr gut geeignet ist.

In DITA, ist die Spezialisierung eines Grund-DITA-Elements wie >topic< folgendermaßen verschlüsselt:

<concept class="- Thema/Themenkonzept/Konzept">…</concept>

Obwohl das Merkmal „Klasse“ einen so offensichtlich redundanten Wert hat, ist es einfach, das Ziel zu erkennen. Das Element „concept“ soll der Klasse „topic“ angehören und deshalb wie ein Thema behandelt werden, sofern nicht eine besondere Verarbeitung für das Konzept definiert wurde.

In Smart Content, wird die Spezialisierung folgendermaßen programmiert:

<section type="Zweck">

Dies ähnelt stark der HTML-Methode zur Spezialisierung, es gibt jedoch sehr spezifische Implementierungsregeln, so dass beispielsweise beim Verfassen einer Standardarbeitsanweisung (SOP) jedes Dokument einen einzigen „Zweck“ hat, und dieser Zweck nach dem Titel des Dokuments angegeben werden muss. HTML schränkt die Nutzung von Klassenmerkmalen nicht ein und validiert sie nicht.

Es sollte auch betont werden, dass in HTML und Smart Content der Name des Objekts immer die Grundlage der Klasse darstellt. Das heißt:

<section type="mySection"> ist nicht <mySection class="section">

DITA-Anwender und andere XML-Fachleute fragen vielleicht: „Warum verwendet man nicht die DITA-Methode zum Definieren von Spezialisierungen?“ Die vollständige Antwort ist komplex, aber die einfache Antwort hängt direkt mit den zuvor beschriebenen Schwierigkeiten beim Bereitstellen einer guten Nutzbarkeit für das Verfassen zusammen, einschließlich des Supports für Grobbearbeitungen durch Ausschneiden und Einfügen in einem oder mehreren Dokumenten.

Beinahe alle verfügbaren XML-Parsing-Tools validieren die Struktur eines Dokuments basierend auf dem Elementnamen (eine valide Struktur bedeutet, dass alle verwendeten Elemente für das Schema erlaubt sind und dass sie sich in einer gültigen Reihenfolge befinden). Außerdem ignorieren XML-Parser beim Validieren einer Struktur die Attributwerte. Durch Nutzung des HTML-Stils der Elementspezialisierung kann Smart Content Grobbearbeitungen mit einer positiven Anwendererfahrung ermöglichen. Der Anwender kann ein Element ausschneiden und einfügen, und nach dem Einfügen kann das stille Verarbeiten entweder das Merkmal „type“ korrigieren, oder, wenn mehrere Möglichkeiten bestehen, dem Author die Auswahl aus mehreren gültigen Optionen für das Merkmal „type“ ermöglichen.

Obwohl es viele andere Gründe für die Architektur des Smart Content Schema gibt, ist diese Fähigkeit zum Rückgriff auf die Verarbeitung basierend auf der Grundklasse einer der wichtigsten und wertvollsten.

Auch wenn das Smart Content Schema in Bezug auf XML-Schemata relativ jung ist, wurde der Grundstein für seine Entwicklung in den Jahren von XML, Content-Authoring und Publishing-Erfahrung von Quark und unseren Kunden und Partnern gelegt. Das Schema wird erfolgreich von einer Reihe von Kunden in Branchen wie Finanzen, Energie, Fertigung sowie Regierung und Behörden eingesetzt. Wir freuen uns über Feedback zum Schema und planen, die Spezifikationen in Zukunft zur Nutzung durch andere Unternehmen bereitzustellen.

Um mehr über die Implementierung einer Smart Content Lösung zu erfahren, besuchen Sie bitte Quark Author. Quark Author ist eine webbasierte Publishing-Software. Zusammen mit Quark Publishing Platform bietet sie Fachexperten und nichttechnischen Redakteuren ein intuitives Authoring-Erlebnis, um Inhalte schnell zu produzieren, als Vorschau darzustellen, zu veröffentlichen und wieder zu verwenden.