SMART CONTENT

Seit den 1990er Jahren wurden mutige Versprechen zu XML und dazu gemacht, was es im Bereich der Wiederverwendung von Inhalten und des automatisierten Publishing ermöglichen könnte. In einigen Bereichen wie beispielsweise Tech Pubs ist dies geschehen, aber wenn es um das Erstellen von Inhalten für die Allgemeinheit durch Unternehmensanwender und Fachexperten geht, ist XML heute genauso wenig verbreitet wie vor zwanzig Jahren.

Hoffentlich bringen intelligente Inhalte Sie dazu zu denken: „Irgendetwas ist anders. Ich weiß, was Inhalte sind, aber was sind intelligente Inhalte?“ Das ist unser Ziel, denn es ist an der Zeit, anders darüber nachzudenken, wie wir Inhalte erstellen.

Was sind intelligente Inhalte?

Wenn man das Gesamtbild ansieht, ist Smart Content, intelligente Inhalte, der von Quark gewählte Name für die neueste Generation des auf XML basierenden Authoring und automatisierten Publishing von hochwertiger Kommunikation. Er spiegelt die Tatsache wider, dass XML, obwohl es als zugrundeliegende Technologie entscheidend ist, in den Hintergrund treten muss, wenn es um die Erstellung und Wiederverwendung von Inhalten geht.

Auf einer sehr granulären Ebene ist Smart Content das offene und vom Kunden konfigurierbare auf XML basierende Content-Schema von Quark. Die Unternehmensprodukte von Quark konzentrieren sich auf das Verstehen und Implementieren von Smart Content, so dass die Kunden schnellstmöglich eine Rendite durch das Einsetzen des Dynamic Publishing erfahren.

Intelligente Inhalte werden am besten eingesetzt, wenn die Art des Inhalts über eines oder mehrere der folgenden Merkmale verfügt:

  • Große Mengen ähnlicher Dokumente
  • Viele Überarbeitungen
  • Häufig wiederholtes Erstellen
  • Gesetzlich oder vom Unternehmen regulierte Dokumente
  • Hohe Wahrscheinlichkeit der Wiederverwendung von Inhalten für mehrere Dokumente
  • Integration von Daten in den Inhalt
  • Übersetzung in mehrere Sprachen
  • Ausgabe in mehreren Formaten
  • Ausgabe mit mehreren unterschiedlichen Präsentationsstilen

Da Smart Content im Grunde eine XML-Schemadefinition ist, ist es beinahe unmöglich, Smart Content zu beschreiben, ohne in technische Details zu gehen.

Wer nutzt XML zur Herstellung von Dokumenten?

Es gibt auf dem Markt viele XML-Schemata für das Verfassen und Veröffentlichen. Einige sind sehr allgemein und einige sind branchenspezifisch. Interessanterweise sind sogar HTML4 und spätere Versionen Implementierungen eines XML-Schemas namens „XHTML“. Andere beliebte XML-Schemata sind:

DITA
Eines der beliebtesten XML-Schemata für das Verfassen und Veröffentlichen von technischen Dokumenten. Es wurde ursprünglich bei IBM entwickelt und wechselte als Branchenstandard für technische Publikationen zu OASIS. Im weiteren Verlauf erfahren Sie mehr über DITA.

Docbook
Ein Vorgänger von DITA und häufig für technische Publikationen und Fachbücher eingesetzt.

MSP
Wird in den USA, in Australien und in anderen Partnerländern zum Erfassen und Mitteilen von Erkenntnissen im Ministerium für Heimatschutz und in beinahe allen Ministerien der US-amerikanischen Regierung eingesetzt. Unterstützung für das Verfassen durch Quark Pubs-XML Accelerator.

SPL −Structured Product Labeling ‒ strukturierte Produktetikettierung
Wird in den USA zum Einreichen von Daten zur Medikamentenetikettierung an die FDA zur Genehmigung vor der Veröffentlichung eines neuen Medikaments oder einer neuen Verpackung auf dem Markt verwendet. Unterstützung für das Verfassen durch SPL Accelerator for Quark XML Author.


Und es gibt viele andere Schemata. Einige Unternehmen definieren ihre eigenen spezifischen Schemata von Grund auf, was VIEL Arbeit bedeutet und schwierig und teuer ist, wenn es gut werden soll.

Wenn es viele XML-Dokumentenschemata gibt, warum hat dann Quark ein neues Smart Content Schema entwickelt?

Was stimmt nicht mit XML?

XML zur Herstellung von Dokumenten wurde zunächst von der Branche der technischen Publikationen übernommen. Es wird stark bei der Dokumentation für Computersoftware und -hardware, komplexer Fertigung und bei Prozessfertigung eingesetzt, wenn der Inhalt letztlich als Print und PDF, HTML und in mehreren Formaten für Hilfesysteme wie HTMLHelp, MSHelp, EclipseHelp, WebHelp und anderen Ausgabeformaten veröffentlicht wird. Die am häufigsten verwendeten XML-Schemata für Dokumente, einschließlich des sehr beliebten DITA-Schemas, wurden von und für die technischen Verlage entwickelt.

Das Ergebnis ist, dass diese Schemata sehr leistungsstarke, aber auch sehr komplexe Tools sind. Um ein Zitat von einem Quark Partner für professionelle Dienstleistungen zu nutzen: „DITA ist toll, wenn die Autoren wie Programmierer denken können.“ Das ist ideal für technische Autoren, die aufgrund der Natur ihrer Arbeit technisch sehr begabt und gut geschult sind. Und bei ihnen handelt es sich um Vollzeitautoren.

Aber bei hochwertiger Kommunikation, beispielsweise bei Dokumenten, die von Finanz- oder Rechtsanalysten oder Produktmarketingteams verfasst werden, kann man nicht annehmen, dass diese Teilzeitautoren „wie Programmierer denken“ können oder wollen.

Weshalb sind diese Authoring-Schemata schwierig? Sie sind oft übermäßig restriktiv. Bei Quark haben viele der frühen Anwender eines dieser Schemata darüber geklagt, dass die einfache Aufgabe, Inhalte aus einem Dokument auszuschneiden und es in einen anderen Bereich eines Dokuments einzufügen, von der Anwendung blockiert wurde. Warum wurde der Inhalt blockiert? Nehmen wir das folgende einfache Beispiel für einen Titel und einen Absatz (wir zeigen die XML-Tags, aber denken Sie daran, dass die meisten XML-Authoring-Tools versuchen, die Tags auszublenden).

<title>So macht man das</title>
<para>Beginnen Sie mit den Zutaten aus dem <keyword>Erntedankrezept</keyword>.</para>

Wenn der Anwender den Satzteil nach dem “<keyword>Erntedankrezept</keyword>.” auswählt, kopiert und nach dem macht man das im <title> einfügt, dann könnte das Authoring-Tool das Einfügen blockieren, denn das Kontrollschema erlaubt kein <keyword> innerhalb eines <title> Elements. Das ist frustrierend, und noch schlimmer, der Grund für den Fehlschlag beim Einfügen wird dem Anwender oft nicht angezeigt − er versteht nicht, warum er den Text nicht einfügen konnte, und denkt deshalb, die Software hätte einen Fehler.

Natürlich hätte ein geschulter technischer Autor in Vollzeit eine Vorstellung davon, was geschehen ist, würde im eigenen Tool „Tags anzeigen“ einschalten und nur den gewünschten Text auswählen − und das Tag „Keyword“ überspringen. Dies ist ein einfaches Beispiel, aber es gibt viele ähnliche Anwedungsfälle. Dieses Problem wird vom Quark Team als „Grobbearbeitung“ bezeichnet, und es ist ein bedeutendes Problem, wenn es einen Unternehmensanwender daran hindert, mit Texte mit der früheren Mühelosigkeit zu verfassen.

Dieses Beispiel zeigt eine der größten Herausforderungen für alle Anbieter von XML-Authoring-Tools, und vor allem für Quark, da sich das Unternehmen an nichttechnische Autoren richtet. Die Herausforderung besteht darin, Anwendern, die jahrelange Erfahrung mit Freiform-Tools haben, Regeln und Einschränkungen aufzuerlegen. Darüber hinaus ist es extrem schwierig, ein Anwendererlebnis zu schaffen, das diese Regeln und Einschränkungen verwaltet und dem Anwender gegenüber darstellt − ohne dass das Tool zu komplex wird. Deshalb ähnelt die Anwendererfahrung so vieler Softwareprodukte für das XML-Authoring stärker der interaktiven Entwicklungsumgebung eines Programmierers als einer Textverarbeitungssoftware.

Denken Sie daran, der Grund, weshalb man diese Herausforderung bewältigen sollte, ist der Wert der Automatisierung des hochwertigen Kommunikationsprozesses über mehrere Kanäle. Im Allgemeinen ist das Nutzenversprechen durch die Automatisierung einfach zu beschreiben:

  • Die Automatisierung verringert die Kosten, steigert die Qualität und verkürzt die Markteinführungszeit.
  • Damit die Automatisierung erfolgreich ist, müssen die Eingaben gültig und erwartet sein: „Schrott rein, Schrott raus“, wie man sagt.

Damit also die Automatisierung des Publishing gelingt, müssen die Eingaben − dies sind die verfassten Inhalte im Fließtext − erwartet und gültig sein. Hier ist XML leistungsstark, denn es ist einfach zu validieren und zwingt die Autoren, nur erwartete Inhalte zu erstellen. Aber dies ist auch die Stelle, an der XML-Authoring-Tools die meisten Probleme verursachen, denn sie erlauben nur, was erwartet wird, und Inhalte, die validiert werden können.

Unternehmensanwender, Teilzeitautoren und Fachleute, die ihr ganzes Leben lang Freiform-Tools zur Textverarbeitung verwendet haben, beispielsweise Microsoft Word oder Google Docs, haben bestimmte Erwartungen an ihre Eingabegeschwindigkeit und die Freiheit (häufig vollständige Freiheit) bei der Art der Eingabe in das Dokument. Wenn Autoren dieser Gruppen zu einem Authoring-Tool für kontrollierte, „strukturierte“ Inhalte wechseln müssen, das ihre Freiheit einschränkt, stellt dies für sie eine große Herausforderung dar. Je vorschreibender und einschränkender das XML-Schema ist, desto größer ist die Lücke zwischen den Erwartungen des Autors und seiner Erfahrung mit dem Erstellen von XML. Und das Bewältigen dieser Herausforderung brachte Quark dazu, das Smart Content Schema zu entwickeln.

Details zum Smart Content Schema

Für mit XML vertraute Personen ist offensichtlich, dass das Smart Content Schema Ideen von vielen anderen XML-Implementierungen entnimmt, einschließlich − dies ist das Wichtigste − der Vorstellung von Inhaltsarten. Sie werden manchmal auch als Inhaltsklassen oder Formen der Informationsarchitektur bezeichnet. Die Grundidee ist relativ einfach: es gibt eine Reihe grundlegender Inhaltsarten, und alle anderen Inhalte können als einer dieser Grundklassen zugehörig beschrieben werden. Für mit DITA vertraute Personen könnte dies auch als die „Spezialisierung“ einer dieser Grundklassen beschrieben werden. Das Konzept der Grundklassen und der Klassenhierarchien ist bei der Computerprogrammierung und in Biologie, Physik, Mathematik und weiteren Disziplinen verbreitet.

Der Wert von Grundklassen und Klassenhierarchien besteht darin, dass ein System, das weiß, wie die Grundelemente verarbeitet werden, alle Spezialisierungen dieser Grundklasse grundlegend bearbeiten kann, ohne zuvor Kenntnisse über die spezifische Spezialisierung zu haben.

Dies ist nicht so kompliziert, wie es sich zunächst anhört. Ein einfaches Beispiel: Wenn das System weiß, dass alle <para>-Elemente mit einer vorausgehenden und einer nachfolgenden Leerzeile dargestellt werden sollen, und das System dann einen Inhalt verarbeitet, der <para type="Blockzitat"> enthält, wird zumindest richtig erkannt, dass ein Blockzitat mit einer vorausgehenden und einer nachfolgenden Leerzeile dargestellt wird. Es gibt viele andere Verarbeitungsregeln, Darstellungsregeln und Anwenderinteraktionen, die auf alle Inhalte ähnlicher Arten angewandt werden können. Die „Spezialisierung“ wird erschaffen, weil ein System auch eine neue und einzigartige Verarbeitung hinzufügen könnte, beispielsweise eine Einrückung rechts und links für ein Blockzitat.

Welches sind diese Grundklassen? Smart Content stellt diese Klassen in unterschiedlichen Kategorien dar, und die folgende Tabelle vergleicht einige der von Smart Content, DITA und HTML verwendeten Begriffe:

Inhaltsart Smart Content HTML DITA
Bereiche section div topic
Blöcke p p p
Inlines tag b, i, u, etc. phrase
Listen ul, ol ul, ol list type="Art"
Tabellen tables table table
Bilder image img image
Medien Media video, object object
Metadaten XML meta fragment tag attribute = "Wert" tag attribute = "Wert"

Einer der wichtigen Unterschiede besteht darin, wie die Spezialisierung dieser Grundinhaltsarten in den einzelnen Markup-Sprachen gehandhabt wird:

In HTML wird die Spezialisierung eines Grund-HTML-Tags im Allgemeinen durchgeführt, um die CSS Formatierung zu fördern oder um tag-spezifische Javascript-Funktionen auszulösen, es wird meistens mit dem Merkmal „class“ codiert, beispielsweise:

<div class="Navigation">…</div>

Doch in HTML, gibt es sehr wenige Regeln dazu, wie und wo man >div< einsetzen kann, und es gibt keine Regeln zum Wert des Merkmals „class“, also ist HTML tatsächlich sehr informell und eignet sich nicht zum Verfassen von hochwertigen Kommunikationsinhalten − obwohl es für die Darstellung auf einer Webseite oder in einer Mobil-App sehr gut geeignet ist.

In DITA ist die Spezialisierung eines Grund-DITA-Elements wie >topic< folgendermaßen verschlüsselt:

<concept class="- Thema/Themenkonzept/Konzept">…</concept>

Es überschreitet den Umfang dieses Dokuments zu erklären, warum das Merkmal „Klasse“ einen so offensichtlich redundanten Wert hat, aber es ist einfach, das Ziel zu erkennen. Das Element „concept“ soll der Klasse „topic“ angehören und deshalb wie ein Thema behandelt werden, sofern nicht eine besondere Verarbeitung für das Konzept definiert wurde.

In Smart Content wird die Spezialisierung folgendermaßen programmiert:

<section type="Zweck">

Dies ähnelt stark der HTML-Methode zur Spezialisierung, es gibt jedoch sehr spezifische Implementierungsregeln, so dass beispielsweise beim Verfassen einer Standardarbeitsanweisung (SOP) jedes Dokument einen einzigen „Zweck“ hat, und dieser Zweck nach dem Titel des Dokuments angegeben werden muss. HTML schränkt die Nutzung von Klassenmerkmalen nicht ein und validiert sie nicht.



Es sollte auch betont werden, dass in HTML und Smart Content der Name des Objekts immer die Grundlage der Klasse darstellt. Das heißt:

<section type="mySection"> ist nicht <mySection class="section">.

DITA-Anwender und andere XML-Fachleute fragen vielleicht: „Warum verwendet man nicht die DITA-Methode zum Definieren von Spezialisierungen?“ Die vollständige Antwort ist komplex, aber die einfache Antwort hängt direkt mit den zuvor beschriebenen Schwierigkeiten beim Bereitstellen einer guten Nutzbarkeit für das Verfassen zusammen, einschließlich des Supports für Grobbearbeitungen durch Ausschneiden und Einfügen in einem oder mehreren Dokumenten.

Beinahe alle verfügbaren XML-Parsing-Tools validieren die Struktur eines Dokuments basierend auf dem Elementnamen (eine valide Struktur bedeutet, dass alle verwendeten Elemente für das Schema erlaubt sind und dass sie sich in einer gültigen Reihenfolge befinden). Außerdem ignorieren XML-Parser beim Validieren einer Struktur die Attributwerte. Durch Nutzung des HTML-Stils der Elementspezialisierung kann Smart Content Grobbearbeitungen mit einer positiven Anwendererfahrung ermöglichen. Der Anwender kann ein Element ausschneiden und einfügen, und nach dem Einfügen kann das stille Verarbeiten entweder das Merkmal „type“ korrigieren, oder, wenn mehrere Möglichkeiten bestehen, dem Author die Auswahl aus mehreren gültigen Optionen für das Merkmal „type“ ermöglichen.

Obwohl es viele andere Gründe für die Architektur des Smart Content Schema gibt, ist diese Fähigkeit zum Rückgriff auf die Verarbeitung basierend auf der Grundklasse einer der wichtigsten und wertvollsten.

Auch wenn das Smart Content Schema in Bezug auf XML-Schemata relativ jung ist, wurde der Grundstein für seine Entwicklung in den Jahren von XML, Content-Authoring und Publishing-Erfahrung von Quark und unseren Kunden und Partnern gelegt. Das Schema wird von einer Reihe von Kunden in unterschiedlichen Branchen sehr erfolgreich eingesetzt. Wir freuen uns über Feedback zum Schema und planen, die Spezifikationen in Zukunft zur Nutzung durch andere Unternehmen bereitzustellen.

Wenn Sie an den vollständigen Details und dem Hintergrund von Smart Content interessiert sind, lesen Sie doch auch den Anfängerleitfaden für Smart Content

Um mehr über die Implementierung einer Smart Content Lösung zu erfahren, besuchen Sie bitte Quark Author. Quark Author ist eine webbasierte Publishing-Software. Zusammen mit Quark Publishing Platform bietet sie Fachexperten und nichttechnischen Redakteuren ein intuitives Authoring-Erlebnis, um Inhalte schnell zu produzieren, als Vorschau darzustellen, zu veröffentlichen und wieder zu verwenden.

Nächste Schritte

Jetzt starten


Einen Experten fragen

 

Quark Enterprise Solutions