CONTENU INTELLIGENT

Depuis les années 90, des promesses audacieuses ont été faites à propos du XML et de ce qu'il pourrait rendre possible dans le domaine de la réutilisation des contenus et de la publication automatisée. Dans certains secteurs comme celui des publications techniques, ceci s'est produit, mais quand il s'agit de la création de contenu traditionnel par des utilisateurs en entreprise et des experts, le XML n'est pas plus répandu qu'il ne l'était il y a 20 ans.

Avec un peu de chance, l'expression Contenu intelligent vous fait réfléchir en ces termes : « Voici quelque chose de différent. Je sais en quoi consiste le contenu, mais qu'est-ce que le Contenu intelligent ? ». C'est bien notre but, car il est temps de penser différemment quant à la manière dont nous créons du contenu.

Qu'est-ce que le Contenu intelligent ?

Vu de loin, Contenu intelligent est l'expression que Quark utilise pour désigner la nouvelle génération de création XML et de publication automatisée de communications à haute valeur ajoutée. Elle reflète le fait que, même si le XML est critique comme technologie sous-jacente, il doit être relégué à l'arrière-plan lorsqu'il s'agit de créer et de réutiliser des contenus.

À un niveau très granulaire, le contenu intelligent est le schéma de contenu XML ouvert et configurable par l'utilisateur de Quark. Les produits Quark pour entreprises sont axés sur la compréhension et la mise en œuvre du contenu intelligent afin que les clients perçoivent, aussi rapidement que possible, un retour sur investissement de l'adoption de la publication dynamique.

Le déploiement du contenu intelligent prend tout son intérêt lorsque le type de contenu présente des caractéristiques incluant un ou plusieurs des aspects suivants :

  • Volume important de documents similaires
  • Volume élevé de révisions
  • Processus de création fréquemment répétés
  • Documents réglementés par le gouvernement ou l'entreprise
  • Possibilité élevée de réutilisation des contenus sur de multiples documents
  • Intégration de données dans le contenu
  • Traduction en de multiples langues
  • Diffusion dans de multiples formats
  • Diffusion avec de multiples styles de présentation différents

Comme le cœur du contenu intelligent est une définition de schéma XML, il est presque impossible de décrire le contenu intelligent sans entrer dans les détails techniques.

Qui d'autre utilise le XML pour la production de documents ?

Il existe de nombreux schémas XML pour la création et la publication sur le marché. Certains sont très génériques et certains sont spécifiques à une industrie. Chose intéressante, même le HTML4 et les versions ultérieures sont en fait des mises en œuvre d'un schéma XML appelé "XHTML". Parmi les autres schémas XML populaires, on citera :

DITA
L'un des schémas XML les plus populaires pour la création et la publication de documents techniques. Il avait été développé à l'origine chez IBM puis transféré à OASIS comme norme de l'industrie pour les publications techniques. Nous reviendrons sur DITA ultérieurement.

Docbook
Un précurseur de DITA fortement utilisé dans les publications techniques et les ouvrages de référence.

MSP
Utilisé aux États-Unis, en Australie et dans d'autres pays partenaires pour la capture et le partage de recherches sur le renseignement au département de la Sécurité intérieure et dans pratiquement tous les départements du gouvernement américain. Pris en charge pour la création par Quark Pubs-XML Accelerator.

SPL - Structured Product Labeling
Utilisé aux États-Unis pour la soumission des informations d'étiquetage des médicaments à la FDA pour approbation avant la mise sur le marché d'un nouveau médicament ou conditionnement. Pris en charge pour la création par le SPL Accelerator pour Quark XML Author.


Et il en existe bien d'autres, y compris chez certaines sociétés qui définissent leur propre schéma personnalisé à partir de zéro, ce qui représente BEAUCOUP de travail, difficile et coûteux pour bien le faire.

Sachant qu'il existe de nombreux schémas de documents XML disponibles, pourquoi Quark a-t-elle créé un nouveau schéma de contenu intelligent ?

Quel est le problème avec le XML?

Le XML pour la production de documents a été adopté en premier par l'industrie des publications techniques. Il est largement utilisé dans la documentation informatique (matériel et logiciel), la fabrication discrète complexe et certaines industries par process où le contenu est publié à terme aux formats papier et PDF, HTML, et dans plusieurs formats de système d'aide tels que HTMLHelp, MSHelp, EclipseHelp, WebHelp, ainsi que d'autres types de sortie. Les schémas de document XML les plus largement utilisés ont été créés par et pour l'industrie des publications techniques, y compris le très populaire schéma DITA.

Le résultat est que ces schémas sont des outils extrêmement puissants, mais aussi extrêmement complexes. Pour emprunter une citation d'un partenaire de services professionnels de Quark, « le DITA est formidable si vos rédacteurs sont capables de penser comme des programmeurs ». C'est parfait pour les rédacteurs techniques qui sont, de par la nature de leur travail, très techniques et bien formés. Ce sont aussi des rédacteurs à plein temps.

Mais pour des communications à haute valeur ajoutée, par exemple des documents rédigés par des analystes financiers et juridiques ou des équipes de marketing produit, il est déraisonnable de penser que ces rédacteurs à temps partiel peuvent ou souhaitent « penser comme des programmeurs ».

Qu'est-ce qui rend ces schémas de création si difficiles ? Ils sont souvent trop restrictifs. Chez Quark, bon nombre de nos premiers adeptes qui utilisaient l'un de ces schémas se plaignaient de ce que le simple fait de couper/coller du contenu d'une zone d'un document vers une autre était bloqué par l'application. Pourquoi était-ce bloqué ? Prenons l'exemple simple suivant d'un titre et d'un paragraphe (nous montrons les balises XML, mais souvenez-vous que la plupart des outils de rédaction XML tentent de masquer les balises) :

<title>Comment faire</title>
<para>Commencez avec les ingrédients de la <keyword>recette pour Thanksgiving</keyword>.</para>

Si l'utilisateur sélectionne et copie la phrase "<keyword>recette pour Thanksgiving</keyword>." et la colle après Faire dans le <title>, l'outil de rédaction pourrait bloquer le collage car le schéma de contrôle ne permet pas <keyword> à l'intérieur d'un élément <title>. C'est frustrant et pire encore, car la raison pour laquelle le collage a échoué est souvent masquée aux yeux de l'utilisateur – lequel ne peut pas comprendre pourquoi c'est bloqué et pense que l'outil ne fonctionne pas correctement.

Bien sûr, un rédacteur technique formé et travaillant à plein temps aurait une bonne idée de ce qui s'est passé, activerait “afficher les balises” dans son outil préféré, et ne sélectionnerait que le texte qu'il souhaite – en sautant la balise de mot-clé. Ceci est un simple exemple, mais de nombreux cas d'utilisation similaire existent. C'est un problème que l'équipe de Quark appelle "modifications extrêmes", et il devient important lorsqu'il empêche un utilisateur de rédiger avec la facilité à laquelle il est habitué.

Cet exemple fait ressortir l'un des défis majeurs pour tout fournisseur d'outil de création XML, et particulièrement pour Quark qui cible les rédacteurs non techniques. Le défi est de tenter d'imposer des règles et des restrictions à des utilisateurs qui ont des années d'expérience de l'utilisation d'outils à structure libre. En outre, la création d'une expérience utilisateur qui gère et expose ces règles et restrictions à l'utilisateur - sans rendre l'outil trop complexe - est extrêmement difficile. C'est pourquoi l'expérience utilisateur de tant de logiciels de création XML est davantage similaire à l'environnement de développement interactif d'un programmeur qu'à celui d'un outil de traitement de texte.

Souvenez-vous que la raison pour laquelle le défi vaut la peine d'être relevé est l'intérêt d'appliquer l'automatisation au processus de communication multicanal à haute valeur ajoutée. Généralement, la proposition de valeur d'automatisation est relativement simple à décrire :

  • L'automatisation diminue les coûts, améliore la qualité et réduit les délais de commercialisation
  • Pour que l'automatisation réussisse, il faut que les entrées soient valides et attendues : “Garbage in, Garbage out” (à données inexactes, résultats erronés), comme le dit le dicton.

Donc, pour que l'automatisation de la publication réussisse, l'entrée - c'est-à-dire le contenu narratif rédigé - doit être prévue et validée. C'est là que le XML est puissant, car il est facile à valider et force les rédacteurs à ne créer que ce qui est prévu. Mais c'est là aussi que les outils de création XML peuvent causer le plus de problèmes, car ils n'autorisent que ce qui est prévu et quel contenu peut être validé.

Les utilisateurs en entreprise, les rédacteurs à temps partiel et les experts qui ont utilisé toute leur carrière un outil de traitement de texte à structure libre comme Microsoft Word ou Google Docs, ont des attentes concernant la rapidité avec laquelle ils peuvent rédiger et de combien de liberté (souvent une liberté totale) ils disposent quant à la manière de rédiger leur document. Faire passer ces types de rédacteurs à un outil de création de contenu contrôlé et "structuré", qui restreint ce qu'ils peuvent faire, présente un défi important pour ces rédacteurs. Plus le schéma XML est prescriptif et restrictif, plus grand sera l'écart entre les attentes des rédacteurs et leur expérience de création XML. Et c'est la résolution de ce défi qui a conduit Quark à développer le schéma de contenu intelligent.

Détails du schéma de contenu intelligent

Pour les utilisateurs "calés" en XML, le schéma de contenu intelligent emprunte des idées de nombreuses autres implémentations XML incluant, et c'est important, l'idée de types de contenu – parfois appelés classes de contenu ou formes architecturales de contenu. L'idée centrale est relativement simple : il existe un ensemble de types de contenus fondamentaux et tous les autres contenus peuvent être décrits comme appartenant à l'une des classes racine. Pour ceux d'entre vous qui sont familiarisés avec DITA, une autre manière de décrire ceci serait la "spécialisation" de l'une de ces classes racine. Le concept de classes racine et de hiérarchies de classe est commun en programmation informatique, biologie, physique, mathématiques et plus encore.

La valeur des classes racine et des hiérarchies de classe est qu'un système qui sait comment traiter l'élément racine peut assurer un traitement de base de toute spécialisation de cette racine sans connaître quoi que ce soit auparavant de la spécialisation spécifique.

Ceci est moins compliqué que vous pourriez le penser. Prenons un exemple simple, si le système sait que tous les éléments <para> doivent être présentés avec une ligne vide au-dessus et en dessous, si le système traite un contenu qui inclut <para type="blockquote">, il saura au moins qu'un Block Quote doit comporter une ligne vide au-dessus et en dessous. Il existe de nombreuses autres règles de traitement, règles de présentation et interactions utilisateurs pouvant être appliquées à tout contenu de type similaire. La "spécialisation" est créée car un système pourrait aussi ajouter un traitement nouveau et unique comme les retraits droite et gauche pour la présentation d'un Block Quote.

Quelles sont certaines des classes racine ? Le contenu intelligent les représente dans différentes catégories, et voici un tableau qui compare une partie de la terminologie que le contenu intelligent, DITA et le HTML utilisent :

Type de contenu Contenu intelligent HTML DITA
Sections section div rubrique
Blocks p p p
In-lines balise b, i, u, etc. phrase
Listes ul, ol ul, ol type de liste ="type"
Tableaux tableaux tableau tableau
Images image img image
Médias Médias vidéo, objet objet
Métadonnées XML meta fragment attribut de balise = "valeur" attribut de balise = "valeur"

Comment la spécialisation de ces types de contenu racine est traitée dans chaque langage de balisage est l'une des différences importantes :

Dans le HTML, la spécialisation d'une balise HTML racine est généralement effectuée pour entraîner le formatage CSS ou pour déclencher un javascript spécifique à une balise et est le plus souvent codée en utilisant un attribut de classe tel que :

<div class="Navigation">…</div>

Toutefois, dans le HTML, il existe très peu de règles concernant où et comment vous pouvez utiliser <div> et il n'existe aucune règle quant à la valeur de l'attribut “class”, de sorte que le HTML est de fait fortement à structure libre et inutile pour la rédaction de contenus de communication à haute valeur ajoutée – bien qu'il soit excellent pour une présentation dans une page Web ou une application mobile.

Dans DITA, la spécialisation d'un élément DITA racine comme <topic> est codée comme suit :

<concept class="- topic/topic concept/concept">…</concept>

Il est au-delà de la portée de ce document d'expliquer pourquoi l'attribut de classe possède une telle valeur apparemment redondante, mais il est facile d'identifier le but, qui est que l'élément "concept" est de la classe "topic" et doit par conséquent être traité comme "topic", sauf lorsqu'un traitement spécifique pour "concept" a été défini.

Dans le contenu intelligent, la spécialisation est codée comme suit :

<section type="purpose">

Ceci est très similaire à la méthode HTML pour spécialisation, mais possède des règles d'implémentation très spécifiques de sorte que, par exemple, la rédaction d'un document de procédure opérationnelle normalisée peut limiter chaque document à un seul "Purpose" et que celui-ci doit être après le titre du document. Le HTML ne limite pas l'utilisation ou même ne valide pas la valeur des attributs de classe.



Il est important de souligner que, dans le HTML et le Contenu intelligent, le nom de l'élément est toujours la racine de la classe. Il s'agit de :

<section type="mySection">, ce n'est pas <mySection class="section">.

Les utilisateurs de DITA et autres experts du XML pourraient demander : « Pourquoi ne pas utiliser la méthode DITA pour définir les spécialisations ? » La réponse intégrale est complexe, mais la réponse simple est directement associée aux difficultés décrites plus haut pour fournir une bonne facilité d'utilisation dans la création, y compris la prise en charge des modifications extrêmes par couper/coller vers un ou plusieurs documents.

Quasiment tous les outils d'analyse XML disponibles valident la structure d'un document en fonction du nom d'élément (structure valide signifie que tous les éléments utilisés sont autorisés par le schéma et sont dans un ordre valide). De plus, les analyseurs XML ignorent les valeurs d'attribut lors de la validation de structure. En utilisant le style HTML de spécialisation d'élément, le Contenu intelligent peut permettre des modifications extrêmes avec une expérience utilisateur positive. L'utilisateur peut couper et coller un élément et, après le collage, le traitement ajouté peut corriger silencieusement l'attribut de type, ou si plusieurs choix peuvent être faits, fournir à l'auteur une expérience utilisateur lui permettant de faire un choix de type valide.

Bien qu'il y ait de nombreuses autres raisons pour la manière dont le schéma de Contenu intelligent est architecturé, cette possibilité de "repli" sur un traitement basé sur la classe racine est l'une des plus importantes et des plus précieuses.

Bien que le schéma de Contenu intelligent soit relativement nouveau en termes de schéma XML, son développement repose sur les années d'expertise du XML, de la création de contenu et de la publication cumulées par Quark ainsi que nos clients et partenaires. Le schéma est utilisé par un certain nombre de clients dans différentes industries avec un réel succès. Les commentaires sur ce schéma sont les bienvenus et nous envisageons dans l'avenir d'en diffuser largement les spécifications auprès des autres sociétés.

Pour les détails complets et l'historique du Contenu intelligent, lisez donc notre ouvrage Guide du débutant - Le contenu intelligent.

Pour en savoir plus sur la mise en place d'une solution Smart Content, consultez Quark Author. Quark Author est le logiciel Web de création qui, avec Quark Publishing Platform, offre aux experts et aux rédacteurs non techniques une interface de saisie intuitive en ligne pour créer rapidement, prévisualiser, publier et réutiliser du contenu.

Étapes suivantes

Première étape


Demandez à un expert

 

Quark Enterprise Solutions