Science hubs & hub Sciences: comparison of XML editors and import/export. HTML, DITA, Docbook

Sunday, January 15, 2017

comparison of XML editors and import/export. HTML, DITA, Docbook

Introduction

En anglais: comparison of XML editor and a small selection.
En français: un long développement sur la vision et les outils quark.

XML editor

https://en.wikipedia.org/wiki/XML_editor

An XML editor is a markup language editor with added functionality to facilitate the editing of XML. This can be done using a plain text editor, with all the code visible, but XML editors have added facilities like tag completion and menus and buttons for tasks that are common in XML editing, based on data supplied with document type definition (DTD) or the XML tree.
https://en.wikipedia.org/wiki/Document_type_definition
DTD is associated with an XML or SGML document by means of a document type declaration (DOCTYPE).

There are also graphical XML editors that hide the code in the background and present the content to the user in a more user-friendly format, approximating the rendered version or editing forms. This is helpful for situations where people who are not fluent in XML code need to enter information in XML based documents such as time sheets and expenditure reports. And even if the user is familiar with XML, use of such editors, which take care of syntax details, is often faster and more convenient.

comparison of XML editor

https://en.wikipedia.org/wiki/Comparison_of_XML_editors

an iframe of a google spreadsheet (copy/paste from wikipedia @janv 2017):

a selection

open CAM

https://en.wikipedia.org/wiki/Content_Assembly_Mechanism

http://camprocessor.sourceforge.net/wiki/index.php/Main_Page

open JEdit

https://en.wikipedia.org/wiki/JEdit

https://fr.wikipedia.org/wiki/JEdit (low)

not open oXygen

You must pay!

From Guided Authoring To Advanced XML Development

Now You Have It All!

http://www.oxygenxml.com/

some plug-in:

https://github.com/oxygenxml

web app

Quark Author est un logiciel Web de création de contenu qui, associé à Quark Publishing Platform, permet aux responsables commerciaux et informatiques de rationaliser et d'automatiser les communications client à haute valeur ajoutée sur tous les canaux de publication.

http://www.quark.com/fr/Products/Quark_Publishing_Platform/

L'expérience de création en ligne intuitive permet aux experts techniques – où qu'ils soient – de créer, prévisualiser, publier et réutiliser rapidement des contenus. Prenez de l'avance sur vos concurrents, charmez vos clients. Quark Author – Des contenus intelligents pour les entreprises innovantes.

http://www.quark.com/Products/Quark_Author/#1
https://en.wikipedia.org/wiki/Quark_Author

Création de contenus intelligents

Une fois le contenu verrouillé dans un document avec un formatage, il est très difficile et coûteux de le dissocier C'est là le principal obstacle pour les organisations souhaitant créer et actualiser efficacement des communications à forte valeur ajoutée sur tous les canaux de publication.

Quark Author a été conçu spécifiquement pour les utilisateurs professionnels afin de leur permettre de créer des contenus structurés (XML) au sein d'un environnement familier de type traitement de texte. Les rédacteurs peuvent créer et organiser des composants de contenu au moyen de types de contenu standard comme des sections, des paragraphes, des listes, des tableaux, des graphiques et des figures. Ces composants de contenu peuvent être assemblés dynamiquement pour tout type de sortie.

Quark Author est basé sur le schéma de contenu intelligent de Quark.

http://www.quark.com/fr/Solutions/Dynamic_Publishing/Smart_Content.aspx

Qui d'autre utilise le XML pour la production de documents ?

Il existe de nombreux schémas XML pour la création et la publication sur le marché. Certains sont très génériques et certains sont spécifiques à une industrie. Chose intéressante, même le HTML4 et les versions ultérieures sont en fait des mises en œuvre d'un schéma XML appelé "XHTML". Parmi les autres schémas XML populaires, on citera :

DITA
http://www.quark.com/fr/Solutions/Applications/DITA.aspx
L'un des schémas XML les plus populaires pour la création et la publication de documents techniques. Il avait été développé à l'origine chez IBM puis transféré à OASIS comme norme de l'industrie pour les publications techniques. Nous reviendrons sur DITA ultérieurement
https://www.oasis-open.org/committees/tc_home.php?wg_abbrev=dita
Docbook
http://www.docbook.org/
Un précurseur de DITA fortement utilisé dans les publications techniques et les ouvrages de référence.

Et il en existe bien d'autres, y compris chez certaines sociétés qui définissent leur propre schéma personnalisé à partir de zéro, ce qui représente BEAUCOUP de travail, difficile et coûteux pour bien le faire.

Sachant qu'il existe de nombreux schémas de documents XML disponibles, pourquoi Quark a-t-elle créé un nouveau schéma de contenu intelligent ?

Quel est le problème avec le XML?

Le XML pour la production de documents a été adopté en premier par l'industrie des publications techniques. Il est largement utilisé dans la documentation informatique (matériel et logiciel), la fabrication discrète complexe et certaines industries par process où le contenu est publié à terme aux formats papier et PDF, HTML, et dans plusieurs formats de système d'aide tels que HTMLHelp, MSHelp, EclipseHelp, WebHelp, ainsi que d'autres types de sortie. Les schémas de document XML les plus largement utilisés ont été créés par et pour l'industrie des publications techniques, y compris le très populaire schéma DITA.

Le résultat est que ces schémas sont des outils extrêmement puissants, mais aussi extrêmement complexes. Pour emprunter une citation d'un partenaire de services professionnels de Quark, « le DITA est formidable si vos rédacteurs sont capables de penser comme des programmeurs ». C'est parfait pour les rédacteurs techniques qui sont, de par la nature de leur travail, très techniques et bien formés. Ce sont aussi des rédacteurs à plein temps.

Qu'est-ce qui rend ces schémas de création si difficiles ? Ils sont souvent trop restrictifs. Chez Quark, bon nombre de nos premiers adeptes qui utilisaient l'un de ces schémas se plaignaient de ce que le simple fait de couper/coller du contenu d'une zone d'un document vers une autre était bloqué par l'application. Pourquoi était-ce bloqué ? Prenons l'exemple simple suivant d'un titre et d'un paragraphe (nous montrons les balises XML, mais souvenez-vous que la plupart des outils de rédaction XML tentent de masquer les balises) :

<title>Comment faire</title>

<para>Commencez avec les ingrédients de la <keyword>recette pour Thanksgiving</keyword>.</para>

Si l'utilisateur sélectionne et copie la phrase "<keyword>recette pour Thanksgiving</keyword>." et la colle après Faire dans le <title>, l'outil de rédaction pourrait bloquer le collage car le schéma de contrôle ne permet pas <keyword> à l'intérieur d'un élément <title>. C'est frustrant et pire encore, car la raison pour laquelle le collage a échoué est souvent masquée aux yeux de l'utilisateur – lequel ne peut pas comprendre pourquoi c'est bloqué et pense que l'outil ne fonctionne pas correctement.

Détails du schéma de contenu intelligent

Pour les utilisateurs "calés" en XML, le schéma de contenu intelligent emprunte des idées de nombreuses autres implémentations XML incluant, et c'est important, l'idée de types de contenu – parfois appelés classes de contenu ou formes architecturales de contenu. L'idée centrale est relativement simple : il existe un ensemble de types de contenus fondamentaux et tous les autres contenus peuvent être décrits comme appartenant à l'une des classes racine. Pour ceux d'entre vous qui sont familiarisés avec DITA, une autre manière de décrire ceci serait la "spécialisation" de l'une de ces classes racine. Le concept de classes racine et de hiérarchies de classe est commun en programmation informatique, biologie, physique, mathématiques et plus encore.

La valeur des classes racine et des hiérarchies de classe est qu'un système qui sait comment traiter l'élément racine peut assurer un traitement de base de toute spécialisation de cette racine sans connaître quoi que ce soit auparavant de la spécialisation spécifique.

Ceci est moins compliqué que vous pourriez le penser. Prenons un exemple simple, si le système sait que tous les éléments <para> doivent être présentés avec une ligne vide au-dessus et en dessous, si le système traite un contenu qui inclut <para type="blockquote">, il saura au moins qu'un Block Quote doit comporter une ligne vide au-dessus et en dessous. Il existe de nombreuses autres règles de traitement, règles de présentation et interactions utilisateurs pouvant être appliquées à tout contenu de type similaire. La "spécialisation" est créée car un système pourrait aussi ajouter un traitement nouveau et unique comme les retraits droite et gauche pour la présentation d'un Block Quote.

Quelles sont certaines des classes racine ? Le contenu intelligent les représente dans différentes catégories, et voici un tableau qui compare une partie de la terminologie que le contenu intelligent, DITA et le HTML utilisent :

Dans le HTML, la spécialisation d'une balise HTML racine est généralement effectuée pour entraîner le formatage CSS ou pour déclencher un javascript spécifique à une balise et est le plus souvent codée en utilisant un attribut de classe tel que :

Toutefois, dans le HTML, il existe très peu de règles concernant où et comment vous pouvez utiliser <div> et il n'existe aucune règle quant à la valeur de l'attribut “class”, de sorte que le HTML est de fait fortement à structure libre et inutile pour la rédaction de contenus de communication à haute valeur ajoutée – bien qu'il soit excellent pour une présentation dans une page Web ou une application mobile.

Dans DITA, la spécialisation d'un élément DITA racine comme <topic> est codée comme suit :

Il est au-delà de la portée de ce document d'expliquer pourquoi l'attribut de classe possède une telle valeur apparemment redondante, mais il est facile d'identifier le but, qui est que l'élément "concept" est de la classe "topic" et doit par conséquent être traité comme "topic", sauf lorsqu'un traitement spécifique pour "concept" a été défini.

Dans le contenu intelligent, la spécialisation est codée comme suit :

Ceci est très similaire à la méthode HTML pour spécialisation, mais possède des règles d'implémentation très spécifiques de sorte que, par exemple, la rédaction d'un document de procédure opérationnelle normalisée peut limiter chaque document à un seul "Purpose" et que celui-ci doit être après le titre du document. Le HTML ne limite pas l'utilisation ou même ne valide pas la valeur des attributs de classe.

Il est important de souligner que, dans le HTML et le Contenu intelligent, le nom de l'élément est toujours la racine de la classe. Il s'agit de :

<section type="mySection">, ce n'est pas <mySection class="section">.

Publication multicanal automatisée

Le schéma de contenu intelligent utilisé par Quark Author a été développé avec deux idées en tête : la facilité d'utilisation pour les experts techniques et la sortie multicanal. Quark Author génère des fichiers XML à riche contenu sémantique pouvant être utilisés pour piloter la publication multicanal automatisée de Quark Publishing Platform afin de toucher les employés, les partenaires et les clients. Contenu, mise en forme et image de marque peuvent être personnalisés pour chaque canal, zone géographique, division, etc. afin de maximiser l'efficacité de vos communications à haute valeur ajoutée, que ce soit pour le support papier, les fichiers PDF, le Web ou les apps mobiles.

word et XML et outils quark

Quark XML Author for Microsoft Word
Lancé en 2002, Quark XML Author™ for Microsoft Word est un outil de création XML de nouvelle génération. Il se présente sous la forme d'un module complémentaire pour Microsoft Word qui permet à tout utilisateur de créer facilement des documents XML, sans connaissance de ce langage ni formation.
Création de documents XML dans Microsoft Word
Quark XML Author for Microsoft Word permet à tout utilisateur de créer facilement des documents XML, sans connaissance de ce langage ni formation. Quark XML Author est un module d'extension pour Microsoft Word qui permet aux rédacteurs de créer des composants d'information utilisables directement dans Quark Publishing Platform, qui les combine automatiquement de manière appropriée pour produire des documents imprimés de grande qualité ou des versions numériques pour le Web ou d'autres supports électroniques.
http://www.quark.com/fr/Products/Quark_XML_Author/

Science hubs & hub Sciences

Pages