Rapport de recherche Single source publishing avec Stylo

Document en cours de finalisation

Introduction

Ce rapport fait état d’expérimentations dans le cadre du projet Revue 2.0 – Repenser les revues savantes en SHS porté par la Chaire de recherche du Canada sur les écritures numériques. Dans le texte qui suit, nous proposons une définition du concept de single source publishing ainsi qu’un état de cette question dans le vaste champ de la publication, et enfin une analyse d’expérimentations de plusieurs revues qui ont appliqué ce concept dans leurs pratiques éditoriales.

Définition du concept de single source publishing

L’expression single source publishing, ou publication à source unique en français, désigne le fait de produire plusieurs formats ou artefacts différents à partir d’une seule et même source, dans le cadre d’une démarche de publication. Dans une activité d’édition savante cela signifie que la même source permet de produire des formats divers, sans avoir besoin de basculer d’un format de travail à un autre : que ce soit un format PDF pour l’impression, un export XML pour un diffuseur numérique ou une version de travail HTML, la source à l’origine de ces formats ou artefacts reste la même.

Le single source publishing est un enjeu majeur pour les éditeurs et les diffuseurs de publications académiques, car il permet en théorie de produire autant de formats que nécessaire tout en conservant une même origine. Il y a au moins trois apports à cette approche :

  1. Éviter les confusions sur la source qui fait référence dans les différentes phases d’édition ;
  2. Mutualiser les efforts pour les différents formats à produire, en évitant de refaire les mêmes actions pour chaque artefact ;
  3. Limiter les coûts en concentrant les activités de la chaîne d’édition sur une même source ;
  4. Faciliter l’archivage en n’ayant qu’une seule et même source.

Il s’agit aussi d’un défi technique, car il n’est pas aisé de prendre en compte les spécificités de chaque artefact/format — qui correspondent à des objectifs différents. Par exemple un fichier PDF pour l’impression devra être préparé selon des exigences graphiques (mise en forme typographique du texte), alors que pour un fichier XML l’attention sera portée sur la qualité du balisage et la correspondance avec un schéma spécifique. Les chaînes classiques d’édition sont habituellement basées sur deux ou trois outils : un traitement de texte pour rédiger et éditer ; un logiciel de publication assistée par ordinateur pour mettre en forme ; éventuellement un éditeur XML pour affiner le balisage du format XML. Chacun de ces outils travaille indépendamment, on constate une rupture dans la chaîne d’édition lorsqu’il y a un passage de l’un à l’autre de ces outils. Il n’est pas possible par exemple de revenir au format du traitement de texte lorsque le balisage XML a débuté, ou alors cela demande trop de temps et d’effort.

Un autre concept proche de single source publishing peut être utilisé, celui de One Document Does it all. L’origine lointaine de ce concept provient des travaux de Donald Knuth et de son concept de programmation lettrée (Knuth, 1992). Ce concept est utilisé dans le domaine de la TEI (Text Encoding Initiative, un schéma XML utilisé pour décrire des documents structurés) pour signifier qu’un schéma de données, une spécification technique et des exemples d’application de ce schéma peuvent être intégrés dans un même fichier. La différence avec le concept de single source publishing réside dans le fait que le concept de One Document Does it all est plus orienté vers la programmation et l’intégration de la documentation dans un programme ou un schéma de données, alors que le premier a une dimension plus éditoriale. Nous préférons utiliser le concept de single source publishing même s’il y a une filiation avec le concept de One Document Does it all.

État de la question

Cet enjeu de disposer d’une seule source tout au long des phases d’édition pour produire différents formats n’est pas nouveau et plusieurs structures d’édition ont tenté cette entreprise. Pour comprendre la mise en pratique du single source publishing, voici quatre exemples d’application dans le domaine de la publication — et plus spécifiquement de l’édition savante pour trois d’entre eux.

LaTeX ou la programmation éditoriale

LaTeX est un langage de balisage ainsi qu’un système de composition pour mettre en forme des documents. LaTeX est l’une des premières tentatives de séparation du fond et de la forme, ainsi qu’un outil de composition typographique informatique très précis. Respectant des normes typographiques strictes tout en étant basé sur des fichiers en texte brut et des commandes, LaTeX est un puissant système de programmation éditoriale (Guichard, 2008) utilisé dans plusieurs domaines scientifiques surtout pour la production d’articles.

Si LaTeX a d’abord été pensé pour produire des fichiers PDF pour l’impression, il est désormais utilisé pour produire tout type d’export, principalement du HTML ou du XML. En ajoutant le convertisseur Pandoc il est possible d’imaginer à peu près tout type d’usage.

Le langage de balisage TeX est particulièrement complexe, même si désormais il existe de nombreuses interfaces et applications facilitant son usage. LaTeX comporte un défaut important : il intègre des informations de mise en forme dans le balisage, ce qui réduit son application pour différentes sorties ou exports. L’autre difficulté réside dans les erreurs d’exports qui nécessitent une très bonne connaissance de LaTeX. Enfin, la création de modèles de documents (pour les PDF notamment) demande un travail très important et peu de personnes sont à même de se charger de cette tâche. Néanmoins LaTeX et TeX restent des systèmes et des formats de publication très utilisés dans certains domaines scientifiques comme les mathématiques, l’économie ou la physique.

Le balisage léger au service de la richesse du XML

Plusieurs langages de balisage léger, bien plus simple à manipuler que TeX et LaTeX, et n’intégrant pas d’éléments de mise en forme, ont été mis en place dès les débuts de l’informatique. Parmi ceux-ci, AsciiDoc a été créé pour faciliter la rédaction de documents techniques. O’Reilly, maison d’édition dans le domaine de l’informatique, s’est emparé de ce format pour la production de ces livres (Hamilton, 2010). Les auteurs étant majoritairement des informaticiens, il n’a pas été difficile de les convaincre d’utiliser ce format pour écrire leurs textes. À partir d’AsciiDoc il devient aisé de générer un format XML DocBook qui est ensuite transformable au format PDF pour l’impression ou aux formats HTML et EPUB pour des diffusions numériques.

O’Reilly a créé une plateforme pour faciliter encore ce travail d’édition, tout en conservant une source au format AsciiDoc. Ce qui est intéressant dans cet exemple, c’est de voir comment des personnes qui ont des habiletés techniques ont mis en pratique leur savoir-faire pour publier en single source publishing, sans faire de concession sur la qualité d’un balisage – ici l’AsciiDoc – et sans modifier la chaîne de publication.

Les outils du web pour gérer et publier

Une troisième initiative dans le champ du single source publishing est portée par une structure d’édition d’un musée : le département numérique de la maison d’édition de la fondation et musée The Getty a mis place un outil d’édition et de publication, Quire (Fauchié, 2020).

Après avoir fait le constat que les outils d’édition numérique classiques ne permettent pas de produire des publications de qualité tout en conservant une pérennité des fichiers, l’équipe de Quire a décidé de développer sa propre chaîne de publication.

Quire est un système de publication pensé d’abord pour produire des formats numériques (HTML, EPUB et MOBI), mais cette chaîne d’édition permet aussi de produire une version imprimée de qualité. Quire est l’assemblage de programmes ou logiciels existants, combiné à plusieurs mécanismes permettant d’automatiser certaines tâches.

Les fichiers sources sont aux formats Markdown, YAML et JSON, permettant de générer plusieurs versions grâce à un générateur de site statique qui transforme ces fichiers dans des formats divers :

Quire est une chaîne de publication modulaire créée et développée par un musée pour une communauté de structures d’édition dans le même domaine. Quire offre la possibilité de travailler sur une même source pour générer des formes multiples d’un même livre.


Avant de présenter des mises en pratique du principe du single source publishing dans le projet Revue 2.0, nous pouvons noter qu’il reste encore un large champ d’expérimentation ouvert. Les initiatives qui tendent vers la simplification de la gestion éditoriale sans faire l’économie de la qualité des formats produits sont de plus en plus nombreuses.

Expérimentations dans le projet Revue 2.0

Dans le cadre du projet Revue 2.0, plusieurs revues ont été convaincues par les principes du single source publishing, à la fois pour des raisons de gain de temps, de facilité de gestion éditoriale et pour expérimenter de nouvelles pratiques de publication. Pour expérimenter, l’éditeur de texte sémantique Stylo répond tout à fait ces besoins, c’est pourquoi il est au centre des trois expérimentations qui vont être présentées ici. Voici les revues qui expérimentent : Sens public, Nouvelles vues, Imaginations.

Sens public

La revue Sens public a été la première à expérimenter de façon intensive l’éditeur de texte sémantique Stylo, dans une situation réelle d’édition. Plusieurs éditeurs et éditrices, ainsi que des auteur·e·s, se sont servis de Stylo pour créer, modifier, éditer et publier des articles, en suivant un protocole précis.

L’objectif initial de l’équipe de la revue Sens public était de pouvoir disposer d’une chaîne de publication sous forme de flux, basée sur une même source tout au long du travail éditorial :

La revue Sens public est capable, aujourd’hui, de produire trois versions de chaque article (HTML, PDF, XML) à partir de Stylo.

[en cours de finalisation]

Nouvelles vues

Nouvelles vues est une revue scientifique consacrée aux pratiques, aux théories et à l’histoire du cinéma au Québec. Il s’agit d’une revue en accès libre. Depuis 2019 Nouvelles vues utilise Stylo dans sa chaîne d’édition afin de produire les trois formats (HTML, PDF et XML) dont la revue a besoin.

[entretien en cours]

Imaginations

Imaginations est une revue sur les études visuelles, plurilingue et en accès libre. Imaginations expérimente Stylo pour produire les différentes versions de ses articles, y compris des versions imprimées.

[entretien en cours]

Scénarios d’usage et mise en pratique

[en cours de finalisation]

Bibliographie