Fiches d’identité des textes

Informations qui doivent se trouver sur la page du texte en question mais aussi dans les pages de bibliographies pour aider le lecteur dans ses choix.

Ce qui existe déjà dans RDF

Dublin Core « est un schéma de métadonnées générique qui permet de décrire des ressources numériques ou physiques et d’établir des relations avec d’autres ressources »1. Il comprend 15 éléments :

Élément Élément (anglais) Commentaire
1. Titre (métadonnée) Title Titre principal du document
2. Créateur (métadonnée) Creator Nom de la personne, de l’organisation ou du service à l’origine de la rédaction du document
3. Sujet (métadonnée) ou mots clés Subject Mots-clefs, phrases de résumé, ou codes de classement
4. Description (métadonnée) Description Résumé, table des matières, ou texte libre. Raffinements : table des matières, résumé
5. Éditeur Publisher Nom de la personne, de l’organisation ou du service à l’origine de la publication du document
6. Contributeur Contributor Nom d’une personne, d’une organisation ou d’un service qui contribue ou a contribué à l’élaboration du document. Chaque contributeur fait l’objet d’un élément Contributor séparé
7. Date (métadonnée) Date Date d’un évènement dans le cycle de vie du document
8. Type de ressource Type Genre du contenu
9. Format Format Type MIME, ou format physique du document
10. Identifiant de la ressource Identifier Identificateur non ambigu : il est recommandé d’utiliser un système de référencement précis, afin que l’identifiant soit unique au sein du site, par exemple les URI ou les numéros ISBN. Raffinement : Is Available At
11. Source Source Ressource dont dérive le document : le document peut découler en totalité ou en partie de la ressource en question. Il est recommandé d’utiliser une dénomination formelle des ressources, par exemple leur URI
12. Langue (métadonnée) Language
13. Relation (métadonnée) Relation Lien avec d’autres ressources. De nombreux raffinements permettent d’établir des liens précis, par exemple de version, de chapitres, de standard, etc.
14. Couverture (métadonnée) Coverage Couverture spatiale (point géographique, pays, régions, noms de lieux) ou temporelle
15. Droits (métadonnée) Rights Droits de propriété intellectuelle, Copyright, droits de propriété divers

Un 16ème élément apparaît parfois, l’Audience, mais il ne figure pas dans la liste de la norme ISO 15836.

Éléments à rajouter

Taille du texte

L’idée ici, toute simple, est de classer les textes par tranches de nombres de mots pour indiquer au lecteur le temps qu’il faudra pour le lire et lui permettre de décider, selon le temps qu’il possède ou a envie de consacrer à un sujet, s’il se lance dans une telle lecture ou pas. Ce système sera bien plus fiable que l’indication du format et du nombre de pages comme cela se fait pour les éditions papier, étant donné que la taille de la police, les marges et les interlignages peuvent différer grandement d’un livre à l’autre. Comme l’idée de numérotation universelle, la quantité de mot est donc ici un indicateur absolu et non relatif à la manière dont est publiée le texte, il permettra de remplacer ce que l’on faisait au juger en tenant l’objet dans ses mains, pour estimer le temps à consacrer à sa lecture.

Le lecteur pourra donc, tout comme il pouvait choisir de lire plutôt une entrée dans un dictionnaire général, dans une encyclopédie spécialisée, lire un 128 pages (Que sais-je ?, Repères) consacré au même sujet, un livre plus conséquent, jusqu’à la monographie pointue qui vous sert de temps en temps de tabouret… décider quelle taille lui convient. Voire chercher plus facilement au sein d’un grand ouvrage en se servant de la recherche de mot, ce qui, bien sûr, lui est impossible à réaliser avec le papier (et ne nécessite plus autant qu’avant le travail de réalisation d’un index rerum de la part de l’éditeur).

Niveau de complexité / de spécialisation

Niveau de langue et filtre par public

Proposer un niveau de langue peut se faire aussi objectivement que les tailles de vêtements ou de chaussures, c’est-à-dire comporter une base objective permettant à l’utilisateur de savoir si le texte est de son niveau ou pas. Il serait en tout cas bien plus satisfaisant que de noter le niveau par âge. Déjà pour les vêtements ce n’est pas une réussite2 mais pour la langue… John Stuart Mill à 12 était sans doute plus instruit et fin qu’un stade de football entier…

L’idée est de reprendre, pour chaque langue, les classements probablement établis qui permettent de décider dans quelle classe de vocabulaire se trouve le mot : usuel, spécialisé, etc. Si un logiciel ou un protocole de référence voyait le jour, il pourrait ainsi en scannant le texte attribuer un niveau de langage, comme par exemple :

  • si le texte ne contient que des mots usuels : niveau 1
  • plus de 10% de mots spécialisés : niveau 2
  • plus de 30% de mots spécialisés : niveau 3

Comparant son propre niveau dans chaque langue (On trouve des notations de ce type-là sur Wikipedia où les wikipediens peuvent noter dans des cartouches leur niveau dans chaque langue et des diplômes comme le Cambridge, le TOEIC ou le TOEFL ont des niveaux de complexité dont on peut s’inspirer)3 le lecteur pourrait en prendre connaissance et évaluer la difficulté qu’il aura à lire.

Un filtre sur certains mots – exactement comme fonctionne les filtres pour contenus adultes dans les moteurs de recherche – pourraient aussi prévenir les parents de contenus par forcément appropriés pour leur progéniture.

Niveau de spécialisation

Pour éviter que le lecteur non-averti se lance trop rapidement dans une lecture dont il sortirait quelques minutes plus tard, rebuté par une complexité qui le dépasse, ou au contraire de décourager un lecteur déjà au fait du sujet et qui se lasserait de relire une autre fois des informations de base qu’il connait déjà,4 nous proposons d’étiqueter les textes selon quatre niveaux, pour lecteurs :

  • 0 – désirant une introduction au sujet
  • 1 – connaissant les grands traits du sujet ou du domaine
  • 2 – connaissant déjà bien le sujet ou le domaine
  • 3 – spécialistes, chercheurs ou érudits

Dès les niveaux 2 et 3, afin d’éviter les redondances et pouvoir se permettre de ne faire que des allusions sur certains points sans s’appesantir en explication supposée connue, l’auteur peut (dans la fiche d’identité du livre) proposer une liste des points à connaître, sous forme de liens vers les pages à consulter au préalable.

Averti par le niveau général de l’ouvrage (comme cela se fait déjà pour les manuels d’apprentissage des langues, les pistes de skis, etc.) et la liste des points qu’on attend qu’il maitrise, le lecteur peut ainsi se lancer dans le texte en toute connaissance de cause.

Versions d’un texte

Contrairement à un livre que l’éditeur propose au lecteur une fois qu’on considère le texte arrivé à maturation (c’est-à-dire après avoir été travaillé et retravaillé par l’auteur en dialogue avec son éditeur, relu et corrigé), il n’est pas rare en édition numérique (et plus globalement en informatique) de proposer des textes à un état plus ou moins avancé. Non pas seulement de simples brouillons mais des textes appelant un mode d’élaboration plus collaboratif, à l’instar de ce qui se faisait déjà en politique ou dans les administrations avec des textes passant entre plusieurs mains pour être amendés, ou encore dans le monde de la recherche où il n’est pas rare (et même souhaitable) que des individus confrontent leur texte inabouti à la critique éclairée de confrères ou d’étudiants, mais en utilisant le web comme canal de diffusion et l’ensemble des internautes comme potentiels lecteurs.

Appelés à subir des modifications plus ou moins profondes, il semblerait nécessaire d’uniformiser les pratiques visant à indiquant au lecteur à quel stade se trouve le texte en indiquant une version. Mediawiki, avec son système d’historique où l’on peut consulter les modifications de chaque utilisateur à chaque nouvel enregistrement, se prête assez bien à cet exercice. Néanmoins il ne permet pas à l’être humain en charge de la publication du texte, de décider dans quelle proportion une ou plusieurs modifications (dans leur aspect quantitatif mais aussi et surtout sur le fond du propos) changent le texte. Aussi, s’il peut être utile, dans le cadre de l’utilisation de ce système de gestion de contenu, de garder l’identifiant unique de chaque révision, une grille d’évaluation du stade du texte parait nécessaire. Celle-ci pourrait donner :

  1. Brouillon ouvert à critique : (a)0.1 à 0.9
  2. Texte achevé, d’un auteur vivant donc susceptible d’être modifié s’il le décide : (a)1.0 à x.y
  3. Texte d’un auteur mort : b (soit b = la dernière version de a)
  4. Texte dans sa version de référence : c

Commentaires :

  • dans les versions du vivant de l’auteur le a est implicite ; de même si aucune version n’est indiquée, c’est b qui est sous-entendu ; par usage on préférera souvent parler de l' »édition de référence » plutôt que de l’édition « c », mais dans la numérotation cela sera utile
  • pour les textes anciens, il pourrait y avoir des b1 ou bx selon le nombres de versions différentes retrouvées, si l’on a pas réussi à définir quelle peut être considérée comme la version de l’auteur, ou quelle version est le brouillon de l’autre
  • le cas de c multiple est normalement exclu par définition, et il faut espérer qu’il n’y aura jamais de cas de conflits graves et rares entre spécialistes, comme il y eut jusqu’à trois papes pour une Eglise censée universelle

Essai de formalisme

formalisme notation explication en français courant
{nom du texte}, {version}({révision}), {numérotation}{note}{n° note} 0.1(234),245n2 Deuxième note de la subdivision 245 (85750 à 86099ème mots) dans la révision 234 considérée comme étant encore en version de brouillon de Statut et numérotation universelle
{nom du texte}, {version}({révision}), {numérotation}{note}{n° note} 245n2 Deuxième note de la subdivision 245 (85750 à 86099ème mots) de Statut et numérotation universelle, texte définitif puisque l’auteur est mort et ne pourra revenir dessus
{nom du texte}, {version}({révision}), {numérotation}{note}{n° note} c245v3n2v4 Quatrième variante de la deuxième note de la variante 3 de la subdivision 245 (85750 à 86099ème mots) de l’édition de référence de Statut et numérotation universelle
  1. Source : Wikipedia []
  2. Qui ne faisait pas du 16 ans à 12 ? []
  3. De là à penser que la certification des niveaux de langues pourraient s’en inspirer plutôt que d’être noyés dans des diplômes comme le Baccalauréat, il n’y a qu’un pas. Et de remettre en cause ce genre de diplômes, il n’y en a qu’un deuxième… []
  4. Je pense notamment aux introductions de livres où se trouve très souvent une biographie sommaire de l’auteur. []

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *