Accueil du site > 1. Actualité > Cap 2004 cédérom lycosthenes

Cap 2004 cédérom lycosthenes

vendredi 9 juillet 2004, par Etienne Ithurria

Après des années de collaboration avec le Professeur Etienne Ithurria, Jacques Aguila met la dernière main au cédérom du lycosthenes qui sera en principe proposé sous forme de souscription à l’automne prochain.

NB IMPREVU Surprise et sursis

Ce CD-ROM met à la disposition de chacun le Lycosthenes, recueil d’Apophtegmes de 1560 (Paris édition Jacques Dupuis) découvert en 1986 au marché aux " Puces " de Saint-Sernin à Toulouse par Etienne Ithurria Professeur à l’Université de Toulouse le Mirail. Les curieux - et donc les pédagogues - y trouveront de façon très accessible un document exceptionnel sur un lecteur avisé, humaniste français, en plein travail, au cœur de notre Renaissance. Les spécialistes, historiens, linguistes, généticiens du texte, juristes, peuvent désormais, grâce au décryptage intégral des milliers de notes manuscrites, en s’appropriant scientifiquement cet objet énigmatique, à bien des égards « montaignien », prendre, pour leurs recherches respectives, la mesure critique d’une enquête de 18 ans.

Définition : 300 dpi permettant une très correcte lisibilité de la totalité de l’ouvrage, y compris de tous les graphismes.

On circule à volonté et rapidement dans toutes les pages de l’ouvrage.

Tous les index de l’ouvrage imprimé, centaines d’entrées alphabétiques thématiques, au coeur des épîtres liminaires, et index de mille personnages à la fin de l’ouvrage, sont activés, avec apparition chiffrée de tous les recoupements et occurrences, ce qui permet de se retrouver instantanément, en croisant thèmes alphabétiques et personnages, dans les pages voulues, puisque chaque chiffre-référence par page du lycosthenes est "activable". Le principe de base de la logistique est donc la page, avec, gravitant autour, thèmes alphabétiques, personnages, mots du scripteur, isolés, ou en séquence de lettres : cette dernière possibilité est très utile en raison de l’orthographe singulière...

Pour chaque page, après grossissement par la loupe ou par des tabulations de zoom, une main permet, en s’appropriant la surface, de l’explorer ad libitum, avec un grossissement très confortable : compte tenu de l’extrême petitesse de l’écriture, c’était, vous le constaterez, indispensable.

Tous les corpus du scripteur, à savoir

le décryptage intégral par page,

le corpus brut alphabétique,

le corpus - environ 6000 mots - statistique de vocabulaire comparé scripteur-Montaigne, intégrant l’orthographe comparée (autorthographe) avec basculement croissant, décroissant, alphabétique,

le contenu complet de mon ouvrage Rencontres avec l’index de recoupements avec les Essais

sont non seulement affichables à la demande, mais disposent de fenêtres de recherche par mots ou par suite de lettres.

Des sources significatives du scripteur (préfigurant ce qui sera donné exhaustivement dans 2 ou 3 ans) sont d’ores et déjà proposées in extenso.

Sera intégrée la quasi-totalité de mes travaux déjà en partie visible sur ce site.

La traduction en français des apophtegmes, sinon complète, du moins très importante, sera également donnée dans le cédérom.

L’ergonomie permet d’emblée une utilisation très simple pour circuler dans les pages, à qui veut s’en contenter pour s’en nourrir, sans complication.

Mais de façon pédagogique, avec un apprentissage minimum, il sera possible de mettre en oeuvre une navigation de plus en plus complexe et riche, pour croiser un maximum d’informations.

Voici le dossier explicatif rédigé par Jacques Aguila, le réalisateur, pour le Colloque organisé en mai 2005 par Olivier Guerrier sur Moralia et Oeuvres morales à la Renaissance .

TRANSPOSITION DU LYCOSTHENES ANNOTE DE 1560 EN LIVRE NUMERIQUE INTERACTIF SUR CEDEROM

1) Entrée en matière :

Les Apophthegmata de Conrad Lycosthenes (Paris, J. Dupuy, 1560) est un recueil de 6500 apophtegmes environ, en latin, comportant quelque 6589 notes manuscrites en français se répartissant sur la presque totalité des marges du livre. La largeur des marges est de 2 cm et l’épaisseur moyenne des notes varie de 1/2 mm à 1 mm. A la première réunion de travail, lorsque j’ai rencontré Etienne Ithurria et que nous avons parlé du projet, j’ai d’emblée été enthousiasmé par l’idée de faire revivre, si l’on peut dire, un vieil ouvrage ayant plus de 400 ans. Je dois dire que lorsque j’ai parcouru pour la première fois le recueil de Conrad Lycosthenes, plusieurs choses m’ont particulièrement marqué, notamment l’efficacité et la modernité de l’organisation de l’ouvrage, mais surtout la précision et la compacité de l’écriture, la beauté du lettrage malgré sa taille minuscule.

II) Objectifs du projet

Au départ, ce projet devait répondre à plusieurs demandes et attentes de la part du chercheur. Tout d’abord il devait permettre la sauvegarde patrimoniale de l’objet dans le respect des normes actuelles d’archivage et de numérisation. Il devait rendre possible l’intégration et l’activation du décryptage intégral des notes du scripteur, déchiffrées par Etienne Ithurria. Ensuite, il devait permettre l’activation de tous les index présents dans l’ouvrage imprimé qu’il s’agisse de l’index regroupant toutes les entrées alphabétiques thématiques ou bien l’index des personnages présent à la fin du livre. Il fallait aussi inclure l’intégralité de l’ouvrage Rencontres où l’auteur étudie et répertorie les relations et les correspondances entre les notes du scripteur et Les Essais de Montaigne. De plus, le système devait pouvoir accepter une intégration, progressive et échelonnée dans le temps, du texte original des multiples sources, références et renvois disséminés dans les notes manuscrites.

III) Problématiques :

1) Sauvegarde patrimoniale et numérisation du livre :

La numérisation du livre en haute résolution (600 dpi), réalisée par l’intermédiaire d’un scanner à balayage, a permis son archivage sous la forme de 590 fichiers au format "TIFF" non compressés. Un fichier équivaut à une double page imprimée du Lycosthenes, soit au total l’équivalent des 1180 pages constituant le livre. Sachant que chaque image au format "TIFF" "pesait" environ 66 Mo, il aurait fallu un support d’une capacité de plus de 38 Go pour les utiliser telles quelles. De plus, les systèmes d’exploitation des ordinateurs de l’époque ne pouvaient traiter rapidement des images de cette taille. Dans l’optique du projet de livre interactif, la réutilisation ultérieure des 590 pages numérisées a donc été possible en réduisant fortement la taille des fichiers, de manière à ce qu’ils puissent tenir sur un support de type cédérom dont la capacité standard est de 650 Mo. Pour cela, j’ai opté pour un format de fichier qui permette une compression importante des données et soit compatible avec les logiciels nécessaires à la réalisation du projet. La solution était donc de compresser le moins possible les fichiers afin que pages numérisées et « données programmes » soient contenues sur un seul cédérom. Les fichiers "TIFF" ont été convertis de 600 à 300 dpi, puis transformés au format "jpeg" avec un taux de compression de l’ordre de 50%. Ainsi, lors de l’exécution du logiciel, celui-ci peut charger, décompresser et traiter les pages numérisées beaucoup plus rapidement.

2)Intégration et activation du décryptage intégral des notes du scripteur :

L’ensemble des fichiers textes comprenant les transcriptions de l’intégralité des notes, provient de l’édition papier du Lycosthenes en fac-similé avec décryptage d’Etienne Ithurria (édition Slatkine). Le déchiffrage étant structuré par unité de page du Lycosthenes, il apparaissait évident d’associer le découpage par page des notes avec la partie paléographique du livre c’est-à-dire avec les doubles pages numérisées. La plus grande difficulté de cette entreprise fut de mettre sur pied un système, le plus simple et le plus rapide possible, qui permette l’activation automatique des notes en mode texte, lors du survol de la zone correspondant à ces notes, sur la double page numérisée. J’ai donc mis au point un programme qui permet de créer des tracés à main levée autour d’une zone particulière de l’image puis d’associer le graphique ainsi créé avec le texte correspondant des notes du scripteur. 3967 entités ont ainsi été créées et mises en relation au sein d’une base de données. De cette façon, lorsque l’utilisateur survole une zone particulière d’une page où se trouvent les notes manuscrites, celles-ci sont mises en valeur et leur contenu est affiché en clair dans une fenêtre.

3) Activation de tous les index de l’ouvrage imprimé :

Le classement alphabétique thématique des apophtegmes et l’index final alphabétique des personnages avec leur renvoi aux pages concernées du Lycosthenes m’ont fortement inspiré. En effectuant toute une série de traitements informatiques pour extraire depuis les données brutes la matière pour concevoir la base de données principale, je me suis aperçu que l’on pouvait assez facilement améliorer la gestion des index existant dans le livre. En constituant des listes d’éléments interactifs bien sûr, mais surtout en les mettant en relation de manière contextuelle. Ainsi, une fois la liste des entrées alphabétiques thématiques créée (653 éléments), j’y ai associé les personnages se rapportant à chaque entrée ainsi que les pages du Lycosthenes concernées. Et, de manière inverse, une fois la liste des personnages constituée (1396 éléments, comprenant diverses orthographes pour un même personnage), j’ai mis en relation chacun d’eux avec les thèmes et les pages où ils apparaissent. Cela dit en passant, toutes ces opérations ont permis de mettre à jour quelques erreurs concernant notamment les renvois aux numéros de pages du livre.

4) "Rencontres" :

L’ouvrage d’Etienne Ithurria, "Rencontres : du Lycosthenes aux Essais, des Essais au Lycosthenes" (éditions inter universitaires SPEC, Mont de Marsan), est constitué de recoupements, où intervient d’une façon ou d’une autre le scripteur, de rapprochements thématiques et formels et d’observations renvoyant aux Essais et, plus largement, aux sources du XVIe siècle. L’interfaçage de la base de données "Rencontres" avec la base de données décryptage a été facilité grâce au découpage préalable du corpus "Rencontres" par page du Lycosthenes.

5) Incorporation progressive des sources du scripteur :

Dans un premier temps, il était entendu avec le chercheur que nous devions activer et fournir les sources et références les plus significatives du scripteur. J’ai donc mis en place toute une série de programmes qui permettent de mettre en valeur, activer et faire interagir les sources, références ou renvois présents dans les textes correspondants au décryptage. A l’origine de cette procédure, se trouve le fichier constitué par le chercheur et contenant une selection significative des textes originaux auxquels se réfère le scripteur. Ces textes ont été classés par pages du Lycosthenes puis par références dans la page. Au total, ce sont quelques 635 textes provenant essentiellement des "Moralia" d’Amyot ainsi que de l’œuvre de Macault qui sont activables dans le cédérom. Dans le futur, ce seront 7107 sources et 795 renvois intérieurs, soit environ 7902 textes, représentant toute la librairie du scripteur, qu’il faudra intégrer. La difficulté, dans cette partie du parcours, est due à la diversité des codifications utilisées par le scripteur pour noter une référence ou un renvoi. Pour les "Moralia" par exemple, on peut avoir : mor 791, mor. 172, mor 65 in pr, mor.115 inf, mor.447.48., mor 2 fol 109, mor ult.lib. 38 in pr, ...

IV) Apports ultérieurs pour consolider le projet :

Au fur et à mesure que se développait le projet, il devenait indispensable de pouvoir faire des recherches croisées sur les différents corpus existants :
-  le décryptage intégral par page
-  le corpus brut alphabétique
-  le corpus statistique de vocabulaire comparé scripteur-Montaigne (environ 6000 mots), intégrant l’orthographe comparée
-  le corpus "Rencontres"
-  le corpus "Sources du scripteur" Par l’intermédiaire de modules de recherche s’appliquant à tous les corpus, on peut donc mettre en relation, interroger et imprimer le contenu de tout ou partie de la recherche.

On peut également interroger les tableaux statistiques par ordre alphabétique, par fréquence croissante dans les Essais, par fréquence croissante dans le Lycosthenes, par proportion dans le corpus des Essais, par proportion dans le corpus du scripteur, par proportion et fréquence Annotations/Essais

Une partie significative des apophtegmes a été traduite en français moderne. La traduction s’active soit automatiquement, si elle existe pour une page donnée, soit l’utilisateur a la possibilité de choisir une traduction particulière dans la liste des traductions.

V) Interface graphique :

Ma première idée, lorsque j’ai amorcé la conception graphique du projet, était de trouver un juste équilibre entre le côté fonctionnel de l’interface, et un habillage, qui soit suffisamment parlant pour évoquer fortement une période passée mais toujours vivante au travers des textes anciens. J’ai donc choisi une iconographie en grande partie tirée des quelques gravures du Lycosthenes et sélectionné des couleurs et teintes associées, pour faciliter l’immersion de la personne qui consulte le logiciel, dans un environnement intimiste. Une des difficultés, due à l’étalement du projet dans le temps, a été de conserver l’interface graphique telle qu’elle était au départ, tout en ayant le souci de l’améliorer constamment sans jamais la modifier radicalement.

VI) Destinataires :

Ce cédérom est destiné à la communauté des spécialistes du 16e siècle, aux universitaires, enseignants chercheurs et étudiants, aux documentalistes...

VII) Annexes :

Exemple de procédure informatique utilisée dans le projet : intégration des sources

0) REMPLACER le fichier "sources.rtf" par le nouveau fichier à intégrer 1) EXTRACTION DES PAGES DE RÉFÉRENCES DANS TEMP (base intermédiaire) 2) COPIE DES ACTEURS PAGES dans la base de données SOURCES DU SCRIPTEUR 3) CRÉATION DES INDEX SOURCES/ PAGES ET DES PAGES dans la base SOURCES 4) CRÉATION DES INDEX SOURCES et PAGES 5) TEST DE COHÉRENCE des liens interactifs pour toutes les pages du lycosthenes 6) CRÉATION des liens interactifs pour toutes les pages dans la base DÉCRYPTAGE 7) TEST DES LIENS pour toutes les pages dans la base DÉCRYPTAGE 8) TEST DES LIENS pour toutes les références de la base SOURCES 9) TEST DES LIENS pour toutes les références existantes dans la base DÉCRYPTAGE (simulation d’un clic utilisateur pour toutes les références existantes) 10) CRÉATION de la base DÉCRYPTAGE finale (codée) à partir de la base DÉCRYPTAGE en clair 11) Mise à jour de tous les index, LISTE_SOURCES, T_SOURCES, T_PAGES dans les programmes

Cliquez ici pour accéder à une présentation sommaire et limitée du CD ROM en flash (1.8 Mo).

SPIP | squelette | | Plan du site | Suivre la vie du site RSS 2.0