Encodage des transcriptions et traductions
Dans une première étape du projet, les textes fournis par les éditeurs scientifiques sous Open Office ont fait l'objet d'une conversion dans un format informatique spécifique, dédié à l'encodage des textes pour leur conservation et leur échange : TEI (Text Encoding Initiative). TEI est un format d'encodage dérivé du métalangage XML : il présente l'avantage d'être indépendant de toute plate-forme logiciel, ce qui favorise la préservation des documents structurés selon ses recommandations. Par ailleurs, les formats de document dérivés du XML reposant sur l'encodage des caractéristiques structurelles et sémantiques des textes, non sur leur mise en forme, les documents XML-TEI permettent de préserver un texte sans préjuger de la forme de sa présentation, et d'envisager des mises en forme diverses à partir des mêmes fichiers sources. Le choix de ce format de document permet donc une pérennisation des textes donnés par les éditeurs scientifiques, ainsi qu'un gain de temps en cas de redéploiement de la plate-forme de diffusion, de changement du format de diffusion ou de la mise en page.Après cette première étape d'encodage, les fichiers XML-TEI ont été convertis en HTML, sous une forme propre à être injectée dans une base de données, en utilisant des feuilles de style XSLT, langage de transformation dédié à la conversion des fichiers XML.
Infrastructure Web
Dans une seconde étape, une application reposant sur une base de données FileMaker Pro 12 et une interface web codée en Lasso 8.6 a été montée. Ultérieurement, cette application a été transposée en PHP.Des champs Filemaker spécifiques contiennent le code HTML des pages de l'ouvrage édité (traduction et transcription)
La mise en forme des pages est gérée à l'aide de styles CSS (titre, corps, notes marginales...) et de scripts javascript, assurant notamment l'affichage des notes et le zoom sur les images.
Polices de caractères
Le texte contient des caractères latins, mais aussi du grec. Le problème était donc double :Nous avons opté pour l'utilisation de la police Cardo, de David J. Perry, à travers le système des Google Fonts, qui permet le téléchargement de la police à la demande, de façon transparente pour l'utilisateur.
- afficher tous ces caractères
- obtenir un affichage identique sur toutes les configurations et tous les navigateurs, sans installation (Windows, Mac, Linux, Android...)
La police Cardo contient à ce jour 3814 signes (liste complète), dont la totalité des signes de la Medieval Unicode Fonts Iniative (MUFI 3.0), et ceux du Thesaurus Lingua Graeca (TLG).