«Métadictionnaire médical multilingue de la bibliothèque numérique Medica»: un nouveau projet de la BIU Santé financé par Collex-Persée

La BIU Santé, en collaboration avec l’UMR 8167 « Orient & Méditerranée Textes Archéologie Histoire », a répondu en janvier 2020 à un appel à projets de Collex-Persée « portant sur de la numérisation enrichie et du développement de services à la recherche en impliquant chercheurs et professionnels de l’information ». Les résultats ont été publiés le 20 mai dernier : le projet de « Métadictionnaire médical multilingue » a été retenu parmi les projets lauréats.

Exploiter, enrichir, rénover le socle des dictionnaires de Medica

Une partie des dictionnaires numérisés dans Medica

Actuellement, au sein de la bibliothèque numérique Medica, 49 dictionnaires médicaux et encyclopédies (XVIIIe-XXe s.) sont interrogeables grâce à une interface spécifique  : entrer un (début de) mot-clé fait accéder aux vedettes des articles, indexées dans les 331 643 pages des 453 volumes.

Le projet, en produisant un nouvel outil et de nouvelles données, valorisera doublement ce trésor lexical et scientifique.

L’usager naviguera dans un corpus élargi à plusieurs dictionnaires majeurs du XVIIe s. (vedettes en grec et / ou latin) grâce à une nouvelle application qui donnera accès à la liste alphabétique continue de tous les mots du corpus (« métadictionnaire »). Les résultats d’une même requête seront considérablement enrichis: s’appuyant sur les données lexicographiques fournies par une dizaine de dictionnaires représentatifs, dans les corps d’article (variantes orthographiques, étymologies, traductions, synonymes, antonymes, hyperonymes et hyponymes, renvois divers) comme à la fin des volumes (index et glossaires), l’application suggérera, à travers une interface intuitive, des liens entre des mots actuellement dissociés par l’orthographe, par la langue (français, anglais, latin et grec ancien, mais aussi allemand, espagnol, italien), ou encore par l’évolution des usages.

Mutualisation des données produites

Par ailleurs, les données lexicographiques recueillies, matériau inédit d’un grand intérêt pour la recherche en histoire de la santé et pour l’étude de l’évolution des lexiques spécialisés en français ou du devenir des termes anciens dans nos langues scientifiques modernes, seront déposées en accès libre sur Medica.

L’équipe projet

Les porteurs du projet sont Jean-François Vincent, conservateur au service d’histoire de la santé de la BIU Santé (Direction des bibliothèques d’Université de Paris), et Nathalie Rousseau, maîtresse de conférences en linguistique grecque à la Faculté des Lettres de Sorbonne Université, membre de l’Institut universitaire de France et responsable de l’axe consacré au lexique médical au sein de l’équipe « Médecine grecque et littérature technique » de l’UMR 8167 « Orient & Méditerranée Textes Archéologie Histoire ».

Cette tentative ambitieuse renouvelle un compagnonnage de vingt années entre l’équipe « Médecine grecque » de l’UMR 8167 « Orient & Méditerranée Textes Archéologie Histoire » et la BIU Santé qui a déjà porté beaucoup de fruits (réalisation du Corpus des médecins de l’Antiquité de Medica, organisation de journées d’études, publications d’actes de colloques…)

Les travaux bénéficieront de la collaboration de Sylvie Bazin-Tacchella, professeure en histoire de la langue à l’Université de Lorraine, spécialiste des premiers textes médicaux en français, qui dirige le projet de Dictionnaire du Moyen Français au sein du laboratoire ATILF (Analyse et Traitement Informatique de la Langue Française, UMR 7118 – CNRS et Université de Lorraine.)

L’équipe comporte plusieurs membres du service d’histoire de la santé et du département de l’informatique de la BIU Santé ; le soutien de Collex-Persée permettra de la renforcer en recrutant un personne de plus, et d’avoir recours à des prestataires spécialisés.

Un projet longuement préparé

La phase préparatoire du projet, encouragée par une bourse individuelle accordée à Nathalie Rousseau en 2018 par Collex-Persée, a été menée tout au long de l’année 2019. Les travaux effectués ont permis de souder l’équipe et de réfléchir de façon déjà très approfondie, sous l’angle à la fois technique et scientifique, aux résultats attendus, aux priorités de traitement au sein du corpus des dictionnaires, et aux modalités de restructuration et d’enrichissement des données.

La durée prévue du projet est de 24 mois.

Collex- PerséeLa BIU Santé est bibliothèque délégataire de Collex-Persée en sciences de la santé, médecine, odontologie, pharmacie, cosmétologie et chimie.

FacebooktwitterpinterestlinkedinmailFacebooktwitterpinterestlinkedinmail

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.