Avec ses 85 kilomètres de rayonnage et ses œuvres millénaires, difficile d’exploiter l’ensemble de la précieuse collection des archives secrètes du Vatican. L’intelligence artificielle pourrait bien changer la donne.Quoiqu’en disent Dan Brown et les conspirationnistes, les archives secrètes, au cœur de la cité du Vatican, n’ont rien de secret. Oui, elles renferment toute l’histoire de l’Église. Oui, il s’agit d’archives “privées” selon la traduction du mot latin “secretum”, c’est-à-dire qu’elles sont à la disposition du Saint-Père… et des chercheurs. Dans ces archives se trouvent des documents relatifs à chaque pontificat, des correspondances privées et diplomatiques ou des lettres adressées à des évêques du monde entier. La tradition veut que chaque pape rende publique un pontificat dans sa totalité.
Du compte-goutte…
Aujourd’hui ces précieux papiers et documents du VIIIe au XXe siècle couvrent 85 kilomètres de rayonnages. Certains sont abîmés par le temps, voire illisibles. D’autres sont difficiles à déchiffrer en raison des caractères, sigles ou abréviations tombés en désuétude. Bien des chercheurs du monde entier voudraient y avoir accès régulièrement mais il est difficile d’accueillir tout le monde. Non seulement pour des raisons d’espace. Mais aussi par crainte que ces précieux documents ne s’abîment.
Lire aussi :
Pourquoi les Archives du Vatican sont-elles secrètes ?
Alors comment exploiter ce patrimoine sans nuire à sa bonne conservation ? Le Saint-Siège a bien pensé à un système de copie digitale pour y avoir accès, mais cela n’est pas suffisant. 85 kilomètres d’archives à passer au scanner ce n’est pas rien. Seule une petite partie a pu l’être jusqu’ici. Quant aux transcriptions à informatiser, le résultat est encore moins concluant. Donc, pas le choix, il ne reste plus qu’à prendre sa valise et faire le voyage jusqu’à Rome et feuilleter page par page à la main.
…à l’intelligence artificielle
Un nouveau projet de recherche auquel travaillent 120 lycéens de Rome, In Codice Ratio, pourrait résoudre une grande partie de ces problèmes. Il utilise l’intelligence artificielle pour retranscrire ces textes et les informatiser. Ces étudiants ont d’abord commencé par entraîner une intelligence artificielle à reconnaître les caractères de l’alphabet latin médiéval en l’alimentant avec 1,5 million de mots en latin. Ils ont ensuite utilisé la méthode de « segmentation en puzzle » qui permet de reconnaître les unités minimales à partir de traits horizontaux ou verticaux. Enfin, pour encore plus de précision, ils ont établi des bases de données regroupant les combinaisons de lettres les plus communes.
Lire aussi :
Le Vatican ouvrira ses archives sur la dictature argentine
Selon les premiers tests, 65% des mots ont été transcrits correctement. Ce n’est pas l’idéal encore, mais les chercheurs ont confiance car ces transcriptions sont déjà une base solide pour les paléographes qui, au fur et à mesure des progrès accomplis, devraient mettre de moins en moins de temps à transcrire. Le professeur Paolo Merialdo, ingénieur, créateur et coordinateur des travaux aux archives, se réjouit des résultats prometteurs obtenus et espère bien les appliquer dans d’autres domaines.
Un projet à la fois culturel et humain
Les personnes de son entourage étaient au début un peu sceptiques mais ils ont fini par épouser le projet et l’ont accompagné avec grand enthousiasme, confie-t-il dans un entretien à Aleteia. Résultat, une vingtaine d’écoles ont participé au projet, soit un total de 600 jeunes. Puis des collaborations sont nées avec d’autres chercheurs humanistes et ils envisagent la possibilité d’appliquer leurs résultats pour l’étude de manuscrits qui rapportent l’histoire de Pierre.
Lire aussi :
Faut-il vraiment avoir peur de l’intelligence artificielle ?
Interrogé sur l’impact de cette expérience au plan culturel mais également humain sur les personnes qui ont participé à son projet, le professeur Merialdo est encore étonné de la « richesse » des relations qui se sont nouées entre tous les membres. “Nous apprenons aussi à interagir avec la presse qui nous ont contacté par dizaines, après l’article sur The Atlantic — a-t-il ajouté — ce qui est nouveau pour nous”.
Pour les archives du Vatican, leur travail se poursuit. Les accords ne prévoient pas la transcription automatique de tout le patrimoine, mais le Vatican leur a fourni un échantillon consistant de Registres d’Honorius III, non publiés en édition critique complète et rédigés en minuscule cancellaresca, un style d’écriture de chancellerie assez claire et homogène, qui dérive de la minuscule caroline, une écriture apparue au VIIIe siècle, vers 780, sous l’impulsion de Charlemagne.
Lire aussi :
Pour que l’intelligence continue de ne pas seulement être qu’artificielle