L'IA au service des généalogistes

Marie-Caroline Schmied (à gauche) et Delphine Mamie (à droite) ont contribué au développement de l’outil de recherche publié en novembre par les Archives de l’Etat du Valais et la Valais Wallis Time Machine.

Les Archives de l’Etat du Valais viennent de publier un nouvel  outil  qui facilite la recherche généalogique : un moteur de recherche dédié aux recensements de la population valaisanne du XIXe siècle. Ce projet, fruit d’une collaboration avec l’association Valais Wallis Time Machine, est à la pointe des humanités numériques, combinant expertise technique et innovation au service de la recherche en histoire.

Un outil innovant pour explorer le passé

Numérisés entre 2010 et 2015, les recensements de la population valaisanne des années 1798 à 1880 étaient disponibles en ligne depuis 2020 sous forme d'images des pages des registres. Cependant, même si cette démarche facilite l'accessibilité des sources par rapport à une consultation sur place, les recherches restaient fastidieuses et limitées à des classements par année et commune. Conscientes des attentes du public, les Archives Cantonales ont relevé le défi d’automatiser les recherches par nom et prénom. Résultat : un moteur de recherche basé sur la reconnaissance d’écriture manuscrite (HTR) capable d’extraire et d’indexer des données à partir de plus de 45 000 images numérisées.

Le nouveau moteur de recherche des recensements valaisans.

Les nouvelles technologies numériques au service du traitement des archives

Marie-Caroline Schmied et Delphine Mamie, figures clés du projet, illustrent la montée en puissance des humanités numériques. Marie-Caroline, avec sa double formation  en histoire médiévale et en technologies numériques, est en charge de ces initiatives depuis 2019 au sein des Archives. Delphine, spécialisée en humanités numériques et sociologie, a collaboré avec elle dès ses études, contribuant à perfectionner les modèles de reconnaissance d’écriture.

Grâce à leur travail minutieux et à l'engagement d'experts comme Cédric Viaccoz, qui a obtenu son Master en humanités numériques à l’EPFL, les algorithmes ont été peaufinés pour intégrer des outils phonétiques innovants. Ceux-ci permettent de retrouver des noms malgré les variations d’orthographe du XIXe siècle, avec un pourcentage de confiance affiché pour chaque résultat. Une fonction précieuse dans un contexte où l’orthographe des noms n’était pas encore standardisée.

Interview : Rencontre avec Marie-Caroline Schmied et Delphine Mamie

Pour en savoir plus sur les coulisses de ce projet, nous avons rencontré Marie-Caroline Schmied et Delphine Mamie.

Q : Pouvez-vous nous expliquer ce qui vous a motivées à travailler sur les recensements de la population valaisanne ?

Marie-Caroline Schmied : Les recensements sont une source essentielle pour la généalogie, car ils sont accessibles à tout le monde, contrairement aux registres paroissiaux qui nécessitent des autorisations. Pendant la pandémie, nous avons mis en ligne les registres numérisés, et nous avons observé que les utilisateurs tentaient de faire des recherches par nom, comme sur Google, alors que le système était conçu pour des recherches par année et par commune. Cela nous a poussés à développer un outil spécifique pour la recherche nominative.

Delphine Mamie : En effet, l'idée était de faciliter l'accès à ces informations. Nous avons commencé les premiers tests de reconnaissance d'écriture en 2020, mais les résultats étaient assez limités. C'est en 2022, avec l'engagement de Thibaut Clérice, chercheur en IA à l'Inria et issu de l'Ecole nationale des chartes de Paris, que nous avons obtenu des résultats beaucoup plus probants, et nous avons pu avancer dans le projet.

Q : Quels ont été les principaux défis techniques rencontrés ?

Delphine Mamie : L’un des grands défis a été de reconstituer le lien entre un mot et sa catégorie dans le formulaire. Nous avons utilisé des algorithmes de clustering pour refaire cette liaison. Nous avons également travaillé sur la résolution des abréviations.

Marie-Caroline Schmied : Un autre défi a été de pallier aux erreurs de la reconnaissances d'écriture Nous avons donc dû développer une approche avec des  algorithmes phonétiques pour permettre des correspondances basées sur la prononciation, ce qui améliore considérablement les chances de trouver un nom, même avec des graphies différentes.De plus, nous avons mis en place un système permettant de donner un pourcentage de confiance aux résultats, ce qui était crucial pour garantir la fiabilité des données.

Q : Quelles sont les prochaines étapes pour ce projet ?

Delphine Mamie : Nous travaillons actuellement sur un formulaire qui permettra aux utilisateurs et utilisatrices de signaler des erreurs et de proposer des corrections. Cela s'inscrit dans une démarche de crowdsourcing afin d'améliorer continuellement la qualité des données. Ces contributions seront vérifiées par des experts et expertes avant d'être intégrées au moteur de recherche, et elles nous fourniront également des données corrigées pour éventuellement réentraîner nos modèles d'IA.

Marie-Caroline Schmied : Nous avons aussi l'intention de continuer à éduquer le public aux humanités numériques, car il est essentiel de développer ces compétences dans notre domaine. Le numérique est devenu un levier incontournable pour les archives et la transmission de notre patrimoine.

Une ressource accessible de partout

Le site dédié, accessible ici, a rencontré un immense succès dès sa mise en ligne, multipliant par cinq le nombre de visites du site des recensements, qui était déjà la plus fréquentée des sites des Archives de l'Etat du Valais. Avec plus de 2 000 consultations mensuelles en novembre 2024, il attire des utilisateurs du monde entier, notamment d’Amérique du Sud, où les descendants d’émigrés valaisans recherchent leurs racines. Ce moteur de recherche démocratise l’accès aux données généalogiques, incluant des informations sur toutes les familles valaisannes.

Les humanités numériques : un levier incontournable

Selon Marie-Caroline Schmied, "Le milieu des archives ne peut pas se passer du numérique." Delphine Mamie ajoute que le numérique est essentiel à la transmission culturelle, permettant d’atteindre un public large et diversifié. Leur implication va au-delà de leur travail quotidien au sein des Archives : elles animent également ensemble des ateliers pour sensibiliser les jeunes aux opportunités offertes par l'IA et le numérique dans les domaines des sciences humaines.

Une collaboration exemplaire

Ce projet illustre les synergies prometteuses entre innovation technologique, préservation et valorisation du patrimoine culturel. Il montre également comment la Valais Wallis Time Machine contribue à impulser ces initiatives au service de la communauté scientifique et du grand public.

En mettant en lumière des compétences souvent invisibles, ce moteur de recherche représente une avancée significative pour les humanités numériques et les passionnés de généalogie. Une véritable invitation à plonger dans l’histoire, armé des outils les plus modernes.

Pour toute question ou pour découvrir cet outil, rendez-vous https://recensements.vallesiana.ch