Une journée pour penser et comprendre l’IA : « In bytes, we trust : IA qu‘à préserver ? »

Le 22 mai dernier, après son Assemblée générale, Aksoni proposait aux professionnels des archives et de l’information un moment pour réfléchir et mieux comprendre l’usage de l’intelligence artificielle pour notre secteur. Pour l’occasion, une journée d’étude  « In bytes, we trust : IA qu‘à préserver ? »  était organisée à Louvain-la-Neuve. Une cinquantaine de participants ont répondu présents à cette journée, ainsi que 6 intervenants.

Conférence « Que se cache-t-il derrière l’IA : Comprendre son fonctionnement et son potentiel »

Pour commencer la journée, il nous paraissait essentiel d’expliquer ce que revêt la notion d’IA. Nous sommes nombreux à avoir entendu ce terme, avec l’apparition des modèles d’IA génératives en 2017-2018. Néanmoins, ce n’est pas pour autant que nous comprenons ce qu’elle est réellement. Pour cela, Frédéric Dedobeleer, cofondateur du Guichet du Numérique, consultant et formateur sur la digitalisation d’entreprises, automatisation de processus et IA, s’est proposé de revenir sur le sujet via une conférence.

Technologie existant depuis les années 1950, l’IA est utilisée depuis longtemps pour de nombreux usages : filtres antispam, reconnaissance de caractère, recommandations sur une page d’accueil d’un site web, etc. Elle existait donc bien avant la popularisation du terme par les IA génératives.

Selon Frédéric, il est crucial pour comprendre l’IA – et plus spécifiquement l’IA générative qui est l’objet principal de cette conférence : d’ailleurs, sur le reste de cette partie on parlera donc d’IA pour parler de l’IA générative –  de savoir que l’IA ne pense pas, elle ne comprend pas les mots qu’elle reçoit ni ce qu’elle répond. Elle donne une réponse via une analyse de probabilité mathématique, pour laquelle elle a été entraînée à partir de données. Elle reproduit donc ce qu’elle reçoit, sans compréhension réelle. L’IA nous paraît donc intelligente car elle agit en quelques secondes pour résumer un corpus de documents, rédiger un rapport, générer une image, traduire de longs documents ou encore  synthétiser des idées.

Néanmoins, Frédéric souligne qu’une vigilance et une relecture sont obligatoires sur les résultats qu’elle renvoie, notamment lorsqu’on l’utilise sur des sujets qu’on ne maîtrise pas – rendant parfois la vérification complexe voir impossible. Il faut avoir en tête ce que fait bien et mal l’IA. Une IA ne sait pas distinguer le vrai du faux. Elle ne comprend pas les conséquences de ce qu’elle fait. Elle n’a pas d’intentions. Elle ne vérifie pas ses affirmations. Elle ne sait pas se taire quand elle ignore une information. Elle fait régulièrement des erreurs sur des dates. Tout cela peut provoquer des biais, voir des erreurs, sur les résultats proposés. Elle peut inventer des sources ou des citations. Elle provoque aussi des risques en gommant les minorités absentes (ou peu présentes) dans les corpus de données sur lesquelles elle a été entraînée. Elle peut mettre en avant les erreurs ou les biais venant de son corpus de données d’entraînement. L’IA reste tout de même performante et utile pour de nombreux usages, dont certains plus spécifiques à notre secteur, comme la synthèse de texte ou d’idées, l’aide à l’indexation, l’exploration de corpus ou encore l’assistance à la recherche.

Il faut savoir que pour qu’une IA soit performante, il lui faut des données structurées, des métadonnées fiables, un corpus organisé, des documents de contexte et un référentiel organisé. Or tous ces points font partie des missions d’un professionnel des archives et de l’information. L’IA donne donc la possibilité de voir l’émergence de nouveaux rôles pour l’archiviste. Il peut s’assurer de la gouvernance de l’information, de la qualité de l’information, de la médiale numérique, de l’accompagnement des usages sur les données et de la formation à l’esprit critique. Ce sont des rôles que les professionnels du secteur peuvent prendre au sein de leur institution pour s’assurer que tout soit bien géré, au risque que les projets d’IA se fasse sans eux.

Lors de son travail d’accompagnement, Frédéric constate d’ailleurs que le besoin des outils d’IA a été créé sans que les utilisateurs aient un réel besoin et sans que les bonnes pratiques soient connues de ces derniers. Il n’est pas rare que ces outils soient donnés aux équipes d’une institution sans formation, avec tous les risques que cela peut engendrer si l’utilisation n’est pas réfléchie et cadrée. Un exemple de risque qu’il partage est la demande à une IA de nettoyer un dossier. Si l’IA est installée sur l’ordinateur et a accès à ce dossier, elle pourrait tout supprimer sans que ce soit la demande réelle de la personne, juste car elle a interprété sa demande selon son modèle. Il y a donc une vigilance à avoir sur son utilisation de l’IA, surtout quand elle a accès à des documents. Ils invitent pour chaque expérimentation de le faire sur des machines servant de bac office sans risques pour les données de l’institution.

Il indique également que pour toute génération avec une IA, la personne ayant fait la démarche en reste l’éditeur responsable, quel que soit le contenu (ou même le fait que ce dit contenu bafoue une loi). Il invite donc à la vigilance sur ce point.

Pour conclure sa conférence, Frédéric invite à lire la version 3 du DigComp, le référentiel européen des compétences numériques. La dernière version, sortie en décembre 2025, a été mise à jour aux regards des utilisations de l’IA. Chaque compétence est répartie en quatre niveaux, qui sont eux-mêmes définis par des exemples ou des cas concrets pour atteindre chacun des niveaux. Ce document devient donc le référentiel numérique pour savoir notre niveau dans les compétences du numérique sur plusieurs domaines dont le premier est celui de l’information, la recherche et l’évaluation : des compétences essentielles pour notre secteur.

Les moments en ateliers

Pour dynamiser la journée et faciliter le dialogue, nous avons prévu deux moments où les participants ont été divisés en deux groupes. Chaque groupe a participé aux deux ateliers : l’un sur le prompting et un autre sur le numérique responsable. Chacun des ateliers durait une heure et était animé par un intervenant.

Mohamad Hajid, expert en systèmes sécurisés, en informatique médicale et en environnements critiques, et fondateur de TrAInyng, cabinet de consultance pour la cybersécurité et IA, proposait aux participants de comprendre l’importance d’un bon prompt pour l’utilisation d’une IA générative et de savoir comment en rédiger un. Au départ, chaque participant a essayé deux prompts : un assez générique et un plus complet et correct, pour constater les différences de résultat. À la suite d’échanges, Mohamad a illustré l’importance d’un bon prompt et aussi les éléments qui définissent ce « bon » prompt : l’action demandée, le rôle donnée à l’IA, le contexte de la demande et l’habillage (forme, longueur et ton de la réponse). Il a ensuite proposé aux intervenants trois méthodes pour faciliter la rédaction de prompt, le tout accompagné d’exercices. Chacun des participants a ainsi pu partir, quel que soit son niveau initial, avec plusieurs clés utiles dans le cas de l’utilisation d’une IA générative, quel que soit le modèle utilisé.

Steve Tumson, formateur et consultant sur la transition vers une technologie responsable et éthique, proposait aux participants à comprendre les enjeux écologiques autour de l’IA. En effet, ces derniers ne sont pas toujours abordés lors des processus de décision, or il reste primordial de les avoir en tête. Pour commencer son atelier, il invitait chaque participant à répondre à une série de dix questions à choix multiples. Pour répondre, ces derniers devaient se positionner dans un endroit de la salle pour indiquer leurs réponses. À la fin de chaque question, l’animateur confrontait le public à leurs réponses et commençait à engager un dialogue avant de leur révéler la réponse. À la suite du quizz, il proposa aux participants de se placer en deux cercles pour poser des questions, débattre et réfléchir à l’usage de l’IA au regard de ces enjeux écologiques : est-ce que l’IA est toujours l’outil le plus judicieux ou le seul outil sur les usages qu’en fait le secteur ? Et est-il alors pertinent de l’utiliser en connaissance des conséquences environnementales ? Ce débat a permis d’aborder divers points techniques, notamment l’effet rebond. À la fin de l’atelier, chacun des participants a pu se forger son propre avis sur la question.

Table ronde « IA et archivistes : Usages réels, plus-value et points de vigilances »

Après ces deux moments en atelier, étant séparés par une pause « repas » bien méritée, les participants sont retournés dans l’auditoire principal pour écouter la table ronde. Cette dernière, animée par Johan Pierret, archiviste au ministère de la Santé et de la Sécurité sociale du Luxembourg et membre du conseil d’administration d’Aksoni, confrontait les points de vue de Benjamin Janssens de Bisthoven, archiviste du Carhif et Christopher Kermorvant, expert en IA depuis une vingtaine d’années et fondateur de Teklia, entreprise française accompagnant les institutions patrimoniales aux solutions d’IA.

Ils sont tous deux revenus sur leur passif et leur connaissance de l’IA. Benjamin a rappelé qu’il n’était pas en expert en IA. Il travaille au Carhif depuis deux ans avec une spécialisation autour des archives électroniques. Son usage de l’IA est autour de la recherche, la technique (notamment pour vérifier et challenger le code qu’il rédige lui-même avec ses connaissances en programmation) et pour le traitement de vrac numérique. Quant à Christopher, il est en contact avec l’IA depuis la rédaction de sa thèse en 2003 sur le machine learning, à une époque où peu de gens comprenaient les enjeux autour de ce domaine (à l’inverse de maintenant). Il travaille depuis cette période avec l’IA. Il indique d’ailleurs que la période actuelle est enrichissante sur le sujet car on ne concentre plus uniquement sur la machine, mais sur les problèmes que les humains ont à résoudre avec cette dernière.

En première question, Johan les a interrogés si une archive produite par une IA est considérée comme une archive en tant que telle. Pour Benjamin, si on part de la définition de l’archive, tout document produit dans le cadre de nos activités est une archive. On doit donc le considérer comme tel, avec même un intérêt au prompt rédigé pour arriver à cette « archive ». Il faudra archiver les prompts car ils renseignent sur notre époque. Christopher appuie ces propos et rajoute même qu’on pourrait scinder la partie « analyse » et la partie « générative ». Selon lui, la partie « générative » n’est d’ailleurs pas la partie la plus intéressante. Pour la partie « analyse », l’IA ne génère rien de nouveau. Elle utilise le corpus en sa possession : ce ne sont pas donc de nouvelles informations qui émergent de cette partie.

Le débat est ensuite revenu sur les erreurs de l’IA. Doit-on les accepter en tant qu’archiviste ? Les deux intervenants sont d’accord sur le sujet : que ce soit par un humain ou une IA, les erreurs existent. Il faut donc être critique, quelle que soit la solution pour obtenir un résultat à la suite d’une action. Il faut comprendre les possibilités d’erreurs et les vérifier. Benjamin souligne d’ailleurs que The Archives & Records Association a fait un outil pour baliser la posture de l’archiviste lors de projet avec l’IA. Christopher rappelle aussi que des protocoles d’évaluation sont toujours proposés pour les projets utilisant l’IA, permettant de savoir les taux d’erreurs sur les résultats. C’est donc largement documenté et étudié. A contrario, il souligne que ce n’est pas nécessairement le cas d’avoir des contrôles qualité sur les résultats produits par les humains pour une tâche donnée.

À la suite de cette question, le débat s’est prolongé sur les questions de médiation et d’altération des archives à l’aide de l’IA (colorisation, animation, voir même de la création d’archives avec l’IA). Est-ce que l’IA est une opportunité pour la médiation ? Pour Benjamin, la question de l’authenticité des archives, une fois altérées, se posait déjà avant le phénomène de l’IA. Un bon exemple est le documentaire « Apocalypse » proposant la colorisation d’archives de la Première Guerre mondiale, de la Seconde Guerre mondiale et du totalitarisme. Cette question émerge juste à nouveau car l’espace numérique est inondé de ce type de contenu, notamment quand l’IA est utilisée pour inventer de fausses archives. C’est donc un terrain glissant sur lequel l’archiviste se doit d’être prudent : le public n’est d’ailleurs pas nécessairement demandeur de ce type de procédé. L’IA n’est donc pas nécessairement une opportunité pour la valorisation. Pour Christopher, la position est assez similaire. Il faut surtout rendre les vrais documents plus accessibles pour permettre la découvrabilité des archives par le grand public. C’est là l’opportunité de valorisation, et non l’utilisation de l’IA. La génération n’est même pas une bonne méthode pour mettre en avant des archives, ou alors via des projets très encadrés et spécifiquement. Par exemple, l’USC Shoah Foundation a enregistré des témoins et victimes de la Shoah lors de captations, et a mis en place une IA à destination des jeunes. Sur cette dernière, il pouvait l’interroger et cette dernière avait pour unique rôle de les renvoyer à un moment des captations. L’IA ne créait donc rien et se contentait de mettre en valeur les archives déjà existantes.

Pour conclure ce débat, Johan invitait les participants à réfléchir à l’avenir du secteur. Est-ce que l’IA est une opportunité ou une menace ? Benjamin rappelle que l’IA n’est que la continuité de la révolution informatique qu’on connaît depuis une trentaine d’années. Or, en parallèle, la formation initiale des archivistes et historiens ne suit pas les modifications numériques : ils existent beaucoup de méthodes avec le numérique, par exemple pour assurer l’authenticité de documents. Or ces dernières ne se retrouvent pas dans ces cursus. L’IA est donc selon lui une opportunité pour le secteur pour enfin embrasser la révolution numérique et augmenter ses compétences et capacités. Ils invitent chaque archiviste à s’y plonger dans ce monde fascinant.

Christopher, avec sa casquette de consultant IA vers le secteur du patrimoine, souligne que l’un des avantages du secteur des archives est le temps long. Sur des projets avec les archives, on a régulièrement le temps. Les modèles évoluent vite et d’ici la fin du projet, on a toujours des résultats supérieurs aux attentes premières. Ce temps permet de prendre du recul et d’aller au bout des résultats, car les documents sont présents depuis un moment et ne risquent pas de disparaître. De plus, il y a un mouvement important des bibliothèques et des archives aux États-Unis qui se sont rendus compte qu’ils avaient des mines d’or qu’ils pouvaient monétiser, ce malgré que le bénéfice ne soit pas la mission initiale de ces institutions. En effet,  tout ce qui est sur le web a déjà été aspiré par les IA et ces dernières sont demandeuses de nouvelles données. Ces institutions se sont posées la question de ce qu’ils doivent faire de leurs archives papiers et sous quelles conditions ils les mettent à disposition en ligne. Après réflexion, leur constat est de les mettre à disposition contre une compensation ou rétribution, a minima pour maintenir les serveurs web. Les archives sont donc des trésors de guerre qu’il faut valoriser.

En conclusion de la journée

Après cette table ronde, pour clôturer la journée, Marie-Laurence Dubois, archiviste indépendante et ancienne présidente d’Aksoni, a pu partager ces quelques réflexions. Elle souligne que toutes ces idées et réflexions sont ressorties à un moment ou l’autre de la journée. Elle retient néanmoins quelques mots qu’elles jugent importants : accélération, saturation et hallucination. Ces mots doivent nous faire réfléchir et nous invitent à nous positionner en tant qu’archivistes. Ce malgré une apparition « nouvelle » de l’IA, surtout en prenant le focus de l’IA générative, les enjeux que proposent cette dernière ne sont pas nouvelles pour le secteur et rejoignent en grande partie les questions autour du numérique. Depuis longtemps, on annonce que le métier va disparaître, et au final, le métier est juste amené à évoluer.

Il convient néanmoins aux acteurs du secteur de se poser, par exemple dans le cadre de journée d’étude, d’y réfléchir et de mieux comprendre les usages et problèmes que proposent ces outils pour notre secteur. Notre expertise est utile, notamment pour la reconnaissance du vrai du faux. C’est un rôle que l’archiviste doit embrasser. L’IA est un outil qui peut être utilisé, à condition d’être critique sur ce qu’elle produit. Une des pistes à réfléchir pour le secteur, notamment en raison des usages très spécifiques, est non de creuser les IA génératives avec toutes les questions qu’elles posent, mais les IA agentiques.

Quoi qu’il en soit, avec toutes les évolutions provoquées par l’IA, l’archiviste ne peut être neutre. Il est le garant des sources qui doivent être conservées dans le futur. Il a un rôle sur le tri, sur le vrai et le faux, et de ce qui va rester sur les traces dans l’avenir.

Marie-Laurence termine par une réflexion sur le temps long. Le numérique est composé d’angles morts qui ne sont pas traités, dont la gestion du temps long. L’expérience qu’on en a est que ce n’est pas tenable. On a déjà perdu des données des années 90 – et encore une partie a été conservée grâce au papier toujours présent. Le numérique, de manière générale, n’est pas pensé pour le temps long, et l’IA d’autant plus. Il faut donc se préparer en tant qu’archiviste à travailler sur d’autres supports, dont le papier, car le numérique ne tiendra pas la route sur ce temps long.

En conclusion de cet article, l’équipe tient à souligner que cette journée n’aurait pas été possible sans l’aide des intervenants et du conseil d’administration qui nous ont aidés là la réflexion et préparation de cette journée d’étude. Nous tenons aussi à remercier la cinquantaine de participants qui sont venus pour cette journée.

De plus, nous informons nos membres qu’une captation audio de la conférence introductive et de la table ronde a été effectuée et que cette dernière devrait être disponible via l’espace membre au cours de l’été. Plus d’informations à suivre lors des prochaines newsletters.

Lire aussi