Quand l'intelligence artificielle rencontre l'histoire du peuple juif
Qui a dit que l'informatique et l'histoire n'avaient rien en commun ?
Si l’informatique revêt la plupart du temps la forme de nouveaux matériels ou logiciels, elle se met également au service de domaines très divers. Cette fois, elle rencontre l’histoire du peuple juif, qu’elle pourrait bien aider dans la quête de son passé, grâce à une intelligence artificielle conçue pour trier et assembler des centaines de milliers de très anciens documents.
Des centaines de milliers de documents à trier
La Guenizah du Caire est une collection unique de documents. Elle compte environ 200 000 pièces et représente un ensemble particulièrement hétéroclite de renseignements. On y trouve ainsi des documents juridiques, des recettes de cuisine, des correspondances privées, des contrats, des livres de prières, de la poésie et ainsi de suite. Une véritable avalanche de détails sur la vie du peuple juif à travers des documents datant d’une période de plus d’un millénaire (870 à 1880).
Collecter, rassembler, organiser et trier ces documents a déjà été fait à plusieurs reprises. La collection représente un trésor historique en plus de pouvoir renseigner sur le passé de tout un peuple à travers les siècles, et donc de suivre son évolution. Seulement voilà, le travail se heurte à une difficulté de taille : les documents sont en désordre. Pourquoi ? Parce qu’une guenizah est essentiellement une « remise ». Les documents portant le nom de Dieu ne doivent en effet pas être détruits, mais enterrés. Le processus de reconnaissance et d’appairage est également rendu complexe par un autre problème : la plupart de ces documents sont en langue arabe mais avec un alphabet hébraïque.
Un grand travail de numérisation
Le travail d’identification, de compréhension et de recherche est particulièrement lent et rébarbatif et n’a produit à ce jour qu’environ 4 000 documents reconstitués. C’est ici qu’intervient l’informatique. Elle a commencé par un très long travail de numérisation, sur 301 000 fragments de papiers, répartis sur toute la planète dans des musées et des collections privées.
Puis, comme l’indique le New York Times, 450 000 photographies en haute qualité ont été prises sur fond bleu afin d’en faire ressortir les détails et les éléments significatifs. Mais si la numérisation est une étape cruciale, elle n’accélère pas nécessairement le travail général, même si un site web avait été mis en ligne pour aider les chercheurs.
L'utilisation de l'intelligence artificielle
La phase suivante est beaucoup plus récente. Elle consiste en un projet lancé par l’université de Tel Aviv (Israël) : unir la puissance de calculs d’une centaine d’ordinateurs pour les faire travailler sur l’identification et le rassemblement des fragments. L’opération, lancée le 16 mai, porte sur précisément 157 514 fragments, analysés un par un et automatiquement sur la base de 500 indices. Le nombre de combinaisons possibles est de 12 405 251 341.
Sur le site officiel du projet, on peut voir que les opérations de comparaison ont été complétées à hauteur de 25,4 %. À ce rythme, les calculs devraient être terminés le 26 juin si rien ne vient enrayer la machine. 3 632 comparaisons sont effectuées à chaque seconde, ce qui laisse encore 708 heures de calculs.
Yaacov Choueka, ancien professeur de sciences informatiques et à la tête du projet, indique que le travail réalisé sert en fait deux objectifs. D’une part, il doit permettre de pouvoir se plonger avec plus de précisions dans une période historique manquant parfois cruellement de détails. D’autre part, il représente une nouvelle opportunité pour l’outil informatique de répondre avec efficacité à des questions inédites posées par la recherche.
Des informations précieuses et un oeil humain irremplaçable
Et les informations contenues peuvent se révéler précieuses pour les historiens. Par exemple, une partie des fragments traite de la vie de tous les jours des Juifs résidant au Caire. De là, ils importaient des moutons de Sicile et préparaient des portions de nourriture chaude dans des récipients fermés. Ils contiennent également des informations sur le commerce du lin et du savon qui prenait place entre l’Égypte, l’actuelle Tunisie et la Sicile.
Mais attention : si l’outil informatique permet de réaliser en un temps record des opérations qui auraient nécessité plusieurs générations de chercheurs, il ne peut pas répondre à toutes les questions. Certaines paires de fragments seront ainsi immédiatement détectées, mais pas toutes. Le projet doit présenter une liste des probabilités existant entre plusieurs morceaux, et ce sont bien les chercheurs qui confirmeront ou pas les résultats donnés par l’intelligence artificielle.
Source : NYT