Regarder les projets en cours : RegistrIA, indexation par IA d’un fonds du SHD

J’en suis toujours à me demander comment automatiser l’indexation des registres militaires napoléoniens grâce à l’IA. Dans le dernier article Quasi-échec…, j’ai constaté que je n’arrive pas à m’en sortir avec la plateforme de transcription Transkribus. Soit que je m’y prends comme un manche, soit que c’est quand-même encore plus compliqué que ça ma bonneLire la suite « Regarder les projets en cours : RegistrIA, indexation par IA d’un fonds du SHD »

Quasi-échec de détection d’un tableau avec Transkribus

(si vous cherchez un article avec des conclusions, passez votre chemin et revenez plus tard) Dans l’article Indexer 0,016% des matricules Napoléoniens, j’expliquais que l’indexation des registres militaire des armées de Napoléon, ça m’a lassée et donné envie de regarder ce que peut l’IA. Il s’agissait de faire ça (des centaines de milliers de fois) :Lire la suite « Quasi-échec de détection d’un tableau avec Transkribus »

Pourquoi parfois ça ne marche pas : essai de trois autres modèles IA pour la transcription de l’acte 1816

On a vu transcription transcription réussie Objectif observation d’une transcription par IA (réussie). Tout à fait lisible, avec noms de lieux, patronymes et prénoms souvent inexacts mais reconnaissables. Avec le même acte en utilisant d’autres modèles, on a des résultats bien différents. Cela va du ‘pas mal du tout’ au ‘catastrophique’ Les autres modèles de transcriptionLire la suite « Pourquoi parfois ça ne marche pas : essai de trois autres modèles IA pour la transcription de l’acte 1816 »

Objectif observation d’une transcription par IA (réussie)

On se lance enfin dans l’observation d’une transcription par Transkribus. Je travaille sur l’acte de 1816, Wallon-Cappel, en français, celui qui nous a servi d’exemple dans les articles L pour détecter les Lignes avant de déchiffrer et N Nouvel essai de détection de ligne sur un acte de naissance de 1816. On a vu que le modèleLire la suite « Objectif observation d’une transcription par IA (réussie) »

Nouvel essai de détection de ligne sur un acte de naissance de 1816

Dans l’article L pour détecter les Lignes avant de déchiffrer, j’ai lancé la détection de ligne dans Transkribus sur l’acte de naissance de Charles Louis CAUWEL, 1816. J’avais utilisé le modèle « Universal Lines », et le résultat était parfait : l’IA avait bien repéré chaque ligne. Mais pourquoi je m’étends sur la détection de lignes? Cela neLire la suite « Nouvel essai de détection de ligne sur un acte de naissance de 1816 »

Mon essai maladroit de repérage d’un patronyme dans un acte de 1589

Soit mon plus vieil acte concernant le patronyme de ma mère. Hondeghem (59), 1589. Naissance de Rémi GHYS. L’acte transcrit par un humain Sauf erreur, l’acte en latin raconte que le 16 a été baptisé l’enfant de Rémi (Remigi) GHYS et Jacqueline (Jacoba, sans patronyme), le parrain François (Franciscus) XXX, la marraine Jacqueline XXX leLire la suite « Mon essai maladroit de repérage d’un patronyme dans un acte de 1589 »

L pour détecter les Lignes avant de déchiffrer

J’explore les usages de l’intelligence artificielle par les généalogistes. J’ai présenté la plateforme de reconnaissance d’écriture Transkribus dans K pour allez essayer Transkribus. Maintenant, quelque chose qu’il faut comprendre avant de se lancer : dans l’acte de déchiffrage, le premier truc qu’on fait, sans y penser, ce n’est pas le déchiffrage. Le premier truc qu’on faitLire la suite « L pour détecter les Lignes avant de déchiffrer »

K pour allez essayer Transkribus

Transkribus est une plateforme de reconnaissance d’écriture, qui propose aussi des fonctionnalités de transcription, recherche de documents, collaboration. Le projet est la continuité de deux projets de recherche européens. Il est maintenant géré par une société privée, READ COOP. Les atouts de Transkribus Selon moi : page d’accueil de la plateforme Transkribus Qu’attendre de TranskribusLire la suite « K pour allez essayer Transkribus »

Indexer 0,016% des matricules Napoléoniens

Encore une situation mobilisant le déchiffrage d’écriture. C’est toujours pour voir comment l’IA pourrait aider les généalogistes amateurs Le projet matricules Napoléoniens Généanet héberge plusieurs projets collaboratifs. L’un deux a pour objectif d’indexer les registres matricules de la garde impériale et de l’infanterie de ligne (1802-1815). Ici -> Matricules Napoléoniens 1802-1815. Le truc est gigantesque.Lire la suite « Indexer 0,016% des matricules Napoléoniens »

Huile de coude collaborative, polonais, Napoléon, recensements. Scénario de déchiffrage numéro 2

On continue un panorama de situations mobilisant le déchiffrage d’écriture. C’est pour comment l’IA pourrait aider, maintenant ou un jour. Le projet polonais de Napoléon Il s’agit d’un projet collaboratif. Nous étions trois, Laurent, ma sœur et moi. De mon côté, c’est parti d’un ancêtre polonais à moi, et à ma sœur donc, un quiLire la suite « Huile de coude collaborative, polonais, Napoléon, recensements. Scénario de déchiffrage numéro 2 »

Concevoir un site comme celui-ci avec WordPress.com
Commencer