Finir l’expérience IA et cartes : compte rendu d’un article de recherche

A la question Que peut l’intelligence artificielle pour la création de cartes par les généalogistes amateurs, on peut répondre Pour le moment, pas grand chose. Expérimentions décrites dans les articles C créer une carte avec une IA, Donc je crée une carte avec l’aide d’IA, Encore un mot sur les cartes : Textomap

Article de recherche

Je souhaite conclure avec un compte-rendu d’un article de recherche datant de septembre 2023. Les auteurs appartiennent à des université françaises, IGN, CNRS et ENSG (école nationale des sciences géographiques). L’article est en anglais. Je n’ai consulté que le résumé (abstract). Il comporte une bibliographie, principalement des articles depuis 2021. On est sur un sujet hyper récent.

Les auteurs font le point sur les défis de la génération d’image à partir d’un texte, concluent comme nous que pour l’instant, on peut pas compter dessus ; mais eux, ils savent comment faire avancer le sujet.

Text-to-map generation: an exploration of current potentials

Azelle Courtial, Jérémy Kalsron, Bérénice Le Mao, Quentin Potié, Guillaume Touya, et al.. Text-to map generation: an exploration of current potentials. CartoAI: AI for cartography, Sep 2023, Leeds, United Kingdom. ffhal-04224973

Résumé accessible directement ici -> https://hal.science/hal-04224973/document

Mon compte rendu de l’article

[ceci est un résumé traduction avec sûrement des interprétations et approximations, et avec mes commentaires, en gris entre [crochets] ]

Avancées impressionnantes des IA capables d’interpréter des demandes en langage naturel et de répondre sous forme d’images. Mais on a peu d’exemples de génération de carte. Or, ce serait une contribution prometteuse à l’objectif de cartographie à la demande. Il s’agit de comprendre les demandes de non-cartographes, rechercher les informations et présenter le résultat sous forme de carte.

Les chercheurs proposent donc une revue de la pertinence de modèles texte-to-image sous différents angles, leurs forces et faiblesses. Ils ont produit des exemples en utilisant DALL-E, l’IA de génération d’images de Open AI.

[la suite en 3 parties : 1) décrire une carte par un texte 2) générer une image qui ressemble à une carte 3) représenter l’information spatiale]

  1. Décrire une carte par un texte. C’est le première étape pour faire l’inverse [effectivement quand on y pense, pour apprendre aux IA a apprendre à dessiner nos cartes faut déjà avoir d’un côté des cartes, et de l’autre la description texte des cartes].

    Les informations doivent comporter l’étendue, l’échelle, les éléments représentés, la façon de les représenter, et le style.

    Les chercheurs concluent que le texte influe sur l’image produite [j’ai du mal à voir comment il pourrait en être autrement]. Axe de recherche: comment décrire efficacement une carte par un texte court

    [ déjà ce premier point me montre que mes critères de description des cartes étaient incomplets. Pour moi, une carte était caractérisée par
    * le fond : plan ou satellite, en gros; ou historique, par exemple Cassini)
    * les éléments d’intérêt : villes, villages, lieux-dits, fermes ; voies de communication Et puis c’est tout. De fait, je m’intéresse plus aux informations portées par la carte
    * elles doivent être juste, les lieux doivent être où ils sont et les voies de communication relier les lieux qu’elles relient, et je dois voir facilement l’échelle
    * la carte doit être lisible, j’ai horreur des cartes où on ne comprend pas où on est ni ce qu’on voit, pour moi la lisibilité passe bien devant l’esthétique ]
  2. Générer une image qui ressemble à une carte. Les chercheurs ont regardé ce qu’ils arrivent à faire produire à l’IA [ je remets le texte qu’ils ont utilisé, les images produites sont dans l’abstract, je ne suis pas sûre d’avoir le droit de les remettre ici donc je ne le fais pas ]

    a. « une carte topographique avec des bâtiments en noir, le long d’une route rouge, avec une forêt pas loin »
    b. « une carte topographique d’une région montagneuse avec des châteaux »
    c. « une carte topographique d’Italie avec les repères principaux »
    d. « une carte topographique de Paris, France avec les repères principaux »

    Toutes les images obtenues ressemblent à des cartes et les éléments sont bien représentés sous une forme plus ou moins abstraite.

    Par contre, quand il s’agit de lieux réelles (exemples c. et d. avec Italie et Paris), la représentation s’éloigne de la réalité, et le problème est amplifié pour les cartes à grande échelle, probablement car l’IA a eu moins de carte à grande échelle pour s’entrainer. [ une carte à grande échelle est une carte qui représente une petite zone avec beaucoup des détails; j’ai vérifié, c’était pas clair pour moi dans quel sens ça marchent « grande échelle » et « petite échelle » ! ]
  3. Représentation des informations spatiales. Ils ont ensuite fait différents essais en demandant la génération d’informations spatiales de différentes manière. [ images dans le résumé aussi ]

    a. « carte d’une ville avec mise en évidence de plusieurs monuments ». Ici il s’agit de mettre certains éléments en évidence

    b. « carte de Paris à l’échelle 1:2500 centrée sur la Tour Eiffel’. Ici il s’agit de changer de point de vue

    c. Là ils n’ont rien demandé à l’IA mais lui on fourni un plan IGN d’une vraie ville

    d. Ils ont demandé à l’IA de montrer ce qu’il y a autour de la carte c. [ je ne suis pas sûre d’avoir compris, ils décrivent leur commande à l’IA the out-painting of a context around map c. ]

    Ils retirent de ce point 3 qu’on peut modifier la manière dont sont représentées les informations spatiales comme dans a. et b. , mais le plus intéressant est le c. et d.: en partant d’une image fournie, donner des instructions en langage naturel pour obtenir des transformations de cette image. [ et à cet endroit j’ai peut-être loupé une partie de la conclusion ]

Conclusion des auteurs sur la génération de cartes à partir de texte

  • il faut des modèles entraînés spécifiquement avec des jeux de données composés des cartes et de la description des cartes [ j’ai compris ça, je crois qu’ils ne disent pas que ça ]
  • les modèles sont limités car ils n’ont pas accès aux données à mettre sur les cartes [ je suppose qu’il s’agirait, exemple super simple, de listes de communes géolocalisées ]. L’intégration de modules de recherche et de collecte de données est incontournable. En effet, les IA entraînées juste à partir d’exemple de cartes existantes ne peuvent pas produire de carte représentant des phénomènes spécifiques, ou des statistiques
  • et en plus, il y a des questions et éthiques et de fiabilité, et il convient de définir des stratégie et des techniques d’évaluation de la qualité des cartes produites

Conclusion de la conclusion des auteurs : à ce stade, en raison de toutes ces limitations, la génération de carte à partir de textes ne peut être utilisée qu’à des fins de production de cartes artistiques

Ma conclusion

Générer des cartes fiable par IA juste en lui expliquant ce qu’on veut, c’est pas encore prêt – mais la communauté scientifique a des idées sur comment faire pour y arriver un jour.

Laisser un commentaire

Concevoir un site comme celui-ci avec WordPress.com
Commencer