Que nous réserve 2024 ? Tout tourne autour de l'IA géospatiale
Le futur de l'automatisation, des drones et de l'agrégation de données
Je suis convaincu que toutes les prédictions de l'industrie se focaliseront sur l'IA (Intelligence Artificielle) compte tenu de l'engouement pour cette technologie au cours de l'année écoulée. En effet, dans mes précédentes analyses, je soulignais que certains usages de l'IA dans l'industrie allaient se développer, tandis que d'autres allaient rester en marge de l'évolution, et ce en fonction des données disponibles. Ce que je n'avais pas prévu, c'est cette explosion d'intérêt pour les Grands Modèles de Langage rendus accessibles au travers de ChatGPT d'OpenAI, ce qui ne manquera pas de contribuer à dynamiser de nombreuses tâches impliquant des humains interagissant avec des machines - mais il s'agit toujours d'un "modèle de langage" et non pas d'un modèle spatial. Cela signifie que ce modèle peut aider les utilisateurs à accomplir des tâches telles que la rédaction de documents, de codes et de scripts, ou à interagir avec des systèmes complexes tels que l'analyse ou la mise en correspondance de schémas, des tâches qui au demeurant sont génériques et non spécifiques à l'industrie géospatiale.
En attendant, les utilisations véritablement géospatiales de l'IA se feront dans deux domaines principaux :
1. Numérisation de données non structurées telles que des images, des nuages de points ou des PDF en contenu spatial structuré
Ce processus est utilisé depuis longtemps, bien qu'il n'ait jamais atteint les niveaux de précision et d'automatisation escomptés. Il est plus souvent utilisé pour la détection d'anomalies, par exemple, telle vidéo montre-t-elle une fissure dans cette canalisation ou ces arbres surplombent-ils la voie ferrée ? Mais peut-être que les améliorations continues rendront la saisie de données plus grandement automatisée et (plus important encore) la mise à jour et la maintenance des données plus facilement réalisables.
2. Utilisation de données spatiales structurées pour l'analyse et l'inférence
Il s'agit d'un domaine où il est possible d'automatiser un nombre croissant de tâches, qui pour le moment sont réalisées manuellement et qui nécessitent des données spatiales structurées de bonne qualité en entrée, ainsi que de nombreux exemples de "ce qu'il faut faire" pour entraîner les modèles. Nous prévoyons de réaliser davantage de projets de ce type cette année et peut-être qu'un jour, un géant de l'industrie créera un "grand modèle spatial" mondial équivalent à un grand modèle linguistique, pour représenter l'environnement naturel et bâti mondial - ce qui rendrait ces projets encore plus faciles.
Les drones révolutionnent la capture de données : Un catalyseur pour l'amélioration des données structurelles
L'une des méthodes de capture de ces données non structurées ou semi-structurées consiste à utiliser des drones qui, depuis plusieurs années, sont les vedettes de tous les salons consacrés au matériel géospatial. Ils sont largement utilisés pour l'inspection par des personnes au moyen de caméras, ou pour la capture de nuages de points dans le cadre de projets, mais essentiellement pour la visualisation par des personnes. Si les techniques d'IA décrites ci-dessus amélioraient la gestion automatisée des données spatiales structurées, cela encouragerait l'utilisation de drones non seulement pour l'interprétation humaine, mais aussi pour la capture de données structurées, de sorte qu'une amélioration débloquerait l'autre.
En attendant, il y a toujours un décalage entre les données produites pendant les phases de conception et de construction - conservées dans des formats DAO, des dessins ou des nuages de points - et les données requises par les systèmes de gestion de données à grande échelle. La transmission et l'adoption de ces informations est un facteur déterminant pour les projets auxquels nous avons participé ces dernières années. Nous constatons que la validation et l'intégration automatiques de ces données sont devenues la norme et que de plus en plus d'organisations adopteront cette approche. Certains projets, tels que le registre national des biens souterrains, ne se préoccupent plus de savoir "comment ingérer, intégrer, maintenir et partager ces données", mais plutôt "quels sont les futurs cas d'utilisation de ces données structurées extrêmement précieuses et actualisées"..
Garantir la qualité des données à l'ère de l'automatisation
La croissance de l'automatisation dans les projets de saisie et d'ingestion de données entraîne également la nécessité de mesurer et de protéger la qualité des données afin de s'assurer que l'automatisation n'entraîne pas une perte de leur qualité, ce qui aurait pu être détecté par les personnes chargées de les saisir. L'automatisation de la qualité des données combinée à l'automatisation de la saisie des données signifie que les données sont alors prêtes pour des cas d'utilisation puissants tels que les jumeaux numériques et les villes intelligentes. Ces projets d'agrégation de données à grande échelle impliquent qu'il y aura un meilleur cadre de données à partir duquel ces utilisations intelligentes pourront prospérer, et nous espérons assister à davantage de projets de ce type au cours de l'année à venir. .
Les hubs d'agrégation de données pourraient n'être qu'un tremplin vers une approche de maillage de données fédérées. L'agrégation de données gérées dans de nombreux systèmes différents en les répliquant physiquement dans un hub de données actualisé est très utile pour obtenir des données cohérentes dans une structure cohérente qui fournit un système unique capable de garantir la résilience, la performance, la sécurité et l'accès basé sur les rôles. Mais il y aura toujours un décalage entre ce qui est stocké dans le hub et la dernière version des données qui peuvent être mises à jour toutes les heures. Un modèle fédéré dans lequel les données sont extraites en direct du système de chaque organisation maîtrisant les données fournirait une version encore plus à jour des données..
Relever les défis : Catalogues de métadonnées et fédération de données
À court terme, on utilise généralement des catalogues de métadonnées dans lesquels on peut effectuer des recherches pour trouver les données et les relier à des données pertinentes, qui pourront être diffusées en continu ou téléchargées. Cette approche par catalogue permet aux données de rester dans les systèmes masters, mais elles ne sont généralement pas mises à disposition dans une structure ou un format cohérent, de sorte qu'il est plus difficile d'agréger ces données en vue de leur utilisation.
La fédération de données est plus difficile, en particulier lorsqu'une structure convenue est nécessaire pour l'agrégation virtuelle, parce qu'elle nécessite un accord sur la structure et l'encodage des données ainsi qu'un niveau élevé de maturité technique chez le dépositaire des données pour fournir des services en direct qui sont évolutifs et sécurisés. Bien qu'il existe de bonnes normes pour le partage des données de la part d'organisations telles que l'OGC (Open Geospatial Consortium), et de bons exemples de flux de données en direct utilisés en production, il sera intéressant de voir si une fédération de données sécurisée plus répandue progresse cette année - peut-être pas encore.
Toutes ces capacités reposent sur la connectivité web et sont donc également exposées au risque de piratage et de perturbation. Les techniques d'IA décrites ci-dessus, qui peuvent automatiser les résultats positifs, peuvent également être utilisées par les cybercriminels, les terroristes et les "acteurs étatiques" en vue de résultats négatifs, de sorte que la course aux armes en matière de sécurité se poursuivra à plein régime, avec des mises à jour, des tests et des meilleures pratiques en continu. Nous ne savons pas s'il y aura des changements spectaculaires dans le domaine de la sécurité, mais il s'agira d'une discipline permanente qui devra être poursuivie pour maintenir et améliorer la confiance dans les systèmes afin de garantir qu'ils puissent continuer à être connectés d'une manière fiable et sûre.
Regard vers l'avenir : Automatisation, efficacité et nouvelles opportunités
En résumé, bon nombre de ces développements permettent une plus grande automatisation, et l'automatisation stimule l'efficacité et ouvre de nouvelles opportunités, de sorte que nous devrions voir divers résultats se concrétiser cette année : Les expériences de capture de données automatisées en IA commenceront à montrer si elles sont viables. Les nouveaux projets d'agrégation de données commenceront à automatiser l'ingestion en appliquant des contrôles de données rigoureux et les projets d'agrégation existants commenceront à bénéficier de l'exploitation de leurs données de manière nouvelle et innovante.
Auteur : Seb Lessware, Directeur de la Technologie, 1Spatial
Prochaine étape ?
Contactez l'un de nos experts et parlons de vos enjeux sur les données géospatiales.
Contactez-nous