Lines image

Pourquoi une approche hybride basée sur des règles et l'apprentissage automatique fournit une intelligence artificielle puissante pour la gestion des données de référence relatives aux lieux.

Par Seb Lessware, CTO

Avant de nous pencher sur l'utilisation de l'intelligence artificielle (IA) pour gérer les données, voyons d'abord ce que l'on entend par IA et examinons certaines des techniques utilisées aujourd'hui.

Dans sa définition la plus simple, l'IA est la capacité d'un ordinateur à effectuer des tâches généralement associées à l'intelligence humaine, par exemple raisonner, découvrir des modèles, généraliser des connaissances et apprendre par l'expérience. L'IA peut cependant être une expression trompeuse et peut-être que l'intelligence simulée ou même les décisions simulées en seraient une meilleure description.

Traditionnellement, les systèmes experts ou basés sur des règles ont toujours été considérés comme faisant partie de l'IA, bien qu'aujourd'hui, lorsque les gens pensent à l'IA, ils fassent plutôt référence au Machine Learning (Apprentissage Automatique). La différence entre les deux approches réside dans le fait que, dans un système à base de règles, les règles sont explicitement définies par des experts, tandis que dans Machine Learning, les règles sont déduites automatiquement de schémas potentiellement subtils dans les données à partir d'approches telles que les réseaux neuronaux ou le Deep Learning.

Il existe un grand nombre d'applications émergentes pour l'Intelligence Artificielle, par exemple l'interprétation de flux vidéo provenant de drones qui effectuent des inspections visuelles d'infrastructures telles que des pipelines, l'organisation d'agendas personnels et professionnels, la réponse à des demandes simples de service client en ligne, la synchronisation avec d'autres systèmes intelligents pour effectuer des tâches telles que la réservation d'un hôtel à une heure et un endroit appropriés, la génération d'un modélisation du monde à partir d'images satellite, et la liste est encore longue.

Avec des approches en Machine Learning, le résultat dépend fortement de la qualité et de la cohérence des données : si un système apprend à partir d'exemples, ces exemples doivent être irréprochables, justes et impartiaux. C'est le premier aspect pour lequel les approches basées sur des règles complètent le Machine Learning : les règles peuvent être utilisées pour valider et nettoyer les données constituant les exemples afin de s'assurer qu'elles sont suffisamment cohérentes, complètes et correctes pour permettre l'apprentissage.

Les processus de Machine Learning tels que les réseaux neuronaux sont en fin de compte basés sur des nombres; toutes les informations en entrée et en sortie du système sont des ensembles de nombres représentant des mots dans une langue, des pixels de couleur dans une image ou toute autre donnée traitée. Dans le cas du Location Master Data Management, les données géospatiales sont un ingrédient clé qui offre des possibilités supplémentaires de corrélation et de mise en correspondance de différentes données, par exemple pour identifier qu'un enregistrement dans un système est le identique dans un autre système. Les processus basés sur des règles peuvent être utilisés pour encoder les données géospatiales sous la forme de nombres qui seront utilisés par le processus du ML. Ces nombres représentent des métriques telles que la taille, la forme, la proximité ou d'autres interactions géospatiales avec les données environnantes, ce qui permet à l'approche fondée sur des règles d'ajouter un deuxième aspect aux processus de Machine Learning : l'encodage du contexte géospatial en tant qu'entrée pour l'apprentissage automatique.

Le troisième aspect concernant l'intégration de techniques basées sur des règles aux techniques de Machine Learning concerne la prise de décision de haut niveau. Également appelée Intelligence Artificielle neuro-symbolique, cette approche reconnaît que la combinaison des règles et de l'apprentissage automatique est plus puissante car elle permet de combiner la logique de guidance d'une personne définissant explicitement des règles avec les avantages de l'inférence approximative de l'apprentissage automatique à partir de nombreuses données. Par exemple, une voiture autonome utiliserait l'apprentissage automatique pour interpréter à partir de ses capteurs qu'un objet situé devant elle est un piéton. Mais la décision selon laquelle "il faut éviter les piétons" ne serait pas déduite de l'analyse des images des autres conducteurs ; il s'agirait d'une règle explicite fournie par un concepteur humain.

Le Master Data Management consiste à s'assurer que les données d'une organisation sont soit centralisées, soit au moins cohérentes et synchronisées entre différents systèmes. Ceci est particulièrement important lorsque les normes des données d'un secteur doivent être respectées afin d'obtenir l'interopérabilité des données externes. Pour ce faire, les données doivent être nettoyées et mises en correspondance avant d'être fusionnées ou synchronisées. Ces tâches sont plus efficaces si des techniques d'IA (basées sur des règles et sur l'apprentissage automatique ou Machine Learning) peuvent être utilisées.

Il existe de nombreuses raisons pour lesquelles les organisations choisissent d'investir dans une solution "basée sur des règles" dans le cadre de leur approche en IA et en Location Master Data Management.

Nous allons examiner quelques-uns de ces avantages et aborder certains aspects de conception concernant l'utilisation du moteur de règles de 1Spatial de cette manière. 

Transparence et traçabilité

Bien que l'IA "basée sur des règles" soit une méthode puissante d'automatisation des processus de gestion des données, c'est aussi l'une des techniques d'intelligence artificielle les plus simples à adopter pour une entreprise.

Lors de la validation des données, une règle doit répondre à des questions du type "Étant donné un objet, qu'est-ce que cette règle exige de cet objet pour qu'il soit valide, éventuellement en le vérifiant par rapport à d'autres objets ?". Lors de la modification des données, par exemple lors du nettoyage, de la mise en correspondance, de la fusion ou de l'inférence, une règle doit spécifier "Étant donné un objet, qu'est-ce qui doit être modifié dans l'objet ou dans d'autres objets connexes ?".

Cela signifie que les règles peuvent être simples et - contrairement aux processus de Machine Learning - transparentes, car elles nous indiquent ce qui constitue un objet valide ou quel traitement a été appliqué à un objet, ce qui permet de retracer facilement ce que la règle a produit à partir de sa définition. Les solutions 1Spatial permettent de créer des règles en utilisant une approche sans code, ce qui signifie qu'elles sont faciles à créer, à gérer, à interpréter et à faire partager entre équipes. En majorité, n'importe qui dans l'entreprise peut comprendre une règle, ce qui crée une meilleure transparence. L'interface sans code signifie qu'aucune programmation n'est nécessaire et qu'il n'y a pas de temps d'attente pour que les développeurs apportent les changements requis par l'équipe chargée des données. Pour en savoir plus sur la façon dont une approche "basée sur des règles" est utilisée dans la gestion des données pour valider et améliorer les données, consultez notre récent blog.

Permettre le Machine Learning géospatial

L'approche neuro-symbolique qui consiste à utiliser des règles en même temps que le Machine Learning apporte les avantages des deux : une logique explicite, traçable et transparente à côté de l'inférence floue pour les aspects subtils et difficiles à encoder sous forme de règles. Les avantages que les règles apportent à l'apprentissage automatique, décrits ci-dessus, signifient qu'il est désormais possible d'exploiter l'apprentissage automatique pour les données géospatiales, mais avec la supervision transparente de règles explicites.

IA rentable et réussie dans les projets Master Data Management

La décision de libérer la puissance des techniques de Machine Learning sur les données peut échouer en raison de données de mauvaise qualité, biaisées ou incomplètes. L'utilisation de règles automatisées permet d'assurer une application réussie du Machine Learning sans nécessiter un nettoyage manuel coûteux des données. Cela peut réduire considérablement les coûts et les risques liés au lancement de projets d'apprentissage automatique et garantir que le processus est facilement reproductible lorsque les données évoluent. Cela permet aux organisations de libérer de puissantes techniques de rapprochement pour le Master Data Management sans être bloquées par des tâches de nettoyage manuel des données, qui sont généralement coûteuses, longues et non reproductibles.

Les règles comme outil de gestion des connaissances

Les règles répétables et contrôlables définies dans l'environnement centralisé et collaboratif du moteur de règles présentent d'autres avantages, car elles deviennent un centre de gestion des connaissances centralisé dans lequel les connaissances ne sont pas enfermées dans la mémoire humaine ou cachées dans le code d'un programme. Ces règles peuvent être adaptées à une organisation, mais elles peuvent aussi refléter les normes d'un secteur d'activité et être partagées entre les organisations.

En conclusion, les règles sont une bonne chose pour le Location Master Data Management ; à la fois pour permettre et soutenir une approche neuro-symbolique de l'Intelligence Artificielle afin de faire appel au Machine Learning pour obtenir de meilleurs résultats, mais aussi en tant qu'approche par système expert, traçable et répétable pour la synchronisation et la gestion de la qualité des données.

Contactez-nous

Ces sujets vous intéressent et vous voulez en savoir plus sur notre approche, prenez-contact :

Prenez-contact