Lines image

US Census économise 5 milliards $ grâce à l’intégration automatisée de données

Comme exigé par la Constitution, le Bureau du Recensement des États-Unis (US Census Bureau) réalise tous les dix ans la plus importante activité civile de la nation.

Le projet comprend le comptage et le profilage d’une population de plus de 318 millions d’individus ainsi que la vérification de 135 millions d’adresses. Il permet d’offrir une représentation politique précise et correcte à la Chambre des représentants. En plus de cette valeur politique, le recensement sert de base lors de l’allocation des fonds fédéraux, équivalant à 400 milliards $ par an.

Le prochain recensement aura lieu en 2020, et les plans sont en cours de déploiement. Tim Trainor, Chef de la Division de Géographie du Bureau du Recensement des États-Unis, explique : « Ce recensement présentera plus de modifications que lors des nombreuses décennies précédentes ».

Le coût d’intégration de données de 3 200 partenaires

Les données géospatiales sont à la base de toutes les activités du Bureau. Tim continue :

Le recensement est composé de 34 opérations différentes, et la plupart de celles-ci dépendent de la géographie, qui est du ressort de la Division de la Géographie.

En plus des adresses, le Bureau requiert  des rapports précis sur l’intégralité du réseau routier national ainsi que sur les frontières entre les différentes administrations étatiques, locales et tribales. Les États-Unis représentent 40 000 administrations distinctes, chacune avec ses propres limites et allocations potentielles de fonds fédéraux.

Afin d’élaborer cette plateforme d’information géographique, le Bureau rassemble les données provenant de 3 200 comtés et autres organisations. L’identification des modifications, l’intégration des nouvelles informations et le maintien d’une mise en adéquation correcte de tous ces ensembles de données constituent un défi majeur pour le Bureau. Le tout nécessite une importante quantité de ressources et beaucoup de temps.

L’intégration de données était une procédure essentiellement manuelle », explique Tim. « La gestion d’une telle quantité de données était extrêmement chronophage.

Cet ensemble de données de base (appelé MAF/TIGER, pour Master Address File / Topologically Integrated Geographic Encoding and Referencing) doit être créé puis validé.

Lors du recensement de 2010, le Bureau avait employé 140 000 personnes pour parcourir à pied ou en voiture toutes les rues du pays afin de valider les rapports compilant les adresses.

Plus tard, il avait encore fait appel à 600 000 individus pour effectuer un suivi auprès des non-répondants, et assurer la participation de chacun, tel qu’exigé par la loi, ou identifier les logements vides. Le Bureau ne dispose que de peu de temps pour mener à bien la tâche et présenter les résultats du recensement, de sorte que ce travail de suivi devait être clôturé rapidement.

Globalement, le volume de travail manuel requis pour l’intégration, la validation et le suivi après le recensement était colossal. Le coût total du recensement des États-Unis de 2010 a été de 12 milliards $.

Si le Bureau ne changeait pas de méthode, le coût de celui de 2020 aurait atteint 17 milliards $.

La procédure nécessitait donc une technique plus efficace.

Automatisation de la validation et de l’intégration des données

Le Bureau a identifié 4 volets d’innovation en vue d’améliorer la préparation et l’exécution du recensement :

  1. Restructurer l’opération de prospection des adresses ;
  2. Perfectionner les méthodes de collecte de réponses, permettre la collecte en ligne et par téléphone tout en conservant l’approche traditionnelle via un formulaire papier ;
  3. Utiliser les rapports déjà existants pour enrichir la base de données ;
  4. Tirer un meilleur profit de la technologie pour gérer l’infrastructure.

Pour étayer ces derniers, Tim désirait rationaliser et automatiser les procédures de gestion des données géographiques. Cela faisait longtemps que nous recherchions des outils », explique-t-il. « Nous en avons mis quelques-uns au point, mais la procédure restait très manuelle.

Tim et son équipe ont alors entamé une collaboration avec 1Spatial. L’entreprise a recommandé une solution dérivée de 1Integrate qui utilise une technologie permettant d’automatiser la gestion des données sur base de règles définies et gérées par l’utilisateur. Ensemble, 1Spatial et la Division de Géographie ont réalisé une procédure automatisée de fusion des données dans le but de gérer l’acceptation et l’intégration des informations soumises par les 3 200 partenaires du Bureau.

La solution identifie automatiquement les différences entre les données soumises par les nouveaux partenaires et celles existant au sein du MAF/TIGER. Le logiciel génère une panoplie de propositions de modifications reprenant tous les changements suggérés par les nouvelles données. Une fois acceptées par les utilisateurs du Bureau, ces suggestions sont automatiquement gérées par 1Integrate afin de mettre à jour la base de données MAF/TIGER.

Ce haut degré d’automatisation permet au Bureau de s’occuper d’autres fichiers des partenaires et de travailler avec plus de rapidité. En conséquence, la base de données MAF/TIGER est plus précise et plus à jour.

L’un des éléments qui ressort de notre collaboration avec 1Spatial est la particularité de cette approche de gestion des données », explique Tim. « Nous constatons de vraies améliorations en matière de rationalisation et d’automatisation de nos procédures, et nous gérons nos données de manière plus efficiente et efficace. En fin de compte, nous atteignons plus facilement nos quatre objectifs.

Des rapports plus actualisés pour moins de prospection sur le terrain

Un meilleur point de départ diminue les besoins en prospection sur le terrain pour le recensement de 2020. Tim estime que seulement 25 % des 140 000 agents de 2010 seront nécessaires. Le reste de la validation sera effectué via des opérations de bureau en comparant le MAF/TIGER à des photographies aériennes – une méthode bien plus efficace.

Enrichir le MAF/TIGER avec des données commerciales

L’automatisation de la procédure d’intégration ou de fusion des données permet au Bureau d’enrichir aisément le MAF/TIGER à l’aide d’ensembles de données supplémentaires, tels que les rapports « Gone Away » du service postal des États-Unis ou les données du réseau routier provenant de fournisseurs commerciaux. L’ajout de ces nouvelles informations réduit davantage le besoin de prospection sur le terrain avant le début du recensement et lors du travail de suivi.

L’innovation génère des économies

Les quatre volets d’innovation du Bureau du Recensement des États-Unis rendront le recensement de 2020 plus simple et plus efficace que les précédents. Nous attendons une économie d’un peu plus de 5 milliards $ grâce à l’innovation », explique Tim. « C’est-à-dire que le coût sera presque équivalent à celui du recensement de 2010. C’est une belle réussite. L’équipe de Tim et 1Spatial continuent l’exploration de nouvelles pistes qui pourraient mener à des économies dans d’autres volets du recensement de 2020 grâce à l’automatisation basée sur des règles des procédures de gestion de données.

PDF

Newsletter 1Spatial

Soyez informés des dernières actualités et des prochains événements du Groupe 1Spatial grâce à notre Newsletter.

Inscrivez-vous maintenant