La valeur des méga-données dans le secteur public : le cas des villes intelligentes

Löfgren, K. & Webster, C. W. R. (2020). The value of Big Data in government: The case of “smart cities”. Big Data & Society, 7(1), 2053951720912775.

 

Contexte

L’émergence des méga-données, également appelées données massives, a ajouté un nouvel aspect à la conceptualisation de l’utilisation des technologies dans la gouvernance numérique. En utilisant le concept de la chaîne de valeur, cette publication analyse l’évolution de la recherche sur la gouvernance numérique et ses liens avec les méga-données. Le discours actuel sur les méga-données corrobore certaines observations faites dans la communauté scientifique sur le gouvernement électronique. Ces connaissances nuancent les impacts des méga-données en matière de prestation de services et de formulation des politiques, tels que les enjeux de la qualité et de la fiabilité des données ou les enjeux éthiques. Les connaissances actuelles peuvent aider à évaluer la valeur des méga-données dans le secteur public et plus particulièrement dans les villes intelligentes.

Définition

La chaîne de valeur catégorise les activités à valeur ajoutée d’une organisation. Elle consiste en un modèle linéaire simple qui identifie une série d’activités essentielles dans la création et la fourniture de biens et de services. Dans un contexte administratif, la chaîne de valeur réfère aux différentes étapes de la formulation d’une politique et de l’implantation de la prestation d’un service qui participent à la création de la valeur. La chaîne de valeur permet d’identifier les problèmes, blocages et échecs dans le processus de production, ce qui facilite l’identification du lien dans la chaîne qui ne fonctionne pas adéquatement.

Résultats
  • Les chercheurs ont identifié quatre étapes composant la chaîne de valeur des méga-données : 1) la collecte des données, 2) le stockage des données, 3) l’analyse et le traitement des données ainsi que 4) l’utilisation des données.
  • La collecte des données se réfère aux enjeux en matière de qualité des données, de biais découlant des inégalités numériques ainsi que des problématiques de consentement et de confidentialité
    • En matière de qualité des données, l’équipe de recherche a observé que certains collecteurs de données sont des agents du secteur public et d’autres sont des parties prenantes du secteur privé. Ces dernières ne sont pas assujetties aux mêmes standards que les agents du secteur public et obéissent souvent à une logique commerciale. De plus, les données collectées à partir d’appareils mobiles dans la ville intelligente sont incomplètes ou imprécises et peu fiables. Enfin, des biais d’échantillonnage peuvent survenir lorsque certaines données sont collectées avec plus d’empressement que d’autres, ce qui affecte la qualité des données.
    • En matière de biais créés par les inégalités numériques, l’équipe de recherche a observé que l’âge est la variable démographique la plus pertinente pour expliquer les inégalités à l’accès aux technologies numériques. Malgré la prolifération des appareils mobiles, il y a encore des inégalités socioéconomiques énormes dans plusieurs villes, ce qui affecte l’accès aux technologies nouvelles pour certains groupes. Aussi, les acteurs commerciaux ne sont généralement pas portés à récolter les opinions et les comportements des groupes plus défavorisés économiquement, puisqu’ils ne représentent pas des clients potentiels attrayants.
    • En matière de confidentialité et consentement, l’équipe de recherche a observé que de nombreuses données sont collectées systématiquement sans obtenir le consentement éclairé des individus.
  • Le stockage des données inclut les problématiques relatives à la sécurité ainsi qu’à l’accès et à la transparence.
  • En matière de sécurité, l’équipe de recherche a observé que la collecte de grandes quantités de données interconnectées en réseau rend les données vulnérables. Un des défis les plus importants est de savoir comment identifier, isoler et protéger les informations personnelles dans des jeux de données non structurés.
  • En matière d’accès et de transparence, l’équipe de recherche a observé que l’accès aux données implique une relation entre des organisations des secteurs public et privé impliquées dans le traitement des données de la ville intelligente. Ainsi, la responsabilité pour la collecte et le partage des données est susceptible d’être répartie entre des acteurs du secteur public et des acteurs du secteur privé.
  • L’analyse des données se réfère à l’incompatibilité des données, à l’interprétation des résultats ainsi qu’au pouvoir laissé aux algorithmes.
  • En matière d’incompatibilité des jeux de données, l’équipe de recherche a observé que la capacité à combiner des formes et des sources de données différentes est extrêmement difficile. C’est un défi qui n’est pas seulement technique, il est aussi organisationnel et légal.
  • En matière de pouvoir des algorithmes, l’équipe de recherche met en évidence que les algorithmes sont généralement opaques et difficiles à analyser ou à interpréter. De ce fait, la conception des algorithmes peut renforcer de subtils biais institutionnels reflétant le contexte dans lequel les acteurs travaillent.
  • L’utilisation des données se réfère aux enjeux de la propriété intellectuelle et à la surveillance.
  • En matière de propriété intellectuelle, l’équipe de recherche a observé que de tels enjeux sont liés aux litiges juridiques concernant les droits d’auteur sur les logiciels, le code source, les algorithmes et les bases de données. En plus des questions de propriété intellectuelle et de possession des données, la question de la gouvernance des différents ensembles de données se pose.
  • En matière de confidentialité et de surveillance, l’équipe de recherche a observé que l’enjeu de la confidentialité individuelle est le plus important à la fin de la chaîne de valeur. Les promoteurs des méga-données contribuent à créer le mythe selon lequel en raison de leur volume important, les méga-données sont automatiquement anonymisées. La « réidentification » est toutefois une menace reconnue pour la confidentialité individuelle. De plus, le recyclage et la réutilisation des données entrent en contradiction avec le principe fondamental d’informer la personne concernée sur la finalité pour laquelle les données ont été collectées et d’obtenir le consentement pour partager les informations.
Messages clés pour la politique et la pratique
  • La confidentialité est importante durant toute la chaîne de valeur des méga-données et doit être centrale dans la conception et l’extension des processus de méga-données.
  • Les préoccupations liées aux méga-données ne sont pas systématiquement associées à la capacité technologique. Elles peuvent être liées à la croyance que les progrès technologiques sont neutres et ignorent les institutions politiques, sociales et économiques.
  • Les éléments soulevés dans cette publication ne sont pas des arguments pour relativiser le potentiel de l’analyse des données dans les villes intelligentes. Elles indiquent le besoin d’obtenir des recommandations et des stratégies pour gérer la révolution des méga-données selon l’intérêt public.
  • Les méga-données ne sont pas fatalement problématiques, mais leur environnement institutionnel et leurs conséquences doivent être compris afin de créer de la valeur pour la société et les individus.
Méthode et limites de la recherche
  • Cette publication est un article conceptuel sur les méga-données en contexte gouvernemental et de villes intelligentes.
  • Aucune limite à la recherche n’est identifiée.
Financement de la recherche

Cette publication fait partie du projet de recherche SmartGov : Smart Governance of Sustainable Cities financé par les conseils de financement au Royaume-Uni, aux Pays-Bas et au Brésil. Les auteurs de la présente publication ont reçu du financement de la part du conseil de financement du Royaume-Uni.