Nuvola apps important.png Attention, suite à une faille de sécurité, quelques liens vers les serveurs d'exploration sont désactivés.

-

Pour une politique ambitieuse des données publiques (2011) chapitre 1 : Différence entre versions

De Wicri France
imported>Eric Goettmann
imported>Eric Goettmann
(1. La donnée au coeur des nouveaux usages)
Ligne 79 : Ligne 79 :
 
http://www.moma.org/interactives/exhibitions/2008/elasticmind/</ref>.
 
http://www.moma.org/interactives/exhibitions/2008/elasticmind/</ref>.
  
Au-delà de l’incidence culturelle de ce phénomène19, la réappropriation du local et de l’espace géographique par le biais du Web et du mobile annonçait l’importance croissante de la donnée informatique géographique, et, audelà, l’émergence du phénomène culturel du remix et de la réutilisation des données.
+
Au-delà de l’incidence culturelle de ce phénomène<ref>Lessig, L. 2009. Remix : Making art and commerce thrive in the hybrid economy. http://remix.lessig.org/</ref>, la réappropriation du local et de l’espace géographique par le biais du Web et du mobile annonçait l’importance croissante de la donnée informatique géographique, et, audelà, l’émergence du phénomène culturel du remix et de la réutilisation des données.
 +
 
 +
 
  
  

Version du 11 août 2011 à 15:32

Logo ponts paristech.png
Pour une politique ambitieuse des données publiques :
Les données publiques au service de l’innovation et de la transparence


Chapitre I. Données publiques : émergence d'une question sociétale
RapportDonnéesPubliques2011.png


Les évolutions technologiques récentes ont rendu possible le partage rapide et aisé de tous types de données. Elles réactivent, sous un jour nouveau, le débat déjà ancien sur l’accès aux documents administratifs, maintenant sous forme électronique et bien plus aisément diffusables. L’Internet a fait apparaître une économie des données. Les stratégies de croissance des acteurs du Web, via l’ouverture de leurs interfaces de programmation (API), ont illustré le potentiel de la réutilisation des données, et suscité des attentes similaires des développeurs vis-à-vis du secteur public. Ils exercent une pression pour que les États, en facilitant l’accès à leurs informations, s’insèrent et tiennent leur rang dans ce « Web des Données ». Ces ruptures technologiques ont accompagné par ailleurs une prise de conscience de l’importance des données produites par l’administration et le secteur public. La possibilité novatrice de réutiliser ces données sous forme brute, pour leur trouver de nouveaux usages utiles et instructifs, a abouti à l’émergence de la question des données publiques en tant que véritable question sociétale.


1. La donnée au coeur des nouveaux usages

Internet et les ruptures technologiques récentes on fait apparaître une nouvelle « économie des données ».


(i)Le Web est structuré autour de l'échange de données

Le génie informatique (computer science dans le monde anglo-saxon) est défini comme la manipulation algorithmique de données et de leurs structures de représentation. Le Web, avant d’être un phénomène social, est une architecture logicielle [1] conçue par un chercheur britannique en physique des hautes énergies au CERN, Sir Tim Berners-Lee [2]. Elle avait pour but de faciliter l’accès et le référencement de documents en symbolisant leur manipulation sous forme de phrases, liant verbes intuitifs (lire, afficher, remplacer, effacer) et métadonnées d’adressage universel (URL ou Uniform Resource Locator [3]).

Bien que basées sur un réseau d’échange de documents, les techniques du Web ont naturellement développé un tropisme de plus en plus marqué vers les données elles-mêmes. L’introduction des bases de données relationnelles dans les outils de développement a permis la création de sites dynamiques, c’est-à-dire dont les pages s’adaptent aux circonstances (évolutions de prix, listes d’objets changeants, « unes » de journaux électroniques mises à jour fréquemment). À partir de 2004, une technique émergente a vu le jour qui consiste à utiliser les fonctionnalités de scripting [4] présentes dans les navigateurs pour permettre la mise à jour en temps réel de pages déjà chargées, en allant chercher en tâche de fond des données remises à jour. Nommée AJAX [5] pour JavaScript Asynchrone et XML (Asynchronous Javascript And XML), à partir du langage de scripting JavaScript et du format d’échanges de données XML, cette technique à la croisée de différentes technologies Web est reconnaissable derrière des applications Web hautement réactives dont les pages ont rarement besoin d’être rafraîchies – telles que GMail [6], Quora [7] ou Facebook [8].

Pour supporter cette technologie, de plus en plus d’applications en ligne ont développé à la fois deux interfaces : une interface graphique classique accessible aux utilisateurs à travers leur navigateur, et une interface exclusivement consacrée aux machines, qui permet justement au moteur de scripting du navigateur de récupérer des données à la volée. C’est cette interface, qu’on peut se représenter comme un protocole d’échange de données de machine à machine, qu’on appelle interface de programmation ou API (sigle anglophone pour Application Programming Interface).


(ii)La donnée, monnaie d'échange et levier d'influence sur le Web

Les API sont devenues un véritable outil stratégique pour les sociétés de services en ligne [9]. Par exemple, c’est dans une large mesure grâce à l’ouverture de leur API [10] que Twitter a pu permettre à une communauté de développeurs de se créer, et de multiplier les applications permettant d’utiliser le service en dehors du site Web principal (notamment dans les premiers jours de l’App Store d’Apple durant l’été 2008). Ce grand nombre d’applications a servi de « force de vente » virtuelle pour Twitter, et est un des facteurs principaux qui expliquent son succès populaire.

Bien documentées et basées sur des standards acceptés (tels que JSON ou XML) pour éviter les problèmes d’interopérabilité, ces interfaces s’adressent à des développeurs informaticiens. Selon le degré d’ouverture (fonction des choix stratégiques de la société) et les conditions de licences (souvent conçues pour encourager la réutilisation) consentis à ces derniers, ils peuvent extraire, éventuellement modifier, et transformer les données du service Web en question, pour les réutiliser, notamment à la construction de nouveaux services ou de nouvelles applications.

L’échange est mutuellement bénéfique : le nouveau service, consommateur de données,gagne en utilité pour ses utilisateurs, et le système producteur voit sa position compétitive renforcée par la dépendance accrue du marché à ses services. En l’essence, c’est une transaction de marché où l’accès à des données est échangé contre leur diffusion à un nouveau public ou dans un nouveau contexte.

L’exposition d’une interface API est aujourd’hui une étape presque obligée du développement d’un nouveau produit en ligne. La généralisation de ce phénomène est d’une grande importance pour la question des données publiques, car elle a permis de prendre conscience de l’omniprésence des données derrière les services qu’utilisent quotidiennement les internautes.

En un mot, « l’économie des données » s’est construite autour de l’échange et de la fluidité sur le Web : les données ont souvent plus de valeur comme outil d’échange et d’influence qu’isolées au sein des entrepôts de données des entreprises [11].


(iii)Avec le Web 2.0, la données devient collective

Un corollaire de la montée en puissance de la donnée est son rôle de liant social sur le Web. En particulier, avec l’apparition de phénomènes de collaboration de masse tels que Wikipedia, on s’aperçoit que l’échelle d’échanges rendue possible par Internet ouvre des possibilités insoupçonnées jusqu’alors.

Des services tels que Delicious (site de partage de bookmarks, qui agrège les catégories dans lesquelles les utilisateurs rangent différents liens, et permet ensuite de trouver des liens par catégorie d’intérêt) ou Flickr (qui permet de chercher des photographies libres de droits sur un sujet particulier, en se basant sur les tags de catégorisation produits par l’ensemble des utilisateurs) ont ainsi profité de ce phénomène de folksonomy, la taxonomie par les foules ou classification par l’intelligence collective [12].

D’autres services tels qu’Amazon ou Netflix ont, eux, profité de la masse d’utilisateurs se servant de leurs sites pour en extraire des modèles de préférences des consommateurs, qui leur permettent de faire des recommandations hautement personnalisées selon les goûts de leurs clients.

L’un des enseignements de la nouvelle incarnation sociale et collaborative du Web, c’est que la valeur des données n’est pas intrinsèque, mais dérive de leur agrégation, de leur recoupement, de leur analyse et de la réutilisation qui en est faite.

Le Web a ainsi mis à jour une économie des données, qui joue un rôle de monnaie d’échange parmi les entreprises d’Internet et les services en ligne.


(iv)Données géographiques et "mash-ups"

L’autre développement technologique qui a conduit à prendre conscience de l’importance des données, c’est la démocratisation de l’information géographique. Google indique par exemple que son approche est « d’utiliser la géographie pour organiser toute l’information mondiale, qu’elle soit géographique ou non. C’est un principe d’organisation qui sera utilisé pour mieux comprendre l’information. » [13].

Si les briques technologiques sont disponibles pour utiliser et manipuler la donnée géographique à loisir, ou même pour l’utiliser pour structurer d’autres données, le défi qui reste posé est celui de la constitution d’une véritable infrastructure des données géographiques. Ces données sont aujourd’hui accessibles en nombre et de qualité, mais les repérer et les réutiliser peut rester obscur et complexe [14].

Conséquence récente des évolutions du Web, des applications cartographiques puissantes réservées jusque-là à des experts sont devenues accessibles à tous. Le monde du Web collaboratif a largement repris à son compte la possibilité de représenter des données sur des cartes. Grâce à l’ouverture gratuite (dans des limites relativement larges de volume) de son API, Google Maps est devenu une base de choix pour la création de « mashups », ces applications Web combinant « différentes sources au sein d’une seule plateforme, (…) l’une des facettes du design collaboratif sur le Web [15] ». Cette nouvelle tendance a connu un tel succès au tournant des années 2006 à 2008 que le prestigieux Museum of Modern Art de New York y a consacré une exposition phare [16].

Au-delà de l’incidence culturelle de ce phénomène[17], la réappropriation du local et de l’espace géographique par le biais du Web et du mobile annonçait l’importance croissante de la donnée informatique géographique, et, audelà, l’émergence du phénomène culturel du remix et de la réutilisation des données.




Notes

  1. World Wide Web Consortium (W3C), 2010, HTTP – Hypertext Transfer Protocol Overview – draft 09. [1]
  2. World Wide Web Consortium (W3C). Sir Tim Berners- Lee: Bio. Téléchargée le 10 janvier 2011. [2]
  3. World Wide Web Consortium (W3C). 1994. Uniform Resource Locators (URL) : A Syntax for the Expression of Access Information of Objects on the Network. [3]
  4. Capacité d’un navigateur à faire tourner dynamiquement un programme qui agit en temps réel sur la page affichée. Par exemple, une page qui affiche l’heure repose sur un script qui demande au navigateur de mettre à jour l’heure, les minutes et les secondes à mesure qu’elles s’écoulent. Dans le cas d’un service de courrier en ligne, c’est souvent un script qui réagit au click sur l’intitulé d’un email et change l’affichage pour détailler le contenu du mail plutôt que celui de la boîte de réception. C’est aussi un script qui vérifie automatiquement l’arrivée de nouveaux courriers en tâche de fond, et réintègre éventuellement ces nouvelles données dans le corps de la page affichée.
  5. Garrett, J.J. 18 février 2005. « Ajax : A New Approach To Web Applications ». [4]
  6. GMail, service de boîte de courrier électronique en ligne de Google, Inc. [5]
  7. Quora, Inc., site de questions et réponses dynamique caractérisé par l’expertise pointue de sa communauté d’utilisateurs, fondé en 2009 et qui a connu une très forte croissance en 2010 [6]
  8. Facebook, Inc., le réseau social dominant qu’on ne présente plus, fondé par Mark Zuckerberg en 2004 et approchant 600 millions d’utilisateurs début 2011 [7]
  9. Shah S., 28 August 2010, « Cannibalize Business Development by Popularizing your API » : http://shaivalshah.com/cannabilize-business-developmentby-populariz
  10. Entretien le 12 novembre 2010 avec Henri Verdier, Président de Cap Digital
  11. Ed Parsons - Geospatial Technologist for Europe, Middle East and Africa chez Google, au séminaire « Innovations et développement du secteur de l’information géographique » organisé le 5 octobre 2009 à la Grande Arche de la Défense par le Conseil National de l’Information Géographique (CNIG), l’AFIGÉO et l’Institut des Sciences et des Techniques de l’Équipement pour le Développement (ISTED)
  12. Tapscott, D. and Williams, A. 2006. Wikinomics : How Mass Collaboration Changes Everything
  13. Ed Parsons – Ibid.
  14. Voir l’intervention de Max Craglia, coordonateur technique d’Inspire pour la Commission Européenne (centre commun de recherche) au séminaire « Innovations et développement du secteur de l’information géographique » organisé le 5 octobre 2009 à la Grande Arche de la Défense par le Conseil National de l’Information Géographique (CNIG), l’AFIGÉO et l’Institut des Sciences et des Techniques de l’Équipement pour le Développement (ISTED)
  15. Google Earth mashups 5 of 14, in « Design and the Elastic Mind. » Museum of Modern Art. New York, NY. 2008. http://www.moma.org/interactives/exhibitions/2008/elasticmind/#/98/
  16. « Design and the Elastic Mind. » Museum of Modern Art. New York, NY. 2008. http://www.moma.org/interactives/exhibitions/2008/elasticmind/
  17. Lessig, L. 2009. Remix : Making art and commerce thrive in the hybrid economy. http://remix.lessig.org/