Nuvola apps important.png Attention, suite à une faille de sécurité, quelques liens vers les serveurs d'exploration sont désactivés.

-

Pour une politique ambitieuse des données publiques (2011) chapitre 8

De Wicri France
Logo ponts paristech.png
Pour une politique ambitieuse des données publiques :
Les données publiques au service de l’innovation et de la transparence


Partie 3 - Comment favoriser la réutilisation des données publiques ?
Chapitre VIII. Seize propositions pour une politique ambitieuse des données publiques
RapportDonnéesPubliques2011.png
RapportDonnéesPubliques2011.png

À partir des leçons des premières expériences d’Open Data et des scénarios que nous avons détaillés au chapitre précédent, nous proposons trois axes stratégiques pour une politique ambitieuse qui viserait à réaliser le plein potentiel de la réutilisation des données publiques.

Simplifier pour accélérer 
réduire les efforts nécessaires d’une part à la diffusion des données par les acteurs publics, et d’autre part à leur réutilisation, afin d’accélérer le développement de services utiles à partir des données publiques.
Faciliter l’expérimentation 
adapter les conditions de réutilisation des données publiques pour faciliter l’expérimentation par les citoyens, les associations et la communauté des développeurs et des entrepreneurs.
Favoriser l’émergence d’un écosystème 
favoriser l’émergence d’un écosystème de producteur et de réutilisateurs de données publiques en France, autour de la mission Etalab et du futur portail data.gouv.fr.

Ce chapitre suggère des modalités concrètes de développement de ces trois axes stratégiques. Il présente seize propositions issues de notre analyse, qui visent à faciliter la réutilisation la plus large des données publiques et à permettre la réalisation la plus rapide possible de l’ensemble des bénéfices que la société peut en attendre.

 

Simplifier pour accélérer

Faciliter la diffusion de données publiques

Proposition 1 - Formaliser les bonnes pratiques de diffusion des données publiques attendues par la communauté des réutilisateurs

Expliciter l’effort minimal attendu des différents acteurs publics.
Pour répondre aux préoccupations très fortes des institutions publiques amenées à diffuser leurs données en ligne pour la première fois, il serait souhaitable de rappeler que l’effort demandé est minimal. Dans la grande majorité des cas, la mise en ligne des données n’a pas de raison de mobiliser excessivement les agents du service, qui plus est en regard des économies de temps qui découleront de la possibilité pour les citoyens d’accéder aux données directement sans devoir établir une demande officielle auprès de l’institution.
Assurer la formation des agents et leur accès à des guides clairs et explicatifs.
Dans la continuité du travail de préfiguration réalisé par l’APIE, nous suggérons de poursuivre l’effort de mise à jour de guides et documents à destination des agents. Notamment, détailler les raisons qui poussent à vouloir mettre en ligne les données publiques, l’importance des formats réutilisables, les étapes à suivre et les grands enjeux juridiques, administratifs et techniques serait d’une aide importante aux institutions publiques amenées à diffuser des données.
Simplifier les formats de diffusion.
Nous suggérons d’expliciter clairement la simplicité potentielle du processus de mise en ligne de données. De simples fichiers CSV suffisent à participer activement à la mise en ligne des données publiques, qui n’a donc pas lieu de mobiliser outre mesure les ressources techniques et humaines de l’administration.

Réduire les barrières à la réutilisation

Proposition 2 - Mettre en cohérence les conditions légales de réutilisation des données issues de sources différentes

Établir une « licence données ouvertes » pour réutilisation gratuite qui s’appliquerait le plus largement possible.
Nous suggérons d’harmoniser le plus possible les licences utilisées au sein des différentes administrations de l’État, des établissements publics et des collectivités territoriales. Il est nécessaire d’éviter la prolifération de licences, qui rendraient la réutilisation de données issues de sources différentes trop complexe.
Nous suggérons pour cela un travail d’harmonisation vers une même licence de réutilisation à titre gratuit, la « Licence Données Ouverte » de l’État, qui serait utilisée par défaut par les administrations centrales, déconcentrées, et dont les collectivités territoriales pourraient s’inspirer.
Appliquer cette licence de la manière la plus large aux données disponibles sur data.gouv.fr permettrait de simplifier substantiellement le régime juridique qui s’applique à ces données.
Ce travail pourrait être mené en concertation entre les différents acteurs et sur la base du travail effectué par le Ministère de la Justice (licence « Information Publique »), des conditions générales d’utilisations rappelées par l’APIE, et des licences issues du monde du libre (par exemple licence ODbL).
Encourager un marquage graphique des droits de réutilisation.
Afin de permettre aux réutilisateurs d’identifier facilement les données réutilisables et les conditions qui s’y appliquent, nous suggérons de généraliser le marquage des fiches descriptives de jeux de données disponibles à la réutilisation avec des pictogrammes spécifiques, sur le modèle du marquage « Information Publique » du ministère de la Justice, qui expliqueraient les droits afférents à ces données.

Proposition 3 - Encourager l’utilisation de formats facilement réexploitables, qui respectent les normes d’interopérabilité et de « lisibilité machine »

Privilégier les formats ouverts respectant les normes d’interopérabilité.
L’utilisation d’un format fermé et difficilement réexploitable peut limiter très fortement l’utilité d’un jeu de données pour ses réutilisateurs, en rendant sa réutilisation trop complexe.
Communiquer sur l’importance des formats réexploitables auprès des agents. 
Il est crucial que les agents de l’État en charge de l’accès aux données publiques soient bien sensibilisés à cette question, et disposent de bases de connaissances et d’outils simples pour privilégier l’utilisation de formats ouverts et respectant les normes d’interopérabilité.
Maintenir une liste de formats correspondants à ces critères.
À cet effet, il sera utile de définir une liste des formats facilement lisibles par des machines, à destination des agents.
Les institutions publiques privilégieront idéalement les formats simples et non propriétaires de type CSV (simples valeurs séparées par des virgules, outil standard parmi les tableurs), et éviteront de communiquer des jeux de données au format PDF (qui rend les données difficilement manipulables) sauf pour des rapports de type traitement de texte.
Au-delà des recommandations du Référentiel Général d’Interopérabilité[1] (RGI) aux administrations, des évolutions seront à prévoir dans la perspective de la réutilisation des données publiques. Il est à noter par ailleurs que la Commission européenne est en discussions avec le W3C dans le cadre d’une réflexion liée aux questions de standards.[2]
Assurer la pérennité des ontologies et structures de données dans le temps.
Une des difficultés liées à la réutilisation de jeux de données remis à jour fréquemment tient aux changements potentiels d’ontologie ou de structuration des données qui peuvent intervenir dans le temps. Dans le cas des jeux de données mis à jour périodiquement, les administrations productrices devront veiller à reproduire le format et la structure de données utilisée, afin d’en faciliter une réutilisation automatisée.

Anticiper les nouveaux usages des données publiques

Proposition 4 - Faire en sorte que chaque contrat public clarifie à l’avenir le financement de l’ouverture et les droits de réutilisation liés aux données produites dans son cadre

Clarifier le financement de l’ouverture et les droits de réutilisation de données dans les contrats publics. 
Une quantité importante de données d’intérêt public sont générées par des acteurs qui sortent du champ de la loi CADA de 1978. Plutôt qu’une modification de la réglementation qui viserait à intégrer l’ensemble des cas particuliers, nous suggérons de privilégier dans un premier temps un travail d’incitation et de communication auprès des entités concernées sur l’importance de ce sujet.
Nous préconisons notamment que l’ensemble des Contrats d’Objectifs et de Moyens des Établissements publics et des Délégations de Service Public contractées avec des entreprises abordent explicitement le statut et les droits de réutilisation afférant aux données générées dans leur cadre.
Ces contrats devraient ainsi prévoir la réorientation des moyens déployés pour facturer et diffuser des données protégées vers l’organisation de l’infrastructure nécessaire à l’ouverture et à la diffusion gratuite ou à coût marginal de ces données.
Il serait bien évidemment souhaitable que ceci se fasse dans le sens d’une généralisation la plus large de la réutilisation des données publiques, de façon gratuite, à titre personnel ou commercial.
Établir des bonnes pratiques et des clauses types. 
L’État pourrait établir des bonnes pratiques, notamment sur les types de données concernées, les formats à privilégier, et les modèles d’accès préférables, en vue du renouvellement des COM et DSP concernés, secteur par secteur (par exemple transport, eau, environnement). Il pourrait par ailleurs préparer des clauses types que les différentes institutions pourraient reprendre et adapter à leur situation spécifique.
Élargir le périmètre des données réutilisables aux ressources essentielles.
Nous suggérons enfin de réfléchir à l’opportunité d’octroyer, sur la base de la doctrine des ressources essentielles en droit de la concurrence, un droit de réutilisation à titre personnel ou commercial sur certaines données générées par des acteurs privés mais qui pourraient avoir une importance forte pour le public, et pour l’établissement d’un marché concurrentiel aval, notamment d’applications et services.

Proposition 5 - Faciliter l’enrichissement des données et l’intégration de corrections éventuelles par la communauté

Faciliter l’intégration des métadonnées.
Une des craintes exprimées par les administrations est le risque que les métadonnées explicatives nécessaires à une utilisation judicieuse des données (par exemple l’incertitude de mesure) se perdent lorsque les données sont recoupées et ne soient pas intégrées aux réutilisations.
Nous suggérons, en réponse à cette crainte, de développer une solution technique de marquage sémantique permettant l’interprétation par les moteurs de recherche ou les outils de collecte de données des métadonnées accompagnant le jeu de données, et leur enrichissement en fonction du contexte. Une norme « microformat[3] » pourrait constituer une solution technique à cet effet.
Permettre l’enrichissement collaboratif des jeux de données. 
Un des avantages de la mise en ligne des jeux de données de l’État consiste en la possibilité, pour les réutilisateurs qui remarqueraient des erreurs dans les jeux de données de les signaler voire de les corriger.
Par exemple, les données sur le système national de transports publics en Grande-Bretagne, mises en ligne en 2010, contenaient près de 6 % de localisations d’arrêts de bus erronées, que les utilisateurs ont pu détecter et signaler[4]. Le défi pour la puissance publique consiste à mettre en place les outils techniques et réglementaires lui permettant de réintégrer éventuellement de telles corrections, afin d’en bénéficier elle-même.

L’État devra donc réfléchir à la possibilité, à terme, de passer d’un modèle « à sens unique » (diffusion des données du secteur public vers la société civile) à un modèle d’écosystème où les données de l’État et des collectivités, ouvertes à la société civiles, pourraient être enrichies en retour de façon collaborative (« crowdsourcing »).

Proposition 6 - Impliquer des acteurs publics pilotes dans les projets de recherche sur le Web sémantique

Bien que prématurées pour un déploiement initial à grande échelle, les technologies du Web sémantique et des données liées (« linked data ») pourraient devenir un élément majeur de l’Internet de demain. Participer à ses premières évolutions pourrait donc être d’une importance stratégique pour l’administration française.

Nous suggérons d’identifier un certain nombre d’acteurs publics en pointe du mouvement de réutilisation des données, et de soutenir l’utilisation de leurs jeux de données dans le cadre des projets de recherche internationaux sur le sujet[5].

Faciliter l’expérimentation pour encourager l’innovation

Généraliser la réutilisation gratuite

Proposition 7 - Rendre la réutilisation des données gratuite pour toute réutilisation à titre personnel

D’après les études économiques déjà présentées (étude de Strasbourg), la propensiondes citoyens à payer un droit d’accès aux données publiques pour en faire ensuite un usage personnel est généralement très faible.

Par défaut, et en dehors des exceptions de bon sens (par exemple des ensembles de données de très grande taille occasionnant des coûts de distribution conséquents), une tarification pour usage personnel réduirait donc fortement la diffusion des données, et donc les bénéfices qu’on peut en attendre.

Ceci irait qui plus est à contre-courant des fortes attentes des citoyens en terme de transparence de l’action de l’État. Nous suggérons donc d’établir un principe formel de gratuité pour toute réutilisation de données publiques à titre personnel.

Proposition 8 - Encadrer strictement les cas dans lesquels une redevance est légitime, et charger les producteurs de données d’établir l’absolue nécessité de toute tarification

Dépasser une valorisation purement commerciale des données publiques et encourager leur réutilisation la plus large.
Dans quelques cas spécifiques et bien identifiés, le revenus issus des données publiques participent aux principes d’indépendance de notre démocratie. Toutefois, les institutions produisant des données publiques au sens de la loi de 1978 doivent dépasser un mode de valorisation des données qui serait purement commercial.
Dans la vaste majorité des cas, l’établissement d’une redevance n’apporterait aucun revenu significatif à l’échelle des institutions productrices, et ne justifierait de toute façon pas les coûts liés à la mise en œuvre d’une tarification.
Il est donc souhaitable que les acteurs publics se concentrent sur la réalisation de leurs missions de service public, et mettent les données créées dans ce cadre à la disposition des entrepreneurs et des startups plutôt que de viser à les valoriser eux-mêmes à travers une redevance inefficace.
Généraliser la réutilisation libre et gratuite la plus large possible.
Dans le cas de jeux de données nouvellement mis en ligne, débouchant sur des marchés en développement et dont les applications sont encore méconnues, le potentiel d’innovation lié à la réutilisation est particulièrement fort.
Il apparaît donc nécessaire d’encourager la gratuité à l’ensemble des jeux de données mis en ligne, même pour des réutilisations à titre commercial, à moins que les producteurs de données puissent établir, sur la base d’arguments fondés (notamment liés à des besoins d’investissements lourds de diffusion des données), l’absolue nécessité d’une redevance.
La décision récente du Premier ministre François Fillon soumettre à un décret toute possibilité d’établir une tarification des données publiques va d’ailleurs dans ce sens.
Restreindre la tarification à coûts moyens aux marchés matures. 
Une tarification qui recouvrerait les coûts moyens de mise à disposition n’est justifiable que pour les marchés matures des données à valeur ajoutée, où le potentiel d’innovation est plus limité et les modèles d’affaires mieux connus, et seulement si cela ne réduit pas excessivement la diffusion des données.
Rappelons cependant que la théorie économique établit qu’il n’est légitime de facturer aux réutilisateurs que les coûts engendrés du fait et uniquement du fait de la mise à disposition des données, et non pas des frais inhérents au fonctionnement normal des institutions, tels que des frais de production des données qui rentrent dans le cadre de leur mission de service public.

Faciliter l'expérimentation pour les citoyens et les acteurs de l'innovation

Proposition 9 - Conditionner toute redevance pour réutilisation de données à valeur ajoutée à la mise à disposition gratuite des données brutes qui les sous-tendent

S’il existe un marché pour des données à valeur ajoutée, son optimalité suppose qu’il soit le plus possible ouvert à la concurrence.

Pour que l’établissement d’une redevance pour réutilisation de données à valeur ajoutée produite par une institution publique ne soit pas anticoncurrentielle, il est nécessaire que les données brutes sur lesquelles cette activité est construite, éventuellement recueillies dans le cadre d’une mission de service public, soient disponibles et réutilisables commercialement.

Les institutions qui fixent une redevance pour la réutilisation de données à valeur ajoutée devraient donc mettre gratuitement les données brutes sous-jacentes à disposition des réutilisateurs, au risque sinon de créer des distorsions de concurrence dommageables et sources de contentieux potentiels.

Proposition 10 - Explorer des conditions alternatives de réutilisation pour laisser carte blanche à l’expérimentation

Même lorsque des redevances pour réutilisations sont jugées légitimes, il nous apparaît très important d’encourager les administrations à se montrer favorables à des expérimentations. Notamment, elles devraient viser à permettre aux acteurs innovants, comme les Jeunes Entreprises des Pôles, d’expérimenter de nouvelles activités commerciales sans devoir s’engager sur un contrat de long terme qui créerait des barrières à l’entrée discriminantes. Nous suggérons dans ce cas de rechercher des modes de couverture des coûts alternatifs qui permettent de favoriser l’innovation.

On privilégiera donc la recherche de partenariats avec des pôles de compétitivité et des incubateurs pour favoriser l’émergence d’applications innovantes. Ces partenariats devront prévoir un partage par la puissance publique du savoir-faire et de la connaissance pointues de ses données avec des startups rompues aux techniques de programmation les plus pointues.

Explorer les licences gratuites avec partage des conditions initiales à l’identique (« share alike »).
Lorsqu’une redevance couvrant la réutilisation de données à titre commercial ne saurait être remise en question, l’institution productrice pourrait explorer la mise en place d’une licence gratuite pour réutilisation commerciale restreinte avec partage des conditions initiales à l’identique (ce qui exclut notamment la revente directe des données).
Ce modèle de licence dite « share alike » a par exemple été mise en place par la Mairie deParis, et permet de soutenir la création de nouveaux usages, par exemple des services aux utilisateurs financés par la publicité, tout en excluant du champ de la gratuité les activités commerciales de revente directe (et donc en assurant le maintient des sources de revenus liés à la donnée publique).
Explorer la rémunération par l’accès aux données d’usage.
Une piste à explorer est la vente de données d’usages sur certains jeux de données ou applications spécifiques, qui pourraient avoir une valeur prédictive forte ou intéresser les acteurs d’un marché particulier. Cela permettrait d’alléger en adéquation la tarification de la réutilisation elle-même.
Explorer la rémunération par le service client. 
Dans le cas des données à valeur ajoutée commerciale, nous suggérons d’imaginer une tarification double, liée au niveau de service promis aux réutilisateurs. Une option gratuite mais offrant des garanties moindres faciliterait l’expérimentation.
Faciliter l’expérimentation avec les Web Services. 
Au-delà de la tarification pour réutilisation des données elles-mêmes, se pose la question de l’accès à des services informatiques (notamment des API ou des « Web Services ») permettant un accès facilité ou en temps réel à des données ou des services basés sur les données.
Lorsque des contraintes techniques mènent le producteur de ce Web Service à fixer une rémunération pour service rendu, nous suggérons de laisser la possibilité à des acteurs innovants d’expérimenter gratuitement avec le service en dessous d’un seuil de volume suffisamment élevé pour permettre une mise en production à l’échelle. Cela permet d’encourager l’innovation tout en respectant les contraintes techniques du producteur.

Soutenir l’émergence d’un écosystème

Animer la communauté des réutiilsateurs

Proposition 11 - Impliquer la communauté des réutilisateurs dans les initiatives de mise à disposition de données publiques

Créer un point d’accès centralisé et mis à jour automatiquement.
Nous suggérons, pour permettre une réutilisation efficace des données mises en ligne, de construire le portail data.gouv.fr sur le modèle d’un moteur de recherche, indexant les ensembles de données publiques réutilisables et leurs métadonnées en un point d’accès identifié.
Il serait souhaitable à terme d’automatiser la mise à jour de l’indexation des données autant que cela sera possible techniquement.
Développer une offre grand public qui mette en valeur des applications utiles.
Un écosystème de réutilisation des données publiques se doit d’impliquer le grand public. Il serait donc souhaitable, à travers le portail data.gouv.fr, de mettre en avant des réutilisations pratiques et utiles aux citoyens réalisés à partir des données publiques.
Le danger d’un portail axé uniquement sur l’agrégation de liens vers des jeux de données brutes est qu’il soit ignoré du grand public, qui n’y trouverait pas son intérêt.
Le portail data.gouv.fr devra être un lieu focal avec une double vocation : portail d’accès aux données pour les réutilisateurs, et site de destination pour consommateurs recherchant des applications utiles à partir des données publiques.
Nous suggérons donc de créer une section « Applications » et de mettre ces dernières en valeur sur la page d’accueil elle-même.
Investir dans l’accompagnement de la communauté. 
Afin de faciliter l’échange de bonnes pratiques et la formation d’une véritable communauté, il est souhaitable d’investir dans la création d’un forum ou d’une base de connaissances évolutive, solution aujourd’hui classique sur le Web. Afin de préserver la qualité des échanges qui y auront lieu, et pour impliquer la communauté dans les activités autour de la donnée publique, nous suggérons de plus de créer un ou plusieurs postes d’animateurs (« community managers »).
Démultiplier le service aux utilisateurs.
Le futur portail pourrait aussi lister et mettre à jour les coordonnées des personnes à même de répondre aux questions des réutilisateurs au sein de chaque administration, et agréger les échanges au sujet de chaque jeu de données, afin d’éviter la répétition de questions aux producteurs. Cela permettrait de démultiplier l’effort que les producteurs de données réalisent pour expliquer le contexte des données collectées aux réutilisateurs.
Organiser des séminaires ou ateliers de travail ponctuels sur les sujets techniques d’intérêt pour la communauté.
La technicité du sujet nécessite de façon occasionnelle la tenue de séminaires à destination de la communauté des producteurs et des réutilisateurs de données publiques.

Proposition 12 - Mettre en place des assises des données publiques et animer la communauté des réutilisateurs

Regrouper l’ensemble de l’écosystème pour des assises des données publiques.
Au delà d’ateliers de travail ponctuels, il paraît important de regrouper, à intervalles réguliers, les différents acteurs concernés par la politique de réutilisation des données publiques, pour des colloques et des sessions de travail permettant l’échange de points de vue et la prise de conscience des évolutions nécessaires.
Il semble préférable d’impliquer tout à la fois les acteurs de l’innovation (pôles de compétitivité, capitaux risqueurs, secteur numérique), les associations, les institutions publiques et les collectivités territoriales, mais aussi l’administration elle-même, dont le travail est modifié et mis en valeur par la réutilisation des données publiques.
Animer la communauté des réutilisateurs. 
Une des conclusions des premières expériences de réutilisation de données publiques est que, sans animation, la mise à disposition des données publiques produit peu[6].
Le rôle d’animateur de la communauté des développeurs et des réutilisateurs de données publiques, à travers la participation à des événements et la mise en avant des réalisations marquantes ou utiles aux citoyens, est donc central à une politique ambitieuse des données publiques.

Encourager la réutilisation des données publiques

Proposition 13 - Encourager le développement d’applications à partir des données publiques

Organiser un concours national de développement d’applications.
L’effet de levier potentiel d’un concours de développement d’application est tel (estimé à 50 pour 1 pour la première expérience en 2008 à Washington, D.C.) qu’il apparaît comme un élément indispensable d’encouragement.
Nous suggérons de s’inspirer du modèle des concours de développement d’applications, notamment ceux organisés par l’IGN (été 2010) et les mairies de Rennes ou de Paris (automne 2010 et hiver 2010-2011), au niveau national, et la Banque Mondiale (hiver 2010- 2011) et l’Open Knowledge Foundation (avril à juin 2011) au niveau international. Il est clairement nécessaire de consacrer des moyens matériels assez importants pour créer une masse critique de postulants.
Dans un second temps des concours thématiques pourraient être mise en place dans le domaines de la santé, de l’éducation, de l’environnement, etc. à l’initiative des ministères et agences concernés et encourageant des partenariats d’organisation avec le secteur privé et la société civile.
Intégrer la réutilisation des données publiques aux appels à projets de R&D numérique. 
Nous suggérons d’encourager dès à présent la prise en compte de l’utilisation judicieuse qui pourrait être faite des données publiques dans l’ensemble des appels à projets de recherche et développement lancés en soutien au développement du secteur du numérique.
Pérenniser l’offre d’applications créées à partir des données publiques. 
Nous suggérons d’investir dans le suivi de l’offre d’applications créées à partir des données publiques, et dans la communication de leur utilité auprès du public.
Un appui en terme de communication et un soutien financier permettraient notamment de multiplier l’impact de concours de développement d’applications éventuels, et de pérenniser les applications utiles aux citoyens qu’ils auraient contribué à faire émerger.

Proposition 14 - Intégrer au débat démocratique les données publiques et leur réutilisation

Communiquer aux administrations l’importance des données pour mettre en lumière leurs métiers. 
Pour permettre la mise en ligne d’une offre de données publiques riche et qui éclaire le débat public, il est en premier lieu nécessaire de convaincre les administrations du potentiel des données publiques pour permettre la mise en lumière de leurs métiers et de leur domaine d’action. Un travail de pédagogie sur la notion de réutilisation paraît aussi indispensable. Il semble notamment nécessaire de mettre à mal la notion selon laquelle « mes données ne peuvent intéresser personne d’autre », et de faire prendre conscience du retard qui risque de s’accumuler si les institutions publiques tardent à mettre en ligne leurs données publiques.
Illustrer la réutilisation des données publiques par le développement de services aux citoyens. 
Il semble important que le public soit tenu au courant, à la fois des efforts consentis par l’administration, et des bénéfices concrets qui en découlent. On pourra par exemple labelliser des applications rendues possibles grâce à la réutilisation des données et au travail de l’administration.
L’État lui-même aura un rôle d’exemple et de démonstration à jouer en la matière, et pourrait choisir de développer lui-même à cet effet un certain nombre de services qui illustrent certains jeux de données publiques qui touchent les citoyens et leurs préoccupations.
Faire des données et de leur réutilisation un outil d’éclairage du débat public. 
Nous suggérons d’encourager par exemple la création, par des développeurs ou des journalistes, de visualisations et d’infographies interactives à partir des jeux de données publiques, qui pourraient avoir un rôle de pédagogie auprès d’un public bien plus large que la simple cible des réutilisateurs, et permettraient de mettre en perspective les grands enjeux des politiques publiques.

Élargir le champ de l’Open Data

Proposition 15 - Développer une stratégie nationale à partir du rôle de coordination des institutions publiques de la mission Etalab

Mutualiser des solutions de mise en ligne pour les administrations et les collectivités.
Pour faciliter l’ouverture des données des collectivités, il serait souhaitable de mettre en place des solutions techniques mutualisées, en particulier pour éviter la multiplication de dépenses superflues.
Par exemple, un des rôles de la future plateforme de données publiques de l’État data.gouv.fr pourrait être de proposer des espaces dédiés aux collectivités qui souhaiteraient y publier leurs données. Ces espaces pourraient enfin être exportables, afin de figurer ensuite sur les sites des mairies et collectivités qui voudraient en disposer.
Développer une stratégie nationale pour les données publiques. La mission Etalab a parmi ses prérogatives un rôle de coordination des administrations. 
Pour favoriser la réutilisation des données publiques de l’ensemble des institutions publiques et des collectivités, ce rôle de coordination pourrait être étendu à l’établissement d’une stratégie nationale visant à faciliter la mise à disposition de toutes les données publiques françaises, et d’encourager à leur réutilisation.
Cette stratégie pourrait bien sûr s’appuyer sur le portail data.gouv.fr, mais aussi sur un choix de licences gratuites, sur des recommandations techniques notamment en terme de formats de diffusion des données, et sur l’animation de l’ensemble de la communauté des réutilisateurs.
Elle permettrait de faciliter non seulement la réutilisation des données publiques de l’État, mais aussi de celles des données des communes et des départements, particulièrement importantes pour les citoyens du fait de leur plus grande proximité.
Une véritable stratégie nationale aurait enfin pour bénéfice de permettre le croisement de données de l’État avec celles des collectivités, ce qui pourrait donner lieu à de nouveaux services plus riches et plus innovants.

Proposition 16 - Élargir le champ de l’Open Data

Élargir le champ de la libre réutilisation des données publiques. 
Face aux régimes dérogatoires et aux exceptions au principe de la réutilisation la plus libre des données publiques, nous recommandons d’élargir le plus possible le champ de la réutilisation qui entre dans les critères de l’Open Data. En particulier, les données qui bien qu’à caractère industriel et commercial représentent un intérêt fort pour le public devraient être largement ouvertes à la réutilisation libre et gratuite.
Explorer l’application de l’Open Data aux entreprises privées. 
La question de la réutilisation des données privées, encore à un stade prospectif, a vu émerger le concept de « Data Portability », l’idée que les utilisateurs de services (par exemple des services en ligne, ou un abonnement de téléphonie mobile) pourraient demander d’accéder à leurs données d’usage dans des formats réexploitables.
Une généralisation de ce principe serait une avancée en faveur des consommateurs. Ils sont sensibles à la fois aux questions de vie privées sous-jacentes et à la possibilité de suivre leur consommation de la façon la plus transparente, afin de réduire l’asymétrie de l’information. Cela doit ainsi leur permettre à terme d’optimiser leurs choix économiques.
L’obligation de communiquer les données d’usage aux consommateurs dans des formats réexploitables serait surtout un enjeu fort de libre choix des consommateurs, car il permettrait des comparaisons beaucoup plus faciles entre offres commerciales et entre fournisseurs de service. Ce serait donc un élément potentiel à part entière des politiques de concurrence.
Développer une stratégie européenne et internationale. 
Pour réaliser le plein potentiel des données publiques et de leur réutilisation, il nous paraît indispensable que la France noue des liens forts avec les autres États autour de la question des données publiques.
Au niveau Européen, les évolutions éventuelles de la Directive PSI pourraient constituer un levier d’action puissant en faveur de conditions de réutilisation plus propices à l’innovation et au développement de nouveaux services aux citoyens.
Enfin, l’établissement de normes d’interopérabilité, ou tout au moins l’échange de bonnes pratiques quant à la structuration des données, aux ontologies utilisées et aux formats de diffusion, pourraient permettre, au niveau international le plus large, de poser les bases du Web des Données et de l’Internet de demain.



Notes originales

  1. Référentiel Général d’Intéropérabilité :
    < http://references.modernisation.gouv.fr/sites/default/files/RGI_Version1%200.pdf >
  2. Commission Européenne, 16 décembre 2010, “W3C annonce les bonnes pratiques pour un web mobile”, CORDIS actualités.
    < http://cordis.europa.eu/fetch?CALLER=FR_NEWS_FP7&ACTION=D&DOC=2&CAT=NEWS&QUERY=012cf488f5e8:c26c:0ac2e8d6&RCN=32879>
  3. Chaumond, J., 2010, « Qu’est-ce que le Web Sémantique ? », section 3.1 et suivantes dans Social Commerce : Quand le E-Commerce Rencontre le Web d’Aujourd’hui.
  4. Shadbolt, N., 2011, allocution au colloque « Open Data : Et Nous, Et Nous, Et Nous ? » du 17 mars 2011 organisé par Regards sur le Numérique. Présentation :
    http://www.slideshare.net/RSLN/opendata-datagovukhow-did-we-do-it
  5. « LOD2 : Creating Knowledge out of Interlinked Data », projet de recherche supporté par la Commission Européenne : http://lod2.eu
  6. Entretien avec Charles Népote, FING.