Nuvola apps important.png Attention, suite à une faille de sécurité, quelques liens vers les serveurs d'exploration sont désactivés.

-

Pour une politique ambitieuse des données publiques (2011) chapitre 8 : Différence entre versions

De Wicri France
imported>Jacques Ducloy
(Faciliter l’expérimentation pour encourager l’innovation)
imported>Jacques Ducloy
(Généraliser la réutilisation gratuite)
Ligne 111 : Ligne 111 :
 
{{Fin cadre}}
 
{{Fin cadre}}
 
</center>
 
</center>
 +
;Dépasser une valorisation purement commerciale des données publiques et encourager leur réutilisation la plus large.: Dans quelques cas spécifiques et bien identifiés, le revenus issus des données publiques participent aux principes d’indépendance de notre démocratie. Toutefois, les institutions produisant des données publiques au sens de la loi de 1978 doivent dépasser un mode de valorisation des données qui serait purement commercial.
 +
:Dans la vaste majorité des cas, l’établissement d’une redevance n’apporterait aucun revenu significatif à l’échelle des institutions productrices, et ne justifierait de toute façon pas les coûts liés à la mise en œuvre d’une tarification.
 +
:Il est donc souhaitable que les acteurs publics se concentrent sur la réalisation de leurs missions de service public, et mettent les données créées dans ce cadre à la disposition des entrepreneurs et des startups plutôt que de viser à les valoriser eux-mêmes à travers une redevance inefficace.
 +
 
===Faciliter l'expérimentation pour les citoyens et les acteurs de l'innovation===
 
===Faciliter l'expérimentation pour les citoyens et les acteurs de l'innovation===
 
<center><span id="proposition 9"></span>
 
<center><span id="proposition 9"></span>

Version du 12 août 2011 à 19:19

Logo ponts paristech.png
Pour une politique ambitieuse des données publiques :
Les données publiques au service de l’innovation et de la transparence


Partie 3 - Comment favoriser la réutilisation des données publiques ?
Chapitre VIII. Seize propositions pour une politique ambitieuse des données publiques
RapportDonnéesPubliques2011.png

À partir des leçons des premières expériences d’Open Data et des scénarios que nous avons détaillés au chapitre précédent, nous proposons trois axes stratégiques pour une politique ambitieuse qui viserait à réaliser le plein potentiel de la réutilisation des données publiques.

Simplifier pour accélérer 
réduire les efforts nécessaires d’une part à la diffusion des données par les acteurs publics, et d’autre part à leur réutilisation, afin d’accélérer le développement de services utiles à partir des données publiques.
Faciliter l’expérimentation 
adapter les conditions de réutilisation des données publiques pour faciliter l’expérimentation par les citoyens, les associations et la communauté des développeurs et des entrepreneurs.
Favoriser l’émergence d’un écosystème 
favoriser l’émergence d’un écosystème de producteur et de réutilisateurs de données publiques en France, autour de la mission Etalab et du futur portail data.gouv.fr.

Ce chapitre suggère des modalités concrètes de développement de ces trois axes stratégiques. Il présente seize propositions issues de notre analyse, qui visent à faciliter la réutilisation la plus large des données publiques et à permettre la réalisation la plus rapide possible de l’ensemble des bénéfices que la société peut en attendre.

Simplifier pour accélérer

Faciliter la diffusion de données publiques

Proposition 1 - Formaliser les bonnes pratiques de diffusion des données publiques attendues par la communauté des réutilisateurs

Expliciter l’effort minimal attendu des différents acteurs publics.
Pour répondre aux préoccupations très fortes des institutions publiques amenées à diffuser leurs données en ligne pour la première fois, il serait souhaitable de rappeler que l’effort demandé est minimal. Dans la grande majorité des cas, la mise en ligne des données n’a pas de raison de mobiliser excessivement les agents du service, qui plus est en regard des économies de temps qui découleront de la possibilité pour les citoyens d’accéder aux données directement sans devoir établir une demande officielle auprès de l’institution.
Assurer la formation des agents et leur accès à des guides clairs et explicatifs.
Dans la continuité du travail de préfiguration réalisé par l’APIE, nous suggérons de poursuivre l’effort de mise à jour de guides et documents à destination des agents. Notamment, détailler les raisons qui poussent à vouloir mettre en ligne les données publiques, l’importance des formats réutilisables, les étapes à suivre et les grands enjeux juridiques, administratifs et techniques serait d’une aide importante aux institutions publiques amenées à diffuser des données.
Simplifier les formats de diffusion.
Nous suggérons d’expliciter clairement la simplicité potentielle du processus de mise en ligne de données. De simples fichiers CSV suffisent à participer activement à la mise en ligne des données publiques, qui n’a donc pas lieu de mobiliser outre mesure les ressources techniques et humaines de l’administration.

Réduire les barrières à la réutilisation

Proposition 2 - Mettre en cohérence les conditions légales de réutilisation des données issues de sources différentes

Établir une « licence données ouvertes » pour réutilisation gratuite qui s’appliquerait le plus largement possible.
Nous suggérons d’harmoniser le plus possible les licences utilisées au sein des différentes administrations de l’État, des établissements publics et des collectivités territoriales. Il est nécessaire d’éviter la prolifération de licences, qui rendraient la réutilisation de données issues de sources différentes trop complexe.
Nous suggérons pour cela un travail d’harmonisation vers une même licence de réutilisation à titre gratuit, la « Licence Données Ouverte » de l’État, qui serait utilisée par défaut par les administrations centrales, déconcentrées, et dont les collectivités territoriales pourraient s’inspirer.
Appliquer cette licence de la manière la plus large aux données disponibles sur data.gouv.fr permettrait de simplifier substantiellement le régime juridique qui s’applique à ces données.
Ce travail pourrait être mené en concertation entre les différents acteurs et sur la base du travail effectué par le Ministère de la Justice (licence « Information Publique »), des conditions générales d’utilisations rappelées par l’APIE, et des licences issues du monde du libre (par exemple licence ODbL).
Encourager un marquage graphique des droits de réutilisation.
Afin de permettre aux réutilisateurs d’identifier facilement les données réutilisables et les conditions qui s’y appliquent, nous suggérons de généraliser le marquage des fiches descriptives de jeux de données disponibles à la réutilisation avec des pictogrammes spécifiques, sur le modèle du marquage « Information Publique » du ministère de la Justice, qui expliqueraient les droits afférents à ces données.

Proposition 3 - Encourager l’utilisation de formats facilement réexploitables, qui respectent les normes d’interopérabilité et de « lisibilité machine »

Privilégier les formats ouverts respectant les normes d’interopérabilité.
L’utilisation d’un format fermé et difficilement réexploitable peut limiter très fortement l’utilité d’un jeu de données pour ses réutilisateurs, en rendant sa réutilisation trop complexe.
Communiquer sur l’importance des formats réexploitables auprès des agents. 
Il est crucial que les agents de l’État en charge de l’accès aux données publiques soient bien sensibilisés à cette question, et disposent de bases de connaissances et d’outils simples pour privilégier l’utilisation de formats ouverts et respectant les normes d’interopérabilité.
Maintenir une liste de formats correspondants à ces critères.
À cet effet, il sera utile de définir une liste des formats facilement lisibles par des machines, à destination des agents.
Les institutions publiques privilégieront idéalement les formats simples et non propriétaires de type CSV (simples valeurs séparées par des virgules, outil standard parmi les tableurs), et éviteront de communiquer des jeux de données au format PDF (qui rend les données difficilement manipulables) sauf pour des rapports de type traitement de texte.
Au-delà des recommandations du Référentiel Général d’Interopérabilité[1] (RGI) aux administrations, des évolutions seront à prévoir dans la perspective de la réutilisation des données publiques. Il est à noter par ailleurs que la Commission européenne est en discussions avec le W3C dans le cadre d’une réflexion liée aux questions de standards.[2]
Assurer la pérennité des ontologies et structures de données dans le temps.
Une des difficultés liées à la réutilisation de jeux de données remis à jour fréquemment tient aux changements potentiels d’ontologie ou de structuration des données qui peuvent intervenir dans le temps. Dans le cas des jeux de données mis à jour périodiquement, les administrations productrices devront veiller à reproduire le format et la structure de données utilisée, afin d’en faciliter une réutilisation automatisée.

Anticiper les nouveaux usages des données publiques

Proposition 4 - Faire en sorte que chaque contrat public clarifie à l’avenir le financement de l’ouverture et les droits de réutilisation liés aux données produites dans son cadre

Clarifier le financement de l’ouverture et les droits de réutilisation de données dans les contrats publics. 
Une quantité importante de données d’intérêt public sont générées par des acteurs qui sortent du champ de la loi CADA de 1978. Plutôt qu’une modification de la réglementation qui viserait à intégrer l’ensemble des cas particuliers, nous suggérons de privilégier dans un premier temps un travail d’incitation et de communication auprès des entités concernées sur l’importance de ce sujet.
Nous préconisons notamment que l’ensemble des Contrats d’Objectifs et de Moyens des Établissements publics et des Délégations de Service Public contractées avec des entreprises abordent explicitement le statut et les droits de réutilisation afférant aux données générées dans leur cadre.
Ces contrats devraient ainsi prévoir la réorientation des moyens déployés pour facturer et diffuser des données protégées vers l’organisation de l’infrastructure nécessaire à l’ouverture et à la diffusion gratuite ou à coût marginal de ces données.
Il serait bien évidemment souhaitable que ceci se fasse dans le sens d’une généralisation la plus large de la réutilisation des données publiques, de façon gratuite, à titre personnel ou commercial.
Établir des bonnes pratiques et des clauses types. 
L’État pourrait établir des bonnes pratiques, notamment sur les types de données concernées, les formats à privilégier, et les modèles d’accès préférables, en vue du renouvellement des COM et DSP concernés, secteur par secteur (par exemple transport, eau, environnement). Il pourrait par ailleurs préparer des clauses types que les différentes institutions pourraient reprendre et adapter à leur situation spécifique.
Élargir le périmètre des données réutilisables aux ressources essentielles.
Nous suggérons enfin de réfléchir à l’opportunité d’octroyer, sur la base de la doctrine des ressources essentielles en droit de la concurrence, un droit de réutilisation à titre personnel ou commercial sur certaines données générées par des acteurs privés mais qui pourraient avoir une importance forte pour le public, et pour l’établissement d’un marché concurrentiel aval, notamment d’applications et services.

Proposition 5 - Faciliter l’enrichissement des données et l’intégration de corrections éventuelles par la communauté

Faciliter l’intégration des métadonnées.
Une des craintes exprimées par les administrations est le risque que les métadonnées explicatives nécessaires à une utilisation judicieuse des données (par exemple l’incertitude de mesure) se perdent lorsque les données sont recoupées et ne soient pas intégrées aux réutilisations.
Nous suggérons, en réponse à cette crainte, de développer une solution technique de marquage sémantique permettant l’interprétation par les moteurs de recherche ou les outils de collecte de données des métadonnées accompagnant le jeu de données, et leur enrichissement en fonction du contexte. Une norme « microformat[3] » pourrait constituer une solution technique à cet effet.
Permettre l’enrichissement collaboratif des jeux de données. 
Un des avantages de la mise en ligne des jeux de données de l’État consiste en la possibilité, pour les réutilisateurs qui remarqueraient des erreurs dans les jeux de données de les signaler voire de les corriger.
Par exemple, les données sur le système national de transports publics en Grande-Bretagne, mises en ligne en 2010, contenaient près de 6 % de localisations d’arrêts de bus erronées, que les utilisateurs ont pu détecter et signaler[4]. Le défi pour la puissance publique consiste à mettre en place les outils techniques et réglementaires lui permettant de réintégrer éventuellement de telles corrections, afin d’en bénéficier elle-même.

L’État devra donc réfléchir à la possibilité, à terme, de passer d’un modèle « à sens unique » (diffusion des données du secteur public vers la société civile) à un modèle d’écosystème où les données de l’État et des collectivités, ouvertes à la société civiles, pourraient être enrichies en retour de façon collaborative (« crowdsourcing »).

Proposition 6 - Impliquer des acteurs publics pilotes dans les projets de recherche sur le Web sémantique

Bien que prématurées pour un déploiement initial à grande échelle, les technologies du Web sémantique et des données liées (« linked data ») pourraient devenir un élément majeur de l’Internet de demain. Participer à ses premières évolutions pourrait donc être d’une importance stratégique pour l’administration française.

Nous suggérons d’identifier un certain nombre d’acteurs publics en pointe du mouvement de réutilisation des données, et de soutenir l’utilisation de leurs jeux de données dans le cadre des projets de recherche internationaux sur le sujet[5].

Faciliter l’expérimentation pour encourager l’innovation

Généraliser la réutilisation gratuite

Proposition 7 - Rendre la réutilisation des données gratuite pour toute réutilisation à titre personnel

D’après les études économiques déjà présentées (étude de Strasbourg), la propensiondes citoyens à payer un droit d’accès aux données publiques pour en faire ensuite un usage personnel est généralement très faible.

Par défaut, et en dehors des exceptions de bon sens (par exemple des ensembles de données de très grande taille occasionnant des coûts de distribution conséquents), une tarification pour usage personnel réduirait donc fortement la diffusion des données, et donc les bénéfices qu’on peut en attendre.

Ceci irait qui plus est à contre-courant des fortes attentes des citoyens en terme de transparence de l’action de l’État. Nous suggérons donc d’établir un principe formel de gratuité pour toute réutilisation de données publiques à titre personnel.

Proposition 8 - Encadrer strictement les cas dans lesquels une redevance est légitime, et charger les producteurs de données d’établir l’absolue nécessité de toute tarification

Dépasser une valorisation purement commerciale des données publiques et encourager leur réutilisation la plus large.
Dans quelques cas spécifiques et bien identifiés, le revenus issus des données publiques participent aux principes d’indépendance de notre démocratie. Toutefois, les institutions produisant des données publiques au sens de la loi de 1978 doivent dépasser un mode de valorisation des données qui serait purement commercial.
Dans la vaste majorité des cas, l’établissement d’une redevance n’apporterait aucun revenu significatif à l’échelle des institutions productrices, et ne justifierait de toute façon pas les coûts liés à la mise en œuvre d’une tarification.
Il est donc souhaitable que les acteurs publics se concentrent sur la réalisation de leurs missions de service public, et mettent les données créées dans ce cadre à la disposition des entrepreneurs et des startups plutôt que de viser à les valoriser eux-mêmes à travers une redevance inefficace.

Faciliter l'expérimentation pour les citoyens et les acteurs de l'innovation

Proposition 9 - Conditionner toute redevance pour réutilisation de données à valeur ajoutée à la mise à disposition gratuite des données brutes qui les sous-tendent

Proposition 10 - Explorer des conditions alternatives de réutilisation pour laisser carte blanche à l’expérimentation

Soutenir l’émergence d’un écosystème

Animer la communauté des réutiilsateurs

Proposition 11 - Impliquer la communauté des réutilisateurs dans les initiatives de mise à disposition de données publiques

Proposition 12 - Mettre en place des assises des données publiques et animer la communauté des réutilisateurs

Encourager la réutilisation des données publiques

Proposition 13 - Encourager le développement d’applications à partir des données publiques

Proposition 14 - Intégrer au débat démocratique les données publiques et leur réutilisation

Élargir le champ de l’Open Data

Proposition 15 - Développer une stratégie nationale à partir du rôle de coordination des institutions publiques de la mission Etalab

Proposition 16 - Élargir le champ de l’Open Data

Notes

  1. Référentiel Général d’Intéropérabilité :
    < http://references.modernisation.gouv.fr/sites/default/files/RGI_Version1%200.pdf >
  2. Commission Européenne, 16 décembre 2010, “W3C annonce les bonnes pratiques pour un web mobile”, CORDIS actualités.
    < http://cordis.europa.eu/fetch?CALLER=FR_NEWS_FP7&ACTION=D&DOC=2&CAT=NEWS&QUERY=012cf488f5e8:c26c:0ac2e8d6&RCN=32879>
  3. Chaumond, J., 2010, « Qu’est-ce que le Web Sémantique ? », section 3.1 et suivantes dans Social Commerce : Quand le E-Commerce Rencontre le Web d’Aujourd’hui.
  4. Shadbolt, N., 2011, allocution au colloque « Open Data : Et Nous, Et Nous, Et Nous ? » du 17 mars 2011 organisé par Regards sur le Numérique. Présentation :
    http://www.slideshare.net/RSLN/opendata-datagovukhow-did-we-do-it
  5. « LOD2 : Creating Knowledge out of Interlinked Data », projet de recherche supporté par la Commission Européenne : http://lod2.eu