Menu principal

Flux RSS

XML Google Reader or Homepage Add to My Yahoo! Add to Technorati Favorites! Add to netvibes

Entrepreneuriats

Ecosystèmes

Expressions

Retour sur l'OpenData Camp Paris (2/2) PDF Imprimer Envoyer
Ecosystèmes - La guerre des données
Écrit par Damien Roussat   
Jeudi, 24 Décembre 2009 06:13

Cet article est la deuxième partie d'un retour sur le premier OpenData Camp qui s'est déroulé le 12 décembre à Paris. Si vous prenez le train en route, je vous invite à lire d'abord la première partie, et en complément un précédent article sur l'émergence de ce mouvement en France. (...)

 

L’ouverture des données au niveau des organes publics locaux (suite)


Juridiquement, la question de licence sous laquelle une donnée peut être ouverte se pose. DataSF.org, par exemple, oblige l’utilisateur à accepter une licence avant d’accorder l'accès effectif aux données, ce qui n’est pas le cas de tous les sites. La question de la propriété des données se pose également, de même que la notion de confiance dans la source de données utilisée. Puis-je me fier à ces données ? De qui émane-t-elle, et qu’est-ce qui me garantit leur légitimité ?

Un projet qui viserait à impliquer un territoire dans la mise à disposition de données publiques doit trouver des soutiens auprès des élus locaux (et non directement servir leurs opposants), car l’exploitation de ces données peut venir alimenter un débat public qui n’est pas toujours en faveur de ces élus. La possibilité pour les citoyens de participer à la qualification des données en ligne peut amener également à une meilleure satisfaction des habitants dans les politiques locales, un argument de taille dans une période de préparation aux élections. Il faut aussi leur garantir (aux élus) que ce travail d’ouverture des données sera récompensé par des applications de qualité, ce qui amène la question de savoir qui aujourd’hui est prêt ou a émis le souhait de construire une application dans ces régions et pour des usages locaux. Brest, par exemple, a libéré une partie de données relatives au territoire et une société privée de jeux vidéo les a utilisées dans une de leurs réalisations.

Pendant cette session, une différenciation a été faite dans l’utilisation des données entre statistiques et suivi en temps réel. Ces deux aspects n’impliquent pas les mêmes infrastructures et procédures et il convient de choisir quel aspect un projet de ce type souhaiterait appuyer ; le choix du type de données disponibles intervient alors. Ici, une liste de données intéressantes a été faite : cadastre, appels d’offre, naissances-décès-mariages ou bien taxe professionnelle, mesures environnementales, faune et flore (TelaBotanica), et données immobilières ont été évoquées. Le grand livre comptable des communes contient également de nombreuses informations, ce qui pourrait de plus intéresser la presse locale. Bref, il faut construire ce projet en fonction d'une multitude de paramètres dont certains s'éloignent parfois de l'ouverture en elle-même pour s'inscrire dans un contexte précis.

Un autre exemple, la mairie de Paris a équipé 120 000 arbres de puces RFID. Un « lâcher » de ces données serait peut-être alors envisageable ? D’autres données plus évidentes, comme les données relatives aux vélos Velib’, serait peut-être plus immédiate. Des organisations ou agences publiques disposant de données intéressantes ont été citées comme Pôle Emploi ou l’Atelier Parisien d’Urbanisme (APUR). Concernant les entreprises, les frais d’accès à la plupart des données comme la base des enregistrements SIRET est un frein à leur ouverture, bien que la fondation Sunlight, rencontrant le même problème aux Etats-Unis, soit allée jusqu’à pirater cette base pour forcer leur libération, selon les dires.

L’Economie Sociale et Solidaire, forte de nombreuses organisations de terrain, pourrait être disposée à ouvrir ses bases de données, notamment dans le domaine de la santé, qui a été cité mais très peu discuté. Pourtant, s’il existe un risque de réticence de la part des pouvoirs publics pour un projet d’ouverture de données publiques locales, alors il faut peut-être se concentrer sur les données qui sont le plus facilement accessibles et dont la libération pose le moins de problème : une équation qui semble trouver solution dans le domaine des transports, qui constituent une source de données publiques importante et dont le libre accès est sans équivoque. Les récents travaux de Google sur la standardisation des données de ce secteur, le Google Transit Feed Specifications, apporterait un argument technique supplémentaire au choix de ce type de données.

D’un point de vue technique

Il existe plusieurs formats et techniques disponibles pour stocker et mettre en forme des données. Bien que les notions de respect des standards et d’interopérabilité soient clés (et au cahier des charges de toute nouvelle application de la mairie de Paris parait-il), elles ne prévalent pas sur l’ouverture en elle-même des données, qui peut rencontrer certains freins qui ne devraient pas être techniques. En d'autres termes, que le format des données ouvertes soit libre ou propriétaire ne doit pas restreindre l’ouverture proprement dite. DevelopmentSeed, société de services américaine, a proposé un cadre d’abstraction des formats de données pour accueillir indépendamment format public ou privé.

Le Web sémantique et le mouvement des « LinkedData », ensemble de formats et de recommandations sur l’évolution du Web, pourrait être une solution technique irréprochable si ce n’était que sa mise en œuvre est encore fastidieuse. Le besoin, dans tous les cas, de pouvoir classer le contenu ouvert à l’aide de méta-informations pose également problème, car créer un référentiel unique officiel serait irraisonnable pour un système étatique.  Ces deux points ont soulevé la question de l’importance ou non de rendre les contenus ainsi libérés facilement accessible aux machines qui parcourent et classifient le Web (ces questionnements techniques propre au Web sémantique et au mouvement qui lui est lié fera l'objet d'un article plus détaillé ultérieurement).

Une autre problématique technique concerne la visualisation des données. En effet, plusieurs logiciels et services proposent des applications de visualisation de données mais il n’est pas encore clair de quelle manière ni sous quelle forme un lien pourra efficacement être fait entre ouverture de données et méthodes de visualisation. L’application Pearltrees a été citée, conjointement avec un début de création d’une classification de ressources existantes sur l’OpenData en son sein.

Enfin, il a été souligné que les départements et agences publiques regorgent encore de documents peu exploitables, qui recèlent une difficulté supplémentaire dans l’effort pour convaincre une collectivité d’adhérer à un projet d’ouverture de données.

L’émergence d’un mouvement

Cette session du samedi matin était celle ayant attiré le plus de monde (notamment par la fusion d'un autre groupe sur la mobilité). La dynamique des discussions, leur diversité et les énergies de chacun témoignent avec justesse d’un moment important pour ce concept de l’OpenData. Il illustre surtout l’émergence d’un mouvement français visant à une plus grande ouverture des données et par là de la société qu’elles modélisent.

 

Pour aller plus loin, vous pouvez lire aussi cet article de Fabrice Epelboin sur ReadWriteWeb France : "Data.gov : bien, mais peu mieux faire" et consulter les différents liens contenus dans l'article.