Des résul­tats d’élec­tion en Open Data


« Le Sénat adhère à l’Open Data » vois-je dans mes fils d’in­for­ma­tion.

Le Sénat a décidé de publier les résul­tats des futures élec­tions séna­to­riales en temps réel, sous un format ouvert docu­menté, à tous, sur son site Inter­net. Je ne peux que m’en féli­ci­ter et si je retiens un « il était temps » c’est pour éviter d’y mêler le néga­tif d’une frus­tra­tion. Le pas était néces­saire, utile, et bien­venu.

Merci de l’ef­fort, il est appré­cié à sa juste valeur

J’ajou­te­rai même que je suis agréa­ble­ment surpris par la volonté de publier ces résul­tats en temps réel, actua­li­sés toutes les cinq minutes. Là on sort du besoin pour propo­ser de l’in­no­va­tion ou en tous cas de la valeur ajou­tée.

Mieux encore, ils ont réussi à convaincre la bureau­cra­tie pour accep­ter les réuti­li­sa­tions non-commer­ciales comme les réuti­li­sa­tions commer­ciales, alors que ces dernières sont très souvent exclues ou payantes. Ils ont aussi réussi l’ex­ploit d’au­to­ri­ser les trai­te­ments, mani­pu­la­tions, extrac­tions, créa­tion de données déri­vées et même la diffu­sion de ces dernières. Si ça vous paraît évident et indis­pen­sable, sachez que nous en sommes rare­ment là habi­tuel­le­ment.

Un risque sur le long terme

Main­te­nant, pour reve­nir à mon pessi­miste habi­tuel, notre admi­nis­tra­tion n’ou­blie pas ses travers et j’ai peur qu’à force de vouloir jouer les compro­mis, le pas qui a été fait ne puisse se révé­ler néga­tif sur le long terme.

Il faut rentrer dans la licence d’uti­li­sa­tion des conte­nus pour voir le problème.

Une  clause de publi­cité

Tout d’abord on récu­père la clause tant honnie des premières licences BSD : Il faut mention­ner expli­ci­te­ment la source et la date de mise à jour des données. Certes, c’est une bonne pratique, mais c’est aussi vite contrai­gnant là où ce n’est pas perti­nent.

La licence me propose un para­graphe qui tient en trois lignes. Si je croise quatre ou cinq données avec une licence simi­laire dans mon tableau, il faut que je commence à réser­ver une demie page unique­ment pour ces mentions. Rien de grave mais ça commence à agacer.

« Appli­ca­tion, Produit ou Service inté­grant les données élec­to­rales issues du dernier renou­vel­le­ment séna­to­rial et publiées sur le site du Sénat (www.senat.fr). Dernière mise à jour le 25 septembre 2011 ».

Pour un contenu origi­nal, une créa­tion artis­tique ou d’opi­nion, l’at­tri­bu­tion a un sens et un rôle parti­cu­lier, mais pour des données objec­tives propres à notre insti­tu­tion publique, quel est le sens de cette attri­bu­tion ? son rôle ?

C’est d’au­tant plus gênant que la licence est expli­ci­te­ment trans­mis­sible. Elle doit s’ap­pliquer à toute base de données déri­vée et pas qu’aux données sources. Si en soi ce « copy­left » est légi­time, il prend toute son impor­tance quand on mélange plusieurs données.

En effet, cette simple clause de publi­cité casse déjà la compa­ti­bi­lité avec toutes les licences dites « libres ». Ces dernières empêchent d’ajou­ter des restric­tions à l’usage ou la distri­bu­tion. Des données publiques qui ne peuvent être réuti­li­sées mixer à des conte­nus ou logi­ciels libres, c’est juste dommage.

Une clause floue de termi­nai­son

Ce qui me rend très pessi­miste ce sont les clauses 7 et 8. Elles contiennent des exclu­sions bien­ve­nues sur la capa­cité du Sénat à chan­ger son format, arrê­ter ou modi­fier ses publi­ca­tions futures, mais elles contiennent aussi la capa­cité de modi­fier les condi­tions de la présente licence.

La formu­la­tion ne permet pas de savoir si le Sénat se réserve le droit de publier les données dans une licence diffé­rente dans le futur, sans impac­ter les droits déjà données (ce qui ne pose aucun problème) ou s’il se permet de modi­fier les condi­tions de la licence actuelle, et donc poten­tiel­le­ment termi­ner les utili­sa­tions actuelles ou d’en modi­fier les condi­tions.

Nombre de licences ont une telle clause de termi­nai­son, permet­tant au déten­teur des droits de fina­le­ment reve­nir sur la licence gratuite offerte jusqu’a­lors, ou d’en chan­ger les termes. Ce serait pour moi l’écueil prin­ci­pal de cette licence.

Peut-être ai-je mal inter­prété ces clauses 7 et 8, mais dans ce cas une refor­mu­la­tion pour lever l’am­bi­guïté me semble indis­pen­sable.

Une licence est-elle indis­pen­sable ?

Et fina­le­ment, c’est tout le prin­cipe de licence de réuti­li­sa­tion qui me semble contes­table ici. On m’a répondu que bien entendu sans licence le droit s’ap­plique et personne n’a aucun droit sur les conte­nus. Je me permets d’être en désac­cord.

En France les docu­ments admi­nis­tra­tifs de l’État, des collec­ti­vi­tés terri­to­riales, des services publics, et des établis­se­ments publics sont publics de par la loi. Tous les citoyens doivent y avoir accès et nous avons même créé une commis­sion spéci­fique pour garan­tir cet accès, la CADA.  Il est je pense évident à tous que des résul­tats d’élec­tion ne peuvent de toutes façons être que publics et publiables dans une démo­cra­tie correcte.

De quel droit ?

C’est d’au­tant plus vrai ici qu’il n’y a aucune créa­tion origi­nale ni aucun travail intel­lec­tuel spéci­fique. Il s’agit de reprendre des données objec­tives et brutes dont même la collecté n’a rien d’une inten­tion intel­lec­tuelle parti­cu­lière. Je ne vois aucun droit d’au­teur permet­tant d’éta­blir une licence parti­cu­lière. Cela pour­rait se discu­ter pour des statis­tiques de l’INSEE où il y a un choix de recou­pe­ment, un travail spéci­fique de collecte et d’ana­lyse, mais pas ici.

Reste le droit des bases de données, l’in­ter­dic­tion à un tiers de récu­pé­rer de façon auto­ma­ti­sée ou d’ex­traire une portion signi­fi­ca­tive des conte­nus d’une base de données. Du fait de la publi­cité obli­ga­toire des données, il me semble diffi­cile de jouer sur ce point. Dans tous les cas cela ne s’ap­plique­rait qu’à ceux qui collectent un ensemble de données et pas les résul­tats d’une élec­tion parti­cu­lière.

Est-ce même conci­liable avec une démo­cra­tie ?

Fina­le­ment, quel est le droit de l’état d’im­po­ser une licence pour l’uti­li­sa­tion des résul­tats d’élec­tion ? Est-ce vrai­ment souhai­table pour ce type de données dans une démo­cra­tie ? Si vrai­ment il fallait une licence, une WTFPL aurait été plus adapté à ce cas.

Quand on commence à défi­nir qui a le droit et sous quelles condi­tions d’uti­li­ser, mani­pu­ler ou publier les résul­tats d’une élec­tion, on commence à toucher les limites de ce qui est accep­table en démo­cra­tie.

Oui, j’em­ploie des grands mots dans des grandes phrases mais sinon, à force de toucher au prin­cipes de base, on finit par les oublier.


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.