Si quelques data geeks ont tenté d’explorer nos lois, ils ont vite vue la difficulté de suivre ce qu’il se passe. Legifrance met à disposition toutes les données souhaitées, mais allez-savoir ce qui est vraiment modifié par telle loi ou tel projet de loi…
Imaginez voir simplement les différences entre différentes versions d’un même code, de voir facilement l’intégralité des changements d’un projet de loi en cours ainsi que ce que donnerait le code résultant. Mieux, imaginez qu’on puisse dupliquer les données pour créer des projets de loi, discuter les amendements actuels, etc.
D’autres pays ont avancé. Les lois du Bundestag sont publiées sous github. Un projet débute aux US sur une loi particulière, plus dans l’esprit d’en proposer des modifications collaboratives.
Techniquement ce n’est pas si compliqué : mettre les articles de loi dans des fichiers textes, le tout dans un dépôt git ; chaque décret ou loi promulguée sous forme d’une nouvelle version du dépôt avec la référence qui va bien ; projets de loi ou amendements sous forme de branches et réintégration sous forme de pull-request. Le problème n’est pas là.
En France ça reste compliqué, pour des raisons non techniques. La loi est forcément un peu plus accessible que la moyenne des données publiques, mais on se heurte vite à la réalité. Nos institutions considèrent que le contenu des bases de Legifrance relève du droit des bases de données et que toute extraction automatique ou substancielle est soumise à licence… payante.
Bref, récupérer nos textes de loi pour les compiler dans un dépôt, c’est 4700 € pour l’historique, plus 1500 € (par an ?) pour les mises à jour. Ajouté aux 400 € de frais de dossier on peut compter près de 7000 € la première année, 1500 € les années suivantes. Est-ce que cela autorise toute forme de republication ? Le site n’indique en fait aucun terme précis quant à la licence et aux droits accordés.
Seul espoir : Dans la notice il est indiqué que le téléchargement des PDF intégraux n’est pas soumis à l’obtention d’une licence. Je ne sais pas si le téléchargement de tous les PDF, de façon automatisée et régulière, peut passer sous ce critère. Je ne sais pas non plus si cette exception autorise la rediffusion (mais en même temps une fois l’extraction autorisée, le droit lié aux bases de données ne devrait je pense plus faire obstacle à une republication). Dans tous les cas le résultat serait forcément dégradé puisqu’on peut voir les modifications successives mais pas les attribuer à tel décret ou telle loi.
J’aimerai bien que quelqu’un plus au fait de ces questions puisse m’aider à y voir clair. Suivant le cas ça peut vouloir dire tenter un financement participatif, ou faire un premier proto rapide pour vérifier que le projet a du sens. Qui se sent de participer à un peu d’exploration avant-projet ? Qui a déjà tenté ou exploré des choses ? Je louche vers les gens de Regards Citoyens par exemple. Je ne voudrai dupliquer aucun effort, et surtout ne pas réinventer la roue déjà abandonnée par d’autres pour de bonnes raisons. Tout contact, toute info et toute aide bienvenue.
7 réponses à “Publier la loi”
On a vraiment besoin de s’inspirer de ce qui se fait ailleurs…
1) en matière de licence (œuvre du service public → licence publique par défaut)
2) en matière de lisibilité (le concept d’indentation serait tellement salutaire, dans la LCEN, par exemple)
3) et en matière d’URL (les URL de Legifrance sont illisibles)
J’envie ce que fait le LII, par exemple.
Désolé, c’est une critique supplémentaire, plus qu’une aide à ton problème !
Un des problèmes c’est que nos institutions ont très bien retenu une règle du logiciel libre : libre n’est pas gratuit. Ils ont des licences publiques, mais payantes :) Et si ça me choque pour certains domaines, le fondement n’est pas totalement idiot non plus. Le sujet n’est pas simple, sinon il aurait été tranché il y a bien longtemps.
Les URL de légifrance ont longtemps été un problème car non pérennes : impossible à mettre en favori, à envoyer à un tiers. Maintenant qu’elles le sont, le seul reproche que j’ai est qu’elles sont difficile à oraliser. Je continue à croire qu’avoir des URL significatives est une bonne pratique, mais je commence à intégrer aussi l’argument de ceux qui ne voient dans l’URL qu’un artefact technique. Si ton outil ne te donne pas d’aperçu du contenu ou du titre de la ressource quand il rencontre un lien, plains toi à ton outil, ne critiques pas la forme du lien.
Reste à faire une parser à la volé (chercher le contenu brut sur Legifrance) et l’afficher avec une interface adapté… :/
Illégal
Le projet a du sens. J’en ai tiré un prototype rapide il y a déjà un certain temps et travaille depuis à l’automatiser. : https://github.com/Lertsenem/legit. Je n’ai en revanche aucune idée de la légalité de la chose (et ne me suis, pour être honnête, jamais posé la question).
Sans entrer dans les détails, je me permets de donner quelques pistes internationales sur le sujet :
– le projet ELI notice wikipedia EN ou Identifiant européen de la législation (ELI) (synthèse de la législation EU), voir notamment les Conclusions du Conseil préconisant l’introduction d’un identifiant européen de la législation (ELI) [Journal officiel C 325 du 26.10.2012] avec du schéma URI dedans.
Je confirme que la DILA est impliquée et très active dans ce projet.
– Une norme XML en matière de description des documents juridiques est en train de prendre une importance considérable : l’Akoma Ntoso http://www.akomantoso.org/. Elle a été conçue pour les parlements africains. Elle est désormais utilisé par le Sénat Italien, le parlement Européen pour ses amendements (www.at4am.org ) et surtout, cet été, le Congrès US a proposé 5000$ en juillet (http://www.loc.gov/today/pr/2013/13-122.html) puis 10000 $ de prix en septembre pour la reprise de ses données en Akoma Ntoso http://akoma-ntoso-markup.challengepost.com/
Le produit développé pour le Parlement européen http://www.at4am.org est en open source et me semble très intéressant.
J’avance : La texte de la licence est sur http://rip.journal-officiel.gouv.fr/index.php/content/download/486/2613/file/Licence%20LEGIFRANCE%20A%202012_03_09.pdf
Quelques points :
Plus basiquement, l’idée que j’en avais sur un github (ou équivalent) n’est réalisable qu’en interdisant le fork, et en interdisant les tiers de réutiliser les données pour les manipuler et en tirer des informations intéressantes.
On peut toujours monter une association et introniser comme membre tous ceux qui veulent participer activement, mais ça limite de fait l’exercice et ça ne couvre pas du tout la volonté de diffusion des lois et de l’activité législative que j’avais.
Ici aussi, rediffusion sur github totalement interdite (non, je ne détiens pas github). Il faudra monter un site dédié. Pas que ça pose un problème concret mais le coût pour monter le projet devient d’un coup plus élevé et surtout on oublie toute diffusion par capilarité dans le pays.
Le cumul des deux contraintes précédentes impose de fait une communication top-down où celui qui détient la licence peut décider de la présentation des données et où les autres peuvent uniquement lire ce qu’on leur a donné, à l’exclusion de toute autre manipulation.
Très dommage, surtout que je ne vois pas la pertinence du critère « détenir le site web ».
Bref, il va falloir discuter et négocier, et ce n’est pas gagné.