Étiquette : API

The lie of the API

Quelques réponses sur un billet qui a beaucoup circulé : The lie of the API.

Ça flatte beaucoup la mouvance HATEOAS mais je n’accroche pas. Même avec des clients très smart, impossible de faire un même site pour les visites « navigateur » et les accès « API ».

Le logiciel client de l’API ne sera jamais assez intelligent pour comprendre autant le contexte que l’humain derrière son navigateur, et jamais assez souple pour gérer des changements non prévus.

Donc partons de notre bibliothèque qui expose des collections avec des contenus, chacun reliés à des auteurs.

Et si demain je change mes représentations pour ne plus mettre les bio des auteurs dans la fiche du livre directement ? Certes techniquement il est possible de faire un robot qui sache récupérer cette bio sur la fiche de l’auteur, mais quelle est la probabilité que les robots actuels gèrent le changement ?

Et si demain le site web est changé pour que le point d’entrée premier soit l’auteur ? Le logiciel saura-t-il rechercher un livre dont il ne connait pas l’adresse ?

Et si demain je change le système de classification des livres pour passer de BISAC à la CLIL française ? Quelle probabilité que le robot et l’applicatif derrière gère ça de façon transparente ?

La partie destinée au robot (qu’on nomme généralement « API ») n’a simplement pas les mêmes besoins que la partie destinée aux humains (qu’on nomme souvent « web »). On peut faire concilier les deux au début, mais ça va casser au fur et à mesure des évolutions de la partie destinée aux humains.

Tout ça pour quoi ? La satisfaction intellectuelle du développeur qui se dit qu’il correspond au schéma idéal du web. La valeur ajoutée ne me semble pas justifier le risque.

C’est d’autant plus vrai qu’en réalité les clients qui codent des robots hypermedia corrects il n’y en a pas tant que ça. Rapidement des tiers vont coder des robots en faisant de l’ingénierie inverse sur les adresses, les identifiants, la structure, les données. Ça sera peut être de leur faute, mais ça va casser si vous faites des changements en vous reposant uniquement sur le côté hypermedia.

D’où la question : Souhaitez-vous que ça fonctionne ou avoir raison ?

17 décembre 2013
Définir son API : versionnement
Toujours dans la logique de réfléchir son API, parce qu’un jour il faudra la faire évoluer, comment gérer le versionnement ?

Plusieurs solutions ont émergé :
- https://api-v2.example.com/maressource
- https://api.example.com/v2/maressource
- https://api.example.com/maressource-v2
- https://api.example.com/maressource?v=2
- https://api.example.com/maressource avec une entête Version: 2
- https://api.example.com/maressource avec une entête Accept ou/et Content-type: application/monformat;version=2
La solution du sous-domaine n’est à mon sens à réserver que pour les big-bang. Elle n’est pas facilement multipliable à l’infini, mais à l’avantage de permettre aisément d’avoir même deux plateformes totalement séparées pour les deux versions de l’API.

Les deux suivantes se distinguent par le fait de versionner l’API ou la ressource. J’ai tendance à penser que s’il faut versionner la ressource en cassant la compatibilité, alors c’est peut être une nouvelle version de l’API qui est à publier si on ne veut pas finir avec un gros patchwork difficile à maintenir : En gardant tout sous le même espace on s’interdit de facilement rendre obsolète les anciennes versions.

Quitte à parfois devoir versionner au niveau de la ressource, l’idée d’ajouter un paramètre a fini par me sembler plus propre. Il s’agit quasiment toujours de s’adresser à une représentation différente de la ressource, pas de changer son sens fondamental. Le risque est que la plupart des gens continuent à utiliser la version d’origine et ne pas prendre en compte le paramètre. Rendre obsolète des anciennes représentations risque là aussi d’être difficile.

Les possibilités d’ajouter les versions dans les entêtes sont souvent conseillées d’un point de vue théorique. En pratique mon retour est que c’est complexe à utiliser, et d’une valeur ajoutée assez discutable. On oublie trop facilement que le bon usage de l’API tient directement à sa simplicité et sa bonne compréhension. S’il y a besoin d’être expert en architecture web pour comprendre le pourquoi des choses, c’est une mauvaise solution. Le « tout dans l’URL » ajoute une facilité pour tester et échanger entre techniciens qui vaut toutes les positions académiques du monde.

Twilio a aussi une façon intéressante de gérer les versions. Au lieu d’un v2 ou v3, le développeur indique une date et c’est le serveur qui sélectionne la version de l’API à utiliser en fonction de la date. C’est tentant, souple, mais j’ai peur que ce ne soit pas suffisamment explicite sur ce qu’on utilise ou sur comment gérer ce paramètre. Qu’est-ce qui change si je met à jour la date ?

Des lectures et expériences je tire quelques recommandations :
- Prévoir dès le départ un système de versionnement, vous en aurez besoin un jour, ne croyez pas que vos API pourront rester telles quelles ad vitam eternam
- Imposer un versionnement explicite, immédiatement, dès la première version. Vous éviterez les ambiguïtés et une partie des moules qui s’attachent aux adresses « sans version » par défaut
- N’utiliser que des numéros de version simples, pas de notion de mineur/majeur, pas de points ou virgules : Si ça change de façon non compatible c’est une nouvelle version et on incrémente d’une unité. Le reste c’est du marketing et ça n’a rien à faire dans vos URLs.
- Utiliser un versionnement dans l’URL, à la racine du service ; il sera temps d’utiliser un autre sous-domaine si un jour il y a un vrai big bang qui le nécessite
- Documenter (oui, c’est évident, mais pas si simple à ne pas oublier)
18 mars 2013
Définir son API : authentification
Je lis le PDF gratuit de Apigee à propos du design des API web. Si les autres PDF gratuits du site sont assez creux, celui là pose de bonnes questions qui font écho avec mes propres reflexions.

Je le prends dans le désordre et pour reprendre mes erreurs passées ou celles que j’ai vu chez les autres :
- Pas de système de session avec point d’entrée spécifique pour le login. Ça demande au client de se préoccuper de l’expiration de la session et de son maintient. Pour des appels isolés ça veut dire faire deux requêtes (login + action) au lieu d’une, avec un délai de réponse finale allongé et une charge plus importante pour le serveur. Sauf besoin spécifique, il faut rester en stateless : Chaque connexion contient ses propres informations d’authentification.
- Pas d’authentification par IP, comme je le vois trop souvent. Outre que c’est un potentiel problème de sécurité, c’est juste quelque chose de difficilement maintenable et c’est toujours au dernier moment quand on veut faire un correctif, une migration ou une bascule vers le serveur de secours en urgence qu’on se rend compte du problème.
- L’authentification HTTP Digest me semble être une mauvaise réponse à tous les problèmes. Pour améliorer légèrement la résistance aux interceptions, il faut stocker le mot de passe en clair côté serveur. Une authentification HTTP Basic avec du TLS pour sécuriser la communication me semble bien plus pertinent, et aussi plus simple à réaliser.
- Le système fait maison est toujours la pire solution, même si vous pensez savoir ce que vous faites. C’est un NO GO commun à toute problématique qui touche la sécurité. Vous avez plus de chances de vous tirer une balle dans le pied qu’autre chose, et pour le même prix ce sera toujours plus complexe quand vous communiquerez avec des tiers.
- OAuth 2 a la mauvaise idée d’être plus une boite à outils qu’une solution finie. Même les gros groupes se prennent les pieds dans le tapis avec ça. On rejoint un peu le système fait maison. OAuth a ses défauts, mais globalement est une sphère contrôlée que vous devriez préférer.
Au final il reste le choix entre l’authentification HTTP Basic, l’authentification par certificat client avec SSL/TLS, ou OAuth 1.0. Ma grille de choix est la suivante :
- OAuth s’il s’agit d’avoir une authentification à trois pattes. Hors de question d’imposer à l’utilisateur final de saisir ses mots de passes dans un logiciel tiers. Pour une API qui veut créer un écosystème de logiciels clients (type twitter) c’est le choix quasiment imposé. Oui il y a des difficultés pour le mobile ou pour ce qui n’est pas « navigateur », mais ces questions sont désormais largement documentées. Pensez bien que choisir ce type d’authentification demande un réel travail (par exemple trouver l’ergonomie pour permettre à l’utilisateur d’autoriser et retirer l’autorisation d’applications tierces sur votre propre système)
- HTTP Basic par défaut pour quasiment toutes les autres situations. C’est simple côté client, simple et maitrisé côté serveur, supporté partout et pour tout, suffisamment sécurisé si on passe par du SSL/TLS.
- Et les certificats clients avec SSL/TLS ? C’est une solution qui semble plus intéressante que l’authentification HTTP mais qui se révèle complexe pour pas mal d’interlocuteurs. La valeur ajoutée ne semble pas valoir la complexité supplémentaire si vous n’interagissez pas avec des entreprises de taille significative. J’y croyais beaucoup, mais finalement j’ai peu d’argument face à la simplicité du HTTP Basic.
Et vous ? vous utilisez quoi pour l’authentification de vos services ?
18 mars 2013

Étiquette : API

The lie of the API

Défi­nir son API : version­ne­ment

Défi­nir son API : authen­ti­fi­ca­tion

Définir son API : versionnement

Définir son API : authentification