Catégorie : Technique

The startup freelancer

Partage de lecture:

I decided to stop doing the office job thing and started doing exactly what I want with my time, seven days a week.

[…]

I’m also a freelance programmer. I help early stage startups get their MVPs out the door. That means I get involved when the first server needs to be set up, the first database installed, the first repo created and the first line of code hastily banged out. There’s something about those first moments of a startup’s existence that is hard to reproduce – the thrill of a newborn idea coupled with the urgency of the penniless.

The startup freelancer — Vassili van der Mersch

1 mars 2014
Flysystem – accès aux systèmes de fichier au PHP

Petite découverte récente et sympa : Flysystem. Une bibliothèque de code PHP qui présente une abstraction assez simple et sympa autour des systèmes de fichier locaux, S3, dropbox, FTP, …

12 février 2014
Documentation PHP

Quelques (nombreux) écrans de présentation de Willian Durand à propos de PHP

Je ne sais pas à qui est destiné cette documentation, mais c’est un boulot énorme et très bien fait de collecte, analyse et présentation des bonnes pratiques. Vous devriez passer dessus et prendre du temps à lire même si vous travaillez déjà avec PHP au jour le jour.

Pour m’être frotté à ce genre d’exercice, j’ai rarement vu un résultat aussi bon.

Il y a une version pour la suite qui parle plus particulièrement de Symfony, mais moins essentielle à mon avis.

12 février 2014
Gérer les services homebrew sur Mac OS X

LaunchRocket : Petit soft qui rajoute une page dans l’appli de préférences Mac OS X. De là vous pouvez gérer les services installés via Homebrew : les arrêter, les démarrer.

Je ne suis pas convaincu par leur explication sur le côté sécurité donc je ne cocherai pas le « run as root » mais sur le reste c’est assez pratique.

12 février 2014
Offshore & startup
Je recherche des startups Europe/US dont une partie de l’équipe technique a été basée hors Europe/US pour des raisons de coûts.
- Est-ce que ça existe ? Vous avez des noms ?
- Si vous l’avez vécu (quel que soit le côté), quelles en ont été les enjeux, les difficultés et les résultats ?
- Si vous avez choisi de ne pas le faire, pourquoi ?
Note : Je ne parle pas de régie offshore mais bien de gens internes à la startup.
I am looking for European/US startups in which part of the team has been located outside Europe/US to lower the costs.
- Did you heard about such experiences ? Do you have names ?
- If you lived it (whatever the side), what where the stakes, the difficulties and the results ?
- If you choose not to go this way: why ?
Note: I am not talking about offshore contracting but about people who are direct employees of the startup
5 février 2014
Lien vers du Javascript
Problématique du jour : Intercepter l’appel à des liens via Javascript.

Mon cas d’usage : J’ai des contenus (images, vidéos, audio, polices de caractères) stockés côté client (indexedDB, webSQL ou DOMStorage) que je souhaite insérer dans mes pages.

(billet mis à jour au fur et à mesure des réponses)

Quelques solutions :

Data:URI

Je récupère ma donnée, je la transforme en base64, et je remplace le lien standard par un lien en data:uri.

Deux défauts : Je stocke N fois la donnée dans le DOM où N est le nombre d’apparition de l’image ou de la ressource dans mes pages HTML/CSS. Pour ne rien gâcher, on stocke en base64 donc avec 30% de poids en plus. De plus, même si je n’ai pas de test à montrer, on s’est déjà pris les pieds dans le tapis à cause de très mauvaises performances de pages avec beaucoup de data:uri, spécialement sur Firefox (probablement sur les polices de caractères)

Blob + createObjectURL

Je récupère ma donnée, je créé un Blob à partir de cette donnée, je passe par URL.createObjectURL pour créer une URL dédiée et j’utilise cette dernière quand je référence ma ressource.

On résout les problèmes du data:uri mais on se coupe de IE 9, IE mobile et iOS 5. Pas gravissime mais j’aurai préféré éviter.

Par contre la solution ne fonctionnera de toutes façons pas pour les images ou polices de caractères référencées depuis les CSS (sauf à construire les CSS via Javascript mais là on entre dans des usines à gaz).

Cas spécifique des vidéo et audio

Les deux solutions me posent de toutes façons un sérieux problème pour les vidéo et les audio, qui peuvent être de gros volume. Je me vois mal sortir d’indexedDB des dizaines de mégaoctets (au mieux) pour construire un blob juste et avoir une URL dans ma balise HTML sans même savoir si l’utilisateur tentera effectivement de lire la vidéo ou le fichier audio.

Pour les vidéos et les audio (mais uniquement ces deux types de contenu) je peux réfléchir à mettre un lien vers une vidéo de taille quasi nulle et le changer dès que la vidéo est activée. J’ai toutefois un peu peur des effets de bords. Il va falloir aussi bosser en amont pour que la première image s’affiche bien dans le lecteur vidéo malgré l’absence de la vidéo complète.

Bidouille

Pour l’instant ma solution serait :
- Pour les images et polices de caractères dans les CSS : data:uri. En espérant que la CSS ne contient pas trop de ressources inutiles ou trop de liens vers la même ressource.
  - Au pire : Générer la CSS en Javascript avec des liens obtenus par createObjectUrl, l’insérer dans le DOM manuellement
- Pour les images dans le code HTML : createObjectURL si possible.
  - Vérifier tout de même si le data:uri n’est pas plus simple. La différence entre les deux sera assez faible si les images ne sont pas répétées plusieurs fois.
- Pour les audio et vidéo : Désactiver le preload, renseigner le lien via createObjectURL qu’au lancement de la vidéo. Pour les vidéo, penser à créer une image d’attente avec l’attribut poster.
Ça reste franchement du bricolage je trouve, et ça va nécessiter plein de javascript pour générer tout ça.

Dans mon monde idéal

Dans l’idéal j’aurai bien aimé avoir une sorte de faux serveur web en javascript depuis le navigateur. Genre toute url en « local-js://xxxxx » fait appel à un objet Javascript qui répond ensuite ce qu’il veut.

À défaut, un URL.createObjectURL( 'text/html', function() { return bindata; } ) serait bien pratique : Le navigateur n’appelant la fonction pour récupérer le contenu que quand il cherche à accéder au dit contenu, au lieu de lui donner tout le contenu par avance au cas où il en aurait besoin.

Quelqu’un a des pistes pour moi ?
3 janvier 2014
[blog] Suivi des discussions

Vieux sujet traîné en commun avec Karl et David (mais pas que) : Faire en sorte de décentraliser les blogs et les discussions qui s’en suivent.

L’histoire

Par le passé nous avions Trackback. On envoyait une notification aux contenus liés, avec le lien vers notre contenu, le nom du blog, un extrait et un titre. Le codage caractère était globalement mal géré, les titres et extraits se sont révélés globalement inutiles voire contre-productifs, mais c’était implémenté un peu partout et ça, techniquement, ça fonctionnait assez bien.

Pour faire court, les gens continuaient à commenter dans le billet d’origine plutôt que de commenter dans un nouveau billet chez eux. Par contre les trackbacks étaient très utilisés pour le spam, avec au final un ratio signal/bruit vraiment mauvais et donc l’abandon du système.

Il y a aussi eu Pingback. Système similaire mais avec une autodécouverte plus sympa et l’arrêt de transmission des titres et extraits. Vu que ces derniers n’étaient jamais personnalisés spécifiquement pour la notification, autant les récupérer directement à partir du lien si jamais on en a besoin.

Différence, Pingback proposait de vérifier la présence d’un lien sortant dans le contenu tiers avant de valider une liaison entrante. Cette différence fut peu impactante au finale. L’idée a aussi été implémentée dans les trackback mais les spameurs ont vite appris à faire des liens sortants pour poster leur spam, quitte à faire des liens invisibles pour le lecteur ou des liens temporaires supprimés après l’opération.

Je trouve aussi l’idée discutable dans le sens où la valeur ajoutée du lien n’est pas la même dans les deux sens. Si je réalise analyse sur une dépêche AFP, il peut être utile d’avoir une notification chez plusieurs personnes qui reprennent verbatim cette dépêche, mais cela n’aurait aucun sens d’en lier plus d’un à partir de mon analyse (ce que la vérification de pingback impose).

Wikipedia cite aussi Refback. Je ne l’avais jamais vu formalisé sous ce nom mais la pratique est connue : Explorer les entêtes HTTP Referrer pour repérer de nouveaux liens entrants automatiquement. Les spammeurs jouaient à fausser ces entêtes depuis longtemps donc là aussi ça n’a pas changé grand chose.

Tous ces systèmes ne spécifient que la notification. Il s’agit de parler un langage commun au niveau de cette notification pour que ce soit plus simple pour tout le monde. Il reste à l’éditeur du site lié de choisir ce qu’il fait de la notification : L’afficher automatiquement avec une modération a posteriori, gérer une liste blanche, mettre un système anti-spam automatisé, ou même faire une validation manuelle a priori.

Il y a aussi Salmon, très orienté commentaire, mais extrêmement complexe et quasiment pas implémenté (les deux sont certainement liés). J’ai du mal à voir ce protocole réellement implémenté partout.

Webmention

Aujourd’hui on parle de Webmention. Même sémantique que Pingback, même mécanismes d’autodécouvertes (seule la valeur de « rel » change), même requête initiale et mêmes paramètres (seuls les noms des paramètres changent légèrement pour retirer les trois derniers caractères).

Les différences tiennent exclusivement dans la précision de la méthode HTTP à utiliser (POST) et dans les codes de retours (Webmention utilise les codes HTTP standards et un lien vers la mention créée, là où Pingback renvoie une code de retour dans le corps de la réponse).

C’est techniquement plus satisfaisant pour les afficionados de HTTP mais la valeur ajoutée fonctionnelle est nulle. On ne fait rien de plus, rien de moins, et pas vraiment différemment. J’échoue d’ailleurs à

Sachant que pingback a une implémentation disponible sur à peu près tous les gros moteurs de blogs, je ne trouve pas que cela justifie de lancer un nouveau protocole. En l’état c’est d’une utilité encore plus faible que ce que j’imaginais initialement. Pas de quoi m’embêter à l’implémenter.

En fait à choisir entre pingback et webmention, une fonctionnalité forte de pingback est l’attribut pingback, qui permettrait de faire une notification automatique suivant ce dernier protocole, et donc de remplacer (en opt-in) l’entête HTTP Referrer là où elle est bloquée par HTTPS. Cette possibilité me semble bien plus utile que le respect théorique de HTTP (je sens que je vais attirer pas mal de commentaires avec cette phrase mais j’assume).

Suivi des discussion

Et puis j’ai l’impression qu’on regresse un peu par rapport au trackback initial. Pingback et Webmention notifient d’un lien entrant, pas d’un suivi de discussion.

Je peux avoir un lien entrant sans aucun ajout à la discussion, juste un relai. Inversement je peux avoir un nouveau contenu qui apporte à la discussion et qui mériterait de notifier plusieurs contenus déjà existant sans forcément s’imposer de faire des liens.

Autre commentaire de Karl : Certains aimeront avoir plus qu’un lien, avec un petit texte sur le pourquoi de la notification, de ce qu’ajoute ce nouveau contenu au sujet déjà en cours – par exemple pour orienter la modération et le choix de (non-)publication. Pas forcément pertinent de le rendre obligatoire (ça empêcherait pas mal d’automatismes) mais le rendre possible serait utile.

Et si je n’impose pas de lien dans le contenu notifié, il faudra que je puisse en authentifier l’origine. Un système de signature simpliste devrait suffire mais sera nécessaire.

Faire une spécification qui implémente ça demande deux heures tout au plus. Rien n’empêche même qu’elle soit compatible avec Webmention et qu’on puisse avoir un point d’entrée unique. Simplement ça n’a de sens que si je ne suis pas le seul à jouer.

David, Karl, les autres ? vous en pensez quoi ?

18 décembre 2013
The lie of the API

Quelques réponses sur un billet qui a beaucoup circulé : The lie of the API.

Ça flatte beaucoup la mouvance HATEOAS mais je n’accroche pas. Même avec des clients très smart, impossible de faire un même site pour les visites « navigateur » et les accès « API ».

Le logiciel client de l’API ne sera jamais assez intelligent pour comprendre autant le contexte que l’humain derrière son navigateur, et jamais assez souple pour gérer des changements non prévus.

Donc partons de notre bibliothèque qui expose des collections avec des contenus, chacun reliés à des auteurs.

Et si demain je change mes représentations pour ne plus mettre les bio des auteurs dans la fiche du livre directement ? Certes techniquement il est possible de faire un robot qui sache récupérer cette bio sur la fiche de l’auteur, mais quelle est la probabilité que les robots actuels gèrent le changement ?

Et si demain le site web est changé pour que le point d’entrée premier soit l’auteur ? Le logiciel saura-t-il rechercher un livre dont il ne connait pas l’adresse ?

Et si demain je change le système de classification des livres pour passer de BISAC à la CLIL française ? Quelle probabilité que le robot et l’applicatif derrière gère ça de façon transparente ?

La partie destinée au robot (qu’on nomme généralement « API ») n’a simplement pas les mêmes besoins que la partie destinée aux humains (qu’on nomme souvent « web »). On peut faire concilier les deux au début, mais ça va casser au fur et à mesure des évolutions de la partie destinée aux humains.

Tout ça pour quoi ? La satisfaction intellectuelle du développeur qui se dit qu’il correspond au schéma idéal du web. La valeur ajoutée ne me semble pas justifier le risque.

C’est d’autant plus vrai qu’en réalité les clients qui codent des robots hypermedia corrects il n’y en a pas tant que ça. Rapidement des tiers vont coder des robots en faisant de l’ingénierie inverse sur les adresses, les identifiants, la structure, les données. Ça sera peut être de leur faute, mais ça va casser si vous faites des changements en vous reposant uniquement sur le côté hypermedia.

D’où la question : Souhaitez-vous que ça fonctionne ou avoir raison ?

17 décembre 2013
La fin d’AdBlock ? Google prend le contrôle exclusif des extensions Chrome

La fin d’AdBlock ? Google prend le contrôle exclusif des extensions Chrome. Le titre est là pour faire du buzz mais le problème est réel : Celui du contrôle de l’écosystème et de l’assujettissement à une ou plusieurs multinationale qui décident ce qu’on a le droit ou non de faire sur le web, avec nos contenus.

Rappelez-vous qu’en mars de l’année dernière Google qui menaçait de mettre des applications Android dehors si elles ne passaient pas par la solution de paiement intégrée de Google (avec les commissions adéquates). Rappelez-vous encore aujourd’hui Google qui bloque les revenus publicitaires dès qu’on voit un bout de peau dénudée sur le site web.

Le fait de pouvoir faire ou pas ce qu’on veut sur la porte d’entrée sur le web est juste un enjeu de société. À la limite ne pas pouvoir placer d’extensions est moins dangereux : on ne risque pas de se voir orienté inconsciemment par ce qui est présent.

8 novembre 2013
Please stop pretending PHP is a good language
The first step to fixing a problem is admitting that there is one.

Bon, des critiques de PHP ce n’est pas ce qui manque mais pour une raison inconnue je m’étais dit que ça partait bien quand j’ai lu la première ligne. Sauf qu’au final…
- It’s not ok that you can’t reliably get the first element of an array using less than 4 lines of code without causing side effects.*[1]
- It’s not ok that the output of echo 5/3 might depend on the country you live in if you don’t know the fine details of configuring PHP.
- It’s not ok that you won’t be able can’t call array_map” or just “$iterator->reduce” on an iterator in 2014.
- It’s not ok to ignore the simple fact that most of the PHP world currently relies on parsing function and class comments for it’s code to function because people can’t get their shit together on mailing lists.
- It’s not ok to run around shouting “type hinting for literals would mean that passing an int to float hint would fatal PHP” and calling that an reasonable argument while people just write $x = (float)$x; in the cases where it actually does matter anyways.
- It’s not ok to be not able to talk to 2 back end data sources in parallel, using “promises” or whatever, in a language that has “pull stuff out of database and put it into the internet” as a proclaimed core competency.
- It’s not ok that echo 0.000001; produces 1.0E-6 and that casting it to string doesn’t help but putting quotes around it does.
- It’s not ok that you have to clear the error buffer by generating a suppressed undefined variable error just to be able to sanely use token_get_all().
Au final la moitié des items ressemblent juste à « ça ne fait pas ce que j’espère ». Alors pour ceux qui m’ont fait suivre le lien :

Pour le premier item il existe plusieurs solutions, dont un simple array_values($tab)[0]. Bref, rien d’exceptionnel pour aller itérer sur un dictionnaire.

Pour le second, si on demande explicitement au niveau du système à afficher les résultats suivant les conventions d’un pays spécifique, PHP s’y conforme. C’est le cas de la plupart des langages, y compris la ligne de commande de base. Difficile d’avancer que c’est un problème, d’autant qu’il est bien évidemment possible d’ignorer la configuration du système pour forcer une locale au niveau du langage.

Quant à savoir comment afficher 0.000001 ou 1E-6, comme le langage n’a aucun moyen de savoir comment a été tapé la valeur initiale dans le code source (rien de spécifique à PHP, à ma connaissance aucun ne le fait), il faut bien qu’il choisisse une forme arbitrairement à la sortie. Si l’auteur veut forcer autre chose, il a tous les outils pour ça.

Pour le dernier item j’ai la flemme de vérifier les cas limites mais à priori c’est juste que l’auteur n’a pas eu le courage d’aller créer un gestionnaire d’erreur pour gérer ses erreurs.

Bref, tout ça c’est bien joli mais à première vue une bonne partie n’est qu’un problème de développeur frustré, pas un problème de langage.

Ce qui me frustre moi c’est que des problèmes de langages il y en a plein, et que pousser des faux problèmes décrédibilise ceux qui essayent de corriger les problèmes réels.
21 octobre 2013

Catégorie : Technique

Data:URI

Blob + crea­teObjectURL

Cas spéci­fique des vidéo et audio

Bidouille

Dans mon monde idéal

L’his­toire

Webmen­tion

Suivi des discus­sion

Blob + createObjectURL

Cas spécifique des vidéo et audio

L’histoire

Webmention

Suivi des discussion