Catégorie : Développement informatique

Pas de moteur DOM en ruby ? vraiment ?

Je trouve ça tellement étrange qu’à mon avis j’ai simplement des oeillères qui me masquent la bonne librairie de code.

Je cherche un moteur DOM XML utilisable en programmation ruby. J’ai trouvé des moteurs dits DOM-like, c’est à dire des TreeBuilder avec des API plus ou moins heureuses, et dont le parcours est généralement franchement pénible si on n’utilise pas XPath ou qu’on ne recherche pas quelques éléments particulier via leur chemin. Hpricot, Nokogiri, REXML et même libxml font partie de cette catégorie.

Par contre je n’ai trouvé aucun moteur DOM qui cherche vraiment l’implémentation de la spécification DOM. J’attends par exemple un attribut documentElement sur la classe DOMDocument. J’aurai compris sur Ruby avoir un attribut document_element au lieu de documentElement mais là c’est généralement un root que je retrouve. Sur les interfaces pour parcourir le XML les différences sont bien plus profondes et je me retrouve avec des APIs qui sont généralement très différentes.

Certes, je peux me passer de DOM mais ce serait quand même étrange que personne n’ait implémenté en ruby ce standard extrêmement courant. Qu’ai-je manqué ?

10 août 2012
Signature des applications Android sur Google Play

Je trouve très peu de conseil ou bonnes pratiques. Développeurs Android qui avez de l’expérience là dedans, j’ai besoin de vos lumières.

Pour l’instant j’ai lu Signing you applications. J’ai retenu que toutes les applications doivent être signées, et que pour pouvoir les mettre à jour il faut utiliser exactement le même certificat que l’application d’origine. Pour signer on créé un keystore et un alias.

Une ou plusieurs clefs

La bonne pratique habituelle côté sécurité c’est une clef par destination, application ou usage. Éventuellement une clef globale pour certifier les premières si on a besoin de s’assurer de la paternité de toutes les clefs. Ça militerait pour signer chaque application avec une clef différente et ça permettrait de déléguer la production d’une ou plusieurs applications à un tiers sans devoir lui donner la clef globale.

Le problème c’est que le document sur la doc Android, ainsi que les quelques documents trouvés sur le web à propos de Google Play, conseillent plutôt d’utiliser une clef globale. Le seul gain que j’y vois c’est que les applications pourront communiquer entre elles. Je n’en ai pas besoin pour l’instant mais il est vrai que je ne connais pas le futur.

Alors, une clef par application ou une clef globale ?

Notion de keystore et alias

Tel que je le comprends le keystore n’est qu’un simple entrepôt pour stocker des clefs. Mis à part que lui même peut être protégé par un mot de passe pour éviter de donner trop facilement accès aux clefs privées. Les clefs privés sont en fait ce qui est pointé par les « alias » dans la documentation. On peut donc avoir plusieurs clefs par keystore.

J’en déduis que la notion de keystore n’influe pas du tout sur Google Play. Je peux sortir ma clef d’un keystore, la mettre dans un autre keystore et signer une mise à jour avec. Tant que c’est la même clef, on se moque du keystore. Ai-je bon ?

J’en déduis donc aussi que Google n’a aucune notion de mon keystore et que je peux y ajouter de nouvelles clefs quand je le souhaite pour de nouvelles applications. Je n’ai pas besoin de préparer un keystore avec un jeu de clef qui ne bougera pas et que je ne pourrai pas mettre à jour. Ai-je bon ?

Voilà voilà, j’ai besoin de vos lumières et ayant peu d’éditeurs d’applications dans mon réseau, j’apprécierai beaucoup que vous fassiez suivre mes interrogations à vos propres connaissances.

Comme j’ai eu quelques conseils de gens qui réfléchissent à haute voix mais n’ont eux-même pas essayé ou pas d’expérience dans tout ça : Si vous vous retrouvez dans cette situation, merci de le préciser pour que je fasse le tri entre les retours d’expérience réels et les autres.

7 août 2012
Un peu de courage sur les formulaires

La fainéantise est une superbe qualité pour un informaticien. C’est ce qui fait que l’informaticien est capable de coder 20 minutes un script pour lui automatiser une tâche qui prend 5 minutes de boulot tous les mois.

Maintenant parfois c’est abusé, et c’est trop souvent le cas sur les formulaires.

Sans rire, préciser « en majuscules et sans accents » en gras c’est que le problème a été repéré lors de la conception du formulaire, ou que les retours clients en assistance téléphonique ont été assez importants pour justifier la modification du texte.

Dans ce cas, vous ne croyez pas que la saisie devrait être libre ? À votre application de mettre en majuscules et de retirer les accents si ça lui chante, mais ne faites pas faire votre boulot à l’utilisateur.

Le pire c’est pour le numéro de téléphone parce que je l’ai vu dans *tous* les formulaires d’opérateurs téléphonie et internet. Le champ est bloqué à dix caractères, donc un numéro de téléphone sans espaces.

Bon, c’est juste agaçant à la saisie, mais c’est surtout inutilisable au copier-coller car quasiment tout le reste de la France utilise des espaces comme séparateur. C’est donc à l’utilisateur d’aller copier-coller le numéro dans un éditeur de texte pour retirer les espace et le copier-coller à nouveau dans le formulaire.

Franchement, le développeur n’avait pas la capacité de retirer lui même espaces et ponctuation côté serveur ? Ça coutait vraiment trop cher ?

Développeurs : Soyez fainéants, mais ne faites pas faire votre boulot par vos utilisateurs !

4 août 2012
D’une façon d’aborder la technique

Aujourd’hui j’ai demandé un peu d’expertise extérieure pour savoir quelles étaient les différences de traitements entre un SELECT DISTINCT et un GROUP BY dans Mysql. La question a trouvé sa réponse et pour ceux que ça intéresse, le serveur fait les mêmes optimisations, au moins dans le cas le plus simple.

Ce qui m’a surpris c’est le nombre de gens qui ont fait une réponse basée sur leur simple intuition, souvent très mal conseillère, et parfois présentée comme une explication sûre.

Que les développeurs émettent des hypothèses ou puissent se tromper n’est pas choquant. Par contre se baser sur ses préjugés, ne pas chercher, vérifier, se documenter, ça c’est une vraie faute professionnelle (et ce encore plus quand les préjugés sont dramatiquement faux et injustifiés).

Dans nos métiers il doit y avoir curiosité et envie de chercher la solution, mais surtout cette solution doit être basée sur une compréhension des mécanismes sous-jacents, ou au moins de la documentation fiable, et le tout idéalement recoupé par des tests sérieux.

Peut-être tire-je trop vite aux conclusions mais j’ai l’impression que de plus en plus de développeurs se satisfont de cette façon de faire et oublient que leur travail ne devrait pas se baser sur des informations incomplètes et des pré-jugés. Collègues : Il est temps de vous réveiller.

1 août 2012
Sites à page unique

J’ai beaucoup aimé le site de Bayrou, et j’ai découvert il y a quelques temps celui de Troll d’idées. Je vous encourage à explorer au moins le second.

Il y a un petit mouvement vers les sites à page unique avec des ancres et des séparateurs visuels pour naviguer. Je dois avouer que c’est génialissime quand c’est bien pensé et bien travaillé, mais ça demande à priori un investissement en conception largement supérieur au site habituel. Sans cet investissement, le résultat est rarement au niveau.

Mon problème c’est que sur ces deux sites, il manque une version mobile. Est-ce une bonne pratique sur mobile ? Ce genre de design résistera-t-il au temps ou restera-t-il un effet de mode comme furent en leur temps les effets de paralaxe (dont Troll d’idées abuse d’ailleurs un peu) ?

Connaissez-vous un site qui fait de même avec en plus du responsive design ?

30 juillet 2012
Web Performance Daybook Volume 2

J’ai le plaisir de vous annoncer la publication de Web Performance Daybook Volume 2 (aussi disponible en France). Il s’agit d’un recueil d’articles de plus de 30 auteurs autour de la performance web, collectés par Stoyan Stefanov en fin d’année dernière et auquel j’ai eu le plaisir de participer.

Certes, tout le contenu peut être trouvé par Internet mais les bénéfices sont intégralement reversés à la fondation WPO, dont l’objectif est d’aider et financer les projets open source et la recherche autour de la performance web.

Bref, probablement un geste utile autant qu’intéressant.

Si ça fonctionne, nous verrons probablement un volume 1 prendre la suite (avec des articles de l’année précédente, mais toujours intéressants).

2 juillet 2012
Document store à recommander
J’ai un modèle relationel très complexe avec des règles métier des plus biscornues quand on souhaite relire quelque chose. Par exemple, pour récupérer le libellé d’un item il faut que je concatène plusieurs champs et que je fasse une ou deux conditions pour gérer des cas spécifiques.

J’ai peur que ça devienne difficile à gérer et que ça facilite énormément les erreurs de traitement à l’avenir.

J’ai envisagé les trois solutions classiques :
- dénormaliser le modèle en stockant à plat certaines données précalulées dans le SGBDR, mais il y a pas mal de choses où c’est vraiment délicat, par exemple quand un item contient une collection de données
- coder des vues complexes et des procédures stockées pour automatiser certaines actions, mais j’ai l’impression de déporter mon métier là où ça sera le plus difficile à maintenir et à développer
- ou utiliser un bête stockage orienté document et laisser tomber le relationnel, qui de toutes façons me sert assez peu sur ces données
À priori je suis plutôt parti sur la troisième solution et j’ai besoin de vos lumières pour choisir le datastore le plus adapté.

Voici mes contraintes :
- Performant (c’est pour utiliser en permanence au cœur de l’infra)
- Accessible facilement en PHP
- Stocke des données structurées (type json) avec de la hiérarchie (un document peut contenir une collection par exemple)
- Le modèle de chaque document doit être libre ou en tout cas très souple
- Sait manipuler une collection de plusieurs millions de documents (d’où la nécessité des index au point précédent)
- Sur ces millions de doc je peux faire des requêtes de type « par date de mise à jour inverse, uniquement ceux qui ont un attribut ‘toto’ à 145 et un attribut ‘tata’ à 567 » sans avoir à faire un scan de tous les documents à la requête (ce qui implique probablement des index)
- Sait gérer de la haute disponibilité (par exemple deux serveurs synchronisés en master-master)
- Simple à utiliser et administrer
- Stockage disque (donnée pérenne en cas de plantage)
- Accès réseau (la base et l’applicatif sont sur des serveurs différents)
J’ai aussi des non contraintes :
- Les écritures sont faites en batch, je n’ai pas besoin de transaction ou de lock d’écriture
- Je n’ai pas besoin de validation, typage, ou contrainte d’intégrité
- Je n’ai pas besoin de transactions
- En cas de plantage, j’accepte de perdre quelques minutes de données non écrites (mais pas de planter les anciennes données)
- J’accepte des latences jusqu’à quelques minutes entre les différents serveurs synchronisés
- Je peux prévoir à l’avance les requêtes que je vais faire (et donc construire des index dédiés)
Les bonus :
- Consommation mémoire pas trop délirante
- Outil pour faire des dump/restore
Cassandra, Voldemort, MongoDB et autres joyeusetés, je suis preneur de vos recommandations avec explications, ou simplement des liens vers des billets qui peuvent m’éclairer.

Merci à vous cher public (j’ai toujours rêvé de dire ça ;)
14 juin 2012
Livre sur les performances cherche famille d’accueil
J’ai commencé un long projet il y a plus de trois ans de cela : un livre sur le temps de réponse des sites web. Le projet a rapidement avancé, avec 150 pages A4 rédigées et relu. C’est la moitié de l’objectif du sommaire, ou à peine plus, mais c’est déjà le volume d’un bon petit livre technique. C’est certainement de l’égo mal placé, mais je pense encore que le contenu est riche, de qualité, et n’a pas vraiment d’équivalent, même en anglais.

Le projet stagne toutefois depuis deux ans avec un avancement entre la moitié et les deux tiers. Écrire un livre technique c’est un projet à plein temps sur plusieurs mois, surtout que j’ai tendance à vouloir être exhaustif. J’ai toujours eu un métier à plein temps à côté et des événements professionnels et personnels réguliers ont fait que je n’ai pas pu y consacrer le temps nécessaire. Ces derniers temps mon métier s’est de plus totalement éloigné de la performance des sites web, ce qui rend difficile l’investissement personnel et la motivation nécessaires.

J’ai tenté de trouver des co-auteurs pour relancer le projet mais chacun a aussi ses propres projets et un manque de temps. Je n’ai pas su trouver les bonnes personnes, ou elles n’ont pas pu dégager le temps pour s’y mettre.

Au final j’ai un contenu qui me semble de bonne qualité mais incomplet qui dépérit avec le temps. Il finira pas ne plus être suffisamment à jour, et ne servir à personne. Voir mourir ce bébé m’attriste, j’aimerai l’éviter.

Voilà où j’ai besoin de vous : trouver une famille d’accueil à cet ouvrage, une personne un groupe ou une société qui complète les chapitres non écrits, remette à jour ceux qui le sont déjà, et qui en fasse quelque chose. Je suis ouvert à toutes les propositions sérieuses. Mes critères sont les suivants, par priorité :
- Je tiens à la qualité du contenu. S’il est repris et qu’il évolue, je tiens à ce que ce soit par ou sous la surveillance de gens sérieux et compétents sur le sujet
- Ceux qui reprennent le projet souhaitent y investir un temps suffisant, sinon une éventuelle reprise n’aura aucun intérêt
- Je souhaite que mon nom reste crédité sur le contenu, et tant que le contenu initial reste significatif dans l’ouvrage final, que ce crédit soit à titre de (co-) auteur principal
- Pour mon égoïste satisfaction personnelle, j’aimerai beaucoup que l’ouvrage finisse publié sur papier (un éditeur est intéressé à priori, « il suffit de »)
- S’il y a une utilisation commerciale, directement ou indirectement, sauf exception je souhaite une rémunération raisonnable à hauteur de ma contribution au résultat final
Là dessus vous pouvez envisager à peu près ce que vous voulez. N’hésitez pas à faire suivre à ceux que ça peut intéresser.
22 mai 2012
Which programming language should I learn first?
Histoire de rire un peu (jaune) :
- To get a guaranteed, mediocre, but well paying job writing financial applications in a cubicle under fluorescent lights: Java.
- To do the same thing with certifications and letters after your name: C#
Which programming language should I learn first? Et vous, quel langage apprenez-vous ?
15 mai 2012
Pour une éducation numérique
L’article de Slate ne va pas loin (oui, je sais, cette phrase est un lieu commun) mais le fond me semble des plus importants. Apprendre à programmer, sera aussi essentiel pour l’autonomie et pour progresser demain que ça ne l’écriture, la lecture et les mathématiques de base pour nos parents ou grands parents.

Ceux qui savent programmer seront indépendants pour réaliser toutes leurs tâches quotidiennes. Tout ce qu’ils feront, personnellement et professionnellement sera numérique. Les feuilles de calcul, les tableaux de données et les fichiers texte seront leur lot quotidien. Pouvoir faire quelques lignes de code pour extraire leurs informations, automatiser des traitements, ou simplement manier comme ils souhaitent la profusion de données auxquelles ils doivent faire fasse, c’est essentiel.

Nous n’en sommes qu’aux prémisses et pourtant, comme beaucoup d’informaticiens, je me demande régulièrement comment font les gens « normaux » pour être autonomes sur leurs petites tâches quotidiennes. Certaines choses sont simplement faites en plus de temps, d’autres sont laissées pour compte. Aujourd’hui ces échecs quotidiens ne provoque pas encore de frustration car l’usage de la programmation n’est même pas envisagé ; l’aide d’un informaticien est vue comme une baguette magique. Demain, avec le tout numérique, personne ne sera dupe.

Mieux, la programmation leur permettra aussi de créer, de ne pas se satisfaire de ce qui existe déjà, de participer à l’innovation, et de simplement n’être limités que par eux-même. N’est-ce pas ce qu’on souhaite pour nos générations futures ?

Apprendre les rudiments de la programmation aux enfants peut paraitre exagéré mais l’objectif n’est pas d’en faire des développeurs de métier, pas plus que mes parents n’ont souhaités me faire écrivain ou mathématicien.

POURTANT ÇA EXISTait DÉJÀ

À quel âge faut-il commencer ? dans quel cadre ? ce qui est certain c’est que l’approche d’aujourd’hui, apprendre à se servir de l’outil via des logiciels tout faits, ne peut que mener à une impasse.

Je me rappelle que j’étais un privilégié à avoir gouté aux MO5 ou TO7, avec l’utilisation de Logo pour faire bouger une petite tortue à l’écran, en primaire, à l’école publique. J’ai l’impression que ces initiatives n’existent plus. On préfère faire des mises en gardes concernant Facebook, la propriété intellectuelle ou montrer comment se servir de MS Word à des élèves qui en maitrisent bien plus l’usage d’une façon que réprouverait n’importe quel informaticien.

À côté de ça le projet OLPC pour l’Afrique promeut l’usage de Python. Ça n’a l’air de rien, mais si cette tendance se confirme, nous vivrons au crochet de l’Afrique dans quelques générations, à moins qu’on ne continue à les assujettir à l’aide des dettes et autres produits financiers (et qu’on reste donc dans du perdant-perdant)

Un plan numérique

Le pire c’est que les lycéens voire collégiens qui apprennent d’eux même à faire du PHP ce n’est pas rare. L’école les freine au lieu de les y inciter.

C’est d’un vrai plan numérique dont nous avons besoin, un plan qui ne soit pas basé sur de l’équipement en tablettes, sur l’usage de logiciels en tant qu’outils bloqués, et à partir de professeurs qui ne gèrent aucunement ces outils.

Voilà quelques pistes :
- Éveil à la programmation en primaire, apprentissage sérieux au collège
- Intégration de la programmation comme outil au lycée pour toutes les disciplines (traiter des données en histoire-géographie, faire des analyses statistiques en français, mathématiques, physique, etc.)
- Utilisation de logiciels, langages et outils sous licence libre (c’est indispensable pour l’autonomie)
- Encourager la copie et le travail sur documents, parce que dans un monde d’abondance d’information et de connaissance, le tri, la réflexion et le traitement de l’information sont les réels enjeux
- Dans le même esprit, favoriser et répandre les travaux et examens où l’accès aux documents est autorisé voire encouragé, parce que ce qui est jugé ne doit pas être la capacité à apprendre par coeur et à retenir
9 mai 2012

Catégorie : Développement informatique

Une ou plusieurs clefs

Notion de keys­tore et alias

POURTANT ÇA EXISTait DÉJÀ

Un plan numé­rique

Notion de keystore et alias

Un plan numérique