Sauvegarde de l’historique de lecture

Réseaux et Internet, Sauvegardes, Vie personnelle

Je cherche à organiser mes archives de lectures, en sauvegardant les pages consultées ou partagées dans leur version de lecture pour une consultation plus tard (si le contenu change ou disparaît) et pourquoi pas une indexation particulière.

J’ai cru entendre par Karl que quelqu’un avait monté son propre proxy sur un serveur en ligne pour tout archiver. C’est une piste qui pourrait commencer à être intéressante à condition d’avoir une extension de navigateur qui désactive le proxy quand je passe en navigation privée. Il faudrait aussi un robot qui aille visiter automatiquement mes flux RSS, G+ et twitter pour les sauvegarder de la même façon. Enfin, je ne sais pas bien comment un tel proxy ferait la différence entre blog qui a des sessions PHP mal réglées (Cache-Control : private) et mon webmail (qui ne soit pas être sauvegardé). Je ne vois pas non plus comment il peut convertir les URLs en #! en ?_escaped_fragment_ de façon à bien les sauvegarder.

Dans les autres bonnes idées j’ai entendu parler (peut être aussi via Karl) d’une extension wordpress qui maintient une version cache de tous les liens faits vers l’extérieur, au cas où le site d’origine tombe.

Enfin, de ce que j’imaginais au départ, il devrait être possible de se bancher sur les synchronisations d’historique et de favoris de Firefox et Chrome pour ensuite avoir une moulinette qui va chercher, sauvegarder et indexer les contenus en site miroir. Le défaut, commun à la solution précédente, est qu’on ne passera pas les paywall. Par exemple l’authentification Mediapart m’empêchera d’avoir une archive de la lecture presse, alors qu’elle fait partie des contenus importants à sauvegarder pour archive. Je ne vois pas non plus comment synchroniser mes lectures sur smartphone avec ce système.

Dans l’idéal j’aimerai même que ces différentes sauvegardes cache soient historisées de façon à garder à chaque fois au moins la première et la dernière version (voire une par semaine ou par mois) et que je puisse manuellement inclure ou exclure des domaines de la sauvegarde. De même, j’aimerai séparer la partie historique de lecture de la partie favoris et partages (cette seconde partie est bien plus importante et à valeur ajoutée).

Pour en avoir discuté un peu je sais ne pas être le seul à espérer mettre en œuvre quelque chose du genre. Avez-vous tenté quelque chose ? des pistes ? des idées ? des conseils ?

Reprendre le contrôle

Comments

Une réponse à « Sauvegarde de l’historique de lecture »

2 novembre 2011

louis

Je ne connais pas de programme web qui réponde à tous ces critères, mais j’en cherche un aussi. Pour le moment j’auto-héberge un gestionnaire de favoris et un gestionnaire d’articles lus, mais sans enregistrement du contenu. Lorsque je veux enregistrer, j’utilise l’extension FF scrapbook, puis je déplace le fichier dans un dossier d’archive (avec url relatives). Bref, c’est du bricolage manuel. Concernant les URLs pourries en #!, c’est problématique…

Répondre

Sauve­garde de l’his­to­rique de lecture

Comments

Une réponse à « Sauve­garde de l’his­to­rique de lecture »

Laisser un commentaire Annuler la réponse

Sauvegarde de l’historique de lecture

Une réponse à « Sauvegarde de l’historique de lecture »