Catégories
Geek Réseaux et Internet Technique Vie personnelle

Sauve­garde de l’his­to­rique de lecture

Je cherche à orga­ni­ser mes archives de lectures, en sauve­gar­dant les pages consul­tées ou parta­gées dans leur version de lecture pour une consul­ta­tion plus tard (si le contenu change ou dispa­raît) et pourquoi pas une indexa­tion parti­cu­lière.

J’ai cru entendre par Karl que quelqu’un avait monté son propre proxy sur un serveur en ligne pour tout archi­ver. C’est une piste qui pour­rait commen­cer à être inté­res­sante à condi­tion d’avoir une exten­sion de navi­ga­teur qui désac­tive le proxy quand je passe en navi­ga­tion privée. Il faudrait aussi un robot qui aille visi­ter auto­ma­tique­ment mes flux RSS, G+ et twit­ter pour les sauve­gar­der de la même façon. Enfin, je ne sais pas bien comment un tel proxy ferait la diffé­rence entre blog qui a des sessions PHP mal réglées (Cache-Control : private) et mon webmail (qui ne soit pas être sauve­gardé). Je ne vois pas non plus comment il peut conver­tir les URLs en #! en ?_esca­ped_frag­ment_ de façon à bien les sauve­gar­der.

Dans les autres bonnes idées j’ai entendu parler (peut être aussi via Karl) d’une exten­sion word­press qui main­tient une version cache de tous les liens faits vers l’ex­té­rieur, au cas où le site d’ori­gine tombe.

Enfin, de ce que j’ima­gi­nais au départ, il devrait être possible de se bancher sur les synchro­ni­sa­tions d’his­to­rique et de favo­ris de Fire­fox et Chrome pour ensuite avoir une mouli­nette qui va cher­cher, sauve­gar­der et indexer les conte­nus en site miroir. Le défaut, commun à la solu­tion précé­dente, est qu’on ne passera pas les paywall. Par exemple l’au­then­ti­fi­ca­tion Media­part m’em­pê­chera d’avoir une archive de la lecture presse, alors qu’elle fait partie des conte­nus impor­tants à sauve­gar­der pour archive. Je ne vois pas non plus comment synchro­ni­ser mes lectures sur smart­phone avec ce système.

Dans l’idéal j’ai­me­rai même que ces diffé­rentes sauve­gardes cache soient histo­ri­sées de façon à garder à chaque fois au moins la première et la dernière version (voire une par semaine ou par mois) et que je puisse manuel­le­ment inclure ou exclure des domaines de la sauve­garde. De même, j’ai­me­rai sépa­rer la partie histo­rique de lecture de la partie favo­ris et partages (cette seconde partie est bien plus impor­tante et à valeur ajou­tée).

Pour en avoir discuté un peu je sais ne pas être le seul à espé­rer mettre en œuvre quelque chose du genre. Avez-vous tenté quelque chose ? des pistes ? des idées ? des conseils ?

1 réponse sur « Sauve­garde de l’his­to­rique de lecture »

Je ne connais pas de programme web qui réponde à tous ces critères, mais j’en cherche un aussi. Pour le moment j’auto-héberge un gestionnaire de favoris et un gestionnaire d’articles lus, mais sans enregistrement du contenu. Lorsque je veux enregistrer, j’utilise l’extension FF scrapbook, puis je déplace le fichier dans un dossier d’archive (avec url relatives). Bref, c’est du bricolage manuel. Concernant les URLs pourries en #!, c’est problématique…

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *