Catégorie : Sauvegardes

  • Oups Crash­plan

    J’ai plusieurs fois parlé de Crash­plan par le passé. Je l’uti­lise avec un backup sur le cloud de la société, et un second sur un serveur person­nel en ligne.

    Crash disque il y a un mois. Je devrais être heureux d’avoir pris les devants mais…

    Tout d’abord c’est lent. C’était exagé­ré­ment lent lors de l’en­voi des données mais ce n’était pas bien grave. Par contre la récu­pé­ra­tion des données se fait entre 2 et 8 Mb/s à partir du cloud alors que j’ai du 60 Mb/s soutenu avec le crash­plan sur mon serveur distant person­nel. Là fran­che­ment il y a de l’abus.

    Là où ça coince c’est ma femme qui a cher­ché une photo spéci­fique dans les données récu­pé­rées. Elle me signale de multiples sous-réper­toires vides qui ne devraient pas l’être. Je regarde, ils sont vides sur une des sources de backup mais pas sur l’autre, à la même date, plusieurs mois après leur ajout.

    Du coup je fouille. Sur un des dossiers qui m’in­té­resse le plus j’ai près d’un Go de diffé­rence entre mes les deux desti­na­tions de stockage. Je ne peux même pas dire que l’une a des fichiers plus récents parce que la première a plus de fichiers mais que l’autre a plus de sous-dossiers. Sachant que que je fais que des ajouts et jamais des suppres­sions… ça n’a aucun sens.

    En remon­tant plus loin, mes photos de mariage vielles de 10 ans et qui ne changent jamais sont passées de 7 Go à moins de 200 Mo sur une des desti­na­tions. Il va falloir que fouille mes DVD de backup mais je crois que j’avais plus de 7 Go de toutes façons…

    Bref, atten­tion Crash­plan. Simple : vous allez dans l’on­glet restau­ra­tion, vous cliquez sur le disque pour tout sélec­tion­ner, ça vous donne un nombre de fichiers, de dossiers et un volume de backup. Si ce n’est pas cohé­rents entre vos diffé­rentes desti­na­tions de sauve­garde (ça ne l’est pas chez moi) ou si ce n’est pas cohé­rent avec vos données sources, alors vous avez un problème.

    Même si c’était un problème spéci­fique à mes instal­la­tions, n’avoir aucune erreur d’in­té­grité pour un truc si impor­tant que le backup, c’est un peu un échec. Et du coup si vous avez une autre recom­man­da­tion que Crash­plan, je suis preneur.

    Entre temps je vais passer une semaine (esti­ma­tion Crash­plan) à restau­rer ce qui doit l’être depuis leur Cloud, puis faire la même chose depuis mon stockage Crash­plan person­nel avant de faire un diff manuel.

  • Mon cloud à moi

    On me parle de cloud tous les deux jours mais… je n’ai toujours pas de cloud à moi.

    Je veux que le PC Linux qui me sert de NAS puisse me propo­ser un disque réseau. Je veux pouvoir m’y connec­ter depuis Linux, Mac et Windows.

    Je veux pouvoir conti­nuer à navi­guer dans ce disque une fois hors-ligne. Je veux que les fichiers déjà ouverts et ceux que je marque expli­ci­te­ment soient mis en cache en local pour que eux aussi soient acces­sibles hors-ligne. Je veux pouvoir modi­fier ces fichiers hors-ligne et qu’ils soient synchro­ni­sées en tâche de fond dès que je me recon­necte.

    Si je devais abuser j’ai­me­rais même un accès Android et iOS, ainsi que pouvoir parta­ger des dossier au niveau d’une famille, voire avec des tiers. Bon, on va dire que ce para­graphe est option­nel.

    Je ne vais pas oser dire « c’est simple », mais on me le promet depuis tant de temps… Pourquoi ne l’ai-je toujours pas ?

    * * *

    J’ai exploré des choses, n’hé­si­tez pas à me propo­ser des ajouts qui répondent à ma problé­ma­tique, ou corri­ger mes erreurs.

    pCloud

    C’est peut-être ce qui semble le plus ressem­bler à ce que je recherche. On reste par contre sur un service en ligne proprié­taire.

    Je ne contrôle pas mes données qui sont obli­ga­toi­re­ment stockées hors-ligne (par défaut en clair, le chif­fre­ment côté client est une option payante).

    À leur décharge le prix est honnête avec 10$ mensuels pour 2 To + 5 $ mensuels avec le chif­fre­ment côté client.

    Si quelqu’un a testé, je suis preneur de retours sur les débits et sur l’in­tel­li­gence du cache local. Je n’ai par exemple pas bien compris si je devais abso­lu­ment marquer manuel­le­ment les fichiers que je veux hors-ligne ou s’il sait mettre seul hors-ligne les derniers fichiers accé­dés.

    Meet Lima

    J’ai trouvé Lima. J’en ai même une, mais l’idée d’y dédié mon disque prin­ci­pal et de l’y bran­cher en USB, ça m’a un peu bloqué.

    Entre autres ça me demande d’avoir un PC spéci­fique à côté pour gérer le backup, que ce PC fasse fréquem­ment un scan complet des 2 To par le réseau pour voir quels fichiers ont changé et les histo­ri­ser… ça me parait assez bancal et risqué.

    Si on ajoute que le débit de la Lima est de l’ordre de 13 Mb/s en écri­ture (d’après eux, donc j’ima­gine qu’il faut comp­ter moins de 10Mb/s), je ne le vois pas encore comme une solu­tion idéale.

    * * *
    Hors Péri­mètre

    Drop­box

    Au début j’ai adoré l’idée. Drop­box utilise un système de fichier stan­dard côté client, et la fiabi­lité qui va avec. Je n’ai pas de raison de craindre pour mes données. Autres points posi­tifs : J’ai le partage et les appli­ca­tions mobiles.

    Le problème c’est que j’ai le défaut qui va avec. Je suis limité par la taille de mon disque local, et ce n’est pas du tout ça que j’at­tends d’un cloud. Au mieux je peux passer par le web pour récu­pé­rer un docu­ment que je n’ai pas encore, ou choi­sir des dossiers qui ne seront pas synchro­ni­sés.

    Bref, hors péri­mètre.

    Pour ne rien arran­ger mes fichiers sont forcé­ment stockés chez Drop­box, en clair (oups, d’au­tant qu’ils ont déjà eu des failles y donnant accès), pour 10 € mensuel le To.

    Hubic

    On va dire que c’est le Drop­box d’OVH. C’est nette­ment moins cher, j’ai des options bien­ve­nues pour déclen­cher des sauve­gardes, mais sinon on reste au même niveau.

    La synchro­ni­sa­tion sélec­tive se limite par contre aux dossiers de premier niveau et ça c’est carré­ment bloquant pour moi.

    Google Drive

    Pas mieux que les deux précé­dents, 10 $ mensuels le To et une synchro­ni­sa­tion qui m’a déjà fait de mauvaises surprises.

    Les photos de petite taille (en dessous de 2048 × 2048) ne comptent pas dans le quota.

    Amazon Drive

    Non testé, mais à priori simi­laire aux précé­dents avec juste un quota illi­mité à 70 € par an (quand on connait les prix de S3, on se demande où est le piège).

    Les abon­nés premium peuvent stocker les photos gratui­te­ment.

    Resi­lio (ex Bittor­rent sync)

    Le jeu de fonc­tion­na­lité est simi­laire aux autres systèmes de synchro­ni­sa­tion précé­dent avec la seule diffé­rence qu’on synchro­nise des appa­reils locaux sans espace centra­lisé en ligne.

    La synchro­ni­sa­tion sélec­tive (indis­pen­sable à mon usage) demande une licence à 40 €, sans abon­ne­ment.

    Sync­thing

    La version « open source » du précé­dent, mais sans la synchro­ni­sa­tion sélec­tive. La consom­ma­tion CPU semble aussi très haute (je ne connais pas celle de Resi­lio).

    Le système semble faire des scan régu­liers de l’en­semble des fichiers pour traquer les chan­ge­ments. Sur 2 To j’ai très peur du résul­tat sur la batte­rie.

    Owncloud

    J’ai juste effleuré mais la synchro­ni­sa­tion ne sait pas décou­per les fichiers donc un petit chan­ge­ment néces­site de renvoyer tout le fichier à chaque fois. Pour moi c’est discri­mi­na­toire.

    Il reste que je ne crois pas avoir vu de synchro­ni­sa­tion sélec­tive et qu’un serveur PHP pour gérer des fichiers ça ne me rassure pas vrai­ment non plus.


    Je me suis permis de mettre des liens de parrai­nage pour certains services que j’uti­lise.

  • Aujourd’­hui c’est encore backup-day

    Aujourd’­hui c’était backup day, enfin hier chez moi. Le dernier était il y a six mois.

    On oublie trop souvent qu’une bonne partie de notre vie est désor­mais sous forme élec­tro­nique : photos, contacts, films, musique, lettres (emails), et même les livres pour moi. Il serait abusé de dire qu’en perdant son disque on perd tout, mais on regret­tera certai­ne­ment beau­coup de choses.

    Bref, hier le RAID a perdu l’ac­cès à un des deux disques. Points posi­tifs : L’alerte est immanquable, la recons­truc­tion du RAID est simple à trou­ver dans l’in­ter­face Ça *doit* donner à penser à ceux qui se satis­font d’un NAS à un seul disque (ou qui ont l’hé­ré­sie de les confi­gu­rer en agré­gat plutôt qu’en miroir). Un disque ça casse, et toutes ses archives sur un disque externe unique, fut-il USB ou réseau, ça n’est pas une sécu­rité suffi­sante.

    Comme certains l’ont fait remarquer, deux disques en RAID ça ne suffit pas non plus : Il faut un accès distant. J’avais fait un bon résumé des poli­tiques de sauve­gardes dans le billet d’il y a six mois. Mes pratiques n’ont pas vrai­ment évolué. Il est peut être temps. Ajou­ter un crash­plan sur le NAS me tente beau­coup par exemple.

    J’ai une chance sur deux que ce soit le disque qui soit mort, une chance sur deux que ce soit le contrô­leur disque du NAS qui soit en rade.

    Si c’est le disque, le plus simple est que je le remplace mais mon NAS (Syno­logy DS207+) est bien trop juste en mémoire vive pour espé­rer faire tour­ner un crash­plan. N’ayant pas de poste fixe, l’idée d’uti­li­ser un crash­plan à partir de mon poste portable connecté au NAS n’est pas viable. Il me faudrait plus d’une année pour l’ini­tia­li­sa­tion. Une des solu­tions que j’étu­die c’est l’ajout d’un micro-PC que je puisse mettre à côté du NAS et qui serve entre autre à cet usage. Dans l’idéal, pour suivre les préco­ni­sa­tions et en fonc­tion de mon volume de sauve­garde, il serait idéal qu’il y ait 1Go de mémoire vive. Les Raps­berry n’en ont que 512Mo, Cubox a l’air sympa mais peut être un peu cher, et du coup je louche sur les produits de Miniand, mais ils ont l’air d’avoir du Android par défaut et le support de distri­bu­tions Linux plus clas­siques ne m’a pas toujours l’air clair. Si vous avez des sugges­tions je suis preneur.

    Si c’est le NAS qui a perdu un contrô­leur, sans RAID il est plus ou moins bon pour la casse. Il me faut donc quelque chose pour un disque local, qui sache aussi avoir suffi­sam­ment de RAM et de puis­sance pour faire tour­ner un Crash­plan. Bien évidem­ment sans y mettre des sommes folles. Là aussi je suis preneur de sugges­tions.

  • Ce week-end c’était Backup day

    On oublie toujours les backup, et même quand on y pense habi­tuel­le­ment les inci­dents arrivent toujours au moment des rares oublis.

    Au niveau personne, la dispa­ri­tion de mes données c’est la perte de 10 ans de photos, de tout mon carnet d’adresse avec télé­phones, adresses et email, de mes docu­ments, de mes 10 ans d’ar­chives mail, de… à peu près tout en fait vu que je vis en numé­rique depuis 2001. La seule chose qui reste en papier c’est l’ad­mi­nis­tra­tif et les factu­res… et même ça j’ai caressé plus d’une fois l’en­vie de numé­ri­ser puis archi­ver en vrac dans un carton à la date de numé­ri­sa­tion. Bref, si je perds les données c’est un peu comme si d’un coup je suppri­mais tout ce que j’ai de perti­nent (c’est à dire tout ce qui n’est pas maté­riel).

    De quand date votre dernier backup ? Mais plus que ça, quelle est votre stra­té­gie ? Quelle niveau de sécu­rité atten­dez-vous ?

    Stra­té­gie

    Il vous faut deux backup, dont au moins un non synchrone ou avec histo­rique, dont un hors site, avec quelque chose qui vous alerte dès que l’un des deux devient inuti­li­sable. Or cela, point de salut.

    Au fur et à mesure je me suis fixé sur la combi­nai­son suivante : Au quoti­dien (c’est à dire quand j’y pense) tout est archivé sur un NAS avec deux disques en RAID. De temps en temps, une à deux fois par an, je grille tout ce qui est perti­nent sur des disques optiques. Ces derniers sont stockés hors site (chez les parents par exemple) au cas où ce qui est chez moi soit irré­cu­pé­rable.

    Le NAS c’est un DS207+ de Syno­logy avec des disques de 1 To. Je n’ai jamais eu l’oc­ca­sion de regret­ter et Syno­logy a un suivi excep­tion­nel de son maté­riel : 4 ans après il y a encore des mises à jour alors qu’ils renou­vellent leur gamme toutes les années. Le logi­ciel interne sait tout faire et l’ac­cès root est possible pour ajou­ter ce qui manque­rait.

    Les disques optiques je suis passé d’an­nées en années des CD au DVD, puis aux DVD DL et ce week end aux BD-R. Ça ne tient pas sur un seul disque mais la taille des réper­toires gros­sit d’an­née en année et je me vois mal sépa­rer ces unités en plusieurs. Cette année c’est le stockage des photos en RAW qui prends une place désas­treuse. Il suffi­rait de trier et effa­cer ce qui n’a pas de sens, mais passer sur BD-R prend bien moins de temps :)

    Le jour où j’au­rai la bande passante montante néces­saire j’em­pi­le­rai peut être des backup sur un stockage en ligne type crash­plan ou une simple dedi­box. Pour l’ins­tant c’est assez inabor­dable avec ma connexion ADSL.

    Quelques pistes d’at­ten­tion

    Une synchro­ni­sa­tion n’est pas une sauve­garde

    Drop­box ? Google Drive ? Gmail ? tout ça est à ranger dans la caté­go­rie « synchro­ni­sa­tion » et pas dans la caté­go­rie « sauve­garde ». Si vous faites n’im­porte quoi ou si on vide votre compte, ça sera synchro­nisé d’un coup partout.  Ce n’est pas pure­ment hypo­thé­tique : ça arrive en vrai.

    C’est vrai pour tout ce qui synchro­nise sans archi­vage. Si vous synchro­ni­sez votre NAS avec une Dedi­box, que se passe-t-il si votre NAS est effacé ? Idem pour crash­plan si vous n’ache­tez pas l’op­tion qui active l’his­to­rique.

    La synchro­ni­sa­tion permet la haute dispo­ni­bi­lité mais ça ne remplace pas un backup. Ce ne sont simple­ment pas les mêmes contraintes et les mêmes usages.

    Un backup unique n’est pas suffi­sant

    Vous avez un NAS avec un disque ? imagi­nez que demain il casse. Vous avez un NAS en RAID ? il ne vous servira à rien en cas de dégât des eaux, de dégât élec­trique majeur, de feu dans l’im­meuble, ou simple­ment d’un cambrio­lage ou d’un méchant qui perce votre wifi ou votre mot de passe pour tout effa­cer.

    Même si vous avez une totale confiance dans les serveurs redon­dés et sauve­gar­dés de votre pres­ta­taire, les comptes gmail qui se vident c’est très rare mais c’est déjà arrivé. Tiens, imagi­nez aussi ceux qui avaient des données légales et bien placées avec un compte payant sur les serveurs redon­dés de megau­pload… au revoir les backup. Le cas est extrême mais si la justice décide de saisir Crash­plan, de bloquer Online.net ou d’in­ter­rompre Drop­box, vous n’au­rez que vos yeux pour pleu­rer.

    Deux sites distincts

    Toujours avec les mêmes causes, même si vous avez bien deux backup, ils ne seront effi­caces que s’ils sont sur deux sites diffé­rents. Un feu, un cambrio­lage, un choc élec­trique, ou un simple dégât des eaux risque de rendre inuti­li­sable d’un coup vos deux backups. Point de salut : l’une des deux copies doit être hors site.

    Rame­ner une copie au boulot, chez les parents ou chez des amis peut suffire. Pas besoin d’ima­gi­ner une archi­tec­ture complexe.

    DEUX MÉDIA DIFFÉRENTS

    Pour des raisons simi­laires, je vous incite à prévoir deux solu­tions de backup diffé­rentes, avec des tech­no­lo­gies diffé­rentes. En cas de défaillance impré­vue, vous mettez toutes les chances de votre côté en espé­rant que l’autre type de média ne sera pas affecté. Pensez par exemple à ceux qui voyait dans le CD un support défi­ni­tif et qui se sont retrou­vés avec des disques inuti­li­sables au bout de 5 à 10 ans ? En avoir deux copies n’a pas du aider beau­coup.

    Cette règle n’est pas neuve, si vous mettez en route des RAID, la bonne pratique est d’avoir des disques de marques diffé­rentes ou au moins de modèle diffé­rents pour ne pas risquer qu’ils cassent à des dates proches (là aussi ce n’est pas hypo­thé­tique, ce sont des cas réels).

    Quelques pistes

    Dans la liste suivante il vous faut deux média diffé­rents, au moins un asyn­chrone ou avec histo­rique, et au moins un hors site :

    Fiabi­lité Hors site Asyn­chrone Histo­rique
    Disque USB mauvaise partielle (*1) oui possible
    2x disque USB bonne possible (*1) oui possible
    NAS simple mauvaise non au choix possible
    NAS RAID bonne (*2) non au choix possible
    Drop­box (synchro en ligne) bonne oui non possible
    Crash­plan (backup en ligne) bonne possible non oui
    CD, DVD, BD-R bonne sur 2 à 5 ans possible oui oui
    Serveur en ligne au choix (raid ?) oui au choix au choix
    Bande moyenne possible (*1) oui oui

    (*1) Les disques USB et les bandes peuvent être mis hors site mais devront être amenés sur site pour les resyn­chro­ni­ser. C’est toujours à ce moment là qu’ar­rivent les problèmes, ou qu’on fait une mauvaise mani­pu­la­tion lors de la sauve­garde qui efface et la source et la desti­na­tion. La solu­tion est d’avoir un jeu d’au moins deux disques et de les amener sur site en alter­nance, ainsi on a toujours une copie sécu­ri­sée hors site quoi qu’il arrive.

    (*2) Certains NAS RAID ne vous alertent pas (ou pas assez bien) quand un des deux disques est en rade. Du coup ça reste en rade jusqu’à ce que le second tombe aussi. Seuls ceux qui ont des alertes effi­caces (c’est à dire qu’on ne peut pas igno­rer même si on ne fait pas atten­tion) sont à consi­dé­rer comme ayant un RAID effi­cace.

    N’ou­bliez pas que pour qu’une sauve­garde hors site par réseau soit effi­cace, il vous faut soit une bonne bande passante montante soit un volume de sauve­garde limité. Sauve­gar­der 100 Go par une ligne ADSL, même de bonne qualité, ça va vite ne pas être raison­nable. Vous ne profi­te­rez réel­le­ment de Crash­plan ou de ses concur­rents qu’a­vec la fibre.

    Enfin : Si vous lais­sez des sauve­gardes hors site, et parti­cu­liè­re­ment si elles sont en ligne, les chif­frer n’est pas tota­le­ment inutile. Si voir vos données divul­guées à des tiers pose problème, alors c’est même indis­pen­sable (et dans ce cas oubliez Drop­box).

  • Sauve­garde de l’his­to­rique de lecture

    Je cherche à orga­ni­ser mes archives de lectures, en sauve­gar­dant les pages consul­tées ou parta­gées dans leur version de lecture pour une consul­ta­tion plus tard (si le contenu change ou dispa­raît) et pourquoi pas une indexa­tion parti­cu­lière. (suite…)