Ce week-end c’était Backup day

On oublie toujours les backup, et même quand on y pense habi­tuel­le­ment les inci­dents arrivent toujours au moment des rares oublis.

Au niveau personne, la dispa­ri­tion de mes données c’est la perte de 10 ans de photos, de tout mon carnet d’adresse avec télé­phones, adresses et email, de mes docu­ments, de mes 10 ans d’ar­chives mail, de… à peu près tout en fait vu que je vis en numé­rique depuis 2001. La seule chose qui reste en papier c’est l’ad­mi­nis­tra­tif et les factu­res… et même ça j’ai caressé plus d’une fois l’en­vie de numé­ri­ser puis archi­ver en vrac dans un carton à la date de numé­ri­sa­tion. Bref, si je perds les données c’est un peu comme si d’un coup je suppri­mais tout ce que j’ai de perti­nent (c’est à dire tout ce qui n’est pas maté­riel).

De quand date votre dernier backup ? Mais plus que ça, quelle est votre stra­té­gie ? Quelle niveau de sécu­rité atten­dez-vous ?

Stra­té­gie

Il vous faut deux backup, dont au moins un non synchrone ou avec histo­rique, dont un hors site, avec quelque chose qui vous alerte dès que l’un des deux devient inuti­li­sable. Or cela, point de salut.

Au fur et à mesure je me suis fixé sur la combi­nai­son suivante : Au quoti­dien (c’est à dire quand j’y pense) tout est archivé sur un NAS avec deux disques en RAID. De temps en temps, une à deux fois par an, je grille tout ce qui est perti­nent sur des disques optiques. Ces derniers sont stockés hors site (chez les parents par exemple) au cas où ce qui est chez moi soit irré­cu­pé­rable.

Le NAS c’est un DS207+ de Syno­logy avec des disques de 1 To. Je n’ai jamais eu l’oc­ca­sion de regret­ter et Syno­logy a un suivi excep­tion­nel de son maté­riel : 4 ans après il y a encore des mises à jour alors qu’ils renou­vellent leur gamme toutes les années. Le logi­ciel interne sait tout faire et l’ac­cès root est possible pour ajou­ter ce qui manque­rait.

Les disques optiques je suis passé d’an­nées en années des CD au DVD, puis aux DVD DL et ce week end aux BD-R. Ça ne tient pas sur un seul disque mais la taille des réper­toires gros­sit d’an­née en année et je me vois mal sépa­rer ces unités en plusieurs. Cette année c’est le stockage des photos en RAW qui prends une place désas­treuse. Il suffi­rait de trier et effa­cer ce qui n’a pas de sens, mais passer sur BD-R prend bien moins de temps :)

Le jour où j’au­rai la bande passante montante néces­saire j’em­pi­le­rai peut être des backup sur un stockage en ligne type crash­plan ou une simple dedi­box. Pour l’ins­tant c’est assez inabor­dable avec ma connexion ADSL.

Quelques pistes d’at­ten­tion

Une synchro­ni­sa­tion n’est pas une sauve­garde

Drop­box ? Google Drive ? Gmail ? tout ça est à ranger dans la caté­go­rie « synchro­ni­sa­tion » et pas dans la caté­go­rie « sauve­garde ». Si vous faites n’im­porte quoi ou si on vide votre compte, ça sera synchro­nisé d’un coup partout.  Ce n’est pas pure­ment hypo­thé­tique : ça arrive en vrai.

C’est vrai pour tout ce qui synchro­nise sans archi­vage. Si vous synchro­ni­sez votre NAS avec une Dedi­box, que se passe-t-il si votre NAS est effacé ? Idem pour crash­plan si vous n’ache­tez pas l’op­tion qui active l’his­to­rique.

La synchro­ni­sa­tion permet la haute dispo­ni­bi­lité mais ça ne remplace pas un backup. Ce ne sont simple­ment pas les mêmes contraintes et les mêmes usages.

Un backup unique n’est pas suffi­sant

Vous avez un NAS avec un disque ? imagi­nez que demain il casse. Vous avez un NAS en RAID ? il ne vous servira à rien en cas de dégât des eaux, de dégât élec­trique majeur, de feu dans l’im­meuble, ou simple­ment d’un cambrio­lage ou d’un méchant qui perce votre wifi ou votre mot de passe pour tout effa­cer.

Même si vous avez une totale confiance dans les serveurs redon­dés et sauve­gar­dés de votre pres­ta­taire, les comptes gmail qui se vident c’est très rare mais c’est déjà arrivé. Tiens, imagi­nez aussi ceux qui avaient des données légales et bien placées avec un compte payant sur les serveurs redon­dés de megau­pload… au revoir les backup. Le cas est extrême mais si la justice décide de saisir Crash­plan, de bloquer Online.net ou d’in­ter­rompre Drop­box, vous n’au­rez que vos yeux pour pleu­rer.

Deux sites distincts

Toujours avec les mêmes causes, même si vous avez bien deux backup, ils ne seront effi­caces que s’ils sont sur deux sites diffé­rents. Un feu, un cambrio­lage, un choc élec­trique, ou un simple dégât des eaux risque de rendre inuti­li­sable d’un coup vos deux backups. Point de salut : l’une des deux copies doit être hors site.

Rame­ner une copie au boulot, chez les parents ou chez des amis peut suffire. Pas besoin d’ima­gi­ner une archi­tec­ture complexe.

DEUX MÉDIA DIFFÉRENTS

Pour des raisons simi­laires, je vous incite à prévoir deux solu­tions de backup diffé­rentes, avec des tech­no­lo­gies diffé­rentes. En cas de défaillance impré­vue, vous mettez toutes les chances de votre côté en espé­rant que l’autre type de média ne sera pas affecté. Pensez par exemple à ceux qui voyait dans le CD un support défi­ni­tif et qui se sont retrou­vés avec des disques inuti­li­sables au bout de 5 à 10 ans ? En avoir deux copies n’a pas du aider beau­coup.

Cette règle n’est pas neuve, si vous mettez en route des RAID, la bonne pratique est d’avoir des disques de marques diffé­rentes ou au moins de modèle diffé­rents pour ne pas risquer qu’ils cassent à des dates proches (là aussi ce n’est pas hypo­thé­tique, ce sont des cas réels).

Quelques pistes

Dans la liste suivante il vous faut deux média diffé­rents, au moins un asyn­chrone ou avec histo­rique, et au moins un hors site :

Fiabi­lité Hors site Asyn­chrone Histo­rique
Disque USB mauvaise partielle (*1) oui possible
2x disque USB bonne possible (*1) oui possible
NAS simple mauvaise non au choix possible
NAS RAID bonne (*2) non au choix possible
Drop­box (synchro en ligne) bonne oui non possible
Crash­plan (backup en ligne) bonne possible non oui
CD, DVD, BD-R bonne sur 2 à 5 ans possible oui oui
Serveur en ligne au choix (raid ?) oui au choix au choix
Bande moyenne possible (*1) oui oui

(*1) Les disques USB et les bandes peuvent être mis hors site mais devront être amenés sur site pour les resyn­chro­ni­ser. C’est toujours à ce moment là qu’ar­rivent les problèmes, ou qu’on fait une mauvaise mani­pu­la­tion lors de la sauve­garde qui efface et la source et la desti­na­tion. La solu­tion est d’avoir un jeu d’au moins deux disques et de les amener sur site en alter­nance, ainsi on a toujours une copie sécu­ri­sée hors site quoi qu’il arrive.

(*2) Certains NAS RAID ne vous alertent pas (ou pas assez bien) quand un des deux disques est en rade. Du coup ça reste en rade jusqu’à ce que le second tombe aussi. Seuls ceux qui ont des alertes effi­caces (c’est à dire qu’on ne peut pas igno­rer même si on ne fait pas atten­tion) sont à consi­dé­rer comme ayant un RAID effi­cace.

N’ou­bliez pas que pour qu’une sauve­garde hors site par réseau soit effi­cace, il vous faut soit une bonne bande passante montante soit un volume de sauve­garde limité. Sauve­gar­der 100 Go par une ligne ADSL, même de bonne qualité, ça va vite ne pas être raison­nable. Vous ne profi­te­rez réel­le­ment de Crash­plan ou de ses concur­rents qu’a­vec la fibre.

Enfin : Si vous lais­sez des sauve­gardes hors site, et parti­cu­liè­re­ment si elles sont en ligne, les chif­frer n’est pas tota­le­ment inutile. Si voir vos données divul­guées à des tiers pose problème, alors c’est même indis­pen­sable (et dans ce cas oubliez Drop­box).

Rejoindre la conversation

16 commentaires

  1. Le problème principal est-il le média sur lequel on stocke ses backups, ou la pénibilité du processus même de backup ?

    Quand on a un parc hétérogène de moyens de stockage, faire une sauvegarde peut devenir prise de tête à un point où on la fait une mois, deux mois, et on s’arrête parce qu’on n’a plus la patience de copier les données depuis le disque interne, le disque externe, le NAS, etc.

    Il y a sûrement un marché de niche à exploiter pour ces usages là. (Ou du logiciel libre à développer, bien sûr.)

  2. @Eric
    Problème que je me pose actuellement, mes méthodes de back-up étant pour le moment ultra précaires (un HD externe USB que je branche de temps en temps pour tout back-uper à la main)… J’étais tenté par Dropbox (ou autre système de synchro en ligne) mais tes contre-arguments sont pertinents…

    @Michel
    La pénibilité du processus est au cœur de mes préoccupations (puisque c’est ce qui me pousse à back-uper trop rarement)… Peut-être un système de rangement par année-mois qui permettrait de n’ajouter que le nécessaire à chaque back-up ? Des logiciels doivent déjà faire ça ? SyncBack ? Je suis preneur de toute idée !

    Quelques pistes ici sur Kob : http://forum.kob-one.com/post343124.html

  3. Aïe! Moi aussi, pour l’instant, c’est sauvegarde hedbo sur un disque-dur-externe-caché-derrière-le-livre-de-recettes-grecques. Avec à peine une ou deux centaines de gigas, ça reste jouable, il me semble. Mais l’idée d’un vrai sinistre me glace. Surtout que j’ai aussi une bouteille de gaz dans le dressing ;). Oh, wait: un disque dur dans une coque ignifugée?

  4. J’utilise depuis 1 an le service de backup CrashPlan+ (+300k fichiers pour 100Go). Le client desktop est relativement réussi et permet de sélectionner finement les documents à sauvegarder. Tournant en tâche de fond je n’affiche le client qu’une fois toutes les lunes. Le service de backup passe inaperçu puisqu’il offre la possibilité de régler le taux de CPU à consommer ainsi que les limites de débit lorsque je suis présent ou absent de mon poste.
    L’interface web m’a déjà permis de récupérer un document depuis un poste non pris en charge par CrashPlan+, et ce dans une version antérieur. Bien pratique.

    Oui, il ne s’agit pas de temps réel puisqu’il s’agit d’une solution de backup et non de synchronisation des données et donc le push ne se fait qu’à intervalles réguliers mais le suivi des modifications des fichiers et quant à lui réalisé en temps réel (de même sur les documents ouverts).
    À noter que l’on a la main sur l’intervalle des backups (15 minutes actuellement) et sur bien d’autres variables.

    Dernier point qui peut gêner (ce qui est ton cas apparemment), l’aspect chronophage du premier backup (parce que lui seul est problématique). CrashPlan compresse les données avant transfert ce qui permet d’économiser quelques heures de transfert. Il faut savoir s’armer de patience, c’est certain (1 semaine dans mon cas lors du premier upload), mais ensuite on l’oublie totalement. À moins de trouver un service qui envoie un HDD pour initialiser ce premier backup (ce que fais CrashPlan pour les US) tu n’as malheureusement pas 36 autres solutions.

  5. J’avais 2 disques en RAID dans ma machine, et j’ai fait l’acquisition il y a quelques années d’un synology 107+ (une seule baie donc) dont je suis ravi.

    Il me manque toutefois une solution hors site, pour le moment je réplique le NAS sur un DD externe quand ça me passe par la tête (en le branchant directement au NAS, très pratique !), mais ce DD est chez moi, et j’y pense une fois tous les 2 mois.

    J’avais souscrit au plus gros crashplan existant pour me mettre dans les nuages, mais hélas c’est incompatible avec une sauvegarde directe depuis le NAS, ce qui est un point bloquant pour moi (oui, il y a des bidouilles en passant par le PC, mais c’est pas satisfaisant, et j’ai jamais réussi à synchro un lecteur réseau monté avec XP)

    Pourtant, crashplan est économique, le site est clair et le suivi est bon (ils m’ont remboursé sans discuter quand je leur ait expliqué mon problème) c’est juste dommage que ça ne soit pas intégré aux synology comme peut l’être amazon S3 (qui pour le coup est bien cher pour mon utilisation)

    Ce qu’il me faudrait, c’est un service qui synchronise le NAS dans le cloud sans que je n’aie rien à faire, et de manière invisible et régulière. Je vais regarder du coté de dedikam qui à l’air de fonctionner comme ça, mais c’est bien plus cher. Vivement que crashplan supporte le rsync.

    PS : vu que l’essentiel de mes données sensibles sont des photos, j’ai pris pour habitude de faire des tirages réguliers et conséquent (je chasse les promos) car à mon avis, en plus de la sauvegarde physique, rien n’assure que les RAW seront consultables dans 10, 15, 20 ans, et de manières aisée. La bonne vielle boite à chaussure de photos sera le support qui perdurera pendant longtemps je pense.

      1. Pour les Synology il y a des hacks, effectivement. Y compris pour ceux qui ne sont pas sur x86 (la plupart).

        Le mien est trop faible en RAM pour que ce soit réaliste visiblement, du moins pas avec de si grosses collections à sauvegarder. D’après les rapports le Go de mémoire est vraiment nécessaire dès qu’on a quelque chose d’assez gros. Maintenant ça vaut le coup d’essayer, oui.

      2. Les packages dont tu parlent ne marchent pas sur les syno à processeur ARM, et sont de toutes façons très lourd. il faudrait que crashplan gère Rsync pour qu’on puisse configurer ça dans le NAS, ou que synology ajoute crashplan à la liste des services de cloud supportés.

        Sinon, ça reste de la bidouille, pas terrible pour de la sauvegarde qui se doit d’être fiable.

      3. sisi, ils ont bidouillé aussi les ARM (faudrait que je retrouve le lien), mais ça pêche en RAM.

        Pour le rsync le problème c’est que ça cadre mal avec les fonctionnalités évoluées de répartition des cibles, de chiffrage côté client, etc. Ils se basent sur client évolué qui sait faire pas mal de choses, je doute qu’ils fassent du rsync simple, ça casserait tout le reste

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

À propos de ce site, du contenu, de l'auteur
Je poste parfois ici des humeurs ou des pensées. Parfois je change, parfois je me trompe, parfois j'apprends, et souvent le contexte lui-même évolue avec le temps. Les contenus ne sont représentatifs que de l'instant où ils ont été écrits. J'efface peu les contenus de ce site, merci de prendre du recul quand les textes sont anciens. Merci

À toutes fins utiles, ce site est hébergé par Scaleway, ONLINE SAS, joignable par téléphone au +33 (0)1 84 13 00 00 et joignable par courrier à l'adresse BP 438 - 75366 Paris Cedex 08.