Sur le même sujet (merci Karl) : à partir de https://gist.github.com/karlcow/e2475deba2c0fd34384d#my-personal-rustyweb
* Notes on my HTTP archives par Gerald Oskoboiny http://impressive.net/people/gerald/1999/01/http-archive/
* Le format WARC utilisé par l’Internet Archive, et sa génération par wget http://www.archiveteam.org/index.php?title=Wget_with_WARC_output
* Le format MAFF (mozilla archive) http://en.wikipedia.org/wiki/Mozilla_Archive_Format
* Le projet Memento http://www.la-grange.net/2010/11/18/browser-memento
* Le Content Browser de David https://bitbucket.org/david/contentbrowser/