Sur le même sujet (merci Karl) : à partir de https://gist.github.com/karlcow/e2475deba2c0fd34384d#my-personal-rustyweb

* Notes on my HTTP archives par Gerald Oskoboiny http://impressive.net/people/gerald/1999/01/http-archive/

* Le format WARC utilisé par l’Internet Archive, et sa génération par wget http://www.archiveteam.org/index.php?title=Wget_with_WARC_output

* Le format MAFF (mozilla archive) http://en.wikipedia.org/wiki/Mozilla_Archive_Format

* Le projet Memento http://www.la-grange.net/2010/11/18/browser-memento

* Le Content Browser de David https://bitbucket.org/david/contentbrowser/