Trasformare un sito dinamico in un sito HTML statico (ovvero farne un backup)
Dovevo fare una copia di un sito Wordpress e archiviarlo, ma volevo qualcosa che all’eventuale ripristino non mi costringesse ad installare un database server (alla MySQL) e un server web.
Ci sono tanti modi per farlo; l’ho fatto con Wget, una arcinota utility open-source e sono rimasto di stucco. Questo il comando:
wget -k -K -E -r -l 10 -p -N -F -e robots=off --restrict-file-names=windows -nH http://miositowordpress.it/
Alla fine del processo avrete a disposizione una copia del sito di vostro interesse con tutta la parte dinamica (i link, la navigazione, le immagini, ecc.) diventata statica, un sito basato su PHP e (quasi sempre) MySQL trasformato in pagine HTML. Ho zippato tutto e archiviato.
Proprio un barbatrucco, che ho scoperto qui (non va bene per tutto e ha qualche limite).
Come clonare una pagina singola
Ecco come farlo su una pagina singola (fonte):
wget -E -H -k -K -nd -N -p -P nomeCartellaOutput https://en.wikipedia.org/wiki/Academy_Award_for_Best_Picture
Come scaricare soltanto gli URL del sito
wget --spider --force-html -r -l 10 -e robots=off "https://www.tuosito.it" 2>&1 | grep --color -Eo 'https?.+$' | sort | uniq >listaURL.txt