Sauvegarde et plan de sites web

La copie statique de sites peut être faite pour diverses raisons, avant une périlleuse migration par exemple. La commande wget : "./wget -r -k -np --user-agent=Firefox http://poincare.univ-lorraine.fr/" est lancée à l'aide du binaire (sous windows) : https://eternallybored.org/misc/wget/ et placé dans le répertoire courant. On obtient ainsi un site statique, réplique exacte des pages du site d'origine. Le moteur de recherche ne fonctionne plus mais le plan d'origine est conservé. Il devient ainsi possible de compter les pages, de générer un plan statique, de naviguer sans latence et de se référer ainsi à une image figée d'un site dynamique. Un plan de site peut être obtenu en parallèle sous forme de page html "sitemap.html" avec par exemple le service en ligne : https://www.xml-sitemaps.com/

Compter les fichiers de manière récursive (répertoire courant) : find . -type f | wc -l

Liste des site sauvegardés statiquement :

Titre Sauvegarde statique Plan Site d'origine Date aspiration
Site AHP-PReST ahp-poinca ahp-poinca plan (plan limité à 500 pages, 2540 fichiers en tout) http://poincare.univ-lorraine.fr/ 21/11/2021
Site IRIST irist irist plan (134 pages) https://irist.unistra.fr/ 21/11/2021
AHP-numérique ahp-num ahp-num plan (363 pages) http://ahp-numerique.fr/ 21/11/2021