Ok

En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies. Ces derniers assurent le bon fonctionnement de nos services. En savoir plus.

28.11.2008

Copier un blog n'est pas jouer

Coller n'est pas jouer, nous l'avons vu récemment, et copier ne l'est pas non plus. Parce que c'est du sérieux, c'est même indispensable.

Vous n'imaginiez tout de même pas que j'allais vous faire une leçon de morale à propos du respect des droits d'auteur, et des limites rapidement atteintes du droit à la copie privée ? Je veux bien en reparler à l'occasion, mais j'aime à considèrer que les rares visiteurs de mon blog sont des adultes responsables.

"J'aime aussi les catastrophes qui mettent la vie en apostrophe"

Mais la disparition d'un site internet personnel pour cause de crash machine chez l'hébergeur, ou plantage monstre dans la plateforme, me fait un peu trop froid dans le dos. Et c'est déjà l'hiver. Que ceux qui n'ont jamais été déçus par une promesse d'infaillibilité me jettent la première pierre, avec douceur. Plus simplement, il peut être utile de faire une sauvegarde régulière, et garder une trace de ses contenus en ligne, pour se préserver de ses propres turpitudes informatiques.

A priori, vos textes et vos images sont déjà sur une machine qui vous appartient, une clé si vous êtes un nomade accro des applications portables. Si vous écrivez toujours à la volée, au gré des hôtels connectés et cyber-cafés fréquentés lors de vos pérégrinations IRL, vous n'avez peut-être qu'une trace réduite de ce que contient réellement votre blog.

Comment copier mon blog ?

Nous allons le capturer, en utilisant un "aspirateur". Les spécialistes de la navigation documentaire en connaissent un certain nombre, pour déjà récupérer régulièrement des contenus en ligne afin de les exploiter en local sur une machine. Sans prosélytisme appuyé, je me contenterai de vous parler de Win HTTrack. Vous en trouverez une description détaillée sur le site de Framasoft avec lien vers le site officiel, et quelques tutoriels qu'il est inutile de reproduire ici (mais qu'il est utile de consulter !).

WinHTTrack-accueil.jpg

1. Une fois installé sur votre machine, le logiciel est relativement facile à prendre en main. Pour une première utilisation, cliquez sur [Suivant], parce que vous n'avez pas de "projet" déjà enregistré.

WinHTTrack-project1-A-nommer.jpg2. Vous aurez besoin d'un nom pour votre "projet" que vous pourrez éventuellement ranger dans une catégorie pour vous y retrouver. Vous avez besoin de décider de l'endroit où HTTrack déposera les fichiers récupérés. Si le répertoire par défaut ne vous convient pas, allez en choisir un autre en cliquant sur [...]

WinHTTrack-project1-B-Donner-Adresse.jpg3. Bien sûr, il vous faudra indiquer l'adresse précise du site à copier. Pour un premier essai, je vous conseille de laisser les options par défaut. Il sera toujours temps d'intervenir plus tard.

4. L'écran suivant vous propose des options relatives à la connexion. Il est rarement nécessaire d'intervenir. Cliquez sur [Terminer] pour lancer la copie.

WinHTTrack-project1-C-Copie-en-cours.jpg5. Une fois la copie lancée, vous pouvez vous voir l'évolution du téléchargement des fichiers, et l'arborescence se développer dans le volet de gauche. Mon propre blog, avant cette note, a demandé moins de 4 minutes. Évidemment, plus il y a de contenu, plus c'est long. Surtout si votre connexion est un peu lente.

WinHTTrack-project1-D-Copie-terminée.jpg6. Voilà, c'est terminé, vous pouvez consulter le "Journal" pour voir les éventuelles erreurs de téléchargement. La copie est prête, cliquez sur [Explorer la copie du site] pour qu'elle s'ouvre dans votre navigateur par défaut.

 

Mais alors ?

Seule la partie publique a été copiée ?
Avec les options, l'aspirateur peut parfois aspirer des fichiers vers lesquels aucune note ne pointe. Ne laissez donc pas traîner des fichiers inutiles dans vos répertoires Haut&Fort.

Et la prochaine fois, il faut tout refaire ?
Au prochain lancement de HTTrack, vous retrouver le nom de votre projet dans le menu fichier, et le logiciel vous propose une mise à jour automatique avec les mêmes paramètres. C'est à ce moment qu'il faut les changer si vous avez rencontré des difficultés.

Au secours, ça prend des heures et des giga-octets !
Si vous n'avez pas touché aux options par défaut, c'est que votre site est particulièrement fourni. Sinon vous avez peut-être poussé un peu loin la profondeur d'exploration des liens externes. Avec une profondeur externe de 2, si votre site pointe vers 10 sites, qui pointent vers 10 sites chacun, vous êtes déjà à 100 pages...

Regardez tout de même un peu les conseils qui sont proposés par Framasoft.

Mais cela ne sauvegarde pas ma base de données ?
Effectivement, vous n'obtenez qu'une copie de ce qu'un visiteur verrait, s'il lisait tout votre blog.
N'imaginez pas que vous pourrez injecter cette copie dans un autre blog !

Tout au plus pourrez-vous en faire un site statique après livraison FTP sur un site d'hébergement, mais c'est une autre histoire.

 

12:25 Écrit par Gee Mee dans Personnaliser son blog | Lien permanent | Commentaires (6) | Tags : blog, copier, aspirer, sauvegarder, httrack | |  del.icio.us | | Digg! Digg |  Facebook

Commentaires

Bonsoir.
Je reviens de temps en temps après mon incursion sur le "D'où venez-vous".
J'ai suivi le conseil de copier mon blog (Mais la disparition d'un site internet personnel pour cause de crash machine chez l'hébergeur, ou plantage monstre dans la plateforme, me fait un peu trop froid dans le dos => cette phrase, justement, m'a fait froid dans le dos).
Le lendemain, comme tous les jours, j'ai consulté mes statistiques de visites et là, surprise, multipliées par 7!
Est-ce un effet de l'aspiration de mon site?
Je me pose la question: je n'ai qu'une adresse ip, mais l'aspiration génère-t-elle des visites, des pages vues ou non?
A bientôt!

Écrit par : Ferocias du Blog Les Peuples du Soleil ( Fictions précolombiennes et Livres anciens) | 18.12.2008

Répondre à ce commentaire

Bonjour Ferocias,

La sauvegarde d'un site par HTTrack ne génère qu'un visiteur et qu'une visite, si le process n'est pas interrompu. Par contre, puisqu'il explore tous les liens, cela gonfle évidemment les statistiques de pages vues.
Pour avoir une idée de son impact, vous pouvez regarder dans vos statistiques détaillées la répartition du trafic selon les navigateurs, et vous devriez trouver une ligne "HTTrack 3".
Le "label" sous lequel se déclare le logiciel est modifiable dans les "Paramètres de la copie du site" / "Définir les options" / onglet "Navigateur Internet".
S'il est donc possible d'avancer "masqué" quand on sauvegarde le site d'un autre, ma fille vous le dirait : "Ça s'fait pas".

En vous remerciant de votre fidélité ;-)

Écrit par : Gee Mee | 19.12.2008

Répondre à ce commentaire

Merci pour ces précisions.
Je comprends mieux l'explosion du nombre de pages vues, un peu moins pourquoi le nombre de visites a fortement augmenté ce jour-là.
J'avais sans doute fait un billet fort intéressant ;-D.

A bientôt.

Écrit par : Ferocias du Blog Les Peuples du Soleil ( Fictions précolombiennes et Livres anciens) | 19.12.2008

Répondre à ce commentaire

Honnêtement je ne vois pas d'autre explication recevable. ;-)

Écrit par : Gee Mee | 19.12.2008

Répondre à ce commentaire

Zut votre appli est pour PC ! Est-ce que par hazard vous connaîtriez son équivalent pour Mac ?
Moi aussi j'ai froid dans le dos ;-)

Sinon j'ai pensé plusieurs fois changer de prestataire (j'ai eu 2 autres expériences de plate-forme de blog plus satisfaisantes), mais j'ai l'impression que Hautetfort ne nous "autorise" pas la migration (alors qu'ils viennent de lancer une offensive dans l'autre sens !). Vous confirmez ?

Écrit par : PersonnelJS | 28.02.2009

Répondre à ce commentaire

@ tous les utilisateurs de WinHTTtrack : une version 3.43-3 est disponible depuis le 21/02/2009.

@ PersonnelJS, HTTrack est compatible Mac, d'après ce qu'il écrit dans le forum du site officiel du logiciel à l'adresse suivante (vous devrez semble-t-il passer par une configuration en ligne de commande...) : http://httrack.com/html/faq.html#QG5

Sinon, j'ai vu évoqué "Site Sucker", tout un poème dans un forum d'utilisateurs Mac cherchant un équivalent à HTTrack.

S'agissant de "l'exportation", il faut bien comprendre qu'aucune plateforme commerciale n'a intérêt à la faciliter, au contraire de "l'importation". Même la fonctionnalité d'export offerte aux abonnés n'est guère plus satisfaisante qu'une copie avec un aspirateur (j'ai eu l'occasion de l'utiliser chez H&F il y a un an). En particulier, personne ne donne de base de données structurée... Ce serait trop facile de comparer, et de "migrer" de l'un à l'autre. Et vous savez comme moi la tolérance actuelle envers les populations migrantes...

Écrit par : Gee Mee | 28.02.2009

Répondre à ce commentaire

Les commentaires sont fermés.