ENREGISTRER CERTAINES PAGES

Transcription

ENREGISTRER CERTAINES PAGES
Page 1 sur 3
ENREGISTRER CERTAINES PAGES
Cinq questions préalables :
• L'adresse Internet n'est-elle pas suffisante ? Vaut-il la peine de conserver ce(s) document(s) ?
Si la réponse est positive, alors, que garder ?
- l'une ou l'autre page isolée ou un ensemble de pages ?
- garder le document tel quel avec tous ses "objets" (images, feuille de style, scripts
javascript, …) ?
- garder uniquement le texte au format HTML ?
- garder uniquement le texte ?
Garder l'une ou l'autre page isolée
• Tous les navigateurs, sauf la dernière version de Netscape (6.2), permettent d'enregistrer la page
lue
- soit au format HTML,
- soit au formate 'texte".
La technique est toujours la même :
- menu Fichier / Enregistrer sous,
- sélectionner ensuite dans la boîte de dialogue sous quel format enregistrer :
- Opera 6 et Netscape (4.6) : Fichiers HTML.
- IE 5 : Page Web HTML uniquement.
• Pour enregistrer la page complète avec tous ses composants, il faut disposer soit d'IE soit
d'Opera.
- IE 5 : Fichier / Enregistrer sous / Page Web complète.
- Effet :
création d'une page HTML + dossier contenant les objets tels que les
images, les feuilles de style s'il y en a, et même les scripts Javascript.
- Opera 6 : Fichier / Enregistrer avec les images sous.
- Effet :
Le document HTML et tous ses composants (images, feuille de styles
éventuelle, et même les scripts Javascript) sont dans le dossier désigné
pour l'enregistrement de la page.
Les documents ainsi récupérés sont modifiables soit via un éditeur (HTML), soit via un éditeur
ou un traitement de texte (TXT).
Remarque :
IE 5 permet le format Archive Web : la totalité des informations nécessaires à
l'affichage de la page est enregistrée dans un seul fichier de format MIME encodé.
Cette option enregistre un cliché de la page Web en cours.
Cette option n'est disponible que si vous avez installé Outlook Express 5 (ou une
version ultérieure). Le document n'est lisible qu'avec IE 5 ou Outlook et n'est pas
modifiable.
A. Marchant
D:\RECHERCHE-WEB\ENREGISTRER-PAGES.DOC
© CeFIS 18/02/2002
Page 2 sur 3
Autre outil : Copernic
• Attention, cet agent de recherche tient compte des accents.
• Après les diverses opérations indispensables pour finaliser une recherche, on dispose d'un
certains nombres de pages enregistrées dans le dossier voulu et accessibles "hors ligne".
Documents trouvés
Sélection plus fine
Documents validés (donc accessibles)
Documents téléchargés
Remarque :
La copie des résultats ailleurs que dans les dossiers "Copernic" fait quelque peu difficulté. En
effet, il n'est pas possible d'enregistrer les résultats ailleurs que dans un sous-dossier dépendant de
Data qui est lui-même un sous dossier de Copernic ainsi qu'indiqué dans le chemin :
c:\Program Files\Copernic 2001 Basic\Data\dossier désigné.
Or, une fois les documents enregistrés et accessibles "hors ligne", la page de consultation y fait
référence par un lien absolu du type
<a href="file:///C:\Program Files\Copernic 2001 Basic\Data\…."> </a>
En conséquence, il faut retravailler quelque peu les résultats :
-
en enregistrant la page de consultation au format HTML (page complète si possible) dans le
dossier requis ;
-
en déplaçant ensuite d'abord toutes les pages enregistrées dans le dossier voulu ;
-
en modifiant le code de la page de consultation de telle sorte que les liens absolus soient
remplacés par des liens relatifs pointant vers le(s) fichier(s) copiés précédemment dans le
dossier choisi.
Sauvegarder un ensemble de pages.
Seul IE 5 permet de travailler un peu à la manière d'un avaleur de site. Il est en effet possible de
récupérer les pages d'un même site liées entre elles, et ce jusqu'à maximum 3 niveaux :
Niveau 1
Niveau 2
Niveau 3
Page active
Page liée
Page liée
Page liée
Page liée
Page liée
Page liée
Page liée
Page liée
+ tous les composants liés à ces pages
• Les pages voulues sont enregistrées dans le dossier c:\windows\Offline Web Pages.
Page 3 sur 3
• Un raccourci est crée dans les Favoris.
• Le contenu de ce dossier peut être supprimé en utilisant les Propriétés Internet, onglet
Général, bouton Supprimer les fichiers Internet temporaires. Il est alors demandé s'il faut
aussi supprimé les fichiers conservés pour une consultation "off line".
Utiliser un aspirateur de sites.
Voir http://www.det.fundp.ac.be/cefis/publications/auguste/avaleurs-5-71.pdf
Avantages :
-
sélection plus fine ;
-
mise à jour des liens (liens relatifs) ;
-
maintien ou non de la structure originelle en dossiers ;
-
possibilité de télécharger ou non certains types de fichiers ;
-
utilisation "hors ligne" mais "comme si on y était".
• Attention !!! Premier niveau = niveau "zéro" (contrairement
à IE 5)
• Structure de l'aspiration :
-
Création d'un dossier spécifique à l'aspiration à
l'intérieur du dossier choisi par l'utilisateur. Son
étiquette correspond au titre donné à l'aspiration (ici
memoweb\Cefis)
-
le dossier Index contient tous les boutons, bannières et
pages HTML spécifiques à Memoweb et aux limites de
l'aspiration
-
plusieurs dossiers représentent les serveurs auxquels se
réfère le site du Cefis, notamment le site global des
FUNDP sur lequel se situent certains logos utilisés.
L'étiquette de ces dossiers est en fait l'adresse Internet
des sites référencés (www.fundp.ac.be)
-
Le dossier principal est étiqueté selon l'adresse du site
aspiré (www.det.fundp.ac.be).
-
Maintien de la structure du site (exigée dans les
préférences).
• Avec Memoweb, une page HTML explicative est affichée lorsqu'un utilisateur active un lien non
suivi.
• Une "page de garde" (_start.htm) est créée et permet de visualiser tout ce qui a été aspiré aussi
bien sur le site lui-même que sur les sites "associés".