ENREGISTRER CERTAINES PAGES
Transcription
ENREGISTRER CERTAINES PAGES
Page 1 sur 3 ENREGISTRER CERTAINES PAGES Cinq questions préalables : • L'adresse Internet n'est-elle pas suffisante ? Vaut-il la peine de conserver ce(s) document(s) ? Si la réponse est positive, alors, que garder ? - l'une ou l'autre page isolée ou un ensemble de pages ? - garder le document tel quel avec tous ses "objets" (images, feuille de style, scripts javascript, …) ? - garder uniquement le texte au format HTML ? - garder uniquement le texte ? Garder l'une ou l'autre page isolée • Tous les navigateurs, sauf la dernière version de Netscape (6.2), permettent d'enregistrer la page lue - soit au format HTML, - soit au formate 'texte". La technique est toujours la même : - menu Fichier / Enregistrer sous, - sélectionner ensuite dans la boîte de dialogue sous quel format enregistrer : - Opera 6 et Netscape (4.6) : Fichiers HTML. - IE 5 : Page Web HTML uniquement. • Pour enregistrer la page complète avec tous ses composants, il faut disposer soit d'IE soit d'Opera. - IE 5 : Fichier / Enregistrer sous / Page Web complète. - Effet : création d'une page HTML + dossier contenant les objets tels que les images, les feuilles de style s'il y en a, et même les scripts Javascript. - Opera 6 : Fichier / Enregistrer avec les images sous. - Effet : Le document HTML et tous ses composants (images, feuille de styles éventuelle, et même les scripts Javascript) sont dans le dossier désigné pour l'enregistrement de la page. Les documents ainsi récupérés sont modifiables soit via un éditeur (HTML), soit via un éditeur ou un traitement de texte (TXT). Remarque : IE 5 permet le format Archive Web : la totalité des informations nécessaires à l'affichage de la page est enregistrée dans un seul fichier de format MIME encodé. Cette option enregistre un cliché de la page Web en cours. Cette option n'est disponible que si vous avez installé Outlook Express 5 (ou une version ultérieure). Le document n'est lisible qu'avec IE 5 ou Outlook et n'est pas modifiable. A. Marchant D:\RECHERCHE-WEB\ENREGISTRER-PAGES.DOC © CeFIS 18/02/2002 Page 2 sur 3 Autre outil : Copernic • Attention, cet agent de recherche tient compte des accents. • Après les diverses opérations indispensables pour finaliser une recherche, on dispose d'un certains nombres de pages enregistrées dans le dossier voulu et accessibles "hors ligne". Documents trouvés Sélection plus fine Documents validés (donc accessibles) Documents téléchargés Remarque : La copie des résultats ailleurs que dans les dossiers "Copernic" fait quelque peu difficulté. En effet, il n'est pas possible d'enregistrer les résultats ailleurs que dans un sous-dossier dépendant de Data qui est lui-même un sous dossier de Copernic ainsi qu'indiqué dans le chemin : c:\Program Files\Copernic 2001 Basic\Data\dossier désigné. Or, une fois les documents enregistrés et accessibles "hors ligne", la page de consultation y fait référence par un lien absolu du type <a href="file:///C:\Program Files\Copernic 2001 Basic\Data\…."> </a> En conséquence, il faut retravailler quelque peu les résultats : - en enregistrant la page de consultation au format HTML (page complète si possible) dans le dossier requis ; - en déplaçant ensuite d'abord toutes les pages enregistrées dans le dossier voulu ; - en modifiant le code de la page de consultation de telle sorte que les liens absolus soient remplacés par des liens relatifs pointant vers le(s) fichier(s) copiés précédemment dans le dossier choisi. Sauvegarder un ensemble de pages. Seul IE 5 permet de travailler un peu à la manière d'un avaleur de site. Il est en effet possible de récupérer les pages d'un même site liées entre elles, et ce jusqu'à maximum 3 niveaux : Niveau 1 Niveau 2 Niveau 3 Page active Page liée Page liée Page liée Page liée Page liée Page liée Page liée Page liée + tous les composants liés à ces pages • Les pages voulues sont enregistrées dans le dossier c:\windows\Offline Web Pages. Page 3 sur 3 • Un raccourci est crée dans les Favoris. • Le contenu de ce dossier peut être supprimé en utilisant les Propriétés Internet, onglet Général, bouton Supprimer les fichiers Internet temporaires. Il est alors demandé s'il faut aussi supprimé les fichiers conservés pour une consultation "off line". Utiliser un aspirateur de sites. Voir http://www.det.fundp.ac.be/cefis/publications/auguste/avaleurs-5-71.pdf Avantages : - sélection plus fine ; - mise à jour des liens (liens relatifs) ; - maintien ou non de la structure originelle en dossiers ; - possibilité de télécharger ou non certains types de fichiers ; - utilisation "hors ligne" mais "comme si on y était". • Attention !!! Premier niveau = niveau "zéro" (contrairement à IE 5) • Structure de l'aspiration : - Création d'un dossier spécifique à l'aspiration à l'intérieur du dossier choisi par l'utilisateur. Son étiquette correspond au titre donné à l'aspiration (ici memoweb\Cefis) - le dossier Index contient tous les boutons, bannières et pages HTML spécifiques à Memoweb et aux limites de l'aspiration - plusieurs dossiers représentent les serveurs auxquels se réfère le site du Cefis, notamment le site global des FUNDP sur lequel se situent certains logos utilisés. L'étiquette de ces dossiers est en fait l'adresse Internet des sites référencés (www.fundp.ac.be) - Le dossier principal est étiqueté selon l'adresse du site aspiré (www.det.fundp.ac.be). - Maintien de la structure du site (exigée dans les préférences). • Avec Memoweb, une page HTML explicative est affichée lorsqu'un utilisateur active un lien non suivi. • Une "page de garde" (_start.htm) est créée et permet de visualiser tout ce qui a été aspiré aussi bien sur le site lui-même que sur les sites "associés".