webmestre : conception de sites et administration de serveurs
Transcription
webmestre : conception de sites et administration de serveurs
WEBMESTRE : CONCEPTION DE SITES ET ADMINISTRATION DE SERVEURS WEB ALGORITHMIQUE / PROGRAMMATION ORIENTÉES INTERNET Cours et TP A3 (1/2 module) Chapitre 3 LES BALISES META ET l’INDEXATION D’UN SITE WEB CONSERVATOIRE NATIONAL DES ARTS ET METIERS Le plus grand soin a été apporté à la réalisation de ce support pédagogique afin de vous fournir une information complète et fiable. Cependant le Cnam Champagne-Ardenne n’assume de responsabilité, ni pour son utilisation, ni pour les contrefaçons de brevets ou atteintes aux droits de tierces personnes qui pourraient résulter de cette utilisation. Les exemples ou programmes présents dans cet ouvrage sont fournis pour illustrer les descriptions théoriques. Ils ne sont en aucun cas destinés à une utilisation commerciale ou professionnelle. Le Cnam ne pourra en aucun cas être tenu responsable des préjudices ou dommages de quelque nature que ce soit pouvant résulter de l’utilisation de ces exemples ou programmes. Tous les noms de produits ou autres marques cités dans ce support sont des marques déposées par leurs propriétaires respectifs. Ce support pédagogique a été rédigé par Michaël KRAJECKI, Maître de Conférences à l’Université de ReimsChampagne-Ardenne. c Copyright 2001-2004 Centre d’Enseignement A Distance du Cnam Champagne-Ardenne. Tous droits réservés. Toute reproduction, même partielle, par quelque procédé que ce soit, est interdite sans autorisation préalable du Cnam Champagne-Ardenne. Une copie par xérographie, photographie, film, support magnétique ou autre, constitue une contrefaçon passible des peines prévues par la loi, du 11 mars 1957 et du 3 juillet 1995, sur la protection des droits d’auteur. CONSERVATOIRE NATIONAL DES ARTS ET METIERS Table des matières 1 INTRODUCTION 2 2 LES META-TAGS DESTINÉS AU RÉFÉRENCEMENT 2.1 LES BALISES META . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 DÉFINITION DES MOTS CLÉS ET DE LA DESCRIPTION . . . . . 2.3 LES AUTRES META-TAGS UTILES POUR LE RÉFÉRENCEMENT 2.4 QUELQUES MOTEURS DE RECHERCHE . . . . . . . . . . . . . . . . . . 2 2 2 3 3 3 LES CARACTÈRES SPÉCIAUX ET LA LANGUE 3.1 LES CARACTÈRES SPÉCIAUX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 DÉFINITION DE LA LANGUE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 UTILISATION DE PLUSIEURS LANGUES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 4 5 5 4 LA BALISE <BASE> POUR DÉFINIR DES ADRESSES URL COMPLÈTES 6 5 QUELQUES META-TAGS UTILES 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Algorithmique / Programmation orientées Internet 1 CONSERVATOIRE NATIONAL DES ARTS ET METIERS 1 INTRODUCTION Les Meta-Tags sont essentiellement destinés aux robots des moteurs de recherche et aux navigateurs. Les différentes balises <meta> permettent en effet de référencer votre site (par l’intermédiaire de mots clés par exemple), de préciser le codage utilisé pour les caractères spéciaux. Dans un premier temps, nous allons nous concentrer sur les meta-tags destinés aux robots. Puis, nous verrons les autres utilisations de cette balise <meta>. Vous trouverez également une présentation détaillée des Meta-tags à l’adresse suivante : www.allhtml.com/metatags/ . 2 LES META-TAGS DESTINÉS AU RÉFÉRENCEMENT Le référencement d’un site WEB est aujourd’hui indispensable car près de huit internautes sur dix trouvent l’adresse d’un site internet par l’intermédiaire de moteurs de recherche ou d’annuaires spécialisés. Je vous conseille à ce sujet la lecture des guides proposés sur www.referencement-fr.com . 2.1 LES BALISES META Les balises <meta> sont placées obligatoirement dans l’entête du document (c’est à dire entre les balises <head> et </head>). En fait, il existe une balise <meta> essentielle pour laquelle nous pouvons définir différents attributs : charset, content, dir, http-equiv, lang, et name. 2.2 DÉFINITION DES MOTS CLÉS ET DE LA DESCRIPTION Lors de la définition de vos documents, il est indispensable de définir en plus de la balise <title> (qui est un meta-tag), les meta-tags keywords et description. Pour définir les mots-clés de votre site WEB, procédez ainsi : <META NAME="keywords" CONTENT="mot-clé1,mot-clé2,mot-clé3,..."> Il est fortement conseillé d’utiliser des mots-clés en rapport direct avec votre site. De même, inutile de reprendre plusieurs fois le même mot-clé en vu d’un meilleur classement auprès des moteurs de recherche. Dans la plupart des cas, votre site sera simplement ignoré... Par exemple, si vous avez créé un site consacré à l’aquariophilie, vous pouvez définir ainsi les mots-clés : <META NAME="keywords" CONTENT="aquariophilie,aquarium,scalaire,clown"> Comme la définition des mots-clés, il est indispensable de proposer une courte description de votre site WEB. Dans un grand nombre de cas, cette définition sera reprise par les moteurs de recherche pour proposer un résumé de votre site. Il est donc fortement conseillé de bien construire son résumé. Celui-ci devra être court (quelques phrases) car sinon il sera probablement tronqué. LES BALISES META ET l’INDEXATION D’UN SITE WEB 2 CONSERVATOIRE NATIONAL DES ARTS ET METIERS La définition de la description se présente ainsi : <META NAME="description" CONTENT="une brève description de la page"> Voici par exemple les deux balises meta définies par le site www.aqualink.com . <html> <head> <meta name= " D e s c r i p t i o n " content= " AquaLink i s a f r e e WWW S e r v i c e d e d i c a t e d t o t h e Aquarium Hobby " > <meta name= " KeyWords " content= " aquarium , f i s h , c o r a l , r e e f , f r e s h w a t e r , marine , tank , hobby , a q u a l i n k , aquaria , s e r v i c e , f r e e , " > < t i t l e > AquaLink < / t i t l e > < / head> 2.3 LES AUTRES META-TAGS UTILES POUR LE RÉFÉRENCEMENT Il existe d’autres informations utiles lors du référencement d’un site Web, parmi lesquelles : <META NAME="author" CONTENT="nom de l’auteur"> Cette balise vous permet de préciser le nom de l’auteur. Cependant, il semble que peu de moteurs de recherche exploitent réellement cette information. <META NAME="Robots" CONTENT="instructions pour les robots"> Cette balise vous permet d’indiquer aux moteurs de recherche si vous souhaitez que votre site soit ou non, indexé par eux. Les instructions possibles sont : All (valeur par défaut) : le site sera entièrement référencé (pages et liens hypertextes). None : vos pages ne sont pas indexées. Index : seule la page qui définit ce meta-tag sera indexée. NoIndex : la page n’est pas indexée, mais les liens définis pourront éventuellement être indexés. Follow : autorise les robots à suivre les liens hypertextes définis. NoFollow : pour le contraire. Exemples : <META NAME="Robots" CONTENT="None"> <META NAME="Robots" CONTENT="Index,Nofollow"> 2.4 QUELQUES MOTEURS DE RECHERCHE Voici les adresses des principaux moteurs de recherche disponible en France. – AltaVista France : fr.altavista.com – Lycos : www.fr.lycos.de – Voila : www.voila.fr – Google : www.google.fr – Nomade : www.nomade.fr – Yahoo : fr.yahoo.com Il existe également des outils pour effectuer simultanément des recherches sur plusieurs moteurs. Dans cette catégorie des Meta-moteurs, l’un des plus connus est Copernic. Vous pouvez télécharger gratuitement une version sur www.copernic.com Algorithmique / Programmation orientées Internet 3 CONSERVATOIRE NATIONAL DES ARTS ET METIERS F IG . 1 – La page d’accueil de Google 3 LES CARACTÈRES SPÉCIAUX ET LA LANGUE Comme nous l’avons précisé dans le chapitre précédent, il faut être particulièrement attentif aux problèmes liés aux caractères accentués nécessaires à certaines langues. 3.1 LES CARACTÈRES SPÉCIAUX Pour préciser le codage de vos pages Web, vous disposez de la solution suivante : <meta http-equiv="content-type" content="text/html ; charset=iso-XXXX-X"> F IG . 2 – Copernic LES BALISES META ET l’INDEXATION D’UN SITE WEB 4 CONSERVATOIRE NATIONAL DES ARTS ET METIERS En particulier, pour les documents rédigés en français, je vous rappelle que le codage utilisé est la table iso-latin1 dont le code est iso-8859-1. Si vous souhaitez utiliser directement les accents dans vos documents, il est impératif de définir la balise suivante : <meta http-equiv="content-type" content="text/html ; charset=iso-8859-1"> Si vous ne prenez pas cette précaution, votre page risque de ne pas s’afficher correctement quand le navigateur utilisé est dans une langue différente par exemple. Ce défaut est également possible lors de l’utilisation d’un système d’exploitation différent. 3.2 DÉFINITION DE LA LANGUE Il est souhaitable de définir la langue utilisée dans le document HTML. Cette information sera utile, à la fois aux moteurs de recherche et aux navigateurs pour réaliser un affichage adaptée à la langue. <META HTTP-EQUIV="Content-language" CONTENT="code de la langue"> Voici les codes utilisés pour quelques langues courantes : L ANGUE Allemand Anglais (Grande Bretagne) Français C ODE de en-gb fr L ANGUE Américain Espagnol Italien C ODE en-us es it Vous trouverez une liste plus complète sur www.allhtml.com/metatags/metatags78.php 3.3 UTILISATION DE PLUSIEURS LANGUES Il est parfaitement possible, de définir des résumés et les mots-clés dans plusieurs langues. Cette solution est particulièrement intéressante quand vous développez un site WEB multi-lingue. Voici un exemple où l’information est disponible en français et en anglais. <html> <head> <meta h t t p −equiv = " Content −Type " content= " t e x t / html ; c h a r s e t= i s o −8859−1" > < t i t l e > Le s i t e du Roi du Web < / t i t l e > <meta name= " d e s c r i p t i o n " lang= " f r " content= " Le s i t e du r o i du Web : sa v i e , son oeuvre " > <meta name= " d e s c r i p t i o n " lang= " us " content= " The King ’ s Web pages : h i s l i f e , h i s work " > <meta name= " keywords " lang= " f r " content= " r o i , web , v i e " > <meta name= " keywords " lang= " us " content= " king , web , l i f e " > < / head> <body> <h1> Le s i t e du Roi du Web / The King ’ s Web pages < / h1> <p> ... < / p> < / body> < / html> Algorithmique / Programmation orientées Internet 5 CONSERVATOIRE NATIONAL DES ARTS ET METIERS 4 LA BALISE <BASE> POUR DÉFINIR DES ADRESSES URL COMPLÈTES Lors de l’inclusion d’images ou d’autres objets dans nos pages HTML, nous utilisons souvent des adresses URL incomplètes pour préciser l’image à inclure. Il est fortement conseillé de procéder ainsi, car cela permet de mettre à jour plus rapidement un site quand son adresse a changé. Cependant, si un visiteur a sauvegardé une de nos pages localement sur son disque dur, il risque d’avoir une mauvaise surprise lors d’une prochaine consultation. En effet, si les différentes ressources utilisées n’ont pas été rapatriées localement, le navigateur sera incapable de retrouver les adresses complètes des images incluses. C’est pourquoi, nous vous conseillons de définir le meta-tag <base> qui permettra au navigateur de retrouver le bon répertoire sur le bon site. Voici un exemple d’utilisation : < !DOCTYPE HTML PUBLIC " − //W3C / / DTD HTML 4.01 T r a n s i t i o n a l / / EN" > <html> <head> < t i t l e > Le s i t e du Roi du Web < / t i t l e > <meta h t t p −equiv = " Content −Type " content= " t e x t / html ; c h a r s e t= i s o −8859−1" > <base href = " f i l e : / home / k r a j e c k i / enseignement / cnam / p l e i a d / 2003/ cours / chap3 / SourceHTML / Image / " > < / head> <body> <h1> Le s i t e du Roi du Web < / h1> <img src= " image . j p g " a l t = " Le r o i du Web" > < / body> < / html> Dans ce cas, quelque soit la localisation de cette page, le navigateur sera en mesure de télécharger l’image Image/roi.jpg. En effet, grâce à la balise <base>, votre navigateur connaît l’URL complète de l’image qui est http ://www.leroiduweb.com/Image/roi.jpg. 5 QUELQUES META-TAGS UTILES Il existe d’autres meta-tags que vous pouvez définir selon vos besoins. En voici une présentation qui n’est pas exhaustive. <META HTTP-EQUIV="Refresh" CONTENT="x ;URL=adresse"> Cette balise META charge automatiquement la page spécifiée au niveau de l’attribut URL après un délai de x secondes. Elle est fréquemment utilisée pour rediriger automatiquement un visiteur dans le cas où l’adresse de votre site WEB a changé. <META NAME="Copyright" CONTENT="Copyright date nom"> Pour réserver les droits concernant les informations disponibles sur votre site WEB. <META NAME="Generator" CONTENT="nom de l’éditeur Html utilisé"> Cette balise n’a pas d’utilité directe, ni pour un internaute, ni pour les moteurs de recherche. En général, elle est définie automatiquement par les éditeurs WEB. Par exemple, voici le meta-tag généré par Netscape Composer : <meta name="GENERATOR" content="Mozilla/4.77 [fr] (X11 ; U ; Linux 2.4.3-20mdk i686) [Netscape]"> LES BALISES META ET l’INDEXATION D’UN SITE WEB 6 CONSERVATOIRE NATIONAL DES ARTS ET METIERS <META HTTP-EQUIV="Reply-to" CONTENT="votre adresse e-mail"> Cette balise permettra au visiteur averti de votre site de connaître votre adresse électronique. Cette information peut être particulièrement utile dans le cas où l’internaute a aspiré votre site WEB et le consulte localement sur sa machine. Elle est alors un complément appréciable de la balise suivante. <META HTTP-EQUIV="Reply-to" CONTENT="URL de votre page d’accueil"> Il est parfois utile de rappeler l’adresse de la page d’accueil de votre site WEB. <META HTTP-EQUIV="Expires" CONTENT="date"> Cette balise META informe le navigateur de la date à laquelle la page Html doit être considérée comme obsolète. Ainsi, quand vous accédez à un document présent dans le cache de votre navigateur, il pourra automatiquement effectuer une recherche sur le réseau si la page présente est périmée. Exemple : <META HTTP-EQUIV="Expires" CONTENT="Wed, 23 Apr 2002 10 :49 :02 GMT"> Attention, les moteurs de recherche peuvent supprimer les pages périmées de leurs bases de données. Algorithmique / Programmation orientées Internet 7