Référencement Search Engine Optimization (SEO) d`une

Transcription

Référencement Search Engine Optimization (SEO) d`une
Référencement Search Engine Optimization
(SEO) d’une Application ou d’un site web
1- Introduction
Le référencement, aussi appelé SEO, est une notion très vaste qui regroupe un grand
nombre de bonnes pratiques. Ces bonnes pratiques évoluent constamment, cependant, le
plus important perdure. Dans cet article nous listerons les éléments récurrents et solides
dans le temps.
2- Initiation et types de référencement
Le référencement selon Wikipédia peut-être définie comme étant le procédé suivant lequel
on fait un lien d'une page A vers une ressource B, c'est y faire référence et donc référencer
la ressource B depuis la page A. Par vulgarisation, l'action générique d'inscription dans les
moteurs de recherche a été appelée référencement. Aujourd'hui, sa pratique s'articule
autour des outils de recherche, plus particulièrement des moteurs et des annuaires de
recherche, en tentant d'améliorer le positionnement des sites (et donc leur visibilité) dans
leurs pages de résultats.
Un bon référencement sur le Web est essentiel puisque « 34 % des internautes cliquent sur
le premier lien naturel d'une page de résultats. Il peut aussi être intéressant d'être référencé
sur des sites externes, notamment des sites de bookmarks (marque-pages) ou des pages de
liens favoris ou encore sur des blogs, soit via un article, soit en utilisant la méthode dite
d'échanges de liens.
Suite à ce qui précède, il ressort donc que le référencement web est un univers très vaste
qui concentre différents types de référencement sur internet. Les différents types
référencements qui existent sont les suivants :
 Le référencement naturel aussi nommé référencement organique, regroupe
l’ensemble des techniques pour optimiser le positionnement d’un site dans les
résultats des moteurs de recherche. Toutes ces méthodes se retrouvent sous
l’acronyme de SEO (Search Engine Optimization). En référencement naturel on
parlera de liens naturels (ou organiques) c’est-à-dire de liens issus du cœur du
moteur (fournis par l’algorithme de pertinence) sans intervention d’un système
publicitaire ou monétaire.
 Le référencement payant aussi nommé référencement sponsorisé, ou non
organique, désigne toutes les actions visant à positionner son site en tête dans
Google en achetant des liens sponsorisés. Ces méthodes se retrouvent sous le terme
de SEA, Search Engine Advertising. Il s’agit de toutes les publicités commerciales
1
mises en place sur les moteurs de recherche avec principalement le référencement
commercial Google Adwords.
 Le référencement International : Dans le cas d’un site web à l’étranger, si vous
souhaitez bien le positionner sur le marché international, vous allez travailler le
référencement international de ce site. Comment mettre en place une stratégie de
référencement à l’international et agir sur des sites multilingues ? Les actions à
mettre en place vont varier selon les zones linguistiques et les cibles locales : ainsi
vous ne référencerez pas un site en anglais pour un public italien par exemple. La
simple transposition (référencement miroir) d’un site d’une langue à une autre n’est
pas suffisante pour espérer se positionner sur ce marché.
 Le référencement Local : Si vous avez un site dont l’activité dépend en grande partie
d’un business local, vous ne pourrez pas faire l’impasse sur une stratégie de
référencement local. Un bon référencement dans Google Maps sera notamment un
passage obligé via les services Google + Local et Google Adresses. Ces outils gratuits,
sont très intéressants pour le référencement (affichage des résultats locaux en haut
des pages de résultats de Google) et pour les internautes qui localiseront
précisément votre entreprise sur une carte et pourront obtenir un lien vers le plan
d’accès. Détaillé chacun de ces référencements rendra notre rédaction lourde
d’autant plus que nous ne cherchons pas à détailler tous ceux-ci. Ce qui nous ramène
à l’objet de notre étude qu’est le référencement naturel. Nous essaierons d’avoir
plus et d’en parcourir tous les aspects qu’il l’incombe.
3- Les Techniques du Référencement SEO
Les différentes techniques de référencement SEO sont nombreuses et il ne suffirait pas de
cet article pour toutes les décrire. Pour cela il existe de très nombreux ouvrages, sites de
formation ou encore forums dans lesquels vous pourrez en apprendre un peu plus. On peut
donc classer les différentes techniques en trois catégories différentes ceci dépend donc de
quel type de moteurs de recherche que l’on souhaite utilisé pour optimiser son site, ceci
revient dont à parler de : White Hat, Grey Hat et Black Hat.
3. 1 La technique du white Hat Seo
Consiste à utiliser des techniques respectant les conseils de qualité des moteurs de
recherche. En les utilisant, nous ne serons pas pénalisés. Ces techniques normales, et surtout
légales, qui vous aident à engendrer plus de trafic sont celles qui sont le plus appréciées par
les moteurs de recherche. Les différentes techniques de White Hat SEO étant trop
nombreuses, nous ne nous attarderons pas à les détailler dans cette partie. Disons
seulement, que d’une manière générale, ces techniques ne consistent pas à tromper les
moteurs de recherche mais plutôt à tout mettre en œuvre pour faciliter l’indexation des
pages et la compréhension de leurs thématiques et contenus.
3. 2 La technique du Grey Hat Seo
2
Celles dont nous ne sommes pas surs. Dans le détail technique, on peut considérer un Grey
Hat Seo, toute action délibérée qui essaye d’améliorer le positionnement d’un site dans les
moteurs de recherche pour certains mots clefs. Ces techniques rentrent dans cette catégorie
parce qu’il semblerait que Google préfère que les webmasters n’interviennent pas pour
essayer de changer le classement de leurs sites web en ajoutant leurs liens de façon
automatique, plutôt que les créer eux-mêmes. Donc la soumission de votre site à des sites
de partage de liens peut être considérée comme Grey Hat Seo. Actuellement aucun
problème ne se pose et vous ne serez pas pénalisé. Cependant, on peut facilement en
abuser et Google pourrait y faire face en le réprimant dans le futur s’il trouve le moyen pour
le faire. L’achat de liens est un bon exemple du comportement répressif de Google face aux
Grey Hat SEO. Cette technique était un bon moyen dans le passé. Elle rapportait aux
propriétaires des sites et aux acheteurs. Maintenant que Google ne la tolère plus, s’il suspect
que vous vendez des liens, votre positionnement en souffrira… (Et s’il suspecte que vous en
achetez, ces liens ne seront pas pris en compte, le résultat est que vous dépensez de l’argent
pour rien).
3. 3 La technique du Black Hat Seo
Le Black Hat Seo possède des techniques qui sont totalement contre les règles des moteurs
de recherche et surtout, elles sont interdites. Elles ont par exemple pour but de donner à un
site web un classement inapproprié pour certains mots clef.



On peut citer le partage des signets pour un site pornographique qui vise à classer le
site sur le mot clef « Acheter une TV LCD » ;
Ou encore, dans une page, le rembourrage de mots clef cachés dans l’arrière-plan
afin de les rendre invisibles aux visiteurs, mais toujours visibles aux spiders ;
Nous pouvons parler aussi des réseaux de sites propres créés seulement pour
référencer le site principal et améliorer son positionnement.
4- Consignes Relatives à la conception et au contenu
Avant d’optimiser vos pages, il faut établir une stratégie de mots-clés afin de bien définir sur
quelles requêtes de recherche vous désirez être visible. Il faut pour cela ; connaître la théorie
de la longue traine ; Utiliser des outils de choix des groupes de mots-clés ; Vérifier la
faisabilité d’utilisation d’un groupe de mots-clés dans le moteur ; Terminer la procédure en
finalisant une liste de 25 groupes de mots-clés.
 La théorie de la longue traine : elle consiste à trouver le mot clé ou le groupe de
mots-clés les mieux adapté pour l’affichage de votre site parmi les premières pages
qui s’afficheront lorsque l’internaute entrera sa requête.
3
Recherches (Nombre de recherches pour une même requête)
Requête d'un seul mot-clé > Très concurrentiel
Requête de 2 mots-clés (ex: cours online)
Requête de plus de 3
mots-clés > peu
concurrentiel (ex:
cours online guitare)
Requêtes (Nombre de mots-clés utilisés dans une requête)
Figure 1: Théorie de la longue Traine
Recherches (Nombre de recherches pour une même requête)
Utiliser la queue de la longue
traîne pour obtenir du trafic
qualifié
Requête de plus de 3
mots-clés > peu
concurrentiel (ex:
cours online guitare)
Requêtes (Nombre de mots-clés utilisés dans une requête)
Taux de Rebond (Nbre de visiteurs qui quittent le site dès la première page)
4
Trafic qualifié (Visiteurs correspondants aux services ou produits proposés par le site)
Figure 2: Méthode de la longue traîne (suite et fin)
 Vérifier la faisabilité d’utilisation d’un groupe de mots-clés dans le moteur ;
Il faut trouver un compromis entre une requête fréquemment utilisée et celle qui généré
trop de concurrence pour avoir une chance d’être positionné…
Pour être plus concret voici des références de résultats pour une requête qui vous
donneront une idée de vos chances d’être positionné :
 De 50000 à 200000 résultats : Bon compromis pour être positionné ;
 De 200000 à 800000 résultats : Positionnement possible mais avec ^plusieurs
optimisations successives ;
Plus de 800000 résultats : requêtes trop concurrentielle pour avoir des chances d’être bien
positionné.
 Terminer la procédure en finalisant une liste de 25 groupes de mots-clés.
Après avoir utilisé les outils de choix et vous êtes assuré de la faisabilité de l’utilisation de
chaque groupe de mots-clés, vous devez obtenir une liste de 25 groupes classés par ordre de
priorité et découpés en 5 blocs : A, B,… Ensuite donc on passe à la liste des groupes de motsclés sélectionnés. Ces différents endroits dans le code de la page à optimiser. Aussi, pour
conserver une cohérence verticale, vous devez toujours prélever les groupes dans cette liste
en commençant par le bloc de priorité la plus élevée (donc le bloc A).
En outre, force est de constaté que 80% des internautes ne dépassent pas la seconde page
de résultats lors de leur recherche sur un moteur. L’objectif est donc d’être positionné dans
ces 2 premières pages si vous ne désirez pas vous partager les 20% d’internautes restants
avec des milliers d’autres sites… Le positionnement d’une page dépend de 2 facteurs :
 La pertinence de la page : c’est l’adéquation des différents mots-clés associés à la
page lors de son indexation par le robot du moteur avec les mots clés saisis dans la
requête par l’internaute.
 La popularité de la page : c’est ce qu’on appelle pour Google, le Page Rank d’une
page le PR permet de mesurer l’indice de popularité d’une page sur l’échelle de 0 à
10.
Il faut noter que ces deux facteurs sont complétement indépendant l’un de l’autre.
5
Pertinence (Par rapport aux mots-clés de la requête)
PAGE A
Bonne pertinence des mots-clés de la
page par rapport à ceux de la requête
PAGE B
Bonne pertinence et bon
indice de popularité
PAGE C
Bon indice de
popularité mais
mauvaise
pertinence des
mots-clés de la
page par rapport
à ceux de la
requête.
Popularité (indice de PR)
Figure 3: Exemple de positionnement de pages selon leur indice de pertinence et de popularité.
4.1 Améliorer la pertinence et la popularité d’une page
Nous ne serons commencés cette partie de notre rédaction sans toutefois cerner les motsclés de cette partie qui l’incombe. Nous allons donc commencer par définir ces deux termes.
Pertinence : Optimisation interne à chaque page (balises Title et Méta, structure et contenu
de la page, images,..), Optimisation globale du site web (nom de domaine, nommage des
URL, sitemap,…).
Popularité : Optimisation externe à chaque page (indice de popularité, stratégies de liens,…)
4.2 Optimisation à chaque page
4.2.1La balise Title
Le contenu est repris en gras dans les résultats affichés par le moteur (voir illustration cidessus)
6
Figure 4: Illustration de l'apparence de la balise Title lors de la recherche.
Le contenu s’affiche également dans la barre de titre du navigateur (barre bleue en haut du
navigateur), le contenu est enregistré comme étiquette dans les favoris du navigateur, le
contenu est repris dans l’historique du navigateur. Le contenu de cette balise est essentiel
pour le positionnement de la page car il est fortement pondéré lors de l’indexation de la
page par le robot des moteurs.
Taille: 6 à 7 mots avec 60 caractères maximum (espaces inclus) ;
Contenu de la page : construire une page décrivant la page en y incluant les premiers mots
les plus importants de votre liste de mots-clés (début du bloc A). Les mots placés au début
auront plus d’importance que ceux de la fin.
Exemple :
<head>
<meta http-equiv="X-UA-Compatible" content="IE=edge"; charset="utf-8">
<title>CoursOnline : cours en ligne de guitare électrique</title>
</head>
Consigne : Même si son contenu est important pour le positionnement de la page, il faut se
rappeler qu’il est avant tout destiné aux internautes. Il faut donc rédiger une phrase explicite
afin de convaincre l’internaute de visiter la page. Il est fréquent de mettre le nom du site (ou
de la marque) au début du titre mais cela n’est pas obligatoire. Placer la balise Title le plus
haut possible dans le head de la page, idéalement juste après la balise Content-type (voir
exemple ci-dessus). Il est fortement recommandé de créer un Title différent pour chaque
page du site afin d’augmenter vos chances d’être positionné sur d’autres requêtes.
7
4.2.2 La balise Meta Description
Le contenu doit être décrit ce que contient la page et sera affiché en dessous du titre dans
les résultats du moteur. A défaut de balise Description, le moteur choisira arbitrairement le
texte placé au début du contenu de la page. (Voir illustration ci-dessus)
Figure 5: Illustration du contenu de la balise Meta Description (Référence: cours vidéo Elephorm:
fondamentaux du webmaster)
Le contenu de cette balise est de moins en moins utilisé dans le positionnement de la page.
Même si les mots-clés qu’elle contient sont faiblement pondérés lors de l’indexation de la
page par le robot, il est fortement recommandé de toujours mettre une balise Description,
ne serait-ce que pour contrôler le texte de la description qui s’affichera dans les résultats du
moteur.
Taille: 15 à 20 caractères avec 165 caractères maximum (espaces inclus)
Contenu : construire une ou deux phrases décrivant la page en y incluant des mots les plus
importants de votre liste de mots-clés (bloc A). Ces mots devront aussi être cohérents avec
les mots contenus dans le texte de la page afin de ne pas risquer d’être un développement
du titre et un résumé du texte de la page.
Exemple :
<head>
<meta http-equiv="X-UA-Compatible" content="IE=edge"; charset="utf-8">
<title>CoursOnline : cours en ligne de guitare électrique</title>
<meta name="description" content="cours de guitare electrique en ligne : méthode complète sur
la théorie musicale et la technique des guitares électriques." />
</head>
8
Consigne : même s’il est conseillé de faire une description spécifique par page, il peut être
toléré d’utiliser la même description pour plusieurs pages abordant le même sujet. Vous
pourrez ainsi découper votre site en plusieurs parties thématiques afin de leur associer une
description commune. Comme pour le contenu du titre, rappelez-vous que le texte est avant
tout destiné aux internautes de visiter la page. Eviter de répéter les mêmes mots-clés de
manière trop rapproché dans le texte des phrases. Si un mot clé est répété, essayez d’en
espacer le plus possible les occurrences.
4.2.3 La balise Meta Keywords
Son contenu n’est plus utilisé par les moteurs de recherche Google et Bing, seul Yahoo
semble encore lui attacher un d’importance. Suite aux nombreux abus dans l’usage de cette
balise par les webmasters pour surclasser leur site, les principaux moteurs de recherche
actuels ne tiennent plus compte des mots-clés qu’elle contient pour positionner une page
dans les résultats. Vous pouvez néanmoins l’ajouter pour améliorer votre positionnement
dans Yahoo qui semble encore l’utiliser.
Taille: 20 à 100 mots avec 1000 caractères maximum (espaces inclus).
Contenu : saisissez tous les groupes de mots-clés de votre liste en séparant chaque groupe
par une virgule (utilisez tous les blocs de A à E).
Exemple :
<head>
<meta http-equiv="X-UA-Compatible" content="IE=edge"; charset="utf-8">
<title>CoursOnline : cours en ligne de guitare électrique</title>
<meta name="description" content="cours de guitare electrique en ligne : méthode complète sur la
théorie musicale et la technique des guitares électriques." />
<meta name="Keywords" content="cours de guitare électrique, cours de guitare en ligne, cours de
guitare gratuit, cours de guitare, cours de guitare en ligne gratuit, cours de guitare net, apprendre
à jouer de la guitare, cours de guitare pour débutant, cours guitare débutant,..." />
</head>
9
Consigne : Proposer plusieurs déclinaisons des groupes de mots-clés en variant la casse,
l’accentuation et en les mettant aussi au pluriel.
Vous pouvez aussi, ajouter les principales fautes d’orthographe que les internautes peuvent
faire en saisissant les mots-clés utilisés dans la balise. Prenez soin de bien mettre les groupes
de forte priorité en début de la liste dans la balise.
4.2.4 La balise H1 de la page
Son contenu est fortement pondéré par les moteurs car il est censé représenter le titre
principal de la page. Comme le contenu de la balise H1 est obligatoirement visible par les
internautes, il doit toujours être cohérent avec le reste du contenu de la page. Il y a donc
peu de risque de spam par le webmaster et il est à ce titre bien considéré par les moteurs de
recherche.
Taille : 5 à 7 mots environ.
Contenu : Le titre H1 doit être cohérent avec le contenu de la balise Title et doit décrire le
contenu de la page. La balise H1 doit être unique dans une page.
Exemple :
<h1>Nos offres de cours de guitare électrique en ligne</h1>
Consigne : Choisissez un titre décrivant le contenu de la page en essayant dans la mesure du
possible d’y inclure un ou deux mots-clés.
4.2.5 La structure des balises Hx de la page
Chaque contenu de la balise de titre sera pondéré en rapport avec le niveau du titre (H2,
H3,..).
Contrairement à la balise H1 qui doit être unique, les autres balises de titre peuvent être
répétées plusieurs fois dans la page selon la structure des informations à afficher.
10
Le fait de pouvoir utiliser plusieurs balises de même niveau dans la structure du contenu de
la page, permet d’y placer facilement des mots-clés importants par rapport à l’objectif de
positionnement de la page.
Taille : 5 à 7 mots environ.
Contenu : le contenu des balises de titre Hx doit illustrer la structure des informations de la
page. Il est conseillé dans la mesure du possible d’y inclure des mots clés de la liste.
Exemple :
<h2>Cours de guitare pour adultes</h2>
<h3>Forfait de cours en ligne mensuel</h3>
<h3> Cours de guitare avec suivi personnalisé </h3>
<h2> Cours de guitare pour Enfants</h2>
Consigne : le contenu des balises de titre Hx doit illustrer la structure des informations de la
page. Il est conseillé dans la mesure du possible d’y inclure des mots clés de la liste. Il est
conseillé d’avoir au moins 3 niveaux de balises de titre (soient de H1 à H3). Vous Pouvez
redéfinir si besoin la mise en forme des balises de titre à l’aide de feuilles de styles en
rapport avec la charte graphique du site. Les textes contenus dans les balises de paragraphes
(<p>) seront aussi mieux pondérés s’ils sont mis en exergue avec une balise STRONG
(<strong>). Vous pourrez ainsi augmenter le poids de certains mots-clés dans les
paragraphes de la page en les encadrant par cette balise.
4.2.6 Les images
L’attribut Alt (texte alternatif à l’image) de la balise image est lu par les moteurs de
recherche et put donc permettre d’améliorer le positionnement de la page contenant
l’image si des mots clés sont placés dans cet attribut. De même, le nom du fichier
apparaissant aussi dans le code, doit lui aussi être nommé en fonction de ce que représente
l’image.
Si votre page comporte des images, prenez soin de bien configurer la balise ALT de chaque
image et nommer le fichier de l’image avec un texte indiquant ce que représente l’image et
comportant si possible des mots-clés issus de la liste.
11
Taille : 2 à 5 mots environ.
Contenu : la valeur de l’attribut Alt doit contenir un texte alternatif à l’image dans le cas où
celle-ci ne s’affiche pas. Il est conseillé dans la mesure du possible d’y inclure aussi des mots
clés issus de la liste.
<img src= ‘’guitare-electrique.jpg’’ alt= ‘’Guitare électrique’’ />
Consigne : L’attribut ALT est aussi utilisé pour l’accessibilité et notamment les non-voyants
qui naviguent à l’aide de lecteur d’écran dans la page web. Il faut donc que le texte de cet
attribut reste cohérent avec ce que représente l’image.
4.2.7 L’indice de popularité
Une page à indice de pertinence équivaut sera d’autant mieux positionnée que son indice de
popularité sera élevé. L’indice de popularité (nommé PageRank pour Google) permet
d »évaluer le nombre et la qualité des liens qui pointent sur la page (les backlinks). Il est noté
de 0 à 10 selon une échelle logarithmique. L’indice de popularité associé à l’indice de
pertinence de la page permettra d’améliorer le positionnement de la page dans les résultats
du moteur.
Consigne : Plus une page est la cible de liens hypertextes, plus son indice de popularité sera
important. Les liens externes au site seront mieux pondérés que les liens inter-pages d’un
même site. Les liens issus d’une page ayant un bon PR seront aussi mieux pondérés. Plus une
page aura des liens sortant, moins l’incidence de chaque lien aura d’importance pour l’indice
de popularité de la page cible. Pour que le lien issu d’une page soit pris en compte, elle doit
être indexée dans le moteur concerné. Le texte du lien devra contenir des mots-clés en
rapport avec le contenu de la page ciblée (évitez cliquez-ici par exemple). Le lien devra être
réalisé en HTML (à bannir les liens en JavaScript ou Flash).
Figure 6: exemple de réalisation d'indice de popularité (référence cours Elephorm: fondamentaux
webmasters)
12
Les flèches vertes représentent les liens de pages externes ou internes au site et leur taille
est proportionnelle à l’incidence sur le PR de la page ciblée.
L’échelle du PR est logarithmique. Il sera donc assez facile d’acquérir un PR de 1 à 4. Mais il
sera dur d’améliorer son classement à partir de 5. Voir le schéma ci-après :
Quantité et quantité des backlinks de la page
Popularité
(indice de
PR)
Figure 7: Les backlinks de la page
Pour connaître l’indice de popularité sur Google (PageRank (PR) chez Google) il faut se
prémunir des outils suivant :


Avec la commande link : www.monsite.com/mapage.html
En utilisant l’extension de Firefox ″Google ToolBar″
Pour augmenter son indice de popularité, nous devons mettre un accent sur les thèmes
suivant :



Réaliser des échanges de liens avec des sites ayant un fort PR ;
S’inscrire dans des annuaires (généralistes ou thématiques) ;
Diffuser du contenu de qualité sur d’autres sites.
4.2.3 Optimisation globale du site
4.2.3.1 Le nom du domaine
13
Il faut inclure un mot clé dans le nom de domaine favorise son positionnement dans les
résultats pour les requêtes contenant ce mot clé. Il n’est toujours pas facile d’agir sur le nom
de domaine car ce dernier doit d’abord satisfaire les exigences du marketing. Néanmoins, s’il
est possible d’y inclure un mot clé, cela ne pourra être que positif pour votre visibilité sur
internet.
Si le nom de domaine est constitué de deux mots, utilisez alors un tiret pour les séparer ()
ex : (mon-domaine.fr). Utilisez un seul nom de domaine pour votre site. Si vous avez un
second domaine, faites une redirection permanente (301) vers le domaine principal.
L’utilisation de sous-domaine permet d’augmenter la visibilité du site dans les résultats en
dépassant la limite des 2 pages par domaine.
4.2.3.2 Les URL
Il faut inclure un mot clé dans les noms des répertoires contenant les pages web favorise
leur positionnement dans les résultats pour les requêtes contenant les pages web favorise
leur positionnement dans les résultats pour les requêtes contenant ce mot clé. Même si
l’incidence de l’URL d’une page dans son positionnement est faible, il est néanmoins
recommandé d’insérer des mots-clés dans le nommage du dossier qui contiendra les pages
web et dans le nom du fichier de la page HTML.
Consigne : Si le nom du répertoire ou de la page est constitué de deux mots, utilisez alors un
tiret pour les séparer (ex : /guitare-electrique/). N’ajoutez pas de répertoires superflus sous
le prétexte d’ajouter un plus grand nombre de mots-clés dans l’URL. N’utilisez jamais de
caractères accentués, d’espace ou d’underscore dans le nommage de vos répertoires ou de
vos fichiers.
/guitare-electrique/cours-en-ligne.html
4.2.3.3 Le sitemap
La présence d’un sitemap.xml à la racine facilite l’indexation de votre site. Le sitemap est un
fichier XML qui représente l’architecture du site. La présence d’un fichier sitemap.xml sur
votre site n’augmente pas son positionnement mais favorise le travail du robot. Il permet
aussi de lui communiquer la structure des pages que le robot devra indexer en précisant
l’importance de chaque page, la date de la dernière actualisation et la fréquence de ses
mises à jour.
Exemple :
14
Figure 8: Exemple de fichier sitemap.xml
Consigne : actualisez le fichier sitemap.xml à chaque ajout de données dans la base. Si le
site est dynamique, il est alors conseillé de générer automatiquement un fichier sitemap à
chaque ajout de données dans la base. Il existe de nombreux logiciels pour générer un
sitemap. Certains d’entre eux peuvent être utilisés en ligne depuis un simple navigateur. (Ex :
www.xml-sitemaps.com). Pour déclarer un sitemap à Google, vous devez créer un compte
de webmaster sur le site de Google puis le déclarer en ligne dans votre espace privé. Pour
déclarer automatiquement un sitemap pour les moteurs, Google, Bing, Yahoo. Il faut ajouter
une instruction qui indique la localisation du fichier dans le fichier robots.txt (ex : Sitemap :
http://www.coursonline.com/sitemap.xml). Il est aussi judicieux de créer une version HTML
du sitemap pour la mettre à la disposition des internautes en guise de plan du site.
4.2.3.4 Le fichier ROBOTS.txt
Le fichier robots.txt ne contribue pas au référencement mais au contraire permet de bloquer
l’indexation de certaines pages du site. Si vous ne désirez pas que certaines pages du site ne
se retrouvent pas dans les résultats des moteurs car elles sont confidentielles ou simplement
en construction, vous pouvez alors configurer le fichier robots.txt en conséquence. Comme
nous l’avons déjà vu précédemment, vous pouvez aussi ajouter dans ce fichier, une
instruction qui indique aux robots où se trouve le sitemap.xml.
Contenu :
User-agent : la première ligne permet d’indiquer à quel robot sont destinées les instructions
qui suivent. Mettre une étoile pour les destiner à tous les robots.
15
Disallow:/prive/ : la seconde ligne désigne le répertoire ou la page qui ne doit pas être
visitée par le robot.
Sitemap : http://www.coursonline.com/sitemap.xml : La troisième ligne doit être ajoutée si
vous avez un fichier sitemap.xml afin de préciser au robot où il se trouve.
Exemple :
User-agent : *
Disallow : /admin/
Disallow : /pageinterdite.html
Sitemap : http://www.coursonline.com/sitemap.xml
Conseils : le fichier robots.txt est un fichier texte (ascii) qui doit être placé à la racine du site
(attention de bien l’écrire en minuscule et avec un s). Ne laissez aucune ligne vide dans le
fichier. Vous pouvez dupliquer la seconde instruction autant de fois que vous aurez le
répertoire ou de pages spécifiques à interdire. Pour exclure toutes les pages du site, utilisez
l’instruction Disallow:/ Pour n’exclure aucune page, utilisez l’instruction Disallow (sans
paramètre) ou ne mettez pas de fichier robots.txt à la racine.
4.2.3.5 Accélérer l’indexation de votre page
La démarche à suivre pour accélérer l’indexation initiale de votre site dans la base du
moteur :



Mettre un lien vers votre page index depuis une page d’un site ayant un fort PR (les
sites ayant un PR est important sont souvent plus fréquemment visités),
Créer un compte webmaster sur le site Google et déclarer le sitemap,
S’inscrire dans des annuaires (Voila, Yahoo, open Directory,..)
16