Le référencement naturel d`un site web

Transcription

Le référencement naturel d`un site web
DUT GEA. – Informatique – D’après le document de Laurent GILI / Lycée Prévert
LE REFERENCEMENT NATUREL D’UN SITE WEB1
« Google n’est un moteur de recherche,
c’est un système de gestion de la
réputation »
S81 - L’information commerciale, ressource stratégique
Leslie Gaines-Ross
Auteure de « Corporate Reputation »
813 - L’accès à l’information
84 – Informatique appliquée à la gestion de la relation avec la clientèle
S87 - Présentation et diffusion de l’information commerciale
Introduction au concept de « référencement »
« Tentons une explication de ce mot au travers d’une analogie avec la grande distribution : lorsque vous allez faire vos course s dans un
supermarché, vous vous promenez dans les rayons et y voyez un certain nombre de produits. On dit d’ailleurs, dans le ja rgon commercial, que ces
produits sont « référencés » auprès de la grande surface. En d’autres termes, ils sont « trouvables ». Cependant, ils sont placés parmi des
centaines, des milliers d’autres, tous rangés au départ de la même façon dans de nombreu x rayons. Pour mettre en évidence certains d’entre eux,
les responsables commerciaux des supermarchés ont alors eu l’idée de les placer au niveau des yeux du consommateur – ou en « tête de gondole
», ou encore au niveau des caisses de paiement –, ce qui les rend plus visibles. Certains produits sont alors mis en avant à des endroits
stratégiques, beaucoup plus facilement « trouvables » par les clients potentiels. Ils sont ainsi bien « positionnés »… Vous voyez où nous voulons en
venir ?
Pour ce qui est du référencement de votre site web, il en sera de même : lorsque votre site sera « présent » dans les bases de données d’un
moteur, on dira qu’il est « référencé ».
C’est une première étape, nécessaire mais pas suffisante, dans le processus de gain de visibilité de votre source d’information.
Disons qu’il est « prêt à être vu »…
*…+ Une phase toute aussi importante sera *…+, dans un deuxième temps, de mettre en « tête de gondole » votre site en le positionnant au mieux
dans les résultats de recherche pour les mots-clés les plus importants pour votre activité.
Enfin, il faudra une troisième étape, malheureusement souvent négligée, pour vérifier in fine que le positionnement a porté ses fruits en évaluant
le trafic généré par vos efforts d’optimisation. Croyez-vous que les responsables de supermarchés ne vérifient pas si leurs produits se vendent
mieux ou non en fonction de leur emplacement ? En effet, ce n’est pas parce qu’un produit est pl acé en tête de gondole qu’il est obligatoirement
plus vendu. Tout dépend de l’endroit où se trouve la gondole et du nombre, voire du type, de personnes qui passent devant. En d’autres termes, il
ne servira à rien d’être bien positionné sur des mots -clés que personne ne
saisit ou sur des moteurs que personne n’utilise… »
ème
Olivier Andrieu, Réussir son référencement web, 2
édition, Ed. Eyrolles.
Pour résumer !
Un processus de référencement s’effectue en 4 phases essentielles :
1. Référencement :
votre site doit être « trouvable » (« en rayon ») dans l’index du moteur, de la façon la plus complète possible.
2. Identification :
une ou plusieurs des pages de votre site doivent se trouver « dans le lot » des pages identifiées car contenant
les mots-clés constituant la requête de l’internaute.
3. Positionnement :
vos pages doivent être optimisées en fonction des critères de pertinence des moteurs afin d’être
classées au mieux dans les pages de résultats pour vos mots-clés choisis au préalable.
4. Contrôle et suivi des résultats.
A noter !
Il existe en fait 2 façons de faire venir des visiteurs sur un site web :
- Via les moteurs de recherche, à condition d’y être indexé et d’obtenir un bon classement dans les résultats affichés.
- Via les liens externes (backlinks) : il s’agit des liens pointant vers votre site, proposés par les annuaires, forums et autres sites
partenaires. A terme, les liens externes génèrent un trafic de près de la moitié de vos visiteurs.
Dans ce chapitre, nous nous intéresserons uniquement au référencement par les moteurs de recherche.
1
Cette partie s’appuie essentiellement sur l’ouvrage suivant : Réussir son référencement web, Olivier Andrieu, 2ème édition, Ed. Eyrolles.
DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected]
I/ Distinguer liens naturels et liens sponsorisés
Voici un extrait de la page affichée par Yahoo suite à la saisie de la requête : «agence immobilière ».
Zones A
Zones B
Zones A :
Les zones A sont occupées par des liens sponsorisés, ou liens commerciaux, baptisés AdWords chez Google et
qui sont des zones publicitaires payées par des annonceurs selon un système de paiement au clic. On parle ici
de référencement payant, ou référencement SEM (Search Engine Marketing).
Zone B :
La zone B représente, elle, ce que l’on appelle les liens organiques ou naturels, qui sont fournis par
l’algorithme mathématique de pertinence du moteur de recherche. Ils n’ont rien à voir avec la publicité
affichée dans les zones ci-dessus. On parle ici de référencement naturel, ou référencement SEO (Search
Engine Optimization).
Définition :
Liens « organiques » ou « naturels »
On appelle liens « organiques » ou « naturels » (car aucun processus publicitaire n’intervient dans leur
classement), les résultats affichés par le moteur de recherche en dehors de toute publicité ou
promotion pour les services de l’outil de recherche.
A retenir !
1) Le référencement naturel est indépendant des liens sponsorisés
Il est important de bien comprendre que les deux sources principales d’information dans les pages de
résultats des moteurs (liens sponsorisés et liens organiques) sont indépendantes les unes des autres.
Être un gros annonceur sur Google ou Yahoo! n’influe donc en rien de façon directe le positionnement
de votre site web dans les liens organiques du moteur en question. Heureusement d’ailleurs, car la seule
façon d’être pérenne pour un moteur de recherche est de présenter des résultats objectifs et
indépendants des budgets publicitaires…
2) Une stratégie de référencement dit « naturel » ou « traditionnel » aura donc pour vocation de
positionner une ou plusieurs page(s) de votre site web dans les meilleurs résultats des liens
organiques lorsque les mots-clés importants pour votre activité sont saisis par les internautes.
DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected]
II/ Préparer le référencement
A. Les trois étapes à respecter lors d’un référencement sur un moteur de recherche
L’affichage des résultats par un moteur se décompose en trois étapes :
-
Extraction, depuis son index, des pages répondant aux mots de la requête tapée par l’utilisateur.
Classement des résultats par pertinence.
Affichage.
(Cf. chapitre 5).
Les étapes à mener
dans le cadre d’un bon
référencement suivront
donc cette même logique.
1. Le moteur se sert d’un
index de recherche : il
faudra donc que votre
site web soit présent
dans cet index.
Il s’agit de la phase de
référencement. Si votre
site propose 100 ou 1 000
pages web, il faudra
idéalement
qu’elles
soient toutes présentes
dans l’index du moteur.
Ceci n’est
pas sans
incidence sur la façon
dont le site doit être
pensé
lors
de sa
conception…
2. L’internaute saisit ensuite
un mot-clé (ou une
expression contenant
plusieurs mots) dans le
formulaire proposé par le
moteur. Celui-ci extrait
de son index général toutes les pages qui contiennent le mot en question. Il faudra donc que vos pages
contiennent les mots-clés importants pour votre activité.
3. Cependant, la présence de ces mots-clés ne sera pas suffisante.
En effet, pour l’expression « agence immobilière », Google renvoie près de 25 000 000 de résultats. Il ne faudra
donc pas mettre ces mots n’importe où dans vos pages. Pour faire en sorte que vos documents soient réactifs
par rapport aux critères de pertinence des moteurs, et donc qu’ils soient bien positionnés, il faudra insérer ces
termes de recherche dans des « zones chaudes » de vos pages : titre, texte, URL, etc.
DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected]
B. Les premiers pas en pratique
1. Méthodologie générale
http://methodologies.abondance.com/referencement.html
http://www.rankspirit.com/referencement.php
http://www.siteduzero.com/tutoriel-3-13666-apprenez-a-creer-votre-site-web.html
2. Le choix des mots-clés
Les mots-clés que vous allez choisir sont extrêmement importants et doivent répondre à deux notions
essentielles :
· L’intérêt :
ils doivent être souvent (le plus possible) tapés par les utilisateurs des moteurs de recherche.
· La faisabilité : il doit être techniquement possible de positionner une page web dans les premiers résultats
des moteurs pour ce terme dans des délais acceptables.
Bien sûr, les termes choisis doivent décrire votre activité et le contenu de votre site web, cela
va sans dire…
Outils !
Pour trouver des mots-clés avec AdWords, de Google : AdWords
Pour trouver les mots-clés qui sont « tendances » (par zone géographique) :
http://www.google.com/insights/search/
3. Les zones chaudes à examiner
Zone chaude 1 :
balise <title>
Zone chaude 2 :
texte visible
Zone chaude 3 :
adresse (URL)
des pages
Zone chaude 4 :
balises meta
Zone chaude 5 :
attributs alt et
title
Voici quelques conseils techniques tirés du site rankspirit.com (http://www.rankspirit.com/realisation-site-web.php) :
Syntaxe irréprochable Un code incorrect peut causer des problèmes d'affichage ou de ralentissement de chargement. Il
peut aussi empêcher l'indexation de tout ou partie de votre site. De nombreux systèmes de
vérification de code sont disponibles en ligne, utilisez-les.
Liens en javascript ou en Ils sont visibles et utilisables par les visiteurs mais ne sont pas interprétés par les moteurs.
Flash Certaines pages risquent donc d'être purement et simplement inaccessibles aux moteurs. Une
solution simple consiste à réaliser une page "plan de site" qui comporte des liens HTML vers
TOUTES les pages de votre site. Un lien HTML de la page d'index vers cette page "plan de site"
permettra aux moteurs d'explorer et d'indexer l'intégralité de votre site.
Balises "Alt"
Si votre site comporte peu de texte et beaucoup d'images, il est impératif de compléter
les balises "Alt" de toutes vos images pour avoir une chance de figurer dans les résultats des
moteurs de recherche. Le fait de compléter ces balises vous permettra dans tous les cas de gagner
de la pertinence.
DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected]
Titres de pages et les Ces zones ne jouent pas un rôle important pour l'indexation des pages. Elles jouent pourtant un
descriptifs (balises <Title> rôle capital dans vos résultats de fréquentation. Les moteurs utilisent en effet souvent le contenu
et <Description> de ces balises pour présenter un "résumé" de vos pages aux internautes. La balise "description"
est également utilisée par certains annuaires. Il est donc impératif d'individualiser ces balises et
d'y loger un texte clair et attractif pour chaque page.
Sources Faites des liens vers les pages dont vous vous êtes inspiré. C'est la moindre des politesses et c'est
un moyen de gagner de la pertinence vis-à-vis des moteurs de recherche.
Pages dynamiques Les pages générées par les langages évolués tels que le PHP ou l'ASP ont parfois des URLs
(adresses) trop complexes pour être reconnues par les moteurs de recherche. Il est alors
indispensable de pratiquer l'"URL Rewriting" pour simplifier ces adresses aux yeux des moteurs.
Les URLs "nettoyées" de cette façon doivent figurer dans votre plan de site ou sur une autre page.
Structure du site Faites en sorte que n'importe quelle page de votre site soit accessible en 3 clics maximum depuis
la page d'accueil.
Noms de fichier Donnez à vos fichiers image et à vos pages des titres explicites et évocateurs. Si vous utilisez des
noms composés, séparez les mots par des tirets. Exemple : axel-red-en-vacances.htm
Frames Elles peuvent compliquer l'indexation de certaines pages. Le plan de site vous permettra, une fois
encore, d'être certain de voir toutes vos pages indexées. L'utilisation des frames pose
malheureusement beaucoup d'autres problèmes et nous vous la déconseillons vivement.
4. Le référencement auprès des moteurs
4.1. Les méthodes de référencement
Il existe trois méthodes pour être référencé naturellement auprès des moteurs de recherche :
a) Le référencement automatique : réalisé par des sites ou des logiciels spécialisés. En général, cette méthode
est peu recommandable, sauf pour des webmasters expérimentés.
b) Le référencement manuel : il est simple à réaliser mais consomme un temps considérable si vous
ambitionnez d'obtenir un nombre important de liens par ce moyen.
c) Le référencement payant : des professionnels s'occupent de faire ce travail pour vous. Cette solution, très
onéreuse, est toutefois intéressante pour un site commercial à condition de choisir son prestataire avec un
grand soin.
Outils !
Les outils de soumission automatique
Il existe plusieurs outils permettant de soumettre de façon automatique votre site à des centaines, voire parfois des
milliers, d’annuaires. En voici quatre, classés par ordre alphabétique :
· Linkomatic – http://www.linkomatic.org/
· SubmitWolf – http://www.trellian.fr/swolf/
· Website Submitter – http://www.submitsuite.com/products/website-submitter.htm
· Yooda Submit – http://www.yooda.com/outils_referencement/submit_center_yooda/
Ces outils sont plutôt à éviter, les moteurs ne les appréciant que de façon très modérée…
Les outils de soumission manuelle
· Google – http://www.google.fr/addurl/?hl=fr&continue=/addurl
· Yahoo! (nécessite un compte Yahoo!) – http://siteexplorer.search.yahoo.com/submit
· Bing – http://www.bing.com/docs/submit.aspx?FORM=WSDD2
· Exalead – http://www.exalead.fr/search/web/submit/
DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected]
4.2. Le choix des moteurs
Baromètre
moteurs
USA
Juin
2011
(source : http://barometre.secrets2moteurs.com/)
Baromètre France - Juin 2011
(source : http://barometre.secrets2moteurs.com/)
ComScore - Part entités Mai 2011 / Juin 2011
Entité de recherche
Mai 2011
Juin 2011
1 - Google
63.3%
64.5%
2 - Yahoo!
19.6%
17.5%
3 - Microsoft
13.1%
14.1%
4 - Ask Network
2.6%
2.6%
5 - AOL LLC Network
1.3%
1.3%
5. Le diagnostic et le suivi du référencement
Outils !
http://www.outiref.com/ ; http://www.soumission-manuelle.com/fr/ ; outils pour webmaster Google
DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected]
III/ Travailler le positionnement
A. Comprendre le système de ranking
Le ranking est un processus qui consiste pour le moteur à classer automatiquement les données de l’index de façon
à ce que, suite à une interrogation, les pages les plus pertinentes apparaissent en premier dans la liste de résultats.
Le but du classement est d’afficher dans les 10 premières réponses les documents répondant le mieux à la question.
Pour cela, les moteurs élaborent en permanence de nouveaux algorithmes (des formules mathématiques utilisées
pour classer les documents). Ces algorithmes sont un véritable facteur différenciant. Ils ne sont donc que très
rarement rendus publics.
Il existe plusieurs grandes méthodes de ranking des résultats et les moteurs utilisent pour la plupart un mélange de
ces différentes techniques. On citera, en particulier :
· Le tri par pertinence
Les résultats d’une requête sont triés en fonction de six principaux facteurs appliqués aux termes de la question :
– localisation d’un mot dans le document (exemple : le poids est maximal si le mot apparaît dans le titre ou au début
du texte) ou son adresse (URL) ;
– densité d’un mot, calculée en fonction de la fréquence d’occurrences du mot par rapport au nombre total de mots
dans le document ;
– mise en exergue d’un mot : gras (balise <STRONG>), titre éditorial (balise <Hn>), lien, etc. ;
– poids d’un mot dans la base de données calculé en fonction de sa fréquence d’occurrences dans l’index (les mots
peu fréquents sont alors favorisés) ;
– correspondance d’expression basée sur la similarité entre l’expression de la question et l’expression
correspondante dans un document (un document est privilégié lorsqu’il contient une expression similaire à celle de
la question, notamment pour des requêtes à plusieurs mots-clés) ;
– relation de proximité entre les termes de la question et les termes utilisés dans le document (les termes proches
l’un de l’autre sont favorisés).
1.
· Le tri par popularité (indice de popularité)
Popularisé – mais pas inventé – par Google en 1998 (pour contrer entre
autres les abus possibles des méthodes de tri par pertinence) avec son
PageRank, le tri par popularité s’appuie sur une méthode basée sur la «
citation » – l’analyse de l’interconnexion des pages web par l’intermédiaire
des liens hypertextes – et il est a priori indépendant du contenu. Ainsi,
Google classe les documents notamment en fonction de leur PageRank
(nombre et qualité des liens pointant vers ces documents). Le moteur
analyse alors les pages contenant les liens : ceux émanant de pages issues
de sites considérés comme importants « pèsent plus lourd » que ceux de
pages de certains forums ou de pages perso jugées secondaires, par
exemple. Plus une page est pointée par des liens émanant de pages
populaires, plus sa popularité est grande et meilleur est son classement.
Cette méthode de tri des résultats est aujourd’hui utilisée par de nombreux
moteurs (pour ne pas dire tous les principaux moteurs).
Les X commandements du « bon lien »
Un « bon lien » doit présenter un maximum de particularités :
– Il doit émaner d’une page populaire (PageRank supérieur ou égal à 4 ou 5).
– Il doit émaner d’une page issue d’un site de la même thématique que le vôtre.
– Si c’est un site de référence du domaine, c’est encore mieux.
– Il doit émaner d’une page contenant le moins possible de liens sortants.
– Le texte du lien (anchor text) doit décrire ce que l’internaute trouvera dans la
page (éviter les « cliquer ici » ou les « pour en savoir plus »).
– Un lien aura une meilleure efficacité au niveau de la pertinence s’il est placé au
cœur de la page, intégré dans un contenu et sur plusieurs pages du site au lieu
d’une seule.
La question du PageRank (ou
tri par popularité) de Google
« Comme l'explique Larry Page,
notre but est de vous fournir
"exactement
ce
que
vous
souhaitez". À l'époque de la création
de Google, l'une de nos innovations
phares
était
la
technologie
PageRank.
Celle-ci
permettait
d'évaluer l'"importance" d'une page
Web, notamment en fonction du
nombre de liens pointant vers elle.
Aujourd'hui, nous nous appuyons
sur plus de 200 signaux, dont
PageRank, pour classer les sites
Web, et nous mettons à jour leurs
algorithmes chaque semaine. Par
exemple, nous pouvons proposer
des
résultats
de
recherche
personnalisés en fonction de votre
historique Web ou de votre situation
géographique. »
Illustration :
Le référencement chez Google :
http://www.google.com/intl/fr/abo
ut/corporate/company/tech.html
DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected]
· Le tri par mesure d’audience (indice de clic)
Créée par la société DirectHit en 1998, cette méthode permet de trier les pages en fonction du nombre et de la «
qualité » des visites qu’elles reçoivent. Cette méthode semble être utilisée encore aujourd’hui par certains moteurs
dont Google.
2.
A noter
Les moteurs sont également amenés à ajuster en permanence leurs algorithmes afin de contrer le spamdexing,
c’est -à-dire les techniques peu scrupuleuses de spam utilisées par certains webmasters pour tromper les moteurs
de recherche et améliorer artificiell ement le positionnement d’une page. Parmi ces techniques, nous pouvons citer :
- le fait de multiplier les mots-clés dans les balises meta des pages HTML, qui a certainement amené les moteurs à
ne plus prendre en compte ce champ ;
- le fait d’intégrer un texte invisible sur une page (en blanc sur fond blanc, par exemple ;
- la création de sites miroirs ou de liens fictifs ou invisibles pointant vers une page (ce qui permet de détourner
l’indice de popularité) ;
- les pages satellites ; la mise en place de faux portails contenant en fait des liens commerciaux ; la création de faux
communiqués de presse…
B. Les objectifs d’un bon positionnement
Objectif n° 1 :
apparaître dans les trois premières pages de résultats des
outils de recherche, soit entre la première et la trentième
position. Être classé après la 30e position sur un mot-clé
donné équivaut à un trafic quasi nul.
62 % des utilisateurs de moteurs de
recherche cliquent sur un résultat
proposé sur la première page de
leur moteur favori sans aller plus
loin, et ils sont 90 % à ne jamais
Objectif n° 2 :
Objectif n° 3 :
3 Liens
commerciaux
en position
« premium »
3 Liens
naturels
Ligne de
flottaison
apparaître uniquement dans les dix premiers liens
affichés, soit dans la première page de résultats.
dépasser la troisième page de
résultats.
être « au-dessus de la ligne de flottaison » (above the
Source : iProspect – Search Engine
fold en anglais). Cela signifie que votre lien sera visible
User Behavior Study (avril 2006).
dans la fenêtre du navigateur de l’internaute sans que
celui-ci ait à utiliser l’ascenseur. Par exemple, en résolution 1 024 × 768 (la plus courante à
l’heure actuelle), une page de résultats de Google pour les mots-clés « agence immobilière »
apparaît comme sur la figure suivante.
DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected]
Objectif n° 4 : tenter de se positionner encore mieux en plaçant un site dans le « triangle d’or » des pages de résultats.
Selon une étude menée par les sociétés Enquiro et Dit-It.com
en collaboration avec la société EyeTool2, l’œil de l’internaute
explore en priorité un « triangle d’or », situé en haut à gauche
des pages de résultats de Google.
Ainsi, il est possible d’indiquer un taux de visibilité pour
chaque rang des liens proposés par le moteur :
· positions 1, 2 et 3 : 100 %
· position 5 : 60 %
· positions 8 et 9 : 30 %
· position 4 : 85 %
· positions 6 et 7 : 50 %
· position 10 : 20 %.
La difficulté pour obtenir un bon positionnement sera
proportionnelle au caractère concurrentiel des mots-clés
représentant le site.
Sur des mots-clés non concurrentiels, une bonne optimisation
des pages (bien étudier leur titre, leur texte, leurs liens, leur
URL => optimisation « à la source » du code HTML) peut
suffire pour obtenir un positionnement parmi les premiers
liens naturels proposés par un moteur de recherche.
Sur des mots-clés concurrentiels, il faudra, en plus d’une
bonne optimisation des pages, l’obtention de backlinks, c’est à
dire la présence de liens vers nos pages sur des sites web tiers.
Le triangle d’or de la page de résultats de Google : plus le
rouge est vif, plus la zone est lue instinctivement par l’œil
des internautes (le trait horizontal épais représente la ligne
de flottaison).
L’étude est consultable à :
http://www.prweb.com/releases/2005/3/prweb213516.htm
Conclusion
Il convient de distinguer deux types essentiels de publicité en ligne : la publicité
« display », qui consiste à afficher des messages sur des espaces
publicitaires (ex. bannières) et la publicité « search », qui propose des
liens vers les sites web.
La publicité « search » implique un travail de référencement,
visant à optimiser la visibilité du site web.
Référencement
commercial
(SEM)
Référencement
naturel (SEO)
Dans le cadre de ce chapitre, nous avons abordé les principes du
référencement naturel (SEO), qui conduit à l’optimisation du site
afin qu’il soit indexé au mieux par les moteurs de recherche.
Le chapitre suivant montrera qu’il existe d’autres axes de
référencement :
- le référencement payant (SEM3), qui désigne l’optimisation de la
visibilité d’un site web au travers d’une campagne de liens sponsorisés
sur un moteur de recherche ;
- le référencement vers les médias sociaux (SMO4), visant à assurer la visibilité
d’un site web sur les réseaux sociaux.
2
Société spécialisée dans les systèmes d’eye-tracking (analyse des mouvements de l’oeil).
SEM : Search Engine Marketing
4
SMO : Social Media Optimization
3
Référencement sur
les réseaux sociaux
(SMO)