DUT GEA. – Informatique – D`après le document de Laurent GILI

Transcription

DUT GEA. – Informatique – D`après le document de Laurent GILI
DUT GEA. – Informatique – D’après le document de Laurent GILI / Lycée Prévert
« Google n’est un moteur de recherche,
c’est un système de gestion de la
réputation »
Leslie Gaines-Ross
Auteure de « Corporate Reputation »
LE REFERENCEMENT NATUREL D’UN SITE WEB1
Introduction au concept de « référencement »
« Tentons une explication de ce mot au travers d’une analogie avec la grande distribution : lorsque vous allez faire vos course s dans un
supermarché, vous vous promenez dans les rayons et y voyez un certain nombre de produits. On dit d’ailleurs, dans le ja rgon commercial, que ces
produits sont « référencés » auprès de la grande surface. En d’autres termes, ils sont « trouvables ». Cependant, ils sont placés parmi des
centaines, des milliers d’autres, tous rangés au départ de la même façon dans de nombreu x rayons. Pour mettre en évidence certains d’entre eux,
les responsables commerciaux des supermarchés ont alors eu l’idée de les placer au niveau des yeux du consommateur – ou en « tête de gondole
», ou encore au niveau des caisses de paiement –, ce qui les rend plus visibles. Certains produits sont alors mis en avant à des endroits
stratégiques, beaucoup plus facilement « trouvables » par les clients potentiels. Ils sont ainsi bien « positionnés »… Vous voyez où nous voulons en
venir ?
Pour ce qui est du référencement de votre site web, il en sera de même : lorsque votre site sera « présent » dans les bases de données d’un
moteur, on dira qu’il est « référencé ».
C’est une première étape, nécessaire mais pas suffisante, dans le processus de gain de visibilité de votre source d’information.
Disons qu’il est « prêt à être vu »…
*…+ Une phase toute aussi importante sera *…+, dans un deuxième temps, de mettre en « tête de gondole » votre site en le positionnant au mieux
dans les résultats de recherche pour les mots-clés les plus importants pour votre activité.
Enfin, il faudra une troisième étape, malheureusement souvent négligée, pour vérifier in fine que le positionnement a porté ses fruits en évaluant
le trafic généré par vos efforts d’optimisation. Croyez-vous que les responsables de supermarchés ne vérifient pas si leurs produits se vendent
mieux ou non en fonction de leur emplacement ? En effet, ce n’est pas parce qu’un produit est pl acé en tête de gondole qu’il est obligatoirement
plus vendu. Tout dépend de l’endroit où se trouve la gondole et du nombre, voire du type, de personnes qui passent devant. En d’autres termes, il
ne servira à rien d’être bien positionné sur des mots -clés que personne ne
saisit ou sur des moteurs que personne n’utilise… »
ème
Olivier Andrieu, Réussir son référencement web, 2
édition, Ed. Eyrolles.
Pour résumer !
Un processus de référencement s’effectue en 4 phases essentielles :
1. Référencement :
votre site doit être « trouvable » (« en rayon ») dans l’index du moteur, de la façon la plus complète possible.
2. Identification :
une ou plusieurs des pages de votre site doivent se trouver « dans le lot » des pages identifiées car contenant
les mots-clés constituant la requête de l’internaute.
3. Positionnement :
vos pages doivent être optimisées en fonction des critères de pertinence des moteurs afin d’être
c
dans les pages de résultats pour vos mots-clés choisis au préalable.
l
4. Contrôle et suivi des résultats.
a
s
s
é
e
s
a
u
m
i
e
u
x
DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected]
I/ Distinguer liens naturels et liens sponsorisés
Voici un extrait de la page affichée par Yahoo suite à la saisie de la requête : «agence immobilière ».
Zones A
Zones B
Zones A :
Les zones A sont occupées par des liens sponsorisés, ou liens commerciaux, baptisés AdWords chez Google et
qui sont des zones publicitaires payées par des annonceurs selon un système de paiement au clic. On parle ici
de référencement payant, ou référencement SEM (Search Engine Marketing).
Zone B :
La zone B représente, elle, ce que l’on appelle les liens organiques ou naturels, qui sont fournis par
l’algorithme mathématique de pertinence du moteur de recherche. Ils n’ont rien à voir avec la publicité
affichée dans les zones ci-dessus. On parle ici de référencement naturel, ou référencement SEO (Search
Engine Optimization).
Définition :
Liens « organiques » ou « naturels »
On appelle liens « organiques » ou « naturels » (car aucun processus publicitaire n’intervient dans leur
classement), les résultats affichés par le moteur de recherche en dehors de toute publicité ou
promotion pour les services de l’outil de recherche.
A retenir !
1) Le référencement naturel est indépendant des liens sponsorisés
Il est important de bien comprendre que les deux sources principales d’information dans les pages de
résultats des moteurs (liens sponsorisés et liens organiques) sont indépendantes les unes des autres.
Être un gros annonceur sur Google ou Yahoo! n’influe donc en rien de façon directe le positionnement
de votre site web dans les liens organiques du moteur en question. Heureusement d’ailleurs, car la seule
façon d’être pérenne pour un moteur de recherche est de présenter des résultats objectifs et
indépendants des budgets publicitaires…
2) Une stratégie de référencement dit « naturel » ou « traditionnel » aura donc pour vocation de
positionner une ou plusieurs page(s) de votre site web dans les meilleurs résultats des liens
organiques lorsque les mots-clés importants pour votre activité sont saisis par les internautes.
DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected]
II/ Préparer le référencement
A. Les trois étapes à respecter lors d’un référencement sur un moteur de recherche
L’affichage des résultats par un moteur se décompose en trois étapes :
1. -Extraction, depuis son index, des pages répondant aux mots de la requête tapée par l’utilisateur.
2. Classement des résultats par pertinence.
3. Affichage.
.
B. Les premiers pas en pratique
1. Méthodologie générale
http://methodologies.abondance.com/referencement.html
http://www.rankspirit.com/referencement.php
http://www.siteduzero.com/tutoriel-3-13666-apprenez-a-creer-votre-site-web.html
2. Le choix des mots-clés
Les mots-clés que vous allez choisir sont extrêmement importants et doivent répondre à deux notions essentielles :
· L’intérêt :
ils doivent être souvent (le plus possible) tapés par les utilisateurs des moteurs de recherche.
· La faisabilité : il doit être techniquement possible de positionner une page web dans les premiers résultats
des moteurs pour ce terme dans des délais acceptables.
Bien sûr, les termes choisis doivent décrire votre activité et le contenu de votre site web, cela
va sans dire…
Outils !
Pour trouver des mots-clés avec AdWords, de Google : AdWords
Pour trouver les mots-clés qui sont « tendances » (par zone géographique) :
http://www.google.com/insights/search/
3. Les zones chaudes à examiner
Zone chaude 1 :
balise <title>
Zone chaude 2 :
texte visible
Zone chaude 3 :
adresse (URL)
des pages
Zone chaude 4 :
balises meta
Zone chaude 5 :
attributs alt et
title
Voici quelques conseils techniques tirés du site rankspirit.com (http://www.rankspirit.com/realisation-site-web.php) :
Syntaxe irréprochable Un code incorrect peut causer des problèmes d'affichage ou de ralentissement de chargement. Il
peut aussi empêcher l'indexation de tout ou partie de votre site. De nombreux systèmes de
vérification de code sont disponibles en ligne, utilisez-les.
Liens en javascript ou en Ils sont visibles et utilisables par les visiteurs mais ne sont pas interprétés par les moteurs.
Flash Certaines pages risquent donc d'être purement et simplement inaccessibles aux moteurs. Une
solution simple consiste à réaliser une page "plan de site" qui comporte des liens HTML vers
TOUTES les pages de votre site. Un lien HTML de la page d'index vers cette page "plan de site"
permettra aux moteurs d'explorer et d'indexer l'intégralité de votre site.
Si votre site comporte peu de texte et beaucoup d'images, il est impératif de compléter
Balises "Alt"
les balises "Alt" de toutes vos images pour avoir une chance de figurer dans les résultats des
moteurs de recherche. Le fait de compléter ces balises vous permettra dans tous les cas de gagner de la pertinence.
DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected]
Titres de pages et les Ces zones ne jouent pas un rôle important pour l'indexation des pages. Elles jouent pourtant un
descriptifs (balises <Title> rôle capital dans vos résultats de fréquentation. Les moteurs utilisent en effet souvent le contenu
et <Description> de ces balises pour présenter un "résumé" de vos pages aux internautes. La balise "description"
est également utilisée par certains annuaires. Il est donc impératif d'individualiser ces balises et
d'y loger un texte clair et attractif pour chaque page.
Sources Faites des liens vers les pages dont vous vous êtes inspiré. C'est la moindre des politesses et c'est
un moyen de gagner de la pertinence vis-à-vis des moteurs de recherche.
Pages dynamiques Les pages générées par les langages évolués tels que le PHP ou l'ASP ont parfois des URLs
(adresses) trop complexes pour être reconnues par les moteurs de recherche. Il est alors
indispensable de pratiquer l'"URL Rewriting" pour simplifier ces adresses aux yeux des moteurs.
Les URLs "nettoyées" de cette façon doivent figurer dans votre plan de site ou sur une autre page.
Structure du site Faites en sorte que n'importe quelle page de votre site soit accessible en 3 clics maximum depuis
la page d'accueil.
Noms de fichier Donnez à vos fichiers image et à vos pages des titres explicites et évocateurs. Si vous utilisez des
noms composés, séparez les mots par des tirets. Exemple : axel-red-en-vacances.htm
Frames Elles peuvent compliquer l'indexation de certaines pages. Le plan de site vous permettra, une fois
encore, d'être certain de voir toutes vos pages indexées. L'utilisation des frames pose
malheureusement beaucoup d'autres problèmes et nous vous la déconseillons vivement.
4. Le référencement auprès des moteurs
4.1. Les méthodes de référencement
Il existe trois méthodes pour être référencé naturellement auprès des moteurs de recherche :
a) Le référencement automatique : réalisé par des sites ou des logiciels spécialisés. En général, cette méthode
est peu recommandable, sauf pour des webmasters expérimentés.
b) Le référencement manuel : il est simple à réaliser mais consomme un temps considérable si vous
ambitionnez d'obtenir un nombre important de liens par ce moyen.
c) Le référencement payant : des professionnels s'occupent de faire ce travail pour vous. Cette solution, très
onéreuse, est toutefois intéressante pour un site commercial à condition de choisir son prestataire avec un
grand soin.
Outils !
Les outils de soumission automatique
Il existe plusieurs outils permettant de soumettre de façon automatique votre site à des centaines, voire parfois des
milliers, d’annuaires. En voici quatre, classés par ordre alphabétique :
· Linkomatic – http://www.linkomatic.org/
· SubmitWolf – http://www.trellian.fr/swolf/
· Website Submitter – http://www.submitsuite.com/products/website-submitter.htm
· Yooda Submit – http://www.yooda.com/outils_referencement/submit_center_yooda/
Ces outils sont plutôt à éviter, les moteurs ne les appréciant que de façon très modérée…
Les outils de soumission manuelle
· Google – http://www.google.fr/addurl/?hl=fr&continue=/addurl
· Yahoo! (nécessite un compte Yahoo!) – http://siteexplorer.search.yahoo.com/submit
· Bing – http://www.bing.com/docs/submit.aspx?FORM=WSDD2
· Exalead – http://www.exalead.fr/search/web/submit/
DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected]
4.2. Le choix des moteurs
Baromètre
moteurs
USA
Juin
2011
(source : http://barometre.secrets2moteurs.com/)
Baromètre France - Juin 2011
(source : http://barometre.secrets2moteurs.com/)
ComScore - Part entités Mai 2011 / Juin 2011
Entité de recherche
Mai 2011
Juin 2011
1 - Google
63.3%
64.5%
2 - Yahoo!
19.6%
17.5%
3 - Microsoft
13.1%
14.1%
4 - Ask Network
2.6%
2.6%
5 - AOL LLC Network
1.3%
1.3%
5. Le diagnostic et le suivi du référencement
Outils !
http://www.outiref.com/ ; http://www.soumission-manuelle.com/fr/ ; outils pour webmaster Google
DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected]
III/ Travailler le positionnement
A. Comprendre le système de ranking
Le ranking est un processus qui consiste pour le moteur à classer automatiquement les données de l’index de façon
à ce que, suite à une interrogation, les pages les plus pertinentes apparaissent en premier dans la liste de résultats.
Le but du classement est d’afficher dans les 10 premières réponses les documents répondant le mieux à la question.
Pour cela, les moteurs élaborent en permanence de nouveaux algorithmes (des formules mathématiques utilisées
pour classer les documents). Ces algorithmes sont un véritable facteur différenciant. Ils ne sont donc que très
rarement rendus publics.
Il existe plusieurs grandes méthodes de ranking des résultats et les moteurs utilisent pour la plupart un mélange de
ces différentes techniques. On citera, en particulier :
· Le tri par pertinence
Les résultats d’une requête sont triés en fonction de six principaux facteurs appliqués aux termes de la question :
– localisation d’un mot dans le document (exemple : le poids est maximal si le mot apparaît dans le titre ou au début
du texte) ou son adresse (URL) ;
– densité d’un mot, calculée en fonction de la fréquence d’occurrences du mot par rapport au nombre total de mots
dans le document ;
– mise en exergue d’un mot : gras (balise <STRONG>), titre éditorial (balise <Hn>), lien, etc. ;
– poids d’un mot dans la base de données calculé en fonction de sa fréquence d’occurrences dans l’index (les mots
peu fréquents sont alors favorisés) ;
– correspondance d’expression basée sur la similarité entre l’expression de la question et l’expression
correspondante dans un document (un document est privilégié lorsqu’il contient une expression similaire à celle de
la question, notamment pour des requêtes à plusieurs mots-clés) ;
– relation de proximité entre les termes de la question et les termes utilisés dans le document (les termes proches
l’un de l’autre sont favorisés).
Le tri par popularité (indice de popularité)
Popularisé – mais pas inventé – par Google en 1998 (pour contrer entre autres les abus possibles des méthodes de
tri par pertinence) avec son PageRank, le tri par popularité s’appuie sur une méthode basée sur la « citation » –
l’analyse de l’interconnexion des pages web par l’intermédiaire des liens hypertextes – et il est a priori indépendant
du contenu. Ainsi, Google classe les documents notamment en fonction de leur PageRank (nombre et qualité des
liens pointant vers ces documents). Le moteur analyse alors les pages contenant les liens : ceux émanant de pages
issues de sites considérés comme importants « pèsent plus lourd » que ceux de pages de certains forums ou de
pages perso jugées secondaires, par exemple. Plus une page est pointée par des liens émanant de pages populaires,
plus sa popularité est grande et meilleur est son classement. Cette méthode de tri des résultats est aujourd’hui
utilisée par de nombreux moteurs (pour ne pas dire tous les principaux moteurs).
La question du PageRank (ou tri par popularité) de Google
« Comme l'explique Larry Page,notre but est de vous fournir "exactement ce que vous souhaitez". À l'époque
de la création de Google, l'une de nos innovations phares était la technologie PageRank. Celle-ci
permettait d'évaluer l'"importance" d'une page Web, notamment en fonction du nombre de liens pointant vers elle.
Aujourd'hui, nous nous appuyons sur plus de 200 signaux, dont PageRank, pour classer les sites Web, et nous
mettons à jour leurs algorithmes chaque semaine. Par exemple, nous pouvons proposer des
résultats
de
recherche personnalisés en fonction de votre historique Web ou de votre situation géographique. »
· Le tri par mesure d’audience (indice de clic)
Créée par la société DirectHit en 1998, cette méthode permet de trier les pages en fonction du nombre et de la «
qualité » des visites qu’elles reçoivent. Cette méthode semble être utilisée encore aujourd’hui par certains moteurs
dont Google.
A noter
Les moteurs sont également amenés à ajuster en permanence leurs algorithmes afin de contrer le spamdexing,
c’est -à-dire les techniques peu scrupuleuses de spam utilisées par certains webmasters pour tromper les moteurs
de recherche et améliorer artificiell ement le positionnement d’une page. Parmi ces techniques, nous pouvons citer
:
- le fait de multiplier les mots-clés dans les balises meta des pages HTML, qui a certainement amené les moteurs à
ne plus prendre en compte ce champ ;
- le fait d’intégrer un texte invisible sur une page (en blanc sur fond blanc, par exemple ;
- la création de sites miroirs ou de liens fictifs ou invisibles pointant vers une page (ce qui permet de détourner
l’indice de popularité) ;
- les pages satellites ; la mise en place de faux portails contenant en fait des liens commerciaux ; la création de faux
communiqués de presse…
B. Les objectifs d’un bon positionnement
Objectif n° 1 :
apparaître dans les trois premières pages de résultats des
outils de recherche, soit entre la première et la trentième
position. Être classé après la 30e position sur un mot-clé
donné équivaut à un trafic quasi nul.
62 % des utilisateurs de moteurs de
recherche cliquent sur un résultat
proposé sur la première page de
leur moteur favori sans aller plus
loin, et ils sont 90 % à ne jamais
Objectif n° 2 :
Objectif n° 3 :
apparaître uniquement dans les dix premiers liens
affichés, soit dans la première page de résultats.
dépasser la troisième page de
résultats.
être « au-dessus de la ligne de flottaison » (above the
Source : iProspect – Search Engine
fold en anglais). Cela signifie que votre lien sera visible
User Behavior Study (avril 2006).
dans la fenêtre du navigateur de l’internaute sans que
celui-ci ait à utiliser l’ascenseur. Par exemple, en résolution 1 024 × 768 (la plus courante à
l’heure actuelle), une page de résultats de Google pour les mots-clés « agence immobilière »
apparaît comme sur la figure suivante.
DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected]
Objectif n° 4 : tenter de se positionner encore mieux en plaçant un site dans le « triangle d’or » des pages de résultats.
Selon une étude menée par les sociétés Enquiro et Dit-It.com
en collaboration avec la société EyeTool2, l’œil de l’internaute
explore en priorité un « triangle d’or », situé en haut à gauche
des pages de résultats de Google.
Ainsi, il est possible d’indiquer un taux de visibilité pour
chaque rang des liens proposés par le moteur :
· positions 1, 2 et 3 : 100 %
· position 5 : 60 %
· positions 8 et 9 : 30 %
· position 4 : 85 %
· positions 6 et 7 : 50 %
· position 10 : 20 %.
La difficulté pour obtenir un bon positionnement sera
proportionnelle au caractère concurrentiel des mots-clés
représentant le site.
Sur des mots-clés non concurrentiels, une bonne optimisation
des pages (bien étudier leur titre, leur texte, leurs liens, leur
URL => optimisation « à la source » du code HTML) peut
suffire pour obtenir un positionnement parmi les premiers
liens naturels proposés par un moteur de recherche.
Sur des mots-clés concurrentiels, il faudra, en plus d’une
bonne optimisation des pages, l’obtention de backlinks, c’est à
dire la présence de liens vers nos pages sur des sites web tiers.
Le triangle d’or de la page de résultats de Google : plus le
rouge est vif, plus la zone est lue instinctivement par l’œil
des internautes (le trait horizontal épais représente la ligne
de flottaison).
L’étude est consultable à :
http://www.prweb.com/releases/2005/3/prweb213516.htm
Conclusion
Il convient de distinguer deux types essentiels de publicité en ligne : la publicité
« display », qui consiste à afficher des messages sur des espaces
publicitaires (ex. bannières) et la publicité « search », qui propose des
liens vers les sites web.
La publicité « search » implique un travail de référencement,
visant à optimiser la visibilité du site web.
Référencement
commercial
(SEM)
Référencement
naturel (SEO)
Dans le cadre de ce chapitre, nous avons abordé les principes du
référencement naturel (SEO), qui conduit à l’optimisation du site
afin qu’il soit indexé au mieux par les moteurs de recherche.
Le chapitre suivant montrera qu’il existe d’autres axes de
référencement :
- le référencement payant (SEM3), qui désigne l’optimisation de la
visibilité d’un site web au travers d’une campagne de liens sponsorisés
sur un moteur de recherche ;
- le référencement vers les médias sociaux (SMO4), visant à assurer la visibilité
d’un site web sur les réseaux sociaux.
2
Société spécialisée dans les systèmes d’eye-tracking (analyse des mouvements de l’oeil).
SEM : Search Engine Marketing
4
SMO : Social Media Optimization
3
Référencement sur
les réseaux sociaux
(SMO)