Travail de bachelor

Transcription

Travail de bachelor
SEO
L'aventure des développeurs/référenceurs web
et le prochain défi stratégique des entreprises
Travail de diplôme réalisé en vue de l’obtention du diplôme HES
par :
Nicolas MESSER
Conseiller au travail de diplôme :
Alexandre BODER, Chargé d'enseignement HES
Carouge, 9 juillet 2010
Haute École de Gestion de Genève (HEG-GE)
Filière Informatique de Gestion
Déclaration
Ce travail de diplôme est réalisé dans le cadre de l’examen final de la Haute école de
gestion de Genève (HEG), en vue de l’obtention du titre d'informaticien de gestion.
L’étudiant accepte, le cas échéant, la clause de confidentialité. L'utilisation des
conclusions et recommandations formulées dans le travail de diplôme, sans préjuger
de leur valeur, n'engage ni la responsabilité de l'auteur, ni celle du conseiller au travail
de diplôme, du juré et de la HEG.
« J’atteste avoir réalisé seul le présent travail, sans avoir utilisé des sources autres que
celles citées dans la bibliographie. »
Fait à Genève, le 9 juillet 2010
Nicolas MESSER
Remerciements
Je tiens à remercier particulièrement Alexandre Boder, pour son accompagnement et
ses conseils toujours judicieux.
J'aimerais également remercier les trois spécialistes du référencement qui ont répondu
à mon questionnaire. Ce sont Scott Smith, a.k.a Caveman, consultant indépendant
(www.thecaveman.org), Dejan Petrovic, directeur de Dejan SEO (www.dejan.com.au)
et
David
Degrelle
a.k.a
DavidD,
fondateur
et
président
1ère
Position
SA
(http://www.1ere-position.fr).
Je tiens également à remercier les deux responsables des sites web qui se sont mises
à dispositions pour des interviews. Ce sont Véronique Murbach, conceptrice web de la
HEG Genève et Nicolas Pittet, responsable de l'équipe web de l'EIA-FR.
Et à ne pas oublier, je remercie toutes les autres personnes qui m’ont apporté leur aide
et leur soutien tout au long de la rédaction de ce mémoire.
Search Engine Optmization
Nicolas MESSER
2/102
Sommaire
Ce mémoire est le fruit de la réalisation de mon travail de diplôme, effectué dans le
cadre de ma formation à la Haute Ecole de Gestion (HEG) de Genève. Ce travail
finalise ma formation en vue de l’obtention du diplôme de Bachelor en Informatique de
Gestion.
Tout au long de la réalisation de ce mémoire, j’ai été suivi et conseillé par M. Alexandre
Boder, Chargé d’enseignement HES à la HEG.
SEO* est l’acronyme anglais pour "Search Engine Optimization", connu comme
référencement ou optimisation pour les moteurs de recherche en français. L'objectif de
ce procédé est d'orienter le positionnement d'une page web dans les pages de
résultats (SERPs*) des différents moteurs de recherche.
L’optimisation des pages web pour les moteurs de recherche représente donc un
véritable enjeu car il permet d'augmenter de façon significative le nombre de visiteurs
du site d’une entreprise et par ce fait le nombre de clients potentiels atteignable.
L'objectif poursuivi par ce mémoire est premièrement, de passer en revue l'histoire et
le fonctionnement des moteurs de recherche qui sont pour une grande partie
responsable du fait qu'aujourd'hui le SEO fait partie du projet de création d'un site web.
Pour cela, je présenterai dans la première partie un bref aperçu de l'histoire des
moteurs de recherche ainsi que les bases du fonctionnement des moteurs de
recherche et l'utilisation des internautes.
Deuxièmement, le mémoire aura pour objectif de présenter les différentes techniques
et bonnes pratiques du référencement naturel*, de les décrire et de les évaluer par
rapport à leur difficulté d'implémentation et leur efficacité. Pour mieux illustrer ces
concepts, je réaliserai une analyse du site de la HEG et je proposerai des
changements ou des améliorations dans le cas échéant à partir des mes propres
expériences de création et optimisation des pages web.
Dans la troisième partie de ce mémoire je présenterai deux outils gratuits à disposition
pour les référenceurs. Ces outils devront permettre d'évaluer les efforts d'optimisation
et dans le meilleur des cas de connaître le retour sur l'investissement (ROI*). Comme
dans la deuxième partie, je proposerais des exemples à partir de notre cas d'étude
avec le site de la HEG.
Search Engine Optmization
Nicolas MESSER
3/102
De plus une réflexion sur les technologies issues du Web 2.0 et de son influence sur la
façon d'orienter le référencement pour capter une communauté spécifique d'usagers
sera réalisée dans la quatrième partie. La HEG devra avoir un intérêt particulier de
conforter sa présence auprès "d'une clientèle" jeune particulièrement friande de ces
technologies. Nous allons donc découvrir le monde des médias sociaux en faisant
l'état des services exploite par la HEG.
Et finalement, j'essayerai de faire quelques projections pour l'avenir du référencement
dans la dernière partie de ce mémoire. Quelles sont les technologies les plus
prometteuses à venir et connaître et quelle sera l'influence du monde mobile sur le
référencement.
Pourtant, il ne sera pas possible de couvrir tous les aspects du référencement dans le
cadre de ce mémoire. Le sujet est beaucoup plus complexe que ces quelques pages
qui ne pourront être autre chose qu'un bon point de départ pour qui aimerait s’initier au
référencement.
Search Engine Optmization
Nicolas MESSER
4/102
Table des matières
Déclaration......................................................................................................... 1 Remerciements.................................................................................................. 2 Sommaire ........................................................................................................... 3 Table des matières ............................................................................................ 5 Liste des Figures............................................................................................... 7 Guide de lecture ................................................................................................ 8 A propos de l'auteur et ses motivations ....................................................... 10 Introduction ..................................................................................................... 11 Partie 1 : Introduction sur les moteurs de recherche .................................. 14 Chapitre 1: Bref aperçu de l'histoire des moteurs de recherche.................... 14 Chapitre 2: Le fonctionnement des moteurs de recherche ............................ 16 Chapitre 3 : Comment les moteurs de recherche sont utilisés par les
internautes................................................................................................ 21 Conclusion (partie 1) .................................................................................. 23 Partie 2 : Le cas d'étude HEG......................................................................... 25 Comment développer un site accueillant le SEO? ..................................... 25 Chapitre 1 : Considérations avant le projet...................................................... 26 Analyse des mots-clés ............................................................................... 26 La longue traîne ......................................................................................... 28 Analyse mots-clés de la HEG .................................................................... 29 Choix du nom de domaine ......................................................................... 31 Chapitre 2 : Applications des Best Practices................................................... 33 La balise <title> .......................................................................................... 34 La balise Meta <description> ..................................................................... 35 Propositions d'amélioration des balises <title> et <description>................ 36 Les balises d'en-tête .................................................................................. 37 Propositions d'amélioration de la balise <h1>............................................ 39 L'optimisation des liens .............................................................................. 39 L'optimisation des images .......................................................................... 42 Le plan du site ............................................................................................ 42 Arborescence d'un site............................................................................... 44 Utilisation du fichier robots.txt .................................................................... 44 La structure des URL ................................................................................. 46 Proposition d'amélioration de la structure URL .......................................... 47 Faciliter la navigation.................................................................................. 47 Respect des standards W3C ..................................................................... 47 Proposition d'autres améliorations ............................................................. 48 Chapitre 3 : "Black hat" – les stratégies à éviter ............................................. 49 Conclusion (partie 2) .................................................................................. 51 Search Engine Optmization
Nicolas MESSER
5/102
Partie 3 : Le suivi et l'évaluation des résultats............................................. 54 Chapitre 1 : Comment suivre les stratégies mises en place........................... 55 Circulation par moteurs de recherche. ....................................................... 59 La circulation par mot-clé ........................................................................... 60 Chapitre 2 : ROI dans l'optimisation pour les moteurs de recherche............ 61 Indicateur : nombre de visiteurs ................................................................. 61 Indicateur : nombre de vues par pages...................................................... 61 Exemple calcul rendement pour la HEG .................................................... 61 Chapitre 3 : Evaluer à quelle fin ? ..................................................................... 62 Conclusion (partie 3) .................................................................................. 63 Partie 4 : L'influence des médias sociaux .................................................... 64 Chapitre 1 : Aperçu des médias sociaux populaires....................................... 66 Facebook.................................................................................................... 66 Twitter ........................................................................................................ 66 LinkedIn...................................................................................................... 67 Wikipedia.................................................................................................... 68 Autres services sociaux.............................................................................. 68 Chapitre 2 : Quel gain apporté par les médias sociaux? ................................ 68 Conclusion (partie 4) .................................................................................. 69 Partie 5 : Le future de l'optimisation ............................................................. 71 Chapitre 1 : La recherche universelle ............................................................... 71 Chapitre 2 : Nouvelles technologies à venir et connaître ............................... 73 SearchWiki – la recherche personnalisée .................................................. 73 L'interprétation du Flash............................................................................. 74 OCR – La reconnaissance optique de caractères ..................................... 74 Les microformats........................................................................................ 74 Chapitre 3 : Le monde mobile............................................................................ 76 Conclusion (partie 5) .................................................................................. 78 Conclusion....................................................................................................... 79 Bilan personnel ............................................................................................... 81 Bibliographie ................................................................................................... 82 Glossaire .......................................................................................................... 86 Annexes ........................................................................................................... 90 Search Engine Optmization
Nicolas MESSER
6/102
Liste des Figures
Figure 0-1. Pyramide du référencement par Rand Fishkin de SEOmoz ............. 8 Figure 1-1. Distribution des parts de marché des moteurs de recherche ......... 14 Figure 1-2. L'interface de Google en 1998 ........................................................ 15 Figure 1-3. L'interface de Google en 2010 ........................................................ 15 Figure 1-4. Présentation du concept du Page Rank ......................................... 16 Figure 1-5. Concept du fonctionnement des Spiders ........................................ 18 Figure 1-6. Cycle de vie d'une requête.............................................................. 19 Figure 1-7. Page de résultat de Google ............................................................ 20 Figure 1-8. Le triangle d'or de Google............................................................... 22 Figure 1-9. Nombre de mots-clés utilisés dans une requête en janvier 2010 ... 23 Figure 2-1. Outil de recherche mots-clés AdWords de Google......................... 27 Figure 2-2. Le principe du "Long Tail" ............................................................... 28 Figure 2-3. Site HEG avant 2010 ...................................................................... 33 Figure 2-4. Site HEG actuel .............................................................................. 34 Figure 2-5. Extrait du site de la HEG sur la page de résultat de Google .......... 36 Figure 2-6. Balise d'en-tête <h1> du site actuel de la HEG .............................. 38 Figure 2-7. Balise d'en-tête <h1> de l'ancien site de la HEG............................ 38 Figure 2-8. Abstraction du concept Link Building .............................................. 41 Figure 2-9. Application possible du link building pour le site de la HEG ........... 41 Figure 2-10. Extrait du code d'un sitemap exemple en format XML ................. 43 Figure 2-11. Plan du site HEG .......................................................................... 43 Figure 2-12. Principe du fichier robots.txt.......................................................... 45 Figure 2-13. Fichier robots simple du site Abondance ...................................... 45 Figure 2-14. Résultat de la validation W3C....................................................... 48 Figure 2-15. Représentation visuelle du Cloaking............................................. 50 Figure 2-16. Formulaire pour annoncer du spam à Google .............................. 53 Figure 3-1. Aperçu du Dashboard de GWT....................................................... 58 Figure 3-2. Informations sitemap de GWT ........................................................ 58 Figure 3-3. Erreurs d'indexation de GWT.......................................................... 58 Figure 3-4. Aperçu du Dashboard de Google Analytics .................................... 59 Figure 3-5. Aperçu de la circulation par moteurs de recherche ........................ 59 Figure 3-6. Aperçu de la circulation par mot-clé................................................ 60 Figure 4-1. Le principe du marketing viral ......................................................... 65 Figure 4-2. Site de la HEG sur Facebook ......................................................... 66 Figure 4-3. Réaction de la CFF sur Twitter ....................................................... 67 Figure 4-4. Profile de la HEG chez LinkedIn ..................................................... 67 Figure 4-5. Page Wikipedia de la HEG ............................................................. 68 Figure 4-6. Résultats Facebook et LinkedIn chez Google pour la HEG............ 69 Figure 5-1. Représentation visuelle du principe "Universal Search" ................. 72 Figure 5-2. Application du microformat hCard................................................... 75 Figure 5-3. Comparaison accès mobile entre les sites de la HEG et TPG ....... 77 Search Engine Optmization
Nicolas MESSER
7/102
Guide de lecture
Méthodologie
J'ai acquis la base pour ce mémoire par la lecture et l'étude des livres, des articles et
des sites web mentionnés dans la bibliographie. Par la suite, j'ai défini une première
structure du mémoire en essayant de suivre le plus prêt possible le concept de la
pyramide du référencement de Rand Fishkin de SEOmoz.
Figure 0-1. Pyramide du référencement par Rand Fishkin de SEOmoz
Le noyau dur de ce mémoire est la 2ème partie avec le cas d'étude où nous verrons des
exemples concrets des concepts de l'optimisation des pages web pour les moteurs de
recherche.
Par rapport à la pyramide du référencement, nous passerons le plus de temps à
construire le fondement représenté par les deux premiers niveaux et nous allons
seulement toucher un peu les possibilités plus avancées du troisième niveau.
Search Engine Optmization
Nicolas MESSER
8/102
Mais nous allons consacrer un peu plus de temps au quatrième niveau qui est un sujet
d'actualité et important dans le contexte du cas d'étude de ce mémoire.
Pour soutenir ou contredire mes affirmations et mes théories, j'ai questionné trois
experts du domaine et conduit des interviews avec des responsables des sites web
des Haute écoles de la Suisse occidentale.
Enfin, pour rester à jour avec les événements dans le monde du référencement, j'e me
suis abonné à deux Podcasts hebdomadaires, SEO 101 et SEO Rockstars, de
Webmaster Radio.
Voici encore quelques informations pour vous faciliter la lecture de ce mémoire pour
conclure ce petit guide de lecture.
Le glossaire
En fin de ce mémoire vous trouverez un glossaire complet des termes rencontrés lors
de votre lecture. Celui-ci reprend l’ensemble des abréviations, termes techniques et
spécifiques liés au sujet traité dans ce mémoire. Lors de votre lecture les mots signalés
par une astérisque (ex : mot*) sont systématiquement repris et explicités dans le
glossaire.
Utilisation des notes de bas de pages
Afin d’alléger le texte et d’en faciliter la lecture, il a été choisi d’insérer dans le texte des
notes de bas de page pour signaler, les sources des documents de références. Toutes
ces références figureront également dans la bibliographie.
Raccourcissement d'URL
Pour faciliter le suivi des liens référencés dans ce mémoire, le service Bit.ly a été
utilisé. Voici un exemple pour le lien du site de la HEG : http://bit.ly/heg-ge
Représentation codage HTML
Pour distinguer l'utilisation du code HTML, ces parties de textes ont un formatage
spécial. Voici un exemple avec la balise titre :
<title>Haute école de gestion de Genève - Bienvenue à la
HEG</title>
Search Engine Optmization
Nicolas MESSER
9/102
A propos de l'auteur et ses motivations
Etudier le sujet de l'optimisation pour les moteurs de recherche n'est pas une exigence
pour obtenir un diplôme en informatique (de gestion) ou devenir un développeur pour
le web.
A l'heure actuelle, il n'existe même pas de formation ou certification officielle à ce sujet
à part quelques exceptions qui ne sont pas reconnues officiellement dans l'industrie.
C'est tout d'abord l'initiative et le savoir technique de la personne qui désire devenir un
spécialiste dans le domaine qui sont le plus importants.
Dans ce contexte, je me permets de faire l'affirmation que les informaticiens de gestion
sont dans une situation de départ avantageuse pour faire de l'optimisation pour les
moteurs de recherche.
L'interdisciplinarité que demande ce travail extrêmement intéressant est le cœur des
études de l'informaticien de gestion. Il est confronté aux nouvelles technologies en
même temps qu'il apprend les bases du côté gestion d'entreprise et de marketing.
Il doit être capable de comprendre et répondre à des questions dans ces différents
domaines et d'appliquer les bonnes pratiques. En même temps, il doit être capable de
présenter ces principes à d’autres personnes, qu’ils soient des membres de l'équipe ou
des clients, dans la poursuite de la bonne conduite d'un projet.
Quelque chose que vous verrez par la suite de ce mémoire est un atout indispensable
dans le travail d'un référenceur. Car il ne doit pas toujours être facile d'expliquer les
méthodes employées et de justifier les honoraires pour un référenceur.
Par contre, il est certain que l'expertise dans le domaine de l'optimisation est un métier
du futur. Et encore une fois, je dirais que les informaticiens de gestion vont être parmi
ceux qui se trouvent dans une excellente position pour mettre les pieds sur ce marché
à l'épreuve du temps.
Ceci dit, je ne suis pas un des experts renommés du référencement et des moteurs de
recherche. Mais l'intérêt très fort à ce sujet était l'opportunité parfaite pour dédier mon
mémoire à ce sujet et mettre mes pieds dans ce monde attrayant.
"Organize the world's information and make it universally accessible and useful."
– Mission statement by Google
Search Engine Optmization
Nicolas MESSER
10/102
Introduction
L'optimisation pour les moteurs de recherche est en même temps une science et un
art. Une fois étudiées, les bases de l'optimisation peuvent apparaître comme du bon
sens pour quelqu'un de familier avec le développement web. Mais souvent les
concepts plus avancés ne sont pas si évidents et plutôt difficiles à comprendre et la
mise en œuvre peut même soulever des questions pour les spécialistes du domaine.
De plus, les moteurs de recherche ont une grande influence sur les résultats qu'on
peut obtenir avec les changements et améliorations apportés en permanence à leurs
algorithmes.
Google, le leader des moteurs de recherche, a publié une vidéo1 à ce sujet et on peut
estimer qu'en moyenne 350 à 400 changements ou améliorations sont apportés par
année. Donc, si vous effectuez une recherche chez Google pour "optimisation des
moteurs de recherche", "SEO" ou n'importe quelle autre terme similaire, vous allez
retrouver un grand nombre d'articles qui favorisent des stratégies dépassées et
inefficaces aujourd'hui.
Parce que les moteurs de recherche ont évolué de manière significative les dernières
années, la majorité de ces stratégies ne sont plus recommandées et d'autres même
considérées comme du spam. Et parce que le succès des moteurs de recherche
dépend considérablement de la pertinence de résultats de recherche, les essais de
manipuler ces résultats sont traités très sérieusement par les dernières.
L'accès "illimité" aux informations se trouvant sur Internet est la raison majeure pour
laquelle les moteurs de recherche deviennent de plus en plus un point d'entrée d'une
session d'Internet pour les internautes d'aujourd'hui.
Avec la possibilité de chercher et de consulter l'information sur un bien ou service à
n'importe quel moment, avoir un bon placement dans les pages de résultats devient
critique pour la survie des entreprises dans ce monde connecté.
Il n'est pas exagéré de dire que les entreprises font face à une concurrence sans
précédent pour le temps et l'argent des consommateurs en ligne.
1
Google Webmaster Help YouTube Channel. How many search algorithm changes were
made in 2009? http://bit.ly/google-changes (consulté le 15.05.2010)
Search Engine Optmization
Nicolas MESSER
11/102
Tout simplement avoir un site web ne suffit plus aujourd'hui. Pour apparaître dans les
meilleures positions des recherches effectuées par vos clients potentiels un site
optimisé à cet effet est indispensable. Comme avec tout grand projet, cela prendra du
temps pour la mise en place et la "maintenance" dans le futur.
Le grand plus de l'optimisation est que ce n'est pas forcement lié à un coût. Les
concepts de bases ne sont pas trop compliqués pour quelqu'un avec des
connaissances dans le domaine du développement web. Il se peut même que vous
disposé déjà d'une personne qui s'occupe de vos besoins en ce qui concerne votre
présence sur le web sans s'être occupée de l'optimisation à ce moment. Clairement, le
temps consacré à ce projet représente un coût, mais si vous n'avez pas besoin
d'engager un consultant externe, la plus-value à long terme sera supérieure à cet
investissement.
L'optimisation pour les moteurs de recherche n'est certainement pas de la physique
quantique, mais ceci peut être un sujet très détaillé et technique.
Tout au cours de ce mémoire, vous allez faire connaissance avec l'art de l'optimisation
pour les moteurs de recherche et apprendre comment implémenter de façon efficiente
et simple ces stratégies pour votre site web à l'exemple d'un cas d'étude.
Pourtant nous allons nous concentrer sur Google dans ce mémoire, vous aurez
certainement également de bons résultats avec les deux autres grands moteurs de
recherche, Yahoo et Bing (Microsoft), en suivant les recommandations de ce mémoire.
Si vous vous intéressez plus aux différences entre les différents moteurs de recherche,
2
je vous recommande de lire les deux articles par Rand Fishkin de SEOmoz qui a
réalisé une étude plus avancée entre Google et Bing.
Il est également important de préciser que nous allons nous occuper par l'optimisation
dans les résultats naturels, connus sous "organic search results", et non pas les
3
résultats payants . Même si certains concepts pourront également s'appliquer à ceuxlà, c'est un tout autre domaine que nous n'aurons pas le temps de traiter en détails.
2
SEOmoz.org, Rand Fishkin. Google vs. Bing: Correlation Analysis of Ranking Elements
http://bit.ly/goog-vs-bing (consulté le 04.07.2010)
SEOmoz.org, Rand Fishkin. Bing vs. Google: Prominence of Ranking Elements
http://bit.ly/goog-vs-bing-2 (consulté le 04.07.2010)
3
Pay per click. In : Wikipedia http://bit.ly/liens-sponsorises (consulté le 20.06.2010)
Search Engine Optmization
Nicolas MESSER
12/102
Une simple indication qu'une campagne complémentaire avec des liens sponsorisés*
pourrait surtout au début de vos efforts d'optimisation fournir des résultats plus rapide.
Centrer l'optimisation de son site web autour de Google, surtout pour les pays
occidentaux, a du sens avec une part de marché d'environs 65% des recherches
effectuées (voir Figure 1-1. Distribution des parts de marché des moteurs de
recherche).
Dans un dernier point, avant de conclure cette introduction, j'aimerais clarifier les
termes de référencement et optimisation. Généralement, lorsque votre site sera
présent dans les bases de données (indexes*) des moteurs de recherche, on dira qu'il
est référencé. L'optimisation est le processus d'augmenter la visibilité et d'améliorer le
positionnement de votre site dans les SERPs* (search engine results page) une fois
votre site a été indexé par les moteurs de recherche.
Tout au long de mes recherches, j'ai pu constater que surtout pour les francophones
ces termes sont souvent utilisés de manière "impropre" et mélangée mutuellement. Je
vous prie donc de m'excuser au cas où j'aurais fait de même dans les pages de ce
mémoire.
Search Engine Optmization
Nicolas MESSER
13/102
Partie 1 : Introduction sur les moteurs de recherche
Pour pouvoir mettre en place une bonne stratégie de référencement et d'implémenter
les concepts d'optimisation, il est important d'avoir une idée comment fonctionnent les
moteurs de recherche.
Chapitre 1: Bref aperçu de l'histoire des moteurs de recherche
Pendant la dernière décennie, nous avons tous pu assister à l'évolution d'un des plus
grands phénomènes de notre ère – l'Internet. A la source d'un projet pour le
département de la Défense (DoD) des Etats-Unis, l'Internet comme nous le
4
connaissons est né au CERN à Genève, il y a un peu plus de 20 ans.
L'accès public à Internet a fondamentalement changé la communication et le partage
d'informations en contournant les frontières existantes. Et avec une estimation
d'environs 8 milliards de pages indexées aujourd'hui, on peut comprendre la nécessité
d'un outil de recherche pour cet espace énorme.
Avec l'explosion de l'information accessible par l'Internet et la popularité des moteurs
de recherche pour retrouver ces informations, il est devenu important d'avoir une
bonne visibilité dans les SERP et la course autour de l'optimisation a commencé.
Pourtant il y a eu plusieurs petits projets au début de cette ère, le premier grand
moteur de recherche qui a pu s'établir a été AltaVista. Mais au cours des années, seul
3 moteurs de recherche ont réussi à résister au temps dans les pays occidentaux.
Figure 1-1. Distribution des parts de marché des moteurs de recherche5
4
CERN. Le berceau du Web. http://bit.ly/berceau-Web (consulté le 15.05.2010)
5
Net Applications. Search Engine Market Share. http://bit.ly/market-share (consulté le
22.06.2010)
Search Engine Optmization
Nicolas MESSER
14/102
Et depuis juillet 2009, ce paysage se résume à deux grands noms, Google et
Microsoft, ce dernier qui maintenant fait tourner le moteur de Yahoo avec ses propres
6
technologies.
Aujourd'hui, l'empire de Google dans ce domaine pour le monde occidental est
incontesté et commence à s'intégrer dans la vie des humains par une diversité de
services, différents du simple outil de recherche de départ.
Mais la constante du succès du moteur de recherche de Google semble être l'interface
pionnier du moteur qui n'a pas changé depuis son début.
Figure 1-2. L'interface de Google en 1998
Cette interface qui depuis le tout début se concentre sur un champ de saisie et un
bouton de recherche est la représentation de cette constante de succès. Et on
remarque également que déjà tout au début Google semble avoir apprécié le mot
BETA pour ces services.
Figure 1-3. L'interface de Google en 2010
6
Mashable. Yahoo-Microsoft Search Deal : The Key Facts http://bit.ly/yahoo-microsoft
(consulté le 19.06.2010)
Search Engine Optmization
Nicolas MESSER
15/102
Google n'a jamais essayé de devenir un portail comme ses concurrent Microsoft et
Yahoo. Et la comparaison des deux interfaces séparées de plus de 10 ans relève
seulement un aperçu plus moderne.
Chapitre 2: Le fonctionnement des moteurs de recherche
En résumé, le travail des moteurs de recherche est de roder les pages indexées et de
retourner seulement celles qui sont similaires au mot-clé saisi par l'internaute dans un
ordre trié d'importance.
L'importance de ce trie est pour la grande majorité déterminée par le nombre et la
pertinence des liens externes et internes qui pointent vers votre site. Dans ce même
concept, il y a un autre facteur qui intervient dans la détermination de l'importance d'un
lien, c'est celui de l'autorité.
Le concept d'utiliser les liens comme méthode pour mesurer l'importance d'un site a
été pour une première fois utilisée par Google dans la forme du fameux algorithme
PageRank* (PR). Pour vous aider à comprendre le principe de base de cet algorithme,
je vais essayer de le résumer le plus brièvement et simplement possible.
Figure 1-4. Présentation du concept du Page Rank7
7
Matt Cutts. Straight from Google: What you need to know http://bit.ly/page-rank (consulté le
29.05.2010)
Search Engine Optmization
Nicolas MESSER
16/102
Brièvement, ce concept dit que chaque lien est un vote pour le site vers lequel celui-ci
pointe, mais pas tous les liens ont un poids équivalent. Une page peut améliorer son
PR par l'accumulation de nouveaux liens de même qu'elle transmet une partie du sien
quand elle pointe un lien vers un autre site.
Google a changé et amélioré l'algorithme du PR des multiples fois dans le passé, mais
le concept de base évoqué précédemment est toujours applicable et utile à connaître
et comprendre.
L'impact des liens sur le positionnement dans les SERPs a plusieurs fois été démontré
dans le passé. L'exemple le plus fameux est sans doute celui de la page biographie de
l'ancien président des Etats-Unis, George Bush, connu sous le nom "misérable
8
failure" . Ce mot-clé a été utilisé par des milliers de personnes dans le texte d'ancrage
vers la page de biographie de la maison blanche et elle s'est par la suite positionnée
en tête pour ce mot-clé pendant très long temps.
Ce phénomène qui est aujourd'hui connu sous le nom de "Google Bombing*"9 a depuis
été essayé d'être reproduit par des spammers pour influencer le positionnement de
leurs sites. Pour éviter que ceci se répète Google semble avoir invente le TrustRank*
(TR) qui s'ajoute au PR dans l'évaluation et classement des résultats.
Néanmoins l'existence et l'application de ce concept par Google est contesté et peu de
détails sont connus sur le fonctionnement par rapport au PR. Sachez donc, si vous ne
faites rien de douteux, vous n'aurez pas à vous faire de soucis à ce sujet. Nous
n'allons donc pas consacrer plus de temps à ce concept.
8
BBC News. 'Miserable failure' links to Bush http://bit.ly/miserable-failure (consulté le
23.03.2010)
9
Search Engine Land. Google Kills Bush's Miserable Failure http://selnd.com/google-bomb
(consulté le 29.05.2010)
Search Engine Optmization
Nicolas MESSER
17/102
La grande question qui se pose est comment les moteurs de recherche obtiennent
toutes ces informations. C'est un processus complètement automatisé qui est effectué
par les "Spiders*", également appelés "Crawler" ou "Robots", des moteurs de
recherche. Chaque moteur dispose de spiders qui vont suivre les liens sur la toile et
faire ce travail d'indexation.
Figure 1-5. Concept du fonctionnement des Spiders
L'indexation d'un lien correspond au processus algorithmique d'analyse et de triage
dans l'index des moteurs de recherche par rapport aux facteurs d'influence du
positionnement.
Search Engine Optmization
Nicolas MESSER
18/102
Voici donc en image les détails du "cycle de vie" d'une requête d'après Google.
Figure 1-6. Cycle de vie d'une requête10
En résumé, on peut donc dire que l'affichage se décompose principalement en trois
étapes.
1. L'indexation et par la suite l'extraction des pages depuis l'index qui
répondent au(x) mot(s) clé(s) de la requête effectuée par l'internaute.
2. Le classement des résultats par pertinence.
3. Et finalement l'affichage.
Nous avons vu les bases pour les deux premiers points de notre liste et ce qui se
cache en dessous de l'interface utilisateur. Examinons maintenant le troisième point de
l'affichage.
10
Google. Informations sur la société : Technologie Google http://bit.ly/technologie-google
(consulté le 29.05.2010)
Search Engine Optmization
Nicolas MESSER
19/102
L'interface de Google qui a été mise à jour le 4 mai de cette année et propose
beaucoup de "nouveaux" fonctionnalité ressemblant très fort à celle de Bing, le
moteurs de Microsoft.
Figure 1-7. Page de résultat de Google
La zone 1 contient les liens sponsorisés ou liens commerciaux connus sous le nom
AdWords chez Google. Parfois ce type de liens est également affiché tout au début
des SERPs. Ce sont des zones publicitaires payées par des annonceurs selon un
système d'enchères avec paiement au clic appelé PPC (Pay Per Clic).
La zone 2 représente ce qu'on appelle les liens organiques ou naturels qui sont fournis
par l'algorithme du moteur de recherche qu'on vient d'étudier. Et c'est d'ailleurs
l'espace sur lequel porterait ce mémoire dans le but de vous aider à mieux positionner
vos pages.
La zone 3 est le phénomène récent appelé "Universal Search". Dans notre exemple,
on voit un extrait de Google Maps, mais avec une autre requête nous verrons peut-être
des images, vidéos ou autres types de résultats affichés. Vous pouvez lire plus sur ce
sujet dans le 1er chapitre de la 5ème partie de ce mémoire qui est dédié au futur de
l'optimisation.
Search Engine Optmization
Nicolas MESSER
20/102
Le changement apporté par Google le 4 mai 2010
11
est visible sur la partie gauche à
côté de la zone avec les résultats. Ceux-ci vous permettent de limiter vos recherches
sur un certain type de résultats comme les images sans devoir encore une fois
effectuer votre requête dans le moteur de recherche d'images de Google. Et beaucoup
d'autres fonctionnalités comme la possibilité de limiter les résultats affichés sur des
liens découverts dans les dernières 24 heures.
Chapitre 3 : Comment les moteurs de recherche sont utilisés
par les internautes
Comment procèdent les internautes? Existe-t-il un schéma qu'on a pu relever à la
majorité des recherches effectuées? Ceci était très clairement le cas dans le passé et
s'applique toujours pour une grande partie des recherches effectuées sur les moteurs.
Souvent l'internaute commence sa recherche avec un mot-clé global et petit à petit
ajoute des termes plus spécifiques pour cibler les résultats.
De comprendre le comportement des internautes n'est pas seulement un point très
important pour les moteurs de recherche qui investissent des ressources énormes
dans ce domaine pour améliorer leurs algorithmes et de servir des résultats plus précis
et plus rapides.
La facilité d'utilisation est quelque chose qui est souvent étudiée en relation avec des
interfaces graphiques de logiciels. Dans ces études l'application des outils "eyetracking" qui poursuit les mouvements des yeux de l'utilisateur génèrent des "heatmap" montrant les endroits les plus focalisés par l'utilisateur. L'entreprise Enquiro a
réalisé ce même genre d'étude en analysant les SERPs des différents moteurs de
recherche. Cette étude montre que les internautes donnent beaucoup plus d'attention
aux titres et mots-clés accentués dans les résultats naturels qui s'affichent en haut de
la page. En fait, les internautes scannent les résultats affichés dans une forme qui
ressemble à la lettre F.
11
Official Google Blog. A spring metamorphosis : Google's new look http://bit.ly/google-2010
(consulté le 19.06.2010)
Search Engine Optmization
Nicolas MESSER
21/102
Ce concept est souvent référence sous le terme de "Golden Triangle"
12
et montre
l'importance de l'optimisation pour obtenir des meilleurs positionnements dans les
SERPs.
Figure 1-8. Le triangle d'or de Google
12
Enquiro. Enquiro Develops Google's Golden Triangle. http://bit.ly/golden-triangle (consulté le
29.05.2010)
Search Engine Optmization
Nicolas MESSER
22/102
Dans ce même concept du triangle d'or, on parle également de la ligne de flottaison,
en anglais "the fold" qui commence sur la figure précédente à partir de la zone noire.
Le placement de celle-ci dépend très fort de la résolution de l'écran de l'utilisateur. Peu
importe sur quelle page de résultats votre site se positionnera, il est préférable d'être
placé en dessus de cette ligne. Encore plus parce que le nombre de liens affichés
avant la ligne de flottaison peut changer suivant l'intégration de liens sponsorisés et
des résultats verticaux s'affichant en tout début de la page de résultats.
Il a également été observé qu'on veut absolument être présent dans les premières
trente positions, donc les trois premières pages de résultats. Ceci car des études dans
le passé ont montré que très peu d'internautes dépassent cette fatidique troisième
page de résultats lors de leurs recherches.
Pourtant ces conclusions datent d'un temps ou la majorité des recherches ont été
effectuées avec un seul mot-clé. Ceci semble avoir changé dans les trois dernières
années vu que la plupart des internautes utilisent entre deux et trois mots-clés pour
leurs recherches. Ce phénomène semble être liée au désir de recevoir des résultats
plus pertinents et on en déduit que de plus en plus de personnes sont également
d'accord de consulter les pages de résultats arrières des moteurs de recherche.
Figure 1-9. Nombre de mots-clés utilisés dans une requête en janvier 201013
Conclusion (partie 1)
Les recherches qui se font par les internautes sur les moteurs comme Google sont
réalisées avec intention. L'internaute a envie de retrouver son contenu par le chemin
13
Trellian. Keyword and Search Engine Statistics. http://bit.ly/keyword-stats (consulté le
29.05.2010)
Search Engine Optmization
Nicolas MESSER
23/102
direct plutôt que de tomber dessus par hasard. L'optimisation pour les moteurs de
recherche est certainement une des meilleures et plus importantes méthodes pour
atteindre les clients aujourd'hui peu importe la taille de l'entreprise en question.
Comprendre le fonctionnement et étudier le comportement des moteurs de recherche
est une partie importante du travail pour chaque référenceur sérieux. Les moteurs
changent et améliorent leurs algorithmes en permanence et il faut suivre leurs
évolutions pour avoir un succès continu et ne pas perdre de positions dans les SERPs.
On a également appris que les spiders des moteurs de recherche ne sont en principe
rien d'autre que des logiciels qui viennent inspecter votre site. Et comme tous les
logiciels, ces spiders ont des forces qu'il faudra utiliser pour faciliter leurs travaux et
des faiblesses qu'il faudra essayer de neutraliser. Il est important de comprendre que
même si vos pages on été lues par un spider cela n'est pas une garantie qu'elle sera
indexée. Mais dans le 1er chapitre de la 3ème partie de ce mémoire nous allons étudier
comment on peut vérifier si votre site a correctement été indexé par les spiders.
Apprendre tout sur les moteurs de recherche et savoir comment optimiser son site web
pour atteindre des meilleurs positionnements est un processus difficile avec l'évolution
permanente des meilleures pratiques et les nouvelles opportunités d'optimisation.
Il existe une grande quantité de sources sur le web et un vaste choix de livres sur ce
sujet. Avec le volume d'informations accessibles, il peut être difficile de séparer le bon
grain de l'ivraie et savoir suivre les bonnes consignes. Dans la suite de ce mémoire, je
présenterai le noyau dur et les bases de mes recherches à partir d'un cas d'étude avec
le site de la Haute école de Gestion (HEG) qui faciliterait votre entrée dans ce
domaine.
Malheureusement, le monde de l'optimisation est trop grand pour découvrir tous les
concepts et stratégies en détails. Mais vous retrouvez toutes mes sources dans les bas
de page et la bibliographie et je vous donnerais également les références pour les
parties qu'on n'aura pas le temps de développer en détails pour continuer votre lecture
et agrandir vos connaissances et compétences dans ce domaine.
Si j'ai appris une chose pendant mes recherches, c'est qu'il faut se méfier des gens qui
vous vendent leurs services avec l'argument de vous placer en tête des SERPs. Donc,
je ne peux pas vous promettre une montée spectaculaire de votre site web, mais je
vous assure que les pratiques dans ce mémoire répondent aux normes des moteurs
de recherche majeurs et vont vous aider dans le travail d'optimisation.
Search Engine Optmization
Nicolas MESSER
24/102
Partie 2 : Le cas d'étude HEG
Comment développer un site accueillant le SEO?
L'optimisation pour les moteurs de recherche commence bien avant le vrai projet de
création d'un site web. Pourtant du travail d'optimisation sur un site déjà existent est la
situation la plus courante qu'un référenceur est amené à faire.
Mais les spécialistes du domaine confirment qu'il est beaucoup plus facile d'optimiser
un site qui n'existe pas encore au lieu d'adapter les bonnes pratiques connues à un
site qui est déjà en ligne.
Ceci ne se limite pas à la stratégie globale du site en développement, mais à nos jours
comporte également le choix d'un CMS, l'architecture et la rédaction du contenu du site
en question.
De plus, des facteurs autres que l'application des bonnes pratiques connues sont
connus pour avoir une influence sur le classement des résultats des moteurs de
recherche. Ce ne sont pas seulement les mots-clés dans le titre et la densité* des
mots-clés dans le texte principal qui font foi.
L'âge d'un site ou la relevance des liens et son texte d'ancrage vers un site font
également partie de l'algorithme de classement des moteurs de recherche. En plus,
l'autorité et la popularité générale d'un site sont aussi des facteurs qui sont pris en
considération et ceux-là ne sont souvent pas gagnés dès la mise en ligne d'un site,
mais sont atteints par le temps.
On voit que l'optimisation d'un site web comporte beaucoup d'aspects différents de la
vie d'une entreprise et nécessite la collaboration de multiples personnes (ou
départements) comme ceux du marketing ou ceux du service des ventes pour des
résultats optimaux.
Utiliser une seule stratégie ne peut avoir qu'un petit impact sur vos résultats. Appliquer
une palette des ces stratégies dans la bonne combinaison par contre peut se révéler
comme un moyen puissant dans vos efforts d'optimisation. Ceci est la raison pour
laquelle l'optimisation n'est pas seulement perçue comme une science, mais
considérée un art.
What matters is how these things are done, and understanding how far each will
get you on its own, and in tandem with other strategies and tactics. – Scott Smith
Search Engine Optmization
Nicolas MESSER
25/102
Chapitre 1 : Considérations avant le projet
Analyse des mots-clés
Un travail important qui précède tout travail de développement est l'analyse des motsclés. L'analyse des mots-clés et les sites de vos concurrents vous permettront non
seulement d'identifier les requêtes optimales, mais également d'apprendre l'une ou
l'autre chose sur vos clients virtuels.
Comme cela a été confirmé par les trois spécialistes que j'ai questionnés, l'analyse des
mots-clés peut être un travail long et suivant le contexte plutôt difficile. Par contre, les
fruits de ce travail vous apporteront un avantage dans la suite de l'optimisation de votre
site web.
Et rappelez-vous que vous ne pouvez pas optimiser un site, si vous ne savez pas pour
quel type de recherche vous aimeriez apparaître dans les premières positions et quel
est le langage utilisé par vos clients.
Une partie de ces données pourront très probablement être obtenues par les autres
départements de votre entreprise et il ne faudra pas hésiter à les utiliser en votre
faveur.
Il s'avère également de considérer des possibles fautes d'orthographe et des fautes de
frappe connues pour vos mots-clés essentiels car cela peut générer du trafic important.
Pensez seulement quand vous avez fait la dernière fois une faute de frappe ou utilisé
une orthographe incorrecte pour retrouver quelques choses avec Google dont vous ne
vous êtes plus rappelé à cent pour cent.
Un autre très bon moyen d'analyser et obtenir des mots-clés est l'outil Keyword Tool du
service AdWords proposé par Google. Cet outil peut vous générer automatiquement
des propositions de mots-clés pour votre site ainsi qu'afficher le nombre de recherches
mensuelles effectuées sur un mot-clé.
Search Engine Optmization
Nicolas MESSER
26/102
D'après les trois spécialistes que j'ai pu questionner sur ce sujet, l'efficacité de cet outil
semble plutôt être contesté, par contre plutôt facile à utiliser pour celui qui aimerait
faire son analyse de mots-clés.
Et même si ces données sont dites ne pas être tout à fait exactes, Google est
certainement l'entreprise qui devra avoir une expertise avant tout le monde dans ce
domaine et il faudra donc ne pas manquer d'utiliser cet outil gratuit.
Figure 2-1. Outil de recherche mots-clés AdWords de Google
Il est hors questions que les mots-clés avec des centaines ou même des milliers de
recherches par mois semblent être plus intéressantes, mais il est important de savoir
que ces mots-clés populaires représentent effectivement seulement autour de 30% du
total des recherches effectuées sur le web.
Malheureusement, les meilleures positions de ces mots-clés sont souvent déjà
occupées par des sites avec une grande influence et il serait de ce fait beaucoup plus
difficile de placer son propre site dans la partie intéressant des SERPs.
Bien choisir ses mots-clés consiste donc à trouver un mélange entre le potentiel des
termes choisis et la faisabilité d'un bon positionnement sur ceux-ci. Il faut intégrer des
mots-clés populaires, mais ne pas oublier la masse.
Search Engine Optmization
Nicolas MESSER
27/102
Ceci confirme l'importance d'une analyse de mots-clés approfondie pour obtenir un
spectre large de requêtes qui chacune tout seule ne produira pas beaucoup de visite,
mais toutes ensemble pourront représenter jusqu'à 70% des recherches effectuées
pour votre site web.
La longue traîne
Ce concept est connu sous le terme de "Long Tail*" et de multiples études ont été
consacrées à ce sujet. Mais je vous propose d'étudier la source mentionnée dans le
pied de page pour plonger plus profondément dans ce sujet de la longue traîne.
Figure 2-2. Le principe du "Long Tail"14
J'ai réalisé une analyse de mots-clés pour notre cas d'étude de la HEG où j'ai
également analysé "les concurrents" et essayé de trouver des mots-clés faisant partie
du concept du "Long Tail".
14
Wired, Chris Anderson. The Long Tail. http://bit.ly/the-long-tail (consulté le 29.05.2010)
Search Engine Optmization
Nicolas MESSER
28/102
Analyse mots-clés de la HEG
Dans un premier temps il faudra mentionner que les mots-clés représentatifs pour la
HEG sont presque tous de haute concurrence et que les mots-clés actuellement
choisis représentent assez bien les mots retrouvés sur les différentes pages du site de
la HEG. Voici donc la liste des mots-clés actuels du site de la HEG.
Mot-clé
HEG
Haute école de gestion de Genève
HES
HESGE
Genève
Suisse
informatique de gestion
économiste d'entreprise
spécialiste en information documentaire
Business Administration with a Major in
International Management
master
bachelor
MAS
CAS
EMBA
DAS
école supérieure
formation
Concurrence
élevée
élevée
élevée
élevée
élevée
élevée
élevée
élevée
élevée
élevée
élevée
élevée
élevée
Recherches mensuelles
74 000
73
1 000 000
6 600
1 830 000
9 140 000
60 500
320
28
<10
68 000 000
7 480 000
55 600 000
5 000 000
450 000
68 000 000
49 500
13 600 000
Pour trouver des mots-clés qui pourront faire partie de la longue traîne, j'ai soit
composé des mots-clés existants, soit interrogé le site de la HEG pour retrouver des
possibles mots-clés pertinents non utilisés.
Le but de ce travail d'analyse est d'identifier des mots-clés qui on une concurrence
moyenne ou faible, mais quand même un nombre de recherches mensuelles assez
élevés. Un meilleur positionnement dans les SERPs de ces mots-clés pourrait
éventuellement être atteint plus rapidement et plus facilement.
Search Engine Optmization
Nicolas MESSER
29/102
Voici donc la liste des mots-clés correspondants que j'ai pu identifier.
Mot-clé
Haute école de gestion
formation hes
économie d'entreprise
recherche appliquée
mba suisse
bachelor informatique
bachelor gestion
information documentaire
formation documentaire
formation bilingue
enseignement bilingue
interdisciplinaire
crédits ects
système bologne
échange erasmus
cap manager
Concurrence
Recherches mensuelles
faible
moyenne
moyenne
moyenne
moyenne
moyenne
moyenne
moyenne
moyenne
moyenne
moyenne
moyenne
moyenne
faible
1 000
480
5 400
2 900
880
880
1 900
2 400
2 900
1 300
1 300
12 100
8 100
110
390
2 900
Quelle est l'utilité de ces informations qu'on a obtenues à partir de cette analyse des
"concurrents" et des mots-clés?
Premièrement, j'ai pu constater que la majorité des sites web des autres Hautes écoles
du réseau HES-SO n'utilisent pas les métas informations description ou/et keywords.
Nous allons parler de la balise description dans le 2ème chapitre de cette partie en plus
de détails. Voici l'extrait du code HTML du site de la Haute de gestion de Fribourg qui
nous dévoile que les mots-clés sont ignorés.
<title>Haute école de gestion - Fribourg :: </title>
<meta name="description" content=""/>
<meta name="keywords" content=""/>
L'inefficacité de cette balise dans le code pour l'optimisation d'une page web pourrait
être la source de ce phénomène. Ceci a également été confirmé par les trois
spécialistes que j'ai questionnés dans le cadre de mon mémoire.
Search Engine Optmization
Nicolas MESSER
30/102
Dans le cas de la HEG Fribourg, cela semble tout simplement être oublié comme m'a
confirmé le responsable de l'équipe web pendant notre entretien téléphonique.
Par contre, ce travail d'analyse n'est pas du temps perdu. Il est même très important de
connaître ces mots-clés car dans l'optimisation dans les balises de titre, les balises
d'en-tête (h1, h2, etc.) et le contenu ce travail vous permettra de placer ces mots-clés à
des endroits stratégique importants.
"Doing keyword researches, and on-page SEO, are categories of work, not
tactics. There are hundreds of keyword research tactics, and thousands of onpage tactics, and my personal experience is that very few people either know
them all or do most or them well." – Scott Smith
Choix du nom de domaine
Un autre point à prendre en considération est le nom de domaine et son extension.
Utiliser le nom de votre entreprise ou une combinaison de mots-clés proche à votre
activé est indispensable.
Avoir un nom de domaine propre est certainement quelque chose que la HEG pourrait
améliorer. Notre autre exemple, la Haute de gestion de Fribourg, utilise par exemple le
nom de domaine http://www.heg-fr.ch.
J'ai fait une demande chez Switch pour enregistrer le nom de domaine http://www.hegge.ch, mais ce nom de domaine est déjà enregistré. Par une recherche Whois15, j'ai pu
identifier que le détenteur est les Hautes écoles spécialisées Genève. J'imagine donc
que ce changement est peut-être déjà prévu dans le futur.
Dans le cas d'une organisation internationale, il peut être une bonne idée d'acheter le
même nom de domaine avec plusieurs extensions (.com, .fr, .ch) et de mettre en place
une redirection 301 pour avoir les meilleurs résultats possibles dans les recherches
locales.
15
who.is. Informations du nom de domaine heg-ge.ch http://bit.ly/whois-heg
Search Engine Optmization
Nicolas MESSER
31/102
Bien sûr le site d'une telle organisation peut être différent suivant le pays et dans ce
cas le processus d'optimisation devient plus complexe. Il existe une différence entre
l'optimisation et le déploiement d'un site pour plusieurs pays différents ou pour un pays
comme la Suisse où nous avons plusieurs langues nationales.
16
Le premier cas est connu sous le terme "Geo Trageting " et pour le deuxième cas il
n'existe pas de terme officiel, mais le terme "Multi-Language Countries Targeting17" est
souvent retrouvé sur le web. Nous n'aurons pas plus de temps d'entrer en matière sur
ce sujet dans le cadre de ce mémoire, mais je vous suggère de consulter les deux
articles du Search Engine Journal pour commencer votre lecture.
D'après les dernières connaissances, l'âge du nom de domaine (la durée depuis
laquelle le nom de domaine est enregistré) semble également avoir une influence sur
le positionnement dans les SERPs. Donc si vous avez une idée pour un projet pour
lequel vous pensez mettre en place un site internet, il peut être utile de réserver le nom
de domaine même si vous n'allez pas vous en servir de suite.
18
Récemment, Google a annoncé
que le temps de réponse de votre site web est
également évalué. Ceci étant quelque chose qui ne sera probablement pas sous votre
contrôle direct, il est donc important de bien étudier les différentes offres
d'hébergement pour être du bon côté au niveau technique ou d'en parler à vos
spécialistes informatique.
16
Search Engine Journal, Ann Smarty. What's Most Effective for Geo Targeting?
http://bit.ly/geo-targeting (consulté le 21.06.2010)
17
Search Engine Journal, Ann Smarty. SEO Case Study : Dealing With Multi-Language
Countries Targeting http://bit.ly/multi-language (consulté le 21.06.2010)
18
Official Google Webmaster Blog. Using site speed in web search ranking http://bit.ly/googlespeed (consulté le 22.06.2010)
Search Engine Optmization
Nicolas MESSER
32/102
Chapitre 2 : Applications des Best Practices
Ce n'est pas par hasard que j'ai choisit de faire le tour des best practices. Il est
important de connaître les directives et recommandations des moteurs de recherche
pour réaliser des bons résultats peu importe si vous êtes un apprenti ou spécialiste du
domaine. Finalement pour une grande partie, ce sont les moteurs de recherche qui
déterminent les règles et vont vous fournir des visiteurs. Il est donc incontournable de
suivre ces meilleures pratiques le plus près possible.
19
On distingue généralement deux types
de facteurs d'influence dans l'optimisation
d'un site web. "Off page", les optimisations que vous pouvez adopter sans même
travailler sur les pages de votre site comme nous l'avons en partie vu dans le 1er
chapitre de cette partie du mémoire. Et "On-page", les optimisations que vous faites
pour les pages de votre site pour les positionner par rapport aux mots-clés du contenu.
Dans la suite de notre cas d'étude de la HEG, nous allons nous concentrer sur les
optimisations "On-site" de bases car nous n'aurons pas le temps d'entrer en détails sur
tous les aspects du processus d'optimisation.
Le site www.archive.org, connu sous le nom "Wayback Machine", m'a permis d'aller
consulter l'état du site de la HEG avant les derniers changements apportés.
Figure 2-3. Site HEG avant 2010
19
Direct Media Traffic. Off Page Optimization VS On-Page Optimization http://bit.ly/off-on-page
(consulté le 22.06.2010)
Search Engine Optmization
Nicolas MESSER
33/102
Par la suite nous allons nous référencer au site de la HEG actuel et également faire
des remarques par rapport aux changements apportés depuis la dernière version.
Figure 2-4. Site HEG actuel
La balise <title>
Le placement de mots-clés dans le titre de la page est un des éléments le plus
important dans le classement des pages web. En effet cette information qui se trouve
dans la partie <head> du code HTML est le seul méta tag qui est pris en considération
pour identifier la pertinence par rapport aux recherches effectuées.
<title>Haute école de gestion de Genève - Bienvenue à la
HEG</title>
Il est recommandé que les titres aient une longueur maximale de 64 caractères
(espaces comprises), même si Google affiche effectivement 66 caractères. Un plus
long titre ne pénalisera pas votre positionnement, mais les internautes ne pourront
peut-être lire que les premiers 66 caractères de votre titre suivi de trois points dans ce
cas.
Search Engine Optmization
Nicolas MESSER
34/102
En plus, le titre devra être le plus pertinent possible par rapport au contenu de la page.
Donc assurez vous qu'au moins une partie des mots-clés, si pas tous, peuvent aussi
être retrouvés dans le contenu de la page.
La balise Meta <description>
Même si le méta tag qui fournit la description pour une page de votre site ne fait plus
foi dans l'évaluation de la pertinence, il peut quand même être bénéfique pour vous de
lui consacrer un peu de temps.
La description est le petit extrait qui s'affiche en plus du titre dans les SERPs et peut
convaincre un internaute à cliquer sur votre lien ou de choisir un autre résultat de la
liste.
La longueur maximale pour la description est de 155 caractères (espaces comprises)
et il semble que Google affiche effectivement 160 caractères avant de couper le texte.
Il est donc important que le texte pour les deux métadonnées soit clair et précis tout en
donnant le plus d'informations pertinentes à l'internaute qui a effectué la recherche.
Voici les métadonnées description du site de la HEG.
<meta content="Haute école de gestion de Genève - Bienvenue
à la HEG" name="Description">
Si on analyse ces métadonnées, on peut identifier un potentiel d'amélioration. Le titre
est clair et contient tout les mots-clés importants pour la HEG avec le nom complet. La
seule chose qu'on pourrait changer est de mettre en avant le nom en anglais au lieu du
"Bienvenue à la HEG", comme il est fait dans le logo du site.
Search Engine Optmization
Nicolas MESSER
35/102
Personnellement, je pense que les métadonnées de la description ne sont pas
efficaces du tout. Le titre est tout simplement répété et on peut voir que Google a
ajouté une information supplémentaire depuis la page d'accueil qui ne contient pas
beaucoup de mots-clés signifiants.
Figure 2-5. Extrait du site de la HEG sur la page de résultat de Google
Ce schéma peut être observé sur toutes les pages du site de la HEG et j'en tire la
conclusion que les métadonnées sont probablement générées automatiquement ou
ignorées. Il serait donc recommandable d'améliorer ce processus pour ajouter plus de
précision pour les internautes.
Pendant mon entretien avec Madame Murbach, conceptrice Web de la HEG, mes
observations ont été confirmées. Ceci est effectivement encore un travail en cours
depuis la mise en ligne de la nouvelle version du site de la HEG.
Propositions d'amélioration des balises <title> et <description>
Sur l'ancienne version du site de la HEG cette balise était mieux renseignée. Voici
l'extrait du titre qui était clair et précis et contenait le mot-clé HES en plus.
<title>HEG - Haute Ecole de Gestion de Genève (HES)</title>
Voici une proposition d'un titre optimisé qui prend en compte le nom de l'école en
français et en anglais comme on le trouve dans le logo sur le site actuel de la HEG.
<title>Haute école de gestion de Genève - Geneva School of
Business Administration</title>
Pourtant cette proposition permettra d'ajouter quelques mots-clés anglais, le titre
compte 75 caractères et une partie sera donc coupée dans la page des résultats.
Search Engine Optmization
Nicolas MESSER
36/102
La balise de description n'a pas changé dans les deux versions du site de la HEG.
Voici une proposition pour la description avec 142 caractères à partir de laquelle
l'internaute pourrait avoir une meilleure idée sur l'activité de la HEG dans les SERPs.
<meta content="La Haute Ecole de Gestion de Genève (HEG)
s’adresse
aux
universitaire
étudiants
de
haut
qui
niveau
veulent
axée
une
formation
la
pratique."
sur
name="Description">
Voici une autre proposition d'optimisation de la description avec 158 caractères qui
pourrait être intéressante dans le cas de la HEG car elle intègre directement les
informations de contact.
<meta content="La Haute Ecole de Gestion de Genève, Campus
de Batelle, Batîment F, 7 route de Drize, 1227 Carouge Tél. +41 22 388 17 00 (Lun au Ven de 8h-12h et 13h30-17h)"
name="Description">
Les balises d'en-tête
Les balises d'en-tête ne sont pas seulement un outil visuel, mais permettent de créer
une structure hiérarchique pour votre site et contenu. Il existe six tailles d'en-tête, de la
balise <h1>, la plus importante jusqu'à la balise <h6>.
Il est important de respecter quelques "règles" pour pouvoir tirer le plus grand
avantage des ces balises d'en-tête. La balise <h1> est le titre principal d'une page et
ne devra pas être utilisé plus d'une fois sur la même page. Les autres balises <h2> à
<h6> peuvent être utilisées plusieurs fois, mais il faut faire attention de respecter
l'ordre hiérarchique imbriqué avec les répétitions.
En analysant le site actuel de la HEG pour notre cas d'étude, j'ai observé que la balise
<h1> est seulement résignée par une image (le logo de la HEG).
Search Engine Optmization
Nicolas MESSER
37/102
Figure 2-6. Balise d'en-tête <h1> du site actuel de la HEG
Ceci n'était pas le cas avec l'ancienne version du site, et la HEG laisse passer un
moyen extrêmement simple et efficace de placer des mots-clés pour un bon
positionnement dans les SERPs.
Figure 2-7. Balise d'en-tête <h1> de l'ancien site de la HEG
Search Engine Optmization
Nicolas MESSER
38/102
Propositions d'amélioration de la balise <h1>
La solution actuelle sera acceptable seulement une fois que Google est les autres
moteurs de recherche sont capables de reconnaître les caractères dans des images
(traité plus en détails dans le 2ème chapitre de la 5ème partie du mémoire qui est
consacré aux futur de l'optimisation).
Je recommande donc très fortement d'ajouter du vrai texte dans la balise <h1> et de le
faire disparaître avec des instructions CSS. Cette petite astuce permettra aux spiders
des moteurs de recherche d'indexer le texte de la balise et en même temps de le
cacher pour les internautes.
De plus, je propose d'optimiser le texte alternatif de l'image de "HEG" à "Haute école
de gestion de Genève" (plus de détails concernant le sujet dans la section
"Optimisation des images").
L'optimisation des liens
Le texte d'ancrage des liens internes est une bonne opportunité pour utiliser des motsclés significatifs plutôt que des textes comme "cliquer ici" qu'on retrouve souvent sur
des différents sites web.
Voici l'exemple d'un lien du site de la HEG lesquels me semble être généralement bien
optimisés.
<a href="/heg/formation-base">Formation de base</a>
Une chose qui pourrait être améliorée est l’ensemble des liens de la partie "Actualité
HEG". Tous les liens ont le même texte d'ancrage, ce qui n'est pas très utile. Voici
l'extrait de code pour la nouvelle "Une recherche HEG récompensée par le Prix
ARDITI" du 15 juin 2010.
<a
class="link-web"
title="lien
internet"
href="/heg/actualites/2010/20100615.asp">Plus d'info</a>
Search Engine Optmization
Nicolas MESSER
39/102
Voici l'extrait de code pour le lien de l'annonce de la formation continue de CISCO de
l'ancienne version du site de la HEG où le texte d'ancrage a été mieux renseigné.
<span
class="textept"><br>
>
plus
d'info
href="http://www.hesge.ch/heg/cisco">site
[<a
CISCO
HEG</a>]</span>
Ceci est à prendre en considération pour la structure des URLs (expliqué en détails
dans la partie "La structure des URL") qui est construit principalement par les noms de
ces fichiers..
Ce principe s'applique également aux fichiers PDF (et toute autre type de fichiers) qui
sont également indexés et référencés par les moteurs de recherche.
La grande majorité des fichiers PDF qu'on peut retrouver dans cette partie du site de la
HEG ont des noms plus pertinents contenant des mots-clés plutôt que la date de
publication comme nous l'avons vu avec l'exemple précédent.
Construction des liens
Comme nous l'avons appris dans l'introduction beaucoup d'autres facteurs font foi
dans l'évaluation d'un lien comme l'autorité et sa pertinence. L'optimisation des liens
interne est importante, mais avoir des liens depuis un autre site est toujours une bonne
affaire.
Cette stratégie est appelée "Link Building*" et souvent confondue avec le PPC (pay per
click). L'efficacité des liens sponsorisés ou achetés est un sujet controversé dans le
monde de l'optimisation et ne sera pas traité plus en détails dans ce mémoire.
Search Engine Optmization
Nicolas MESSER
40/102
Figure 2-8. Abstraction du concept Link Building
Mais réfléchir comment vous pourriez obtenir un lien pertinent ou avec qui vous
pourriez faire un échange de liens fait partie de l'optimisation de votre site web. Dans
le cas de la HEG qui fait partie du réseau HESSO des liens entre les différents sites
des Hautes écoles genevoises dans la partie "footer" pourrait être une option.
Figure 2-9. Application possible du link building pour le site de la HEG
Cette stratégie est par exemple employée par les sites du réseau des Hautes écoles
de Fribourg.
La seule chose qu'il faut se rappeler est que 100 liens du même nom de domaine sont
moins efficaces qu'un lien de 100 noms de domaines différents. Ce n'est donc pas la
quantité, mais la qualité des liens vers votre site qui est importante.
Search Engine Optmization
Nicolas MESSER
41/102
L'optimisation des images
Nous avons déjà parlé de l'importance du nom de fichiers dans la partie de
l'optimisation des liens qui s'applique également pour les images. Ceci est donc le
premier élément qui nous permet de placer des mots-clés et d'en tirer un bénéfice pour
le positionnement.
L'autre élément des images qui permet de faire la même chose est l'attribut "alt". C'est
le texte alternatif qui sera affiché au cas où l'image rencontrait des problèmes pendant
le chargement.
Lors de ma proposition d'optimisation pour la balise d'en-tête <h1>, nous avons
également vu l'exemple du logo de la HEG. Voici l'extrait de code pour cette image.
<img alt="HEG" src="/heg/img/heg-logo.gif">
Au premier coup d'œil cette image semble être en ordre, mais on peut toute fois
l'optimiser dans le contexte de la HEG. Voici le même extrait de code optimisé.
<img src="/heg/img/heg-geneve.gif" alt="HEG - Haute école
de gestion de Genève">
On peut constater que j'ai apporté deux optimisations à part de l'ordre des instructions
qui ne devra pas avoir d'importance. J'ai ajouté le mot-clé "geneve" au nom du fichier
et plusieurs mots-clés par l'ajout du nom complet de la HEG.
Le plan du site
La création d'un plan du site, appelé sitemap, surtout en format XML peut aider à
augmenter le nombre de pages indexées par les spiders des moteurs de recherche,
mais n'aidera pas directement à votre positionnement.
Il existe deux types de plan du site différents. Celui pour les humains, que l'on retrouve
également sur le site de la HEG, et celui pour les spiders de moteurs de recherche.
Search Engine Optmization
Nicolas MESSER
42/102
Figure 2-10. Extrait du code d'un sitemap exemple en format XML20
Je viens d'expliquer l'importance du plan site pour les spiders, lequel n'est pas existent
pour le site de la HEG, mais le deuxième type n'est pas moins important car il permet à
vos utilisateurs de rapidement et directement accéder aux informations dont ils ont
besoin.
En fait, il faut penser en proximité pour bien comprendre le concept du plan de site. Un
click depuis la page d'accueil vers le plan du site et un deuxième pour atteindre
n'importe quelle autre page – du caviar pour les spiders des moteurs de recherche!
Figure 2-11. Plan du site HEG
20
Sitemaps.org. What are Sitemaps? http://bit.ly/sitemap-xml (consulté le 29.05.2010)
Search Engine Optmization
Nicolas MESSER
43/102
Arborescence d'un site
L'implémentation du plan du site, fait également du sens si on considère toujours que
le nombre de clicks associés à un lien toujours est un facteur important dans le
processus d'optimisation.
Même si les avis de mes trois experts ne pourront pas se différencier plus sur ce sujet,
l'idée du concept en général semble plutôt claire et Google semble quand même y
21
mettre un peu d'importance .
Utilisation du fichier robots.txt
Le fichier robots.txt doit être placé à la racine de votre site et le nom du fichier doit
absolument être en minuscule et en format texte. Si ce fichier se trouve dans n'importe
quel autre endroit sur votre serveur ou dans un autre format, il ne sera pas pris en
compte par les moteurs de recherche.
L'impact du fichier robots.txt
22
est contesté parce qu'une mauvaise instruction dans ce
fichier pourrait priver une partie ou la totalité de votre site de l'indexation par les
spiders des moteurs. Sachez donc, où mettre les pieds avant d'appliquer n'importe
quoi dans ce fichier pour votre site.
21
Google Webmaster Blog. Importance of link architecture. http://bit.ly/link-depth (consulté le
23.06.2010)
22
Robotstxt.org http://bit.ly/fichier-robots (consulté le 29.05.2010)
Search Engine Optmization
Nicolas MESSER
44/102
Figure 2-12. Principe du fichier robots.txt
Mais d'après mes recherches et mes expériences personnelles, il n'y a pas encore de
technologie équivalente qui pourrait remplacer ce fichier à l'heure actuelle. Et l'avis de
mes trois spécialistes montre quand même un effet plutôt positif avec une bonne
application.
De plus, cette méthode est incontestée dans la protection contre du contenu dupliqué23
(sujet que nous n'aurons pas le temps de traiter en plus de détails) et un moyen
efficace et facile de fournir votre plan du site, donc les liens vers votre contenu, aux
Spiders des moteurs de recherche.
Figure 2-13. Fichier robots simple du site Abondance
23
Google Webmaster Tools Help. Duplicate content. http://bit.ly/contenu-duplique (consulté le
29.05.2010)
Search Engine Optmization
Nicolas MESSER
45/102
Je n'ai pas pu trouver un fichier XML appliqué dans le cas de la HEG. Il serait donc
recommandable de vérifier le rythme d'indexation dans les Google Webmaster Tools
(si la HEG dispose d'un compte pour les services Google) et dans le cas échéant créer
un tel fichier pour le site de la HEG.
La structure des URL
Si vous utilisez un CMS ou faites appels à une base de données pour afficher une
partie du contenu de votre site web, il se peut que vous vous retrouvez avec des liens
dynamiques. Ceci est le cas de l'annuaire des collaborateurs qui peut être consulté sur
le site de la HEG.
Les paramètres dans l'url pourraient désorienter les moteurs de recherche et il est
préférable d'utiliser des liens statiques. La situation aujourd'hui semble être que les
moteurs de recherche n'ont pas de problème, si votre URL ne contient pas plus de
trois de ces paramètres, ce qui est le cas pour le site de la HEG.
24
Pourtant si vous hébergez votre site sur un serveur Apache , le module mod_rewrite
supporte cette technique par l'ajout des instructions nécessaires dans le fichier
25
.htaccess. Le URL rewriting est également possible avec le ASP , la technologie
utilisée pour le site de la HEG, mais est un peu plus avancée que sous Apache.
Cette optimisation pourrait également vous permettre de placer quelques mots-clés
dans vos URLs ce qui peut améliorer le positionnement de vos pages.
24
Apache Software Foundation. Apache Module mod_rewrite. http://bit.ly/mod-rewrite (consulté
le 29.05.2010)
25
Microsoft. URL Rewriting in ASP.NET. http://bit.ly/asp-rewrite (consulté le 29.05.2010)
Search Engine Optmization
Nicolas MESSER
46/102
Proposition d'amélioration de la structure URL
Dans l'exemple de l'URL choisi précédemment, c'est l'entrée de mon directeur de
mémoire, Alexandre Boder, qui est référencé par l'identifiant 35. Une URL optimisée
pourrait avoir l'apparence suivante.
Faciliter la navigation
Depuis la nouvelle version du site de la HEG ce point semble avoir été amélioré. Sur
l'ancien site le premier niveau depuis la page d'accueil était bien accessible, mais de
trouver plus de détails était de loin une tâche facile. Le site actuel permet d'accéder à
tous les détails en quelques cliques.
En plus l'implémentation d'un fil d'Ariane (en anglais "breadcrumbs*") permet de
retourner facilement dans les différents niveaux du site.
Respect des standards W3C
Avoir du code qui valide avec les standards du consortium W3C* et avoir un site
accessible qui répond à l'initiative WAI n'est pas un critère dans l'établissement des
classements par les moteurs de recherche, mais ce dernier est inclu dans les lois de
plusieurs pays et ne peut donc pas être complètement ignoré.
Pour les institutions Suisses c'est l'article 10 de l'Ordonnance sur l’élimination des
inégalités frappant les personnes handicapées qui fait foi.26
26
Art. 10 Ohand, RS 151.31 http://bit.ly/rs-art-10
Search Engine Optmization
Nicolas MESSER
47/102
Joost de Valk, spécialiste d'optimisation, a publié un article
27
sur ce sujet le 13 juin
2010, lequel résume bien la problématique qui se pose avec les standards du
consortium W3C. De manière générale et d'après le message vidéo de l'employé
Google, Matt Cutts, dans le même article cela n'apporte aucun avantage pour le
positionnement de votre site.
Par contre, si vous faites appel au service d'optimisation d'un spécialiste pour votre
site, vous pouvez attendre que le nombre d'erreurs soit réduit au minimum.
Le consortium W3C met à disposition un service28 pour valider son code HTML. Si on
fait valider le site actuel de la HEG on obtient en retour 32 erreurs lesquelles sont
principalement liées au service AddThis et au widget de Facebook qui sont utilisés sur
les pages du site.
Figure 2-14. Résultat de la validation W3C
Proposition d'autres améliorations
En analysant le site de la HEG, j'ai identifié deux autres points qui ne sont pas
directement en rapport avec le sujet de ce mémoire, mais qui pourront améliorer la
perception et l'expérience des visiteurs du site.
27
Joost de Valk. W3C Validation & SEO. http://bit.ly/w3c-validation-seo (consulté le
23.06.2010)
28
W3C. Markup Validation Service http://bit.ly/w3c-validation
Search Engine Optmization
Nicolas MESSER
48/102
Premièrement, sur la page "Contact" l'ajout d'un formulaire qui permettra aux
internautes de remplir une demande de contact directement sur le site pourrait
éventuellement augmenter le nombre de prise de contact. Le fait de devoir ouvrir un
logiciel de messagerie ou copier l'adresse souhaitée dans le champ destinataire d'une
interface web d'un service de messagerie peut représenter un obstacle pour les
internautes.
Le deuxième point concerne la section avec les témoignages d'étudiant-es. Je pense
que cette partie du site est spécialement importante pour attirer des nouveaux
étudiants. Avoir des portraits est une bonne idée, mais peut-être une sorte de blog par
les étudiants de la HEG avec leurs expériences tout au long de l'année académique
pourrait intéresser beaucoup de monde et aider à convaincre des futurs étudiants.
Chapitre 3 : "Black hat" – les stratégies à éviter
Les stratégies artificielles d'optimisation, plus couramment connues sous le nom "black
hat*" et jugées non éthiques ont pour but de tromper les moteurs de recherche et de
propulser le positionnement d'un site web dans les SERPs.
Des multiples stratégies de spamming avec des approches différentes ont été utilisées
dans le passé pour améliorer la visibilité d'un site web. Certaines ont connu plus de
succès que d'autres, en appliquant plus ou moins le même concept de fournir du
contenu non relevant par rapport aux mots-clés recherchés.
Commençons ce chapitre par une technique qui est souvent employée par les
développeurs web. Ce sont des éléments HTML cachés29. L'utilisation de cette
technique peut avoir plusieurs raisons qui ne sont pas forcements considérés comme
mauvais. Les menus déroulants emploient même presque tous cette technique. Dans
ce cas il semble évident que votre intention n'est pas de faire indexer des mots-clés ou
du texte caché qui pourront aider à votre positionnement. Mais malheureusement,
cette technique est de plus en plus abusée pour ce genre de chose et il circule des
rumeurs que Google n'index plus ces éléments HTML cachés.
29
Google Webmaster Central. Hidden text and links. http://bit.ly/hidden-text (consulté le
26.06.2010)
Search Engine Optmization
Nicolas MESSER
49/102
Une autre technique qui n'appartient pas à cette catégorie mais a les mêmes effets
sont les fonctionnalités proposées par le JavaScript et Ajax. L'utilisation de ces
techniques permettra par exemple de rafraîchir une partie de votre site web sans
devoir rafraîchir la page entière. Le problème avec ces fonctionnalités est que les
spiders des moteurs de recherche ne vont pas exécuter le JavaScript nécessaire pour
accéder à ce contenu. Il faut donc être sûr de maitriser cette technologie à fin d'éviter
que votre site soit incorrectement indexé.
Passons donc aux techniques qui auront avec une très grande possibilité pour
conséquence une punition chez les moteurs de recherche et donc une influence pour
votre positionnement actuel ou même l'exclusion des SERPs dans des cas extrêmes.
Une stratégie d'optimisation qui s'est prouvé extrêmement efficace dans le passé est le
"Cloaking*".
Figure 2-15. Représentation visuelle du Cloaking
Search Engine Optmization
Nicolas MESSER
50/102
L'idée derrière cette stratégie est de présenter des contenus différents pour les vrais
visiteurs de vos sites et les spiders des moteurs de recherche. Malheureusement, ceci
a aussi été largement repris par les spammers et abusé excessivement dans le passé
et est donc devenu un tabou dans le monde de l'optimisation.
Pourtant, il y a des experts dans le domaine qui disent qu'il est toujours possible
30
31
d'utiliser cette stratégie avec prudence , mais la position
des moteurs de recherche
à ce sujet est très claire et les possibles punitions ne valent pas la peine de prendre le
risque.
L'autre stratégie qui a souvent été utilisée surtout en relation avec des produits
pharmaceutiques est connue en anglais sous "Doorway pages*". Le terme français est
l'utilisation des pages satellites qui a pour but d'utiliser une page extrêmement
optimisée pour un certain mot-clé tout en appliquant une redirection vers la page
officielle qui souvent n'a rien en commun avec le sujet de cette dernière.
Une stratégie qui a été utilisée dans le passé, mais qui est dite de ne plus avoir
d'impact du tout, est l'accumulation des mots-clés. Ceci semble être le cas déjà pour
un certain moment et se confirme au moment où la balise méta des mots-clés a été
ignorée par les moteurs de recherche. Pourtant, je pense qu'il faudra toujours mettre
un œil sur ce point parce que Google a toujours une entrée
32
dans l'aide pour les
webmasters, qui dit que ce comportement peut influencer votre positionnement.
Conclusion (partie 2)
Maîtriser le travail d'optimisation d'une part est seulement possible avec une
compréhension profonde des directives et bonnes pratiques du domaine et nécessite
de la patience.
Avoir du succès avec l'optimisation d'autre part, nécessite une compréhension
approfondie de l'entreprise en question. Quels sont les biens et services ou encore
informations que vous avez à offrir?
30
SEOmoz, Rand Fishkin. White Hat Cloaking: It Exist. It's Permitted. It's Useful.
http://bit.ly/white-cloaking (consulté le 26.06.2010)
31
Google Webmaster Central. Cloaking, sneaky JavaScript redirects, and doorway pages.
http://bit.ly/google-cloaking (consulté le 26.06.2010)
32
Google Webmaster Central. Keyword stuffing. http://bit.ly/stuffing-keywords (consulté le
26.06.2010)
Search Engine Optmization
Nicolas MESSER
51/102
L'analyse des mots-clés qui devrait précéder chaque projet de création d'un site web
est un travail complexe, long et souvent pénible, mais la récompense potentielle est
très grande. Une fois ce travail de réflexions accomplit, vous pouvez commencer à
réfléchir sur l'architecture et le développement de votre site.
Avoir du contenu avec le plus de mots-clés possibles était la façon d'optimiser les sites
web dans le passé. Des indicateurs comme la densité des mots-clés sont apparus pour
évaluer le niveau d'optimisation du contenu d'un site. Aujourd'hui toujours efficace, ces
indicateurs ont beaucoup moins d'influence sur le positionnement dans les SERPs et
ne sont dans aucun cas une assurance pour avoir des visiteurs satisfaits.
Ceci ne veut pas dire qu'il ne faut pas utiliser quelques-uns de vos mots-clés dans vos
pages, mais rédiger votre contenu surtout pour les visiteurs de votre site et non pas
pour les moteurs de recherche.
Si vos efforts ne vous permettront pas de vous placer dans les meilleures positions des
SERPs, vous succomberez peut-être à la tentation d'utiliser des stratégies artificielles
d'optimisation.
Le référencement "black hat" vise pour des résultats immédiats en trompant les
moteurs de recherche. Avant de passer à ces stratégies, prenez en considération
qu'une punition pour votre site par les moteurs de recherche est très probable dans ce
cas de figure.
Il se peut que vous violiez les recommandations par les moteurs de recherche sans le
savoir car il existe une zone grise dont les frontières sont passablement brumeuses.
Les moteurs de recherche sont conscients des stratégies existantes, mais ne peuvent
pas connaître vos intentions.
De plus, si votre unique but est simplement d'augmenter le nombre de visiteurs de
votre site, il existe des moyens comme le PPC dont vous n'aurez pas à craindre
d'inconvénient en les appliquant.
Search Engine Optmization
Nicolas MESSER
52/102
Même si les moteurs de recherche n'ont pas pu découvrir votre intention, vos
concurrents ou des webmasters malveillants ont la possibilité de vous dénoncer à tout
moment.
Figure 2-16. Formulaire pour annoncer du spam à Google33
Et une fois attrapé, il est dit difficile de regagner la confiance des moteurs de
recherche. Garder donc la distance des stratégies artificielles pour avoir le moins de
risques et le plus de résultats possibles sur le long terme.
33
Google Webmaster Tools. Spam report http://bit.ly/spam-report
Search Engine Optmization
Nicolas MESSER
53/102
Partie 3 : Le suivi et l'évaluation des résultats
Un des plus grands défis dans le suivi et l'évaluation des efforts d'optimisation est le
délai important entre l'implémentation et le recueil des résultats. En général, les
premiers résultats peuvent être visibles environs 24h plus tard, mais pour avoir une
collection pertinente de données utilisables, des semaines ou même des mois sont
nécessaires.
Mais certains des outils peuvent être utilisés dès le début pour contrôler le travail de
base pour l'optimisation d'un site web.
En fait, les moteurs de recherche sont les outils les plus basiques à disposition des
spécialistes du référencement. La majorité des moteurs disposent d'une boîte à outil
riche qui permet de réaliser des recherches avancées, faire des interprétations et
procéder à des analyses des concurrents. Nous allons découvrir les commandes mises
à disposition par Google et d'autres outils plus avancés en plus de détails dans le
chapitre inutile "Comment suivre les stratégies mise en place".
Google favorise l'affichage de contenus divers dans les SERPs grâce à une méthode
appelée "Query Derserves Diversity (QDD)"34. On peut anticiper de cela que pour avoir
des bons résultats, spécialement chez Google, il faudra un travail plus conséquent. Le
terme anglais souvent utilisé en rapport pour ce genre de travail est "Reputation
Management ou Branding".
Le suivi de la réputation de sa marque, peut donc représenter une autre partie
importante du suivi de l'optimisation. Si tout a bien fonctionné, vos efforts d'optimisation
auront attribué une plus grande attention à votre marque sur le web. En même temps
que cela peut être positif et exactement ce que vous avez voulu, cela a certainement
aussi attiré l'attention de ceux qui vous aiment un peu moins. Il se peut donc qu'en
même temps que l'intérêt pour votre entreprise est devenu plus importante, les voix
négatives se soient multipliées de leur côté.
Pour l'identité de votre entreprise, il est critique de trouver ces résultats, et une fois
identifiés de les traiter avec prudence et certitude. Des exemples dans le passé ont
montré deux scénarios. Celui où l'absence d'une réaction adaptée a eu un impact
énorme sur la réputation de l'entreprise en question.
34
SEOmoz, Rand Fishkin. Does "Query Deservse Diversity" Algorithm Exist at Google?
http://bit.ly/query-diversity (consulté le 26.06.2010)
Search Engine Optmization
Nicolas MESSER
54/102
Ou alors l'inverse ou la perception et l'image de l'organisation se sont améliorées chez
le grand public grâce à une réaction à temps et appropriée.
L'exemple par excellence vient de l'entreprise américaine Blendtec avec leur
campagne "Will it blend"
35
qui est même apparu dans le Bloomberg Business Week.
36
Chapitre 1 : Comment suivre les stratégies mises en place
Google et les moteurs de recherche en général disposent d'une boîte à outils riche qui
est accessible à tout le monde et permet de réaliser plusieurs tâches de base dans le
suivi des stratégies d'optimisation. Je ne présenterai ici qu'une poignée de ces
commandes en détails, mais vous retrouvez une liste complète avec les commandes
les plus importantes dans la partie annexe de ce mémoire.
Dans la plupart des projets, vous disposerez d'une idée du nombre de pages que
comporte le site web. Il est donc très utile de savoir si vos efforts pour faciliter
l'indexation de ces pages par les spiders des moteurs de recherche ont rencontré du
succès.
La commande (site:) peut vous donner une valeur approximative du nombre de
pages qui ont été indexées par les spiders de Google.
Dans l'exemple du site de la HEG, cette requête retourne 1'450 pages. Il faut prendre
en considération que cette commande retourne également les fichiers comme des
PDFs qui peuvent également être indexés par les spiders des moteurs de recherche
s'ils sont références dans une page par un lien textuel.
Cela représente également une opportunité de vérifier si vos instructions du fichier
robots.txt sont bien appliquées. Si par exemple vous avez décidé de bloquer une
certaine partie de votre site web et vous retrouvez une page appartenant à cette partie
dans ces résultats, il y a certainement un problème avec les instructions ou le fichier
robots.txt de votre site.
35
Portail "Will it blend" (http://bit.ly/will-blend)
36
Bloomberg Businessweek, Rachael King. Business Goes Straight to Video (http://bit.ly/bbwblend)
Search Engine Optmization
Nicolas MESSER
55/102
Si vous aimeriez savoir qui utilise un certain mot-clé, à priori les vôtres, dans son URL
ou comme titre pour ses pages, les commandes (inurl:) et (allinrul:) ou alors (intitle:) et
(allintitle:) vous fourniront les réponses désirées.
Cette requête nous retourne environs 66'000 résultats. Mais dans le cas de la HEG
cela n'est pas très représentatif car l'acronyme semble être utilisé dans une variété de
domaines qui n'ont rien en commun avec la formation universitaire. Il serait donc plus
adapté d'utiliser la combinaison de plusieurs mots-clés.
Nous notons l'utilisation du mot-clé "geneve" sans accent car pourtant aujourd'hui il est
possible d'enregistrer des noms de domaines avec des combinaisons de chiffres et
lettres accentuées, cela n'est pas encore très répandu sur le net aussi à cause de la
langue dominante qui est l'anglais. De même est vrai pour les majuscules. Ceci est
pourtant plus utilisé, mais les moteurs de recherche ne sont généralement pas
sensibles à la case pour le cas des URLs. Dans les deux cas évoqués, des différences
plus ou moins importantes sont possible, dans les résultats obtenus qui dépendent de
la région de l'internaute ou de la langue appliquée au terme recherché.
Cette deuxième requête retourne environs 1'690 résultats et on constate qu'en général
les résultats retournés semblent être plus pertinents pour retrouver des liens
référençant le site de la HEG.
Dans le cas des deux dernières commandes qui font la recherche à partir du titre de la
page, on peut observer le même phénomène. La première version de la requête
retourne un nombre beaucoup moins important. Cela est certainement dû à l'effet que,
dans ce deuxième cas l'orthographe joue un rôle et donc le terme "heg geneve" ne
retournera pas le même résultat que le terme "heg genève" que j'ai employé dans cet
exemple.
Search Engine Optmization
Nicolas MESSER
56/102
Même si la précédente méthode vous permet de découvrir des liens vers votre site, il
existe une méthode plus efficace pour avoir une idée sur le nombre de lien par la
commande (inanchor:) et (allinanchor:).
De nouveau la première requête nous retourne le nombre énorme d'environ 1'020'000
résultats ce qui ne semble pas être réaliste dans le cas de la HEG. La deuxième
version de la requête semble plus pertinente en analysant les résultats retournés et le
nombre d'environ 11'200 résultats.
Comme dans le cas de la recherche dans les titres des pages, l'orthographe a une
influence sur le nombre de résultats retournés et les résultats peuvent dépendre
fortement de la langue appliquée au(x) mot(s)-clé(s) recherché(s).
Enfin, même avec toutes ces informations accessibles directement par l'interface des
moteurs de recherche, il est indispensable d'avoir un compte avec les outils pour les
webmasters chez les moteurs majeurs comme Google, Yahoo! et Bing.
Cela vous permettra d'accéder à une bonne partie de ces informations et d'autres qui
ne sont pas accessibles par l'interface du moteur de recherche sans devoir interroger
la requête à la main.
Search Engine Optmization
Nicolas MESSER
57/102
Figure 3-1. Aperçu du Dashboard de GWT
L'outil Google Webmaster Tool (GWT) permet d'accéder à une représentation visuelle
plus agréable de toutes des informations qu'on vient de voir précédemment ainsi que
des informations supplémentaires importantes.
Vous pouvez par exemple soumettre votre fichier sitemap en format XML et GWT vous
affichera le nombre de pages indexés.
Figure 3-2. Informations sitemap de GWT
Des informations importantes pour les webmasters qu'on n'a pas pu exploiter par les
commandes précédentes, sont les erreurs d'indexation. GWT vous informe si une de
vos pages n'a pas pu être indexée et le type d'erreur rencontré.
Figure 3-3. Erreurs d'indexation de GWT
Search Engine Optmization
Nicolas MESSER
58/102
Des autres outils encore plus spécialisés comme Google Analytics peuvent également
vous fournir toute sorte de données. Dans la suite, je vais vous présenter les plus
importantes qui méritent d'être suivies et analysées dès le début dans Analytics.
Figure 3-4. Aperçu du Dashboard de Google Analytics
Circulation par moteurs de recherche.
Ceci pourra vous permettre de découvrir d'éventuels problèmes avec un moteur
spécifique et/ou indiquer pour lequel des moteurs il faudra consacrer un peu plus de
temps dans le futur.
Figure 3-5. Aperçu de la circulation par moteurs de recherche
Search Engine Optmization
Nicolas MESSER
59/102
La circulation par mot-clé
Cela fournit les données essentielles pour améliorer votre visibilité auprès des moteurs
de recherche. Vous ne pouvez pas seulement vérifier si vos mots-clés choisis vous
fournissent le nombre de visiteurs souhaités, mais également découvrir des mots-clés
de la longue traîne omis dans votre sélection.
Figure 3-6. Aperçu de la circulation par mot-clé
L'utilisation des outils d'analyse en général semble plutôt être difficile par le fait qu'ils
fournissent plus d'informations qu'on a effectivement besoin. Par contre l'importance
d'avoir accès à un tel outil est grande, car c'est avec ces informations qu'on sera
capable de faire des adaptations aux stratégies et continuer à améliorer son
positionnement.
Search Engine Optmization
Nicolas MESSER
60/102
Chapitre 2 : ROI dans l'optimisation pour les moteurs de
recherche
Si vous vous êtes déjà un peu occupé des logiciels d'analyse, souvent installés par
défaut avec les offres d'hébergement, ou si vous avez déjà eu l'occasion de voir
l'interface d'un outils proposé par les moteurs de recherche comme Google Analytics,
vous avez certainement observé qu'il y a un nombre de données presque infini.
Je dirais même qu'il y a probablement trop de données pour le suivi d'un site de taille
moyenne. Il est donc important de savoir lesquelles de ces données méritent d'être
analysées et lesquelles vous pouvez ignorer avec bonne conscience (en tout cas au
début de vos efforts d'optimisation).
Indicateur : nombre de visiteurs
Le nombre de visiteurs et visiteurs uniques de votre site vous permettra de voir si vos
efforts attire des nouveaux visiteurs ou si ce sont toujours les mêmes qui viennent sur
votre site. Cela ne veut pas dire que d'avoir des visiteurs fidèles est une mauvaise,
mais l'objectif ultime de l'optimisation est de conduire le plus de clients potentiels vers
votre site. La fidélisation de ces derniers est certainement à envisager, mais si votre
site se présente pertinent à leurs recherches et offre du contenu intéressant cela est
souvent une conséquence explicite.
Indicateur : nombre de vues par pages
Le nombre de vues par pages est une autre métrique importante. Avec ces données
vous pourrez analyser quelles pages intéressent vos visiteurs et adapter votre contenu
à leur goût.
De même si vous vendez vos biens ou services en ligne vous pourriez calculer un vrai
ROI en fonction du nombre de vue d'une page, ce qui devrait inciter le visiteur à
acheter un bien ou service par le nombre de commandes effectuées.
Exemple calcul rendement pour la HEG
Dans le cas de la HEG, on pourrait par exemple suivre le nombre de vue de la page
contenant le bulletin d'inscription (ou même le nombre de téléchargement de ce
dernier) par rapport au nombre de dossiers effectivement reçus.
Search Engine Optmization
Nicolas MESSER
61/102
Google Analytics permet de faire ceci et le lien du fichier d'inscription qui actuellement
a le mark-up suivant:
<a
class="link-pdf"
target="_blank"
title="document
pdf"
href="doc/ckd12_06_bulletin_inscription.pdf">Bulletin
d’inscription</a>
aura plutôt un mark-up qui correspond au suivant:
<a
class="link-pdf"
d'inscription
à
target="_blank"
la
title="Bulletin
HEG"
href="
doc/ckd12_06_bulletin_inscription.pdf
"
onClick="javascript:
pageTracker._trackPageview('/fichiers/bulletininscription'); "> Bulletin d’inscription</a>
Ceci enregistrerait une vue pour la page /fichiers/bulletin-inscriptions dans l'interface
de Google Analytics à chaque click (égal à un téléchargement) du fichier d'inscription.
Chapitre 3 : Evaluer à quelle fin ?
La difficulté de définir et calculer un ROI dans le monde du référencement est que très
souvent les seules informations que vous avez à disposition sont des chiffres comme
le nombre de visiteurs par jour ou la durée moyenne d'une visite sur votre site. Il est
très difficile de quantifier ce type de données et de leurs attribuer une valeur.
Si vous tenez à jour un blog sur votre site où vos visiteurs peuvent laisser des
commentaires ou si vous disposez d'un formulaire de contact, vous disposeriez au
moins d'un nombre total d'interactions par jour ou mois. Ce type de données vous
permettra déjà de faire des conclusions plus précises sur la valeur de votre site.
Et si en plus, vous proposez vos biens ou services directement dans une boutique en
ligne, vous pourrez réaliser des évaluations du ROI beaucoup plus précises.
De ceci on peut déduire cinq indicateurs principaux qui pourront vous aider à calculer
un ROI. Ce sont la portée, la fréquence des visites, la sphère d'influence, les
conversions (transactions effectuées) et la persistance.
Search Engine Optmization
Nicolas MESSER
62/102
Si en prend on considération une approche d'évaluation d'objective souvent utilisé
dans le marketing traditionnel ou en gestion de projet, l'acronyme mnémotechnique
SMART (spécifique, mesurable, atteignable, réaliste, temporellement défini) vient en
tête.
Je pense que cela montre très clairement que pour calculer le ROI dans le monde du
référencement on ne peut généralement pas suivre des moyens de calcul connus.
Chacun doit trouver et définir ses propres indicateurs qui vont permettre d'avoir une
idée sur le ROI et de suivre les progrès.
Conclusion (partie 3)
Vous ne verrez pas de résultats le lendemain de votre travail, mais la patience et un
engagement sur long terme est garant pour une amélioration de votre situation.
Les outils d'analyse peuvent vous fournir un nombre de données précieuses dans le
processus d'optimisation. De connaître et savoir utiliser ces outils peut vous aider à
améliorer vos pages pour atteindre un meilleur positionnement dans les SERPs.
Mais il ne faudra pas oublier que les moteurs de recherche et spécialement Google
sont connus pour changer et améliorer leurs algorithmes en permanence ce qui peut
contribuer à de petits changements réguliers des résultats. Il est donc important
qu'avec le temps vous soyez capable d'identifier et cibler ces changements car ils n'ont
aucune importance du point vu d'optimisation.
Search Engine Optmization
Nicolas MESSER
63/102
Partie 4 : L'influence des médias sociaux
Aujourd'hui, la quantité des méthodes par lesquelles il est possible de favoriser son
référencement est quasi infinie, et les médias sociaux sont pour une bonne partie la
source de ce phénomène.
Le terme médias/réseaux sociaux décrit les sites web qui réunissent des internautes
de la même culture ou d'intérêts communs. Le concept général des médias sociaux est
d'utiliser ces différents canaux de communication pour faire du marketing direct aux
endroits où se trouve votre public cible.
Tout ceci pointe dans la direction du management de la réputation et peut apporter du
bénéfice à n'importe quelle entreprise.
Avez-vous déjà recherché le nom de votre bien ou service sur Google? Savez-vous ce
que les clients disent sur vos biens ou services ou votre marque? Si oui, est-ce que
vous n'avez pas senti le désir de répondre à quelques remarques?
Il est bien connu que les mauvaises nouvelles sont souvent plus rapidement partagées
et font plus de bruits que des éloges. Avec les médias sociaux vous disposez d'un
moyen de communication rapide et directe pour atteindre la communauté autour de
votre marque et la possibilité de l'influencer en votre faveur.
Les gens partageront leurs opinions peu importe si vous décidez de participer à ce
dialogue ou pas. Et en même temps, cela vous permettra d'atteindre des groupes que
vous n'auriez pas pu atteindre par les canaux de communication traditionnelle.
Search Engine Optmization
Nicolas MESSER
64/102
L'utilisation efficace des médias sociaux représente presque un travail spécialisé en
plus de l'optimisation. L'idée n'est pas seulement d'augmenter sa visibilité, mais de
construire des stratégies de marketing viral* qui ont subi un changement profond avec
l'évolution de l'Internet.
Figure 4-1. Le principe du marketing viral
Search Engine Optmization
Nicolas MESSER
65/102
Chapitre 1 : Aperçu des médias sociaux populaires
Facebook
Sans doute le réseau social le plus connu pour toutes sortes d'activités aujourd'hui est
Facebook. Et clairement dans le contexte de la HEG ce réseau représente une
plateforme indispensable pour entrer en contact avec les jeunes d'aujourd'hui qui
fréquentent très fortement ce média.
Figure 4-2. Site de la HEG sur Facebook
Twitter
Twitter est le leader dans l'émission des messages de textes, également appelé microblogging. Aujourd'hui beaucoup d'entreprises utilisent ce média pour une sorte de
service client, non seulement avec le but d'être plus proche de la clientèle, mais de
pouvoir réagir plus rapidement sur des voix critiques.
Un exemple de ce type de service client d'une entreprise Suisse est les CFF37. En fait,
j'ai fait l'expérience moi-même une fois après avoir envoyé un message que mon train
avait du retard dans lequel j'avais annoncé de ne pas savoir si j'allais pouvoir prendre
mon train de correspondance à Zurich.
37
CFF. @railservice sur Twitter. http://twitter.com/railservice
Search Engine Optmization
Nicolas MESSER
66/102
Figure 4-3. Réaction de la CFF sur Twitter
LinkedIn
LinkedIn est le leader pour connecter les professionnels. L'orientation business de ce
média est probablement la source d'une particularité pour ce réseau social en
proposant des niveaux de comptes d'utilisateurs différents sur cotisation mensuelle.
Figure 4-4. Profile de la HEG chez LinkedIn
Ce ne sont pas les fonctionnalités qui changent quand on est d'accord de payer une
cotisation, mais le compte utilisateur aura moins de restriction pour entrer en contact
avec d'autres utilisateurs. C'est comparable avec le principe d'une loge VIP lors d'un
congrès où il serait probablement plus facile de contacter certaines personnalités.
Search Engine Optmization
Nicolas MESSER
67/102
Wikipedia
La HEG dispose également d'une entrée chez Wikipedia qui est une source souvent
utilisée par les internautes pour retrouver des informations. Le problème qui se pose
avec Wikipedia est que n'importe qui peut y faire des changements et donc fausser
l'information disponible.
Figure 4-5. Page Wikipedia de la HEG
Autres services sociaux
Digg ou encore Delicious sont des endroits où vous pouvez partager vos favoris avec
le monde. Et bien sûr YouTube qui a déjà produit des stars d'Internet par la diffusion et
le partage de vidéos.
Chapitre 2 : Quel gain apporté par les médias sociaux?
Les médias sociaux sont avant tout un moyen de mettre en avant son contenu et
augmenter sa popularité. Et même si pour la plupart des ces services les liens ne sont
actuellement pas comptabilisés par les moteurs de recherche, ils apparaissent dans
les SERPs et sont sûr de vous amener des visiteurs.
C'est le point souvent révélé par les experts du domaine des médias sociaux, que ce
sont finalement souvent ces services populaires qui recevront la référence (le vote) par
un lien et non le site original. Donc l'amélioration de la visibilité chez les moteurs de
recherche n'est pas transmise directement à votre site.
Search Engine Optmization
Nicolas MESSER
68/102
Par contre, vos profiles chez les médias sociaux ont une forte chance d'être très bien
placé dans les SERPs. Ceci est en partie dû à l'introduction de la recherche universelle
dont nous allons parler dans la partie suivante de ce mémoire. Et donc un lien sur votre
profil pourra quand même rapporter indirectement plus de visibilité à votre site.
Figure 4-6. Résultats Facebook et LinkedIn chez Google pour la HEG
De plus, un outil comme Twitter ou un blog vous permettra de réagir et publier plus
rapidement vos réactions à des événements comme nous l'avons vu dans l'exemple du
chapitre précédent. Pour une fois le silence n'est pas d'or. Dans l'ère de l'Internet on
attend de vous un communiqué officiel plutôt aujourd'hui que demain.
Le laboratoire des Technologies et l'Information (LTI) dispose d'un blog38 qui reprend
le design du site de la HEG, mais qui n'est malheureusement pas mentionné sur la
page d'accueil de la HEG.
Conclusion (partie 4)
Dans le monde d'aujourd'hui les gens que vous aimeriez atteindre utilisent presque un
nombre illimité des médias sociaux. C'est un environnement beaucoup plus complexe
que les concepts utilisés dans les campagnes marketing traditionnelles.
Développer et mettre en place des stratégies pour ces services nécessite parfois un
investissement financier et peut prendre beaucoup de temps avant qu'on devienne un
membre de confiance dans une communauté. Mais si ces stratégies sont bien
implémentées et accueillies par les membres de la communauté, le bénéfice peut être
plus grand que prévu au départ.
Il faut voir l'utilisation et le marketing par les médias sociaux comme une forme de
relations publique moderne. Vous pouvez atteindre plusieurs objectifs par les médias
38
Centre des Technologies et de l'Information. Le blog du LTI http://bit.ly/blog-lti
Search Engine Optmization
Nicolas MESSER
69/102
sociaux de la simple croissance des visiteurs sur votre site à l'augmentation des ventes
de vos biens et services.
Même si ces outils sont certainement plus faciles à gérer que le référencement, le
temps est également un facteur important. Créer et soigner une relation avec les
milliers de personnes présentes sur les médias sociaux, ainsi que participer activement
à l'interaction peut occuper une personne à plein temps.
Ce phénomène a donc donné naissance à un nouveau métier dans les grandes
entreprises qui est souvent connu sous le nom "Community Manager"39. Cette
personne est une voix officielle
40
de l'entreprise qui est en contact direct avec vos
clients, actionnaires ou tout simplement les membres des communautés dans
lesquelles vous êtes actif.
Les médias sociaux ont pris même un rôle tellement important qu'il y a des spécialistes
des deux domaines, référencement et médias sociaux, qui disent que l'ère où les
classements des moteurs de recherche se font uniquement par un calcul purement
algorithmique est finie. L'intégration des résultats en temps réel
41
fournit par les médias
sociaux montrait la prise en compte du comportement des internautes.
39
WebWorkerDaily, Dawn Foster. Online Community Manager: Yes, It's Really A Job.
http://bit.ly/com-man (consulté le 26.06.2010)
40
Chris Brogan. Essentials Skills of a Community Manager http://bit.ly/community-skills
(consulté le 26.06.2010)
41
Official Google Blog. Relevance meets the real-time web. http://bit.ly/real-search (consulté le
26.06.2010)
Search Engine Optmization
Nicolas MESSER
70/102
Partie 5 : Le future de l'optimisation
Le rôle des moteurs de recherche ne changera certainement pas avec l'évolution de
technologies dans les années à venir. Mais les différentes méthodes d'optimisation à
disposition vont grandir avec ces évolutions. A quel moment ces différentes évolutions
techniques seront introduites est difficile à dire, mais de commencer à connaître la
direction et comprendre les concepts pour ne pas être perdu quand le feu vert sera
donné est indispensable.
Chapitre 1 : La recherche universelle
En mai 2007, Google a introduit
42
la notion "Universal Search" qui a été repris par les
autres moteurs de recherche peu après, ce qui a donné naissance au concept de
"Blended Search". Aujourd'hui ce phénomène est connu comme recherche vertical
chez la majorité des moteurs de recherche.
Le changement principal apporté était l'affichage d'autres types de résultats comme
des photos et vidéos et pas simplement les liens les plus pertinents sur le web, qui
sont maintenant appelés les "10 blue links". Ceci montre clairement l'effort des moteurs
de recherche d'afficher des résultats de plus en plus ciblés et pertinents.
Cette évolution a eu une influence sur les résultats des études avec les outils "eyetracking" mentionné dans le 3ème chapitre de la 1ère partie du mémoire. Les zones du
"heat-map" obtenu ont souffert d'un effet de désassemblage autour des différents
médias supplémentaires proposés dans les SERPs.
42
Search Engine Land, Danny Sullivan. Google 2.0:
http://selnd.com/google-universal (consulté le 26.06.2010)
Search Engine Optmization
Nicolas MESSER
Google
Universal
Search
71/102
Figure 5-1. Représentation visuelle du principe "Universal Search"
L'influence de ce changement sur les résultats montre l'importance des SERPs en vue
de l'amélioration de cette façon d'afficher des résultats. Dans le futur les internautes
retrouveront plus de choix sur les SERPs pour accéder au contenu d'un site web.
Search Engine Optmization
Nicolas MESSER
72/102
L'affichage de ces résultats verticaux se fait soit en début de la page, soit entre les
premiers liens affichés. Par conséquence les détenteurs de sites web doivent se
rendre compte que pour un même mot-clé leur positionnement pourrait se dégrader.
On pourrait très bien occuper la meilleure place dans l’énumération des résultats et ne
plus se retrouver au début de la page de recherche. Mais ceci représente en même
temps une opportunité, si on fait usage des ces types de médias.
Sachant que des liens référençant des vidéos sont également intégrés dans les
SERPs par ce changement, il est important de savoir que d'après ComScore,43
YouTube est devenu le deuxième plus grand moteur de recherche en août 2008. Ces
chiffres ont été relevés pour les Etats-Unis, mais sont certainement généralement
applicables si on considère l'énorme popularité de YouTube.
Et il paraît logique que cette tendance de fournier plus de résultats divers continuera
dans le futur et des nouvelles technologies seront probablement intégrées dans les
SERPs par la recherche universelle.
Chapitre 2 : Nouvelles technologies à venir et connaître
SearchWiki – la recherche personnalisée
Encore une nouveauté chez Google appelée SearchWiki
44
qui fait controverse dans le
monde de l'optimisation. SearchWiki permet aux utilisateurs qui détiennent un compte
utilisateur chez Google de personnaliser leurs résultats de recherches, donner un vote
d'appréciation à un résultat individuel ou encore de faires des commentaires.
43
TG Daily, Joshua Hill. YouTube surpasses Yahoo as world's #2 search engine http://bit.ly/tgdaily (consulté le 29.05.2010)
44
Official Google Blog. SearchWiki: make search your own http://bit.ly/search-wiki (consulté le
29.05.2010)
Search Engine Optmization
Nicolas MESSER
73/102
Ceci est une problématique qui est sujette à caution pour les spécialistes du domaine
car cette influence pourrait faire que plusieurs personnes obtiennent des résultats
totalement différents pour un même mot-clé indépendant de la région ou de la langue
employé par l'internaute.
L'interprétation du Flash
Une technologie très répandue sur le net est le Flash. De manière générale les
moteurs de recherche ne sont pas capables d'interpréter les fichiers flash. Mais ceci
est en train de changer car en juin 2008 Google a annoncé qu'ils sont capables
d'extraire au moins une partie de l'information contenu dans les fichiers flash45.
OCR – La reconnaissance optique de caractères
Un autre souci dans le passé a été les images. Même si les moteurs sont capables
d'interpréter le thème de l'image par le texte autour et son texte alternatif
correspondant, souvent il se trouvait que l'image contenait une partie texte qui n'a pas
pu être exploré par les spiders des moteurs. Ceci changera certainement dans le futur
car les moteurs de recherche ont commencé des premières expérimentations avec des
technologies de reconnaissance de caractère connu sous le nom de OCR (Optical
46
Character Recognition) .
Les microformats
47
Les microformats , également connu sous le nom "rich snippets", sont une autre
technologie à maîtriser dans le futur. Ce n'est pas une nouvelle technologie car elle
existe déjà depuis un certain temps, sans avoir été vraiment exploitée à nos jours.
45
Google Webmaster Central. Flash and other rich media files http://bit.ly/google-flash
(consulté le 29.05.2010)
46
Wikipedia. Reconnaissance optique de caractères http://bit.ly/wiki-ocr
47
Microformats http://bit.ly/rich-snippets
Search Engine Optmization
Nicolas MESSER
74/102
Le site de la HEG utilise le microformat hCard pour l'adresse de l'école dans la partie
footer.
Figure 5-2. Application du microformat hCard
Pourtant un élément important de ce microformat, le champ "fn" semble manquer dans
cette déclaration. Ceci et d'autres erreurs peuvent être évité en utilisant un créateur
automatique proposé par le site des microformats.
48
L'importance et l'impact de ce format semble toujours être contesté dans le monde de
l'optimisation, mais avec l'intégration de ceux-ci dans les résultats des moteurs de
recherche certainement une technologie à connaître. De plus les trois spécialistes que
j'ai questionnés pour ce mémoire, accordent une grande efficacité à l'utilisation des
microformats pour l'optimisation.
48
Créateur du microformat hCard (http://bit.ly/hcard-creator)
Search Engine Optmization
Nicolas MESSER
75/102
Il y a certainement des autres technologies qui sont sur la voie montante, mais celles
qu'on vient de voir sont les plus utilisées actuellement.
La performance des sites web, temps de chargement, taux de rebond,
deviendrons de nouveaux critères de positionnement dans les SERP's. – David
Degrelle
Chapitre 3 : Le monde mobile
Avec l'explosion des "Smartphones" et surtout par le boom de l'iPhone l'utilisation de
l'Internet à partir de ces gadgets a connu une croissance rapide. Et c'est vrai aussi
pour les recherches effectuées par les internautes sur ces gadgets. Google propose
déjà une page et application mobile et beaucoup d'organisations ont compris
l'importance d'avoir un site optimisé pour ces outils mobile.
Dans le cas de la HEG, il n'existe pas de site optimisé pour les browsers mobiles.
Même si ce n’est pas impossible, il est plutôt difficile de naviguer sur le site par un
browser mobile.
Un bon exemple à mon avis pour un site optimisé pour les browsers mobiles est le site
des Transport publics genevois (TPG) qui permet d'accéder à toutes les informations
nécessaires quand on est sur la route.
Search Engine Optmization
Nicolas MESSER
76/102
Figure 5-3. Comparaison accès mobile entre les sites de la HEG et TPG
Pourtant la HEG n'a peut-être pas un besoin urgent d'avoir un site mobile les
statistiques et les tendances attendues pour l'utilisation du web mobile font croire que
cela est un point indispensable dans un futur proche, pour tous ceux qui disposent d'un
site web.49
49
GIGAOM, Mathew Ingram. Mary Meeker: Mobile Internet Will Soon Overtake Fixed Internet
http://bit.ly/mobile-web (consulté le 26.06.2010)
Search Engine Optmization
Nicolas MESSER
77/102
Conclusion (partie 5)
L'importance des moteurs de recherche ne devrait pas changer dans le futur. Le
contraire sera certainement le cas. Chaque jour le nombre d'informations accessible
sur l'Internet augmente et par ce fait, il devient toujours plus difficile de trouver
l'information qu'on cherche.
On fait donc tous confiance à Google (ou à un autre moteur de recherche) de nous
retourner les résultats les plus pertinents et de nous guider dans l'infinitude de la toile.
Même l'évolution des technologies ne pourrait pas changer ce comportement. Mais elle
va influencer la façon dont nous allons effectuer nos recherches.
Le monde devient de plus en plus mobile et l'Internet a pris place dans la poche des
internautes. Aujourd'hui il est possible de faire une recherche peu importe si on se
trouve à la maison devant son ordinateur ou sur la terrasse d'un café en ville.
Search Engine Optmization
Nicolas MESSER
78/102
Conclusion
Le monde de l'optimisation pour les moteurs de recherche n'a pas connu de révolution,
mais il est en constante évolution! On ne parle pas non plus d'une science exacte,
mais d'un domaine que certains diraient empirique avec la suprématie de Google, où
seuls le test de concepts et l'expérience permettent d'avancer.
La réalité est que l'optimisation pour les moteurs de recherche est un sujet vaste et
complexe et l'opportunité d'apprendre de nouveaux concepts et stratégies ne s'arrêtera
jamais. Mais avec l'information en abondance disponible sur ce sujet, il est également
important qu'on apprenne à filtrer et analyser ce flux d'informations.
De multiples théories et recherches existent et on peut en conclure des avis différents
dans ce monde en changement permanent. Pourtant quelques points sur lesquels tout
le monde semble être d'accord existent après tout et ceux-là ne sont pas négligeables.
Google est l'acteur principal du marché de recherche. Tous vos efforts d'optimisation
n'auraient probablement peu de valeur sans l'existence de Google. La dominance de
Google est souligné par le fait que le verbe anglais "to google" (et également souvent
utilisé dans les autres langues) fait partie du dictionnaire officiel aujourd'hui et il est
donc considéré comme un vrai mot.
Les moteurs de recherche sont très populaires. Des millions d'internautes utilisent les
moteurs tous les jours partout dans le monde. Peu importe si c'est pour faire de
simples recherches ou pour chercher le meilleur tarif pour les prochaines vacances.
L'ère où les internautes ont fait des recherches grossières avec un simple mot-clé est
terminée. Les recherches deviennent de plus en plus spécifiques et par ce fait la
chaîne des mots-clés employés de plus en plus longue.
L'optimisation pour les moteurs de recherche est devenue un travail interdisciplinaire.
L'importance de l'optimisation pour les moteurs, en particulier pour les entreprises,
touche à plus que l'équipe du développement du site web. Ce n'est plus uniquement le
programmeur web qui code le site web dans son coin et l'entreprise qui espère pour le
mieux. Surtout pour les entreprises avec un but principalement lucratif, l'optimisation
du site web est un effort commun et ne s'arrêtera pas en ligne.
Search Engine Optmization
Nicolas MESSER
79/102
Et avec l'importance croissante d'apparaître en bonne position pour atteindre le
maximum de nouveaux clients potentiels, les spécialistes du domaine n'ont pas à
craindre de se retrouver sans travail dans le futur.
La maîtrise des médias sociaux est une exigence indispensable et en plus un facteur
de différenciation pour les référenceurs dans le futur.
La seule chose qu'on peut prédire pour le futur de l'optimisation est le changement
permanent des moteurs de recherche. La façon de rechercher est grandement
influencée par les tendances du net et seul un savoir-faire vif et à jour permettra de
rester de front avec les technologies et survivre à ces évolutions.
La véritable voie de réflexion pour l'avenir des stratégies d'optimisation est la création
de pages et du contenu optimisé et non pas l'utilisation des stratégies frauduleuses.
Les moteurs de recherche ont des méthodes de détection de plus en plus affinées et
ne vont pas hésiter à vous punir ou exclure de leurs indexes. Et comme on dit sur
Internet, "content is king!" – le contenu est le capital!
Peu importe si vous allez vous consacrer au référencement propre, aux médias
sociaux ou à une combinaison des deux, il faut toujours procéder aux manipulations
avec précaution pour ne pas nuire à vous même.
Search Engine Optmization
Nicolas MESSER
80/102
Bilan personnel
Arrivé à la fin de ce mémoire, je suis parfaitement conscient que certaines parties n’ont
pu être développées comme elles le méritaient.
Je m’aperçois qu’il me faudrait bien plus de pages ou presque un livre, pour pouvoir
développer d’autres points à côté de l'optimisation pour les résultats naturels et étudier
les outils proposés par les deux autres grands moteurs Yahoo! et Bing, pour que ce
thème du référencement soit complètement couvert.
Parmi les abandons que je regretterais le plus, figure l’aspect de l'interdisciplinarité de
ce sujet lequel je pense sera vraiment un garant de succès dans le futur de ce
domaine. C'est pour cette raison que j'aurai aimé m'attarder plus sur cette relation et
par exemple travailler avec un étudiant de la filière économie du côté marketing
traditionnel en faisant des comparaisons et des analyses des méthodes du
référencement qui s'imbriquent les uns dans les autres. Ainsi que la notion de retour
sur investissement qui n'est pas encore très évoluée dans le monde du référencement
qui pourrait être intéressant d'étudier plus et analyser les impacts d'une présence
optimisée sur Internet.
L'enjeu du mémoire est le fait qu'un des trois grands moteurs de recherche (Google,
Yahoo et Bing) pourrait apporter un changement majeur à son algorithme à n'importe
quel moment et une grande partie des informations dans ce mémoire pourront de ce
fait être obsolètes dans peu de temps.
L'enjeu personnel de ce mémoire se trouve dans le fait que l’optimisation pour les
moteurs de recherche à l’heure actuelle n’est pas une science exacte et il existe
beaucoup d’opinions différentes sur le "comment faire" et le "comment obtenir" les
meilleurs résultats. Par conséquence, on retrouve un grand nombre d’informations
diverses qui sont à étudier, trier et évaluer, dans le but d’avoir une documentation la
plus complète sur ce sujet. Et j'espère que mes recherches et réflexions m'ont permis
de faire les bons choix pour déposer un mémoire "complet" et de qualité.
En conclusion, j'espère que ce mémoire représentera une source fiable et "complète"
pour qui aimerait s'investir dans l’optimisation pour les moteurs de recherche et
renforcer sa présence de leur site sur Internet.
Search Engine Optmization
Nicolas MESSER
81/102
Bibliographie
Livres (monographie)
ANDRIEU, Olivier. Réussir son référencement web. 2e édition. Eyrolles, 2010. 442 p.
ENGE, Eric et al. The Art of SEO : Mastering Search Engine Optimization. O'Reilly,
2009. 574 p.
JERKOVIC, John I. SEO Warrior : Essential Techniques for Increasing Web Visibility,
O'Reilly, 2009. 470 p.
WEINBERG, Tamar. Social Media Marketing : Strategien für Twitter, Facebook & Co.
O'Reilly, 2010. 388 p.
Livres électroniques, e-books
Beginner's Guide to SEO. FISHKIN Rand, SEOmoz.org, 2005. 30 p. http://bit.ly/guideSEOmoz (consulté le 23.03.2010)
Guide de démarrage Google : Optmisation pour les moteurs de recherche. Version 1.1.
Google, 2008. 23 p. http://bit.ly/guide-google (consulté le 23.03.2010)
Le référencement naturel : évolution, intérêts et perspectives. Version 1.1. 1ère Position,
2005. 36 p. http://bit.ly/guide-position (consulté le 23.03.2010)
Livre blanc de la création de site web optimisé. LSFinteractive, Version 1.0 – 12 février
2008. 8 p. http://bit.ly/LSFinteractive (consulté le 23.03.2010)
New Features Relevant to Webmasters. Bing Webmaster Center Team, 2009. 24 p.
http://bit.ly/guide-bing (consulté le 23.03.2010)
Noms de domaines et référencement. AFNIC & Olivier Andrieu, Octobre 2007. 6 p.
http://bit.ly/AFNIC-Andrieu (consulté le 23.03.2010)
Référencement : la revanche du contenu. Dixit, 2007. 32 p. http://bit.ly/dixxit (consulté
le 23.03.2010)
Référencer son site internet : Comprendre les enjeux du référencement. Yann
KERVAREC, 2007. 45 p. http://bit.ly/yann-kervarec (consulté le 23.03.2010)
Sites web ou blogs
Apache Software Foundation. Apache Module mod_rewrite. http://bit.ly/mod-rewrite
(consulté le 29.05.2010)
BBC News. 'Miserable failure' links to Bush http://bit.ly/miserable-failure (consulté le
23.03.2010)
Bloomberg Businessweek, Rachael King. Business Goes Straight to Video
(http://bit.ly/bbw-blend)
Chris Brogan. Essentials Skills of a Community Manager http://bit.ly/community-skills
(consulté le 26.06.2010)
CERN. Le berceau du Web. http://bit.ly/berceau-Web (consulté le 15.05.2010)
Direct Media Traffic. Off Page Optimization VS On-Page Optimization http://bit.ly/offon-page (consulté le 22.06.2010)
Enquiro. Enquiro Develops Google's Golden Triangle. http://bit.ly/golden-triangle
(consulté le 29.05.2010)
Search Engine Optmization
Nicolas MESSER
82/102
GIGAOM, Mathew Ingram. Mary Meeker: Mobile Internet Will Soon Overtake Fixed
Internet http://bit.ly/mobile-web (consulté le 26.06.2010)
Google. Informations sur la socitété : Technologie Google http://bit.ly/technologiegoogle (consulté le 29.05.2010)
Google Blog. SearchWiki: make search your own http://bit.ly/search-wiki (consulté le
29.05.2010)
Google Blog. A spring metamorphosis : Google's new look http://bit.ly/google-2010
(consulté le 19.06.2010)
Google Blog. Relevance meets the real-time web. http://bit.ly/real-search (consulté le
26.06.2010)
Google Webmaster Blog. Using site speed in web search ranking http://bit.ly/googlespeed (consulté le 22.06.2010)
Google Webmaster Blog. Importance of link architecture. http://bit.ly/link-depth
(consulté le 23.06.2010)
Google Webmaster Central. Flash and other rich media files http://bit.ly/google-flash
(consulté le 29.05.2010)
Google Webmaster Central. Keyword stuffing. http://bit.ly/stuffing-keywords (consulté le
26.06.2010)
Google Webmaster Central. Hidden text and links. http://bit.ly/hidden-text (consulté le
26.06.2010)
Google Webmaster Central. Cloaking, sneaky JavaScript redirects, and doorway
pages. http://bit.ly/google-cloaking (consulté le 26.06.2010)
Google Webmaster Tools Help. Duplicate content. http://bit.ly/contenu-duplique
(consulté le 29.05.2010)
Google Webmaster Help YouTube Channel. How many search algorithm changes
were made in 2009? http://bit.ly/google-changes (consulté le 15.05.2010)
Joost de Valk. W3C Validation & SEO. http://bit.ly/w3c-validation-seo (consulté le
23.06.2010)
Mashable. Yahoo-Microsoft Search Deal : The Key Facts http://bit.ly/yahoo-microsoft
(consulté le 19.06.2010)
Matt Cutts. Straight from Google: What you need to know http://bit.ly/page-rank
(consulté le 29.05.2010)
Microsoft. URL Rewriting in ASP.NET. http://bit.ly/asp-rewrite (consulté le 29.05.2010)
Net Applications. Search Engine Market Share. http://bit.ly/market-share (consulté le
22.06.2010)
Robotstxt.org http://bit.ly/fichier-robots (consulté le 29.05.2010)
Search Engine Land. Google Kills Bush's Miserable Failure http://selnd.com/googlebomb (consulté le 29.05.2010)
Search Engine Land, Danny Sullivan. Google 2.0: Google Universal Search
http://selnd.com/google-universal (consulté le 26.06.2010)
Search Engine Journal, Ann Smarty. What's Most Effective for Geo Targeting?
http://bit.ly/geo-targeting (consulté le 21.06.2010)
Search Engine Journal, Ann Smarty. SEO Case Study : Dealing With Multi-Language
Countries Targeting http://bit.ly/multi-language (consulté le 21.06.2010)
Search Engine Optmization
Nicolas MESSER
83/102
SEOmoz, Rand Fishkin. White Hat Cloaking: It Exist. It's Permitted. It's Useful.
http://bit.ly/white-cloaking (consulté le 26.06.2010)
SEOmoz, Rand Fishkin. Does "Query Deservse Diversity" Algorithm Exist at Google?
http://bit.ly/query-diversity (consulté le 26.06.2010)
SEOmoz, Rand Fishkin et al. Search Engine Ranking Factors 2009 http://bit.ly/SEOmozsurvey (consulté le 22.05.2010)
Sitemaps.org. What are Sitemaps? http://bit.ly/sitemap-xml (consulté le 29.05.2010)
TG Daily, Joshua Hill. YouTube surpasses Yahoo as world's #2 search engine
http://bit.ly/tg-daily (consulté le 29.05.2010)
Trellian. Keyword and Search Engine Statistics. http://bit.ly/keyword-stats (consulté le
29.05.2010)
WebWorkerDaily, Dawn Foster. Online Community Manager: Yes, It's Really A Job.
http://bit.ly/com-man (consulté le 26.06.2010)
Wired, Chris Anderson. The Long Tail. http://bit.ly/the-long-tail (consulté le 29.05.2010)
Texte législatif
Art. 10 Ohand, RS 151.31 http://bit.ly/rs-art-10
Article d'une encyclopédie en ligne
Pay per click. In : Wikipedia http://bit.ly/liens-sponsorises (consulté le 20.06.2010)
Périodique / Article de périodique
Dye, K. SEO Attack : Website abuse for search engine optimisation. Network Security,
March 2008, p 4-6.
Malaga, R. A. 2008. Worst practices in search engine optimization. Commun. ACM 51,
12 (Dec. 2008), 147-150. DOI= http://doi.acm.org/10.1145/1409360.1409388
Noruzi, A. A Study of HTML Title Tag Ceation Behavio of Academic Web Sites, The
Journal of Academic Librarianships, Volume 33, Number 4, pages 501 – 506.
Actes de congrès (Proceedings)
Abhishek, V. and Hosanagar, K. 2007. Keyword generation for search engine
advertising using semantic similarity between terms. In Proceedings of the Ninth
international Conference on Electronic Commerce (Minneapolis, MN, USA, August 19 22, 2007). ICEC '07, vol. 258. ACM, New York, NY, 89-94. DOI=
http://doi.acm.org/10.1145/1282100.1282119
Cheng, Z., Gao, B., and Liu, T. 2010. Actively predicting diverse search intent from
user browsing behaviors. In Proceedings of the 19th international Conference on World
Wide Web (Raleigh, North Carolina, USA, April 26 - 30, 2010). WWW '10. ACM, New
York, NY, 221-230. DOI= http://doi.acm.org/10.1145/1772690.1772714
Dahiwale, P., Mokhade, A., and Raghuwanshi, M. M. 2010. Intelligent web crawler. In
Proceedings of the international Conference and Workshop on Emerging Trends in
Technology (Mumbai, Maharashtra, India, February 26 - 27, 2010). ICWET '10. ACM,
New York, NY, 613-617. DOI= http://doi.acm.org/10.1145/1741906.1742046
Freeman, R. T. 2007. Topological tree clustering of social network search results. In
Proceedings of the 8th international Conference on intelligent Data Engineering and
Automated Learning (Birmingham, UK, December 16 - 19, 2007). H. Yin, P. Tino, W.
Search Engine Optmization
Nicolas MESSER
84/102
Byrne, X. Yao, and E. Corchado, Eds. Lecture Notes In Computer Science. SpringerVerlag, Berlin, Heidelberg, 760-769.
Ghose, A. and Yang, S. 2008. Comparing performance metrics in organic search with
sponsored search advertising. In Proceedings of the 2nd international Workshop on
Data Mining and Audience intelligence For Advertising (Las Vegas, Nevada, August 24
24,
2008).
ADKDD
'08.
ACM,
New
York,
NY,
18-26.
DOI=
http://doi.acm.org/10.1145/1517472.1517475
You, G. and Hwang, S. 2007. Personalized ranking: a contextual ranking approach. In
Proceedings of the 2007 ACM Symposium on Applied Computing (Seoul, Korea,
March 11 - 15, 2007). SAC '07. ACM, New York, NY, 506-510. DOI=
http://doi.acm.org/10.1145/1244002.1244119
Wang, Y., Ma, M., Niu, Y., and Chen, H. 2007. Spam double-funnel: connecting web
spammers with advertisers. In Proceedings of the 16th international Conference on
World Wide Web (Banff, Alberta, Canada, May 08 - 12, 2007). WWW '07. ACM, New
York, NY, 291-300. DOI= http://doi.acm.org/10.1145/1242572.1242612
Cahier de recherche (technical report)
Höchstötter, N. and Lewandowski, D. What users see – Structures in search engine
results pages. In Information Sciences 179, 1796 – 1812. Elsevier.
DOI:10.1016/j.ins.2009.01.028
Skiera, B. et al. An analysis of the importance of the long tail in search engine
marketing. Electron. Comm. Res. Appl. (2010), DOI:10.1016/j.elerap.2010.05.001
Zhang, J. and Dimitroff, A. 2005. The impact of webpage content characteristics on
webpage visibility in search engine results (Part 1). In Information Processing and
Management 41, 665 – 690. Elsevier. DOI:10.1016/j.ipm.2003.12.001
Zhang, J. and Dimitroff, A. 2005. The impact of metadata implémentation on webpage
visibility in search engine results (Part II). In Information Processing and Management
41, 691 – 715. Elsevier. DOI:10.1016/j.ipm.2003.13.002
Documents audiovisuels (Podcasts)
WebmasterRadio.FM, Ross Dunn et John Carcutt. SEO 101. http://bit.ly/wmr-101
WebmasterRadioFM, Daron Babin. SEO Rockstars. http://bit.ly/wmr-rockstars
Search Engine Optmization
Nicolas MESSER
85/102
Glossaire
Accessibilité : L'accessibilité d'un site web désigne le respect d'un certain nombre de
critères techniques (définis par le W3C) destinés à faciliter l'accès du site aux
personnes porteuses de handicap.
Analyse d'audience / Web Analytics : Les outils d'analyse d'audience mesurent le
trafic sur un site web et fournissent de nombreux indicateurs: origine du trafic, pages
vues, requêtes saisies …
Balises méta : Le HTML est constitué de balises, permettant, par exemple de définir
un titre pour une page. Les balises méta sont des balises qui sont généralement
utilisées pur le référencement, en vue de définir le contenu d'une page, comme la
balise méta description oul les mots-clés associés à la page, comme la balise méta
keywords.
Black Hat : Ensemble des pratiques douteuses du référencement, parmi lesquelles le
spamdexing, le cloaking, etc.
Breadcrumb / File d'Ariane : Donne une indication à l’internaute de sa situation sur le
site.
Cloaking : Technique désormais bannie par les moteurs de recherche, le cloaking
("masquage") permet de fournir aux robots une page web "optimisé", différente de celle
proposé aux lecteurs humains.
Contenu viral / Marketing viral : Un moyen efficace d'obtenir spontanément des liens
entrants et consiste à mettre en œuvre des contenus de référence, inédits ou
polémique, susceptibles d'être relayés par des médias, des institutions ou la
blogospère.
Densité : Dans le texte d'une page web, l'indice de densité d'un terme désigne le
rapport entre l'occurrence de ce terme et le nombre total des mots.
Google Bombing : C’est une technique qui utilise le processus d’indexation de Google
pour influencer ses résultats de recherche. Google entre autres paramètres de mesure
base la pertinence de ses réponses sur le nombre et la présence des expressions
recherchées dans des sites et sur des hyperliens. Pour faire un bon Google bombing il
vous faut donc rallier à votre cause un maximum de webmasters qui positionneront sur
leur site des liens contenant une même expression vers la même page.
Search Engine Optmization
Nicolas MESSER
86/102
.htaccess : Fichier de configuration des serveurs web sous Apache utilisés pour
contrôler les droits d’accès des répertoires où ils sont positionnés ou pour créer des
redirections.
Importance : fait référence au poids relatif apporté par une citation comme on le
connaît du monde académique qui est dans ce cas un lien d'un autre site web. Ceci
permet de décider sur l'ordre dans les pages de résultats quand un mot-clé produit
plusieurs résultats pertinents.
Indexation : Inscription, par les robots d'un moteur, des pages d'un site dans sa base
de données (index). L'indexation est le préalable indispensable au positionnement des
pages. Une page non indexée ne peut pas apparaître dans les résultats des moteurs.
Lien entrant : Sur une page web donnée, est considéré comme "entrant" tout lien
provenant d'une autre page, qu'elle appartienne au même site (lien entrant interne) ou
à un autre (lien externe). Le nombre de liens entrants d'une page, et plus encore la
qualité des pages dont ils proviennent, sont utilisées par les moteurs pour en
déterminer la popularité et la pertinence.
Lien sponsorisé : Lien provenant d'un achat de mot-clé auprès d'un moteur de
recherche, et qui apparaît dans une zone spécifique de la page des résultats.
Long Tail / Longue traîne : Est une notion statistique qui apparait dans les
distributions. La traîne symbolise l’amortissement de la courbe de Gauss des
répartitions statistiques. Appliquée au référencement elle met par exemple en évidence
qu’il ne faut pas négliger de nombreux mots-clés générant chacun une seule visite au
détriment d’un seul générant beaucoup de visites. La somme des mots faibles étant
supérieure à un mot fort.
Link Building / Linkbaiting : Ensemble des actions visant à obtenir des liens entrants
(échange, achat …).
Page
satellite
/
Doorway
pages
:
Optimisées
"mécaniquement"
pour
le
référencement, les pages satellites sont des pages web réservées aux robots (les
visiteurs humains sont automatiquement redirigés vers une autre page du site).
Destinées à améliorer de manière totalement artificielle le positionnement du site qui
les héberge, elles sont désormais bannies par les moteurs.
Search Engine Optmization
Nicolas MESSER
87/102
Popularité / PageRank : La popularité d'une page web est fonction du nombre de
liens pointant vers cette page, et de la propre popularité des pages dont ces liens
proviennent. C'est un critère déterminant, utilisé par les moteurs de recherche lors de
al détermination du positionnement d'une page dans leurs résultats. L'indice de
popularité le plus célèbre est celui de Google, baptisé PageRank.
Positionnement : Le positionnement d'une page web désigne son rang dans les
résultats des moteurs de recherche, lors de la saisie d'une requête spécifique.
Référencement naturel : Le référencement naturel est un ensemble de savoirs-faire
et de techniques visant à positionner efficacement et durablement une page internet
sur les bons mots-clés (c'est-à-dire sur les mots-clés correspondant à l'activité mais
aussi à la demande des internautes) et ce, dans les pages de résultats naturels
(organiques, c-à-d non sponsorisés) de l'ensemble des moteurs de recherche.
Relevance : Est le degré de pertinence des résultats retournés dans une recherche
par rapport à l'intention du mot-clé saisie par l'internaute.
Requête : Ensemble de termes saisis par l'internaute dans un moteur de recherche.
Longtemps cantonnées à un ou deux termes, les requêtes sont désormais de plus en
plus complexes, ce qui limite l'efficacité d'un référencement basé sur une simple liste
de mots-clés.
ROI : Abréviation pour Return On Investment. Dans les plus simples termes, le ROI est
un ratio permettant de mesurer l’argent perdu ou gagné dans une action de
communication ou encore la fabrication d’un produit, par rapport à la somme investie à
la base.
SEO : On regroupe sous le terme de Search Engine Optimization, ou référencement
naturel, les actions destinées à améliorer le positionnement d'un site dans les résultats
des moteurs de recherche.
SERP : Acronyme de l’anglais “Search Engine Result Page”. Ce sont les pages des
résultats sur un moteur de recherche.
Spider / Crawler / Robot : Un Bot est un robot au sens informatique du terme, c’est à
dire un programme développé pour analyser le contenu des pages Web, les classer,
les répertorier et les noter. Ce sont les bots qui renseignent les bases de données des
moteurs de recherche.
Search Engine Optmization
Nicolas MESSER
88/102
Tri par pertinence (système de ranking) : Est le processus qui consiste à classer
automatiquement les données de l'index de façon à ce que, suite à une interrogation,
les pages les plus pertinentes apparaissent en premier dans la liste des résultats. Le
but du classement est d'afficher dans les premières réponses les documents
répondant au mieux à la requête.
TrustRank : Ce terme déposé par Google désigne le résultat d'un algorithme destiné à
mesurer la crédibilité des pages web. Contrairement au PageRank, essentiellement
quantitatif, le TrustRank est qualitatif et privilégie les liens en provenance de sites
considérés comme faisant référence.
URL rewriting / Réécriture des URLs : Une technique consistant à réécrire les URLs
d'un site, pour qu'elles soient plus compréhensibles par les robots des moteurs de
recherche.
W3C : Abréviation pour World Wide Web Consortium. Organisation qui définie la
normalisation et donne des recommandations pour les standards de création de sites
web.
Web 2.0 : Concept aux contours flous, le Web 2.0 désigne une nouvelle génération
d'outils (flux RSS, blogs, …) et de pratiques (création d'espaces communautaires, …)
visant à centrer les fonctionnalités d'Internet sur ses utilisateurs. Parce qu'il offre une
conception radicalement nouvelle de la création et de la diffusion des contenus, les
Web 2.0 influence fortement les méthodes de référencement naturel.
White Hat : Ensemble des bonnes pratiques du référencement. Ce sont par exemple
les pratiques qui visent à augmenter la visibilité des informations de la page auprès
des spiders.
Search Engine Optmization
Nicolas MESSER
89/102
Annexes
Advanced Search Operators .......................................................................... 91 Charte de Qualité et de déontologie du métier de référenceur................... 94 Interview avec Véronique Murbach ............................................................... 97 Search Engine Optmization
Nicolas MESSER
90/102
Advanced Search Operators
Google advanced search operators
Operator
(site:)
Domain-restricted
search
Short description
Narrows a search to
(a) specific
domain(s)/directories
SEO application
Shows approximately
how many URLs are
indexed by Google
From a directory
Includes all subdomains
Shows sites of a
specific top-level
domain (TLD)
(inurl:)/(allin
Narrows the results to
url:)
documents containing
(a) search term(s) in
URL keyword
the URLs
restricted search
(intitle:)/(all
Restricts the results to
intitle:)
documents containing
(a) search term(s) in a
Title keyword
page title
restricted search
Restricts the results to
(inanchor:)/(al
documents containing
linanchor:)
(a) search term(s) in
the anchor text of
Anchor text keyword
backlinks pointing to a
restricted search
page
(intext:)
Restricts the results to
documents containing
Body text keyword (a) search term(s) in
restricted search
the body text of a page
Wildcard search
(Related:)
Similar URLs
search
Means “insert any
word here”
site:mit.edu/research/
site:google.com
site:org
Find web pages using intitle:seo intitle:company
your keyword in a page = allintitle:seo company
title
Find pages having the
inanchor:seo
most backlinks/the most
inanchor:company =
powerful backlinks with
allinanchor:seo company
the keyword in the
anchor text
Find pages containing
intext:seo
the most relevant/most
optimized body text
Search for a phrase
“partial match”
Shows related pages
by finding pages
linking to the site and
Evaluate how relevant
looking at what else
the site’s “neighbors”
they tend to link to
are
(i.e., “co-citation”);
usually 25 to 31 results
are shown.
Search Engine Optmization
Nicolas MESSER
site:www.google.com
Find web pages having inurl:seo inurl:company =
your keyword in a file
allinurl:seo company
path
A few possible
extensions/file types:
PDF (Adobe Portable
(ext:)/(filetyp
Document Format)
Narrows search results
e:)
HTML or .htm
to the pages that end
(Hypertext Markup
in a particular file
Language)
File type restricted extension
.xls (Microsoft Excel)
search
.ppt (Microsoft
PowerPoint)
.doc (Microsoft Word)
(*)
Examples
filetype:pdf ext:pdf
seo * directory
returns “seo free
directory”, “seo friendly
directory”, etc.
Compare:
related:www.linkdi
y.com
and
related:www.alchem
istmedia.com
91/102
(Info:)
Gives information
Information about a about the given page
URL search
(Cache:)
See what the page
looked like when
Google crawled it
(~keyword)
Learn whether the page
has been indexed by
Google; provides links
for further URL
information; this search
can also alert you to
possible site issues
(duplicate content or
possible DNS
problems)
info:netconcepts.c
om will show you the
page title and
description, and invite
you to view its related
pages, incoming links,
and page cached version
Google’s text version of
cache:www.stonetemple.
Shows Google’s saved the page works the
com
copy of the page
same way as SEO
Browser
Shows keywords
Google thinks are
related to keyword
Can be very useful in
uncovering related
words that you should
include on your page
about keyword
~zoo ~trip will show you
keywords related to zoo
and trip
Yahoo! advanced search operators
Operator
(Link:)
URL backlinks
restricted search
(LinkDomain:)
Domain backlinks
restricted search
Short description
Finds any page
backlinks (if used in
isolation, redirects to
Yahoo! Site Explorer)
Finds any domain
backlinks (if used in
isolation, redirects to
Yahoo! Site Explorer)
SEO application
Find most the relevant
backlinks of any page
Examples
link:http://www.seomoz.
org/blog seo
linkdomain:www.alchemi
Find the most relevant
stmedia.com seo
backlinks of any domain
A few possible
extensions/file types:
PDF (Adobe Portable
Document Format)
originurlextension:pdf
.xls (Microsoft Excel)
.ppt (Microsoft
PowerPoint)
Narrows search results .doc (Microsoft Word)
to the sites belonging Example regions:
to a particular territory region:europe
region:europe
region:africa region:asia
(OriginUrlExten
sion:)
Narrows search results
to the pages that end
File type restricted in a particular file
extension
search
(Region:)
Area restricted
search
(Url:)
URL restricted
search
Finds a specific
document in Yahoo!’s
index
Search Engine Optmization
Nicolas MESSER
url:http://www.netconcep
Learn whether the page
t.com
was indexed by Yahoo!
92/102
Bing advanced operators
Operator
(LinkFromDomain:)
Short description
SEO application
Examples
Find most relevant
Finds all pages the
linkfromdomain:seomoz.org
sites your
given domain links
seo
Domain outbound links
competitor links out
out to
restricted search
to
Narrows search
Find pages linking
(Contains:)
results to pages
to a specific
contains:wma seo
linking to a document document type
File type restricted
of the specified file
containing relevant
search
type
information
Restricts the results
(InBody:)
Find pages
to documents
containing the most inbody:seo (equivalent to
containing query
Body text keyword
relevant/best
Google’s intext:)
word(s) in the body
restricted search
optimized body text
text of a page
Narrows search
results to a specified
(Location:)/(loc:)
location (multiple
Find geospecific
seo loc:AU
location options can documents using
Location specific
be found under
your keyword
search
Bing’s advanced
search)
(Feed:)
Narrows search
results to terms
feed:seo
Find relevant feeds
Feed keyword
contained in RSS
restricted search
feeds
Narrows search
(Hasfeed:)
results to pages
Find pages linking hasfeed:seo site:cnn.com
linking to feeds that
Feed keyword
to relevant feeds
contain the specified
restricted search
keywords
Consolidé depuis le livre SEO Warrior et le site web d'accompagnement
http://www.seowarrior.net de John Jerkovic.
Search Engine Optmization
Nicolas MESSER
93/102
Charte de Qualité et de déontologie du métier de référenceur
© Abondance.com
Les signataires de la "Charte de Qualité Abondance sur le référencement de sites
web" devront accepter les conditions suivantes (O-R = Outils de Recherche) :
Titre
Contenu
Réalisme /
Garanties
Les signataires s'engagent à une obligation de moyens à mettre en
oeuvre et à ne pas promettre (garantir) de résultats de positionnement
limités à une requête et un moteur, et plus généralement ne pas
promettre de résultats qui ne pourront être tenus ou vérifiés par le
client. Des garanties statistiques (X% de positionnements sur Y mots
clés et Z moteurs) pourront cependant être proposés.
Transparence
Les signataires s'engagent à tenir à disposition de leurs clients - et à leur
faire connaître sa disponibilité - un document clair et précis présentant
leur méthodologie de travail : technologies mises en œuvre, méthodes
d'optimisation, procédures de référencement, etc.
Conseil
Les signataires s'engagent à aider leurs clients dans la réflexion sur les
informations qui seront fournies aux O-R (descriptif, mots clés,
optimisation des titres et textes des pages, etc.) lors du référencement.
Méthodologie
Les signataires restent libres de la méthodologie mise en place pour
référencer les sites de leurs clients, à partir du moment où elle respecte
la présente charte, notamment en ce qui concerne la lutte contre le spam
de la part des O-R (voir plus loin).
Loyauté
Les signataires s'engagent à suivre strictement les indications des O-R,
publiées de façon spécifique sur leurs sites (et reprises ci-après dans la
présente charte), dans le but d'effectuer une soumission efficace d'un
site web dans leur index ou bases de données.
Suivi
Les signataires s'engagent à remettre à leurs clients de façon périodique
des rapports clairs sur l'avancée des travaux de référencement de leur
site web (suivi du positionnement, du trafic généré, du retour sur
investissement, etc.), sous la forme qui leur semble la plus appropriée
(tableaux Excel, extranet, outils en ligne, etc.).
Autonomie
Les signataires s'engagent à remettre tous les éléments relatifs aux
travaux réalisés dans le cadre de la prestation de référencement de
façon à permettre à leurs clients de changer de prestataire s'ils n'étaient
pas satisfaits de la prestation effectuée. Comme pour toute prestation
informatique ou de service, les travaux effectués appartiennent au client
qui en a payé le montant.
Veille
Les signataires s'engagent à mettre en place des mécanismes de veille
afin de se tenir au courant de l'évolution des outils de recherche et à en
faire profiter leurs clients.
Qualité
Les signataires s'engagent auprès des O-R à ne soumettre à leur
indexation que des sites dont le contenu et la pertinence sont
suffisamment riches pour alimenter leur base de données en vue
Search Engine Optmization
Nicolas MESSER
94/102
d'apporter une information utile au visiteur.
Mode de
fonctionnement
Les signataires s'engagent à n'effectuer pour leurs clients que des
prestations de référencement manuel, sans l'aide d'aucun logiciel de
soumission automatique, sauf dans le cas où cette prestation est
explicitement indiquée dans la proposition commerciale, et uniquement si
l'utilisation de logiciels n'intervient qu'en complément d'une prestation
manuelle majeure et ce aussi bien en phase de référencement qu'en
phase de suivi et de veille.
Respect de la
concurrence
Les signataires s'engagent à ne pas nuire au référencement d'un
concurrent pour le compte d'un client et à ne pas utiliser la marque de
concurrents pour le référencement de leurs clients. En règle générale, les
signataires s'engagent à ne pas nuire au référencement d'un site pour
lequel ils n'auraient pas été mandatés.
Combat contre
le spam
Les signataires acceptent de ne pas réaliser d'action de spamdexing
(fraude sur les O-R). Une annexe (voir ci-après) décrit de façon précise
ce qui est considéré comme du spamdexing et ce qui n'en est pas dans le
domaine du référencement de site web.
Les signataires s'engagent notamment à ne cacher aux O-R aucun
contenu destiné au référencement à l'intérieur du code HTML (balise
Noscript, utilisation de zones invisibles - visibility-hidden, display:none,
etc.) du site de leur client.
Information
Les signataires s'engagent à remettre à leurs clients et prospects, dans
leurs propositions commerciales, un exemplaire de la Charte ici présente,
accompagnée d'un document expliquant le fonctionnement des O-R,
détaillant en quoi consiste un référencement de site Web, ainsi que ses
contraintes.
Clarté
Les signataires s'engagent à expliciter de façon claire les actions
effectuées sur les moteurs de recherche et notamment à ne pas
entretenir de flou entre des prestations de référencement manuel et
d'éventuelles actions d'achat de mots clés dans le cadre de campagnes
de liens sponsorisés. Les deux types d'actions, si elles cohabitent dans la
prestation proposée au client, devront être clairement mentionnées et
démarquées.
Blacklistage
Les signataires s'engagent à rembourser intégralement la prestation
réalisée s'il est avéré que le site est exclu d'un moteur suite à une faute
de leurs services.
Echange de
liens
Les signataires s'engagent à ne pas mettre en place de lien vers leur site
depuis le site du client, de façon visible ou invisible, sauf si cela est
stipulé clairement dans le contrat signé entre les deux parties.
Définition du spamdexing
Les actions suivantes sont considérées comme étant du spam (ou spamdexing : fraude au
référencement sur les O-R (= Outils de Recherche)), cette liste n'étant pas considérée
comme limitative :
Search Engine Optmization
Nicolas MESSER
95/102
• Référencement d'un site faisant la promotion d'activités illicites ou dégradantes (piratage,
racisme, sectes, pédophilie, etc.).
• Mise en place d'une stratégie de référencement basée sur plusieurs noms de domaine
différents (chaque nom de domaine pointant sur la même page) ou sous plusieurs adresses
ou sous-domaines différents (www.site.com et actu.site.com par exemple, chaque adresse
pointant sur la même page).
• Répétition de façon abusive des mots clés à l'intérieur d'une page, que ce soit dans des
zones cachées ou non du code HTML.
• Répétition abusive de balises TITLE, META ou autres (commentaires).
• Utilisation de mots clés inadéquats avec le contenu du site, utilisation de marques ou de
noms sans liaison avec le site ou faisant mention de marques déposées sans autorisation.
• Utilisation de texte invisible (blanc sur fond blanc par exemple) ou caché à l'intérieur du
code HTML (balise Noscript, utilisation de zones invisibles - visibility-hidden, display:none,
etc.).
• Cloaking (technique instllée sur les serveurs web et permettant de délivrer aux spiders des
pages spécifiquement réalisées pour les moteurs de recherche) à des fins de positionnement.
• Copie sur son propre site de code HTML existant et n'appartenant pas au signataire.
• Création de pages HTML ou de liens ayant pour unique but d'augmenter l'indice de
popularité d'un site ou d'une page.
• Achat de lien au prorata d'un indice de popularité (PageRank ou autre).
• Pages de redirection (balise Meta Refresh, Javascript ou autre) notamment dans la cadre
de création de pages satellites.
• Popularité : toute manœuvre visant à tenter d'augmenter l'indice de popularité (ou
PageRank) d'une page de façon artificielle.
• Pages satellites, alias, fantômes, doorway pages, etc., et toutes techniques d'optimisation
permettant de positionner une page dans les pages de résultats des moteurs, cette page
redirigeant de façon automatique l'internaute sur une autre page "réelle".
• Toute méthode de création massive et automatisée de pages web spécifiquement
optimisées pour les moteurs de recherche, même sans redirection automatique, dans le
cadre d'une stratégie de référencement.
• D'une manière générale, non-respect des limites indiquées par les O-R et rappelées ici :
Google :
http://www.google.fr/support/webmasters/bin/answer.py?answer=35769&hl=fr
http://www.google.fr/support/webmasters/bin/answer.py?answer=35291&hl=fr
Yahoo! :
http://eur.help.yahoo.com/help/fr/ysearch/deletions/index.html
http://eur.help.yahoo.com/help/fr/ysearch/deletions/deletions-04.html
http://eur.help.yahoo.com/help/fr/ysearch/deletions/deletions-05.html
Microsoft Live Search:
http://search.msn.fr/docs/siteowner.aspx?FORM=WMDD2
http://search.msn.fr/docs/siteowner.aspx?t=SEARCH_WEBMASTER_REF_GuidelinesforOptimi
zingSite.htm&FORM=WGDD
Search Engine Optmization
Nicolas MESSER
96/102
Interview avec Véronique Murbach
Interview du 29.06.2010 à la HEG
Avec Véronique MURBACH, Ajointe au chef du laboratoire, Conceptrice en
communication WEB
Je réalise mon travail de diplôme sur le référencement/l'optimisation pour les moteurs
de recherche avec le cas d'étude du site de la HEG. C'est M. Jean-Philippe Trabichet,
responsable de la filière informatique de gestion et responsable du laboratoire, qui m'a
proposé de vous contacter concernant mes questions par rapport à mon travail
d'analyse du site de la HEG.
Quelle est votre rôle?
Je suis la webmaster de la HEG. Mon travail, et celui de mon équipe, est la
maintenance et la mise à jour du site de la HEG.
Actuellement la HEG n'utilise pas de CMS pour son site web et tous les changements
et mise à jour passent obligatoirement par mes collaborateurs ou moi-même. Mais
nous ne sommes évidemment pas responsables pour le contenu lui-même.
Quel est l'objectif principal du site de la HEG?
Attirer les futurs étudiants de la HEG et promouvoir les travaux de recherche réalisés
par la HEG. Mais le site est également un moyen de communication sur les différentes
nouvelles et événements au sein de la HEG.
Est-ce que la HEG à une stratégie d'optimisation?
Oui, nous essayons au mieux d'optimiser le site de la HEG. Mais depuis le passage à
la nouvelle version du site de la HEG, les changements apportés à la structure ne nous
ont pas encore permit d'achever tout le travail nécessaire pour avoir un site
particulièrement optimisé. Et il faudra évidemment un peu de temps pour que la totalité
du nouveau site soit correctement indexé chez les moteurs de recherche.
Le site de la HEG est développé entièrement en interne et nous sommes "limités" au
niveau des technologies par les serveurs mises à disposition par la Haute école. En ce
moment, c'est soit du .ASP (choix technologie du site actuel), soit du PHP.
Search Engine Optmization
Nicolas MESSER
97/102
Tout le travail de référencement est réalisé par nos collaborateurs. La direction
s'intéresse au listing dans les résultats des moteurs de recherche par rapport à des
mots-clés défnis, mais ne nous a pas donné des directives plus détaillés pour
l'optimisation des pages du site de la HEG. Au delà, ils ne donnent pas une grande
priorité à cela, mais nous essayons de mettre en place les bonnes pratiques que nous
jugeons importantes.
Est-ce que la HEG, fait un effort pour utiliser les médias sociaux?
Oui, c'est un travail qui a été réalisé pour un travail de maturité professionnelle et mise
en place avec la version actuelle du site de la HEG. Le résultat de ce travail est que
nous avons maintenant une page officielle sur Facebook où nous proposons
égalments toutes les nouvelles de la
HEG et nous espérons atteindre des futurs
candidats qui sont amis avec les étudiants actuels de la HEG. Et depuis quelques
temps, nous proposons aux visiteurs du site de partager notre contenu directement sur
les différents réseaux sociaux par le widget du service AddThis.
Est-ce que la HEG utilise des outils comme Google Analytics pour analyser la
circulation du site web?
Je sais qu'on exploite les méthodes d'analyse avec Analytics, mais c'est un collègue
qui s'occupe de cela.
Mais, est-ce que vous savez si la HEG à mis en place des métriques (valeur de
référencement) pour calculer une sorte de rendement sur le site web?
Je sais qu'on a analysé la durée des visites et toutes ces données standards qu'on
peut retrouver par l'outil Analytics. Est-ce que vous auriez un exemple plus concret
pour votre question?
Oui, je me suis demandé si par exemple la HEG avait mis en place un système
pour compter le nombre de fois le fichier PDF pour les inscriptions est
téléchargé pour le comparer avec le nombre de dossiers effectivement reçus?
Non, alors je ne pense pas que cela est actuellement réalisé, mais c'est une bonne
idée. Par contre, je pense que ce ne sera pas si facile à réaliser parce qu'il y a toujours
des dossiers en retour qui ne sont pas téléchargés depuis le site.
Search Engine Optmization
Nicolas MESSER
98/102
Est-ce que la HEG fait une analyse des "concurrents" pour savoir où elle se
place par rapport aux autres hautes écoles?
Oui, bien sûr nous essayons de regarder ce que font les autres hautes écoles et où on
se positionne par rapport à eux. Mais depuis le changement sur la nouvelle version du
site, nous ne l'avons pas encore fait parce que nous avons perdu beaucoup de liens et
pefereons attendre encore un moment pour que le site soit de nouveau bien indexé.
Quelques questions par rapport aux analyses que j'ai réalisées au cours de mon
mémoire.
Pour réprendre l'élément de l'analyse des concurrents pour un moment. Une
chose que j'ai remarquée est que la HEG n'a pas de nom de domaine
independant. Par contre, j'ai pu constater que le nom de domaine www.heg-ge.ch
est reservé par les Hautes écoles spécialisée de Genève. Est-ce que c'est prévu
d'utiliser ce nom de domaine dans le futur pour améliorer cet élément qui est
quand même assez important du côté référencement?
Vous avez raison que le nom de domaine est réservé et pas utilisé à ce jour. C'est la
direction des Hautes écoles génévoises qui a décider de reserver ces noms de
domaines pour proteger que ce n'est pas quelqu'un d'autres qui le fait. Mais a mes
connaissances, les Hautes écoles génévoises sont obligées de suivre le modèle du
nom de domaine qu'utilise la HEG actuellement. Je pense que nous ne pourrons donc
pas changer cela dans le futur.
J'ai pu constater que le nouveau site de la HEG n'a plus les mots-clés (nom de l'école)
en clair dans la balise d'en-tête <h1>, mais au lieu utilise le logo officiel avec le nom en
français et anglais dans un format image. Est-ce que cela à été un choix volontaire ou
cela a été décidé par quelqu'un d'autre (la direction par exemple) parce que vous
perdez quand même l'opportunité de placer des mots-clés dans la partie la plus
importante du site?
Non, c'était décidé parce que ce logo est utilisé par tout et parce que c'était comme
cela sur la maquette de la nouvelle version. Et il y a toujours le texte alternatif de
l'image pour placer quelques mots-clés.
Si j'ai bien vu, le site de la HEG n'exploite pas un plan du site en format XML
pour essayer de faciliter l'indexation par les moteurs de recherche?
Non, nous avons le plan du site traditionnel en format HTML qui est accessible sur le
site.
Search Engine Optmization
Nicolas MESSER
99/102
Est-ce que le site de la HEG utilise un fichier robots.txt?
Non, nous n'utilisons pas cela. Le site de la HEG ne dispose actuellement pas d'une
partie privée à la quelle il faudra bloquer l'accès aux spiders des moteurs de
recherche. De plus, je dirais que nous n'avons pas le problème de contenu dupliquée.
Nous en avons déjà parlé un peu, mais j'ai pu constater que les métadonnées en
général ne sont pas très optimisées pour le site de la HEG. Est-ce que des
informations comme les titres et/ou descriptions des pages sont générées
automatiquement en ce moment? Et quelle importance donner vous à ces
données parce que j'ai vu que des autres hautes écoles ont carrément ignoré
complètement les descriptions par exemple?
Ces données sont toujours importantes pour les informations qui s'affichent dans les
pages de résultats des moteurs de recherche. Pour le site de la HEG, les données
pour la description sont créées automatiquement. Mais comme vous l'avez remarqué, il
y en a d'autres qui ne sont pas encore optimisées par tout car il faut les mettre à jour
manuellement. Mais nous avons un schéma en place pour cela.
Est-ce que vous avez considéré de faire de la reécriture des URLs dans le cas de
l'annuaire et/ou optimiser les noms des fichiers pour avoir des URLs
optimisées?
Non, cela n'est pas prévu pour cette version du site de la HEG. Peut-être avec une
prochaine version qui sera basé sur un CMS on pourrait améliorer ce point (et d'autres
que vous avez mentionnés avant).
Quelques questions sur des améliorations/propositions qui sont apparues lors
des analyses pour mon travail de diplôme, mais qui ne sont pas directement en
relation avec le référencement.
Est-ce que vous avez considéré de mettre un formulaire pour la prise de contact
sur le site de la HEG plutôt que d'y mettre les différents adresses e-mails
(comme cela se fait pour contacter les collaborateurs)?
Non, nous n'y avons pas pensé, mais c'est à réfléchir si on veut le faire. Parce que je
comprends tout à fait votre point de vue pour les gens qui ne sont pas sur leur poste de
travail à eux ou n'ont pas de programme de messagerie installé.
Une autre chose qu'on a prévu d'améliorer dans cette même ligne est le bulletin
d'inscription. On veut bien qu'on puisse le remplir directement sur ordinateur.
Search Engine Optmization
Nicolas MESSER
100/102
La "fraicheur" du contenu d'un site est également importante dans le
référencement pour les moteurs de recherche. J'ai constaté que les témoignages
des étudiants ont récemment été actualisés. Est-ce que vous pensez que d'avoir
une sorte de blog rédigé par les étudiants au lieu de la page plutôt statique qui
ne change pas souvent pourrait être un autre moyen pour attirer des futur
candidats?
Oui, peut-être. Mais mon équipe et moi, nous ne nous occupons pas du tout du
contenu (ni la rédaction de celui). Donc, ce n'est de toute façon pas à nous de prendre
une telle décision.
Et ma dernière question. Quel est le futur du site de la HEG?
Nous envisageons de passer à un CMS pour la prochaine version. Mais pour ce qui
concerne le site actuel, nous aimerions remettre à disposition la possibilité de faire des
recherches sur le site et également mettre à disposition des flux RSS.
Je vous remercie de m'avoir acceuili pour répondre à mes questions. Vos réponses
vont beaucoup m'aider à clarifier quelques points dans mon mémoire. Encore une fois,
merci pour votre temps.
Search Engine Optmization
Nicolas MESSER
101/102