Travail de bachelor
Transcription
Travail de bachelor
SEO L'aventure des développeurs/référenceurs web et le prochain défi stratégique des entreprises Travail de diplôme réalisé en vue de l’obtention du diplôme HES par : Nicolas MESSER Conseiller au travail de diplôme : Alexandre BODER, Chargé d'enseignement HES Carouge, 9 juillet 2010 Haute École de Gestion de Genève (HEG-GE) Filière Informatique de Gestion Déclaration Ce travail de diplôme est réalisé dans le cadre de l’examen final de la Haute école de gestion de Genève (HEG), en vue de l’obtention du titre d'informaticien de gestion. L’étudiant accepte, le cas échéant, la clause de confidentialité. L'utilisation des conclusions et recommandations formulées dans le travail de diplôme, sans préjuger de leur valeur, n'engage ni la responsabilité de l'auteur, ni celle du conseiller au travail de diplôme, du juré et de la HEG. « J’atteste avoir réalisé seul le présent travail, sans avoir utilisé des sources autres que celles citées dans la bibliographie. » Fait à Genève, le 9 juillet 2010 Nicolas MESSER Remerciements Je tiens à remercier particulièrement Alexandre Boder, pour son accompagnement et ses conseils toujours judicieux. J'aimerais également remercier les trois spécialistes du référencement qui ont répondu à mon questionnaire. Ce sont Scott Smith, a.k.a Caveman, consultant indépendant (www.thecaveman.org), Dejan Petrovic, directeur de Dejan SEO (www.dejan.com.au) et David Degrelle a.k.a DavidD, fondateur et président 1ère Position SA (http://www.1ere-position.fr). Je tiens également à remercier les deux responsables des sites web qui se sont mises à dispositions pour des interviews. Ce sont Véronique Murbach, conceptrice web de la HEG Genève et Nicolas Pittet, responsable de l'équipe web de l'EIA-FR. Et à ne pas oublier, je remercie toutes les autres personnes qui m’ont apporté leur aide et leur soutien tout au long de la rédaction de ce mémoire. Search Engine Optmization Nicolas MESSER 2/102 Sommaire Ce mémoire est le fruit de la réalisation de mon travail de diplôme, effectué dans le cadre de ma formation à la Haute Ecole de Gestion (HEG) de Genève. Ce travail finalise ma formation en vue de l’obtention du diplôme de Bachelor en Informatique de Gestion. Tout au long de la réalisation de ce mémoire, j’ai été suivi et conseillé par M. Alexandre Boder, Chargé d’enseignement HES à la HEG. SEO* est l’acronyme anglais pour "Search Engine Optimization", connu comme référencement ou optimisation pour les moteurs de recherche en français. L'objectif de ce procédé est d'orienter le positionnement d'une page web dans les pages de résultats (SERPs*) des différents moteurs de recherche. L’optimisation des pages web pour les moteurs de recherche représente donc un véritable enjeu car il permet d'augmenter de façon significative le nombre de visiteurs du site d’une entreprise et par ce fait le nombre de clients potentiels atteignable. L'objectif poursuivi par ce mémoire est premièrement, de passer en revue l'histoire et le fonctionnement des moteurs de recherche qui sont pour une grande partie responsable du fait qu'aujourd'hui le SEO fait partie du projet de création d'un site web. Pour cela, je présenterai dans la première partie un bref aperçu de l'histoire des moteurs de recherche ainsi que les bases du fonctionnement des moteurs de recherche et l'utilisation des internautes. Deuxièmement, le mémoire aura pour objectif de présenter les différentes techniques et bonnes pratiques du référencement naturel*, de les décrire et de les évaluer par rapport à leur difficulté d'implémentation et leur efficacité. Pour mieux illustrer ces concepts, je réaliserai une analyse du site de la HEG et je proposerai des changements ou des améliorations dans le cas échéant à partir des mes propres expériences de création et optimisation des pages web. Dans la troisième partie de ce mémoire je présenterai deux outils gratuits à disposition pour les référenceurs. Ces outils devront permettre d'évaluer les efforts d'optimisation et dans le meilleur des cas de connaître le retour sur l'investissement (ROI*). Comme dans la deuxième partie, je proposerais des exemples à partir de notre cas d'étude avec le site de la HEG. Search Engine Optmization Nicolas MESSER 3/102 De plus une réflexion sur les technologies issues du Web 2.0 et de son influence sur la façon d'orienter le référencement pour capter une communauté spécifique d'usagers sera réalisée dans la quatrième partie. La HEG devra avoir un intérêt particulier de conforter sa présence auprès "d'une clientèle" jeune particulièrement friande de ces technologies. Nous allons donc découvrir le monde des médias sociaux en faisant l'état des services exploite par la HEG. Et finalement, j'essayerai de faire quelques projections pour l'avenir du référencement dans la dernière partie de ce mémoire. Quelles sont les technologies les plus prometteuses à venir et connaître et quelle sera l'influence du monde mobile sur le référencement. Pourtant, il ne sera pas possible de couvrir tous les aspects du référencement dans le cadre de ce mémoire. Le sujet est beaucoup plus complexe que ces quelques pages qui ne pourront être autre chose qu'un bon point de départ pour qui aimerait s’initier au référencement. Search Engine Optmization Nicolas MESSER 4/102 Table des matières Déclaration......................................................................................................... 1 Remerciements.................................................................................................. 2 Sommaire ........................................................................................................... 3 Table des matières ............................................................................................ 5 Liste des Figures............................................................................................... 7 Guide de lecture ................................................................................................ 8 A propos de l'auteur et ses motivations ....................................................... 10 Introduction ..................................................................................................... 11 Partie 1 : Introduction sur les moteurs de recherche .................................. 14 Chapitre 1: Bref aperçu de l'histoire des moteurs de recherche.................... 14 Chapitre 2: Le fonctionnement des moteurs de recherche ............................ 16 Chapitre 3 : Comment les moteurs de recherche sont utilisés par les internautes................................................................................................ 21 Conclusion (partie 1) .................................................................................. 23 Partie 2 : Le cas d'étude HEG......................................................................... 25 Comment développer un site accueillant le SEO? ..................................... 25 Chapitre 1 : Considérations avant le projet...................................................... 26 Analyse des mots-clés ............................................................................... 26 La longue traîne ......................................................................................... 28 Analyse mots-clés de la HEG .................................................................... 29 Choix du nom de domaine ......................................................................... 31 Chapitre 2 : Applications des Best Practices................................................... 33 La balise <title> .......................................................................................... 34 La balise Meta <description> ..................................................................... 35 Propositions d'amélioration des balises <title> et <description>................ 36 Les balises d'en-tête .................................................................................. 37 Propositions d'amélioration de la balise <h1>............................................ 39 L'optimisation des liens .............................................................................. 39 L'optimisation des images .......................................................................... 42 Le plan du site ............................................................................................ 42 Arborescence d'un site............................................................................... 44 Utilisation du fichier robots.txt .................................................................... 44 La structure des URL ................................................................................. 46 Proposition d'amélioration de la structure URL .......................................... 47 Faciliter la navigation.................................................................................. 47 Respect des standards W3C ..................................................................... 47 Proposition d'autres améliorations ............................................................. 48 Chapitre 3 : "Black hat" – les stratégies à éviter ............................................. 49 Conclusion (partie 2) .................................................................................. 51 Search Engine Optmization Nicolas MESSER 5/102 Partie 3 : Le suivi et l'évaluation des résultats............................................. 54 Chapitre 1 : Comment suivre les stratégies mises en place........................... 55 Circulation par moteurs de recherche. ....................................................... 59 La circulation par mot-clé ........................................................................... 60 Chapitre 2 : ROI dans l'optimisation pour les moteurs de recherche............ 61 Indicateur : nombre de visiteurs ................................................................. 61 Indicateur : nombre de vues par pages...................................................... 61 Exemple calcul rendement pour la HEG .................................................... 61 Chapitre 3 : Evaluer à quelle fin ? ..................................................................... 62 Conclusion (partie 3) .................................................................................. 63 Partie 4 : L'influence des médias sociaux .................................................... 64 Chapitre 1 : Aperçu des médias sociaux populaires....................................... 66 Facebook.................................................................................................... 66 Twitter ........................................................................................................ 66 LinkedIn...................................................................................................... 67 Wikipedia.................................................................................................... 68 Autres services sociaux.............................................................................. 68 Chapitre 2 : Quel gain apporté par les médias sociaux? ................................ 68 Conclusion (partie 4) .................................................................................. 69 Partie 5 : Le future de l'optimisation ............................................................. 71 Chapitre 1 : La recherche universelle ............................................................... 71 Chapitre 2 : Nouvelles technologies à venir et connaître ............................... 73 SearchWiki – la recherche personnalisée .................................................. 73 L'interprétation du Flash............................................................................. 74 OCR – La reconnaissance optique de caractères ..................................... 74 Les microformats........................................................................................ 74 Chapitre 3 : Le monde mobile............................................................................ 76 Conclusion (partie 5) .................................................................................. 78 Conclusion....................................................................................................... 79 Bilan personnel ............................................................................................... 81 Bibliographie ................................................................................................... 82 Glossaire .......................................................................................................... 86 Annexes ........................................................................................................... 90 Search Engine Optmization Nicolas MESSER 6/102 Liste des Figures Figure 0-1. Pyramide du référencement par Rand Fishkin de SEOmoz ............. 8 Figure 1-1. Distribution des parts de marché des moteurs de recherche ......... 14 Figure 1-2. L'interface de Google en 1998 ........................................................ 15 Figure 1-3. L'interface de Google en 2010 ........................................................ 15 Figure 1-4. Présentation du concept du Page Rank ......................................... 16 Figure 1-5. Concept du fonctionnement des Spiders ........................................ 18 Figure 1-6. Cycle de vie d'une requête.............................................................. 19 Figure 1-7. Page de résultat de Google ............................................................ 20 Figure 1-8. Le triangle d'or de Google............................................................... 22 Figure 1-9. Nombre de mots-clés utilisés dans une requête en janvier 2010 ... 23 Figure 2-1. Outil de recherche mots-clés AdWords de Google......................... 27 Figure 2-2. Le principe du "Long Tail" ............................................................... 28 Figure 2-3. Site HEG avant 2010 ...................................................................... 33 Figure 2-4. Site HEG actuel .............................................................................. 34 Figure 2-5. Extrait du site de la HEG sur la page de résultat de Google .......... 36 Figure 2-6. Balise d'en-tête <h1> du site actuel de la HEG .............................. 38 Figure 2-7. Balise d'en-tête <h1> de l'ancien site de la HEG............................ 38 Figure 2-8. Abstraction du concept Link Building .............................................. 41 Figure 2-9. Application possible du link building pour le site de la HEG ........... 41 Figure 2-10. Extrait du code d'un sitemap exemple en format XML ................. 43 Figure 2-11. Plan du site HEG .......................................................................... 43 Figure 2-12. Principe du fichier robots.txt.......................................................... 45 Figure 2-13. Fichier robots simple du site Abondance ...................................... 45 Figure 2-14. Résultat de la validation W3C....................................................... 48 Figure 2-15. Représentation visuelle du Cloaking............................................. 50 Figure 2-16. Formulaire pour annoncer du spam à Google .............................. 53 Figure 3-1. Aperçu du Dashboard de GWT....................................................... 58 Figure 3-2. Informations sitemap de GWT ........................................................ 58 Figure 3-3. Erreurs d'indexation de GWT.......................................................... 58 Figure 3-4. Aperçu du Dashboard de Google Analytics .................................... 59 Figure 3-5. Aperçu de la circulation par moteurs de recherche ........................ 59 Figure 3-6. Aperçu de la circulation par mot-clé................................................ 60 Figure 4-1. Le principe du marketing viral ......................................................... 65 Figure 4-2. Site de la HEG sur Facebook ......................................................... 66 Figure 4-3. Réaction de la CFF sur Twitter ....................................................... 67 Figure 4-4. Profile de la HEG chez LinkedIn ..................................................... 67 Figure 4-5. Page Wikipedia de la HEG ............................................................. 68 Figure 4-6. Résultats Facebook et LinkedIn chez Google pour la HEG............ 69 Figure 5-1. Représentation visuelle du principe "Universal Search" ................. 72 Figure 5-2. Application du microformat hCard................................................... 75 Figure 5-3. Comparaison accès mobile entre les sites de la HEG et TPG ....... 77 Search Engine Optmization Nicolas MESSER 7/102 Guide de lecture Méthodologie J'ai acquis la base pour ce mémoire par la lecture et l'étude des livres, des articles et des sites web mentionnés dans la bibliographie. Par la suite, j'ai défini une première structure du mémoire en essayant de suivre le plus prêt possible le concept de la pyramide du référencement de Rand Fishkin de SEOmoz. Figure 0-1. Pyramide du référencement par Rand Fishkin de SEOmoz Le noyau dur de ce mémoire est la 2ème partie avec le cas d'étude où nous verrons des exemples concrets des concepts de l'optimisation des pages web pour les moteurs de recherche. Par rapport à la pyramide du référencement, nous passerons le plus de temps à construire le fondement représenté par les deux premiers niveaux et nous allons seulement toucher un peu les possibilités plus avancées du troisième niveau. Search Engine Optmization Nicolas MESSER 8/102 Mais nous allons consacrer un peu plus de temps au quatrième niveau qui est un sujet d'actualité et important dans le contexte du cas d'étude de ce mémoire. Pour soutenir ou contredire mes affirmations et mes théories, j'ai questionné trois experts du domaine et conduit des interviews avec des responsables des sites web des Haute écoles de la Suisse occidentale. Enfin, pour rester à jour avec les événements dans le monde du référencement, j'e me suis abonné à deux Podcasts hebdomadaires, SEO 101 et SEO Rockstars, de Webmaster Radio. Voici encore quelques informations pour vous faciliter la lecture de ce mémoire pour conclure ce petit guide de lecture. Le glossaire En fin de ce mémoire vous trouverez un glossaire complet des termes rencontrés lors de votre lecture. Celui-ci reprend l’ensemble des abréviations, termes techniques et spécifiques liés au sujet traité dans ce mémoire. Lors de votre lecture les mots signalés par une astérisque (ex : mot*) sont systématiquement repris et explicités dans le glossaire. Utilisation des notes de bas de pages Afin d’alléger le texte et d’en faciliter la lecture, il a été choisi d’insérer dans le texte des notes de bas de page pour signaler, les sources des documents de références. Toutes ces références figureront également dans la bibliographie. Raccourcissement d'URL Pour faciliter le suivi des liens référencés dans ce mémoire, le service Bit.ly a été utilisé. Voici un exemple pour le lien du site de la HEG : http://bit.ly/heg-ge Représentation codage HTML Pour distinguer l'utilisation du code HTML, ces parties de textes ont un formatage spécial. Voici un exemple avec la balise titre : <title>Haute école de gestion de Genève - Bienvenue à la HEG</title> Search Engine Optmization Nicolas MESSER 9/102 A propos de l'auteur et ses motivations Etudier le sujet de l'optimisation pour les moteurs de recherche n'est pas une exigence pour obtenir un diplôme en informatique (de gestion) ou devenir un développeur pour le web. A l'heure actuelle, il n'existe même pas de formation ou certification officielle à ce sujet à part quelques exceptions qui ne sont pas reconnues officiellement dans l'industrie. C'est tout d'abord l'initiative et le savoir technique de la personne qui désire devenir un spécialiste dans le domaine qui sont le plus importants. Dans ce contexte, je me permets de faire l'affirmation que les informaticiens de gestion sont dans une situation de départ avantageuse pour faire de l'optimisation pour les moteurs de recherche. L'interdisciplinarité que demande ce travail extrêmement intéressant est le cœur des études de l'informaticien de gestion. Il est confronté aux nouvelles technologies en même temps qu'il apprend les bases du côté gestion d'entreprise et de marketing. Il doit être capable de comprendre et répondre à des questions dans ces différents domaines et d'appliquer les bonnes pratiques. En même temps, il doit être capable de présenter ces principes à d’autres personnes, qu’ils soient des membres de l'équipe ou des clients, dans la poursuite de la bonne conduite d'un projet. Quelque chose que vous verrez par la suite de ce mémoire est un atout indispensable dans le travail d'un référenceur. Car il ne doit pas toujours être facile d'expliquer les méthodes employées et de justifier les honoraires pour un référenceur. Par contre, il est certain que l'expertise dans le domaine de l'optimisation est un métier du futur. Et encore une fois, je dirais que les informaticiens de gestion vont être parmi ceux qui se trouvent dans une excellente position pour mettre les pieds sur ce marché à l'épreuve du temps. Ceci dit, je ne suis pas un des experts renommés du référencement et des moteurs de recherche. Mais l'intérêt très fort à ce sujet était l'opportunité parfaite pour dédier mon mémoire à ce sujet et mettre mes pieds dans ce monde attrayant. "Organize the world's information and make it universally accessible and useful." – Mission statement by Google Search Engine Optmization Nicolas MESSER 10/102 Introduction L'optimisation pour les moteurs de recherche est en même temps une science et un art. Une fois étudiées, les bases de l'optimisation peuvent apparaître comme du bon sens pour quelqu'un de familier avec le développement web. Mais souvent les concepts plus avancés ne sont pas si évidents et plutôt difficiles à comprendre et la mise en œuvre peut même soulever des questions pour les spécialistes du domaine. De plus, les moteurs de recherche ont une grande influence sur les résultats qu'on peut obtenir avec les changements et améliorations apportés en permanence à leurs algorithmes. Google, le leader des moteurs de recherche, a publié une vidéo1 à ce sujet et on peut estimer qu'en moyenne 350 à 400 changements ou améliorations sont apportés par année. Donc, si vous effectuez une recherche chez Google pour "optimisation des moteurs de recherche", "SEO" ou n'importe quelle autre terme similaire, vous allez retrouver un grand nombre d'articles qui favorisent des stratégies dépassées et inefficaces aujourd'hui. Parce que les moteurs de recherche ont évolué de manière significative les dernières années, la majorité de ces stratégies ne sont plus recommandées et d'autres même considérées comme du spam. Et parce que le succès des moteurs de recherche dépend considérablement de la pertinence de résultats de recherche, les essais de manipuler ces résultats sont traités très sérieusement par les dernières. L'accès "illimité" aux informations se trouvant sur Internet est la raison majeure pour laquelle les moteurs de recherche deviennent de plus en plus un point d'entrée d'une session d'Internet pour les internautes d'aujourd'hui. Avec la possibilité de chercher et de consulter l'information sur un bien ou service à n'importe quel moment, avoir un bon placement dans les pages de résultats devient critique pour la survie des entreprises dans ce monde connecté. Il n'est pas exagéré de dire que les entreprises font face à une concurrence sans précédent pour le temps et l'argent des consommateurs en ligne. 1 Google Webmaster Help YouTube Channel. How many search algorithm changes were made in 2009? http://bit.ly/google-changes (consulté le 15.05.2010) Search Engine Optmization Nicolas MESSER 11/102 Tout simplement avoir un site web ne suffit plus aujourd'hui. Pour apparaître dans les meilleures positions des recherches effectuées par vos clients potentiels un site optimisé à cet effet est indispensable. Comme avec tout grand projet, cela prendra du temps pour la mise en place et la "maintenance" dans le futur. Le grand plus de l'optimisation est que ce n'est pas forcement lié à un coût. Les concepts de bases ne sont pas trop compliqués pour quelqu'un avec des connaissances dans le domaine du développement web. Il se peut même que vous disposé déjà d'une personne qui s'occupe de vos besoins en ce qui concerne votre présence sur le web sans s'être occupée de l'optimisation à ce moment. Clairement, le temps consacré à ce projet représente un coût, mais si vous n'avez pas besoin d'engager un consultant externe, la plus-value à long terme sera supérieure à cet investissement. L'optimisation pour les moteurs de recherche n'est certainement pas de la physique quantique, mais ceci peut être un sujet très détaillé et technique. Tout au cours de ce mémoire, vous allez faire connaissance avec l'art de l'optimisation pour les moteurs de recherche et apprendre comment implémenter de façon efficiente et simple ces stratégies pour votre site web à l'exemple d'un cas d'étude. Pourtant nous allons nous concentrer sur Google dans ce mémoire, vous aurez certainement également de bons résultats avec les deux autres grands moteurs de recherche, Yahoo et Bing (Microsoft), en suivant les recommandations de ce mémoire. Si vous vous intéressez plus aux différences entre les différents moteurs de recherche, 2 je vous recommande de lire les deux articles par Rand Fishkin de SEOmoz qui a réalisé une étude plus avancée entre Google et Bing. Il est également important de préciser que nous allons nous occuper par l'optimisation dans les résultats naturels, connus sous "organic search results", et non pas les 3 résultats payants . Même si certains concepts pourront également s'appliquer à ceuxlà, c'est un tout autre domaine que nous n'aurons pas le temps de traiter en détails. 2 SEOmoz.org, Rand Fishkin. Google vs. Bing: Correlation Analysis of Ranking Elements http://bit.ly/goog-vs-bing (consulté le 04.07.2010) SEOmoz.org, Rand Fishkin. Bing vs. Google: Prominence of Ranking Elements http://bit.ly/goog-vs-bing-2 (consulté le 04.07.2010) 3 Pay per click. In : Wikipedia http://bit.ly/liens-sponsorises (consulté le 20.06.2010) Search Engine Optmization Nicolas MESSER 12/102 Une simple indication qu'une campagne complémentaire avec des liens sponsorisés* pourrait surtout au début de vos efforts d'optimisation fournir des résultats plus rapide. Centrer l'optimisation de son site web autour de Google, surtout pour les pays occidentaux, a du sens avec une part de marché d'environs 65% des recherches effectuées (voir Figure 1-1. Distribution des parts de marché des moteurs de recherche). Dans un dernier point, avant de conclure cette introduction, j'aimerais clarifier les termes de référencement et optimisation. Généralement, lorsque votre site sera présent dans les bases de données (indexes*) des moteurs de recherche, on dira qu'il est référencé. L'optimisation est le processus d'augmenter la visibilité et d'améliorer le positionnement de votre site dans les SERPs* (search engine results page) une fois votre site a été indexé par les moteurs de recherche. Tout au long de mes recherches, j'ai pu constater que surtout pour les francophones ces termes sont souvent utilisés de manière "impropre" et mélangée mutuellement. Je vous prie donc de m'excuser au cas où j'aurais fait de même dans les pages de ce mémoire. Search Engine Optmization Nicolas MESSER 13/102 Partie 1 : Introduction sur les moteurs de recherche Pour pouvoir mettre en place une bonne stratégie de référencement et d'implémenter les concepts d'optimisation, il est important d'avoir une idée comment fonctionnent les moteurs de recherche. Chapitre 1: Bref aperçu de l'histoire des moteurs de recherche Pendant la dernière décennie, nous avons tous pu assister à l'évolution d'un des plus grands phénomènes de notre ère – l'Internet. A la source d'un projet pour le département de la Défense (DoD) des Etats-Unis, l'Internet comme nous le 4 connaissons est né au CERN à Genève, il y a un peu plus de 20 ans. L'accès public à Internet a fondamentalement changé la communication et le partage d'informations en contournant les frontières existantes. Et avec une estimation d'environs 8 milliards de pages indexées aujourd'hui, on peut comprendre la nécessité d'un outil de recherche pour cet espace énorme. Avec l'explosion de l'information accessible par l'Internet et la popularité des moteurs de recherche pour retrouver ces informations, il est devenu important d'avoir une bonne visibilité dans les SERP et la course autour de l'optimisation a commencé. Pourtant il y a eu plusieurs petits projets au début de cette ère, le premier grand moteur de recherche qui a pu s'établir a été AltaVista. Mais au cours des années, seul 3 moteurs de recherche ont réussi à résister au temps dans les pays occidentaux. Figure 1-1. Distribution des parts de marché des moteurs de recherche5 4 CERN. Le berceau du Web. http://bit.ly/berceau-Web (consulté le 15.05.2010) 5 Net Applications. Search Engine Market Share. http://bit.ly/market-share (consulté le 22.06.2010) Search Engine Optmization Nicolas MESSER 14/102 Et depuis juillet 2009, ce paysage se résume à deux grands noms, Google et Microsoft, ce dernier qui maintenant fait tourner le moteur de Yahoo avec ses propres 6 technologies. Aujourd'hui, l'empire de Google dans ce domaine pour le monde occidental est incontesté et commence à s'intégrer dans la vie des humains par une diversité de services, différents du simple outil de recherche de départ. Mais la constante du succès du moteur de recherche de Google semble être l'interface pionnier du moteur qui n'a pas changé depuis son début. Figure 1-2. L'interface de Google en 1998 Cette interface qui depuis le tout début se concentre sur un champ de saisie et un bouton de recherche est la représentation de cette constante de succès. Et on remarque également que déjà tout au début Google semble avoir apprécié le mot BETA pour ces services. Figure 1-3. L'interface de Google en 2010 6 Mashable. Yahoo-Microsoft Search Deal : The Key Facts http://bit.ly/yahoo-microsoft (consulté le 19.06.2010) Search Engine Optmization Nicolas MESSER 15/102 Google n'a jamais essayé de devenir un portail comme ses concurrent Microsoft et Yahoo. Et la comparaison des deux interfaces séparées de plus de 10 ans relève seulement un aperçu plus moderne. Chapitre 2: Le fonctionnement des moteurs de recherche En résumé, le travail des moteurs de recherche est de roder les pages indexées et de retourner seulement celles qui sont similaires au mot-clé saisi par l'internaute dans un ordre trié d'importance. L'importance de ce trie est pour la grande majorité déterminée par le nombre et la pertinence des liens externes et internes qui pointent vers votre site. Dans ce même concept, il y a un autre facteur qui intervient dans la détermination de l'importance d'un lien, c'est celui de l'autorité. Le concept d'utiliser les liens comme méthode pour mesurer l'importance d'un site a été pour une première fois utilisée par Google dans la forme du fameux algorithme PageRank* (PR). Pour vous aider à comprendre le principe de base de cet algorithme, je vais essayer de le résumer le plus brièvement et simplement possible. Figure 1-4. Présentation du concept du Page Rank7 7 Matt Cutts. Straight from Google: What you need to know http://bit.ly/page-rank (consulté le 29.05.2010) Search Engine Optmization Nicolas MESSER 16/102 Brièvement, ce concept dit que chaque lien est un vote pour le site vers lequel celui-ci pointe, mais pas tous les liens ont un poids équivalent. Une page peut améliorer son PR par l'accumulation de nouveaux liens de même qu'elle transmet une partie du sien quand elle pointe un lien vers un autre site. Google a changé et amélioré l'algorithme du PR des multiples fois dans le passé, mais le concept de base évoqué précédemment est toujours applicable et utile à connaître et comprendre. L'impact des liens sur le positionnement dans les SERPs a plusieurs fois été démontré dans le passé. L'exemple le plus fameux est sans doute celui de la page biographie de l'ancien président des Etats-Unis, George Bush, connu sous le nom "misérable 8 failure" . Ce mot-clé a été utilisé par des milliers de personnes dans le texte d'ancrage vers la page de biographie de la maison blanche et elle s'est par la suite positionnée en tête pour ce mot-clé pendant très long temps. Ce phénomène qui est aujourd'hui connu sous le nom de "Google Bombing*"9 a depuis été essayé d'être reproduit par des spammers pour influencer le positionnement de leurs sites. Pour éviter que ceci se répète Google semble avoir invente le TrustRank* (TR) qui s'ajoute au PR dans l'évaluation et classement des résultats. Néanmoins l'existence et l'application de ce concept par Google est contesté et peu de détails sont connus sur le fonctionnement par rapport au PR. Sachez donc, si vous ne faites rien de douteux, vous n'aurez pas à vous faire de soucis à ce sujet. Nous n'allons donc pas consacrer plus de temps à ce concept. 8 BBC News. 'Miserable failure' links to Bush http://bit.ly/miserable-failure (consulté le 23.03.2010) 9 Search Engine Land. Google Kills Bush's Miserable Failure http://selnd.com/google-bomb (consulté le 29.05.2010) Search Engine Optmization Nicolas MESSER 17/102 La grande question qui se pose est comment les moteurs de recherche obtiennent toutes ces informations. C'est un processus complètement automatisé qui est effectué par les "Spiders*", également appelés "Crawler" ou "Robots", des moteurs de recherche. Chaque moteur dispose de spiders qui vont suivre les liens sur la toile et faire ce travail d'indexation. Figure 1-5. Concept du fonctionnement des Spiders L'indexation d'un lien correspond au processus algorithmique d'analyse et de triage dans l'index des moteurs de recherche par rapport aux facteurs d'influence du positionnement. Search Engine Optmization Nicolas MESSER 18/102 Voici donc en image les détails du "cycle de vie" d'une requête d'après Google. Figure 1-6. Cycle de vie d'une requête10 En résumé, on peut donc dire que l'affichage se décompose principalement en trois étapes. 1. L'indexation et par la suite l'extraction des pages depuis l'index qui répondent au(x) mot(s) clé(s) de la requête effectuée par l'internaute. 2. Le classement des résultats par pertinence. 3. Et finalement l'affichage. Nous avons vu les bases pour les deux premiers points de notre liste et ce qui se cache en dessous de l'interface utilisateur. Examinons maintenant le troisième point de l'affichage. 10 Google. Informations sur la société : Technologie Google http://bit.ly/technologie-google (consulté le 29.05.2010) Search Engine Optmization Nicolas MESSER 19/102 L'interface de Google qui a été mise à jour le 4 mai de cette année et propose beaucoup de "nouveaux" fonctionnalité ressemblant très fort à celle de Bing, le moteurs de Microsoft. Figure 1-7. Page de résultat de Google La zone 1 contient les liens sponsorisés ou liens commerciaux connus sous le nom AdWords chez Google. Parfois ce type de liens est également affiché tout au début des SERPs. Ce sont des zones publicitaires payées par des annonceurs selon un système d'enchères avec paiement au clic appelé PPC (Pay Per Clic). La zone 2 représente ce qu'on appelle les liens organiques ou naturels qui sont fournis par l'algorithme du moteur de recherche qu'on vient d'étudier. Et c'est d'ailleurs l'espace sur lequel porterait ce mémoire dans le but de vous aider à mieux positionner vos pages. La zone 3 est le phénomène récent appelé "Universal Search". Dans notre exemple, on voit un extrait de Google Maps, mais avec une autre requête nous verrons peut-être des images, vidéos ou autres types de résultats affichés. Vous pouvez lire plus sur ce sujet dans le 1er chapitre de la 5ème partie de ce mémoire qui est dédié au futur de l'optimisation. Search Engine Optmization Nicolas MESSER 20/102 Le changement apporté par Google le 4 mai 2010 11 est visible sur la partie gauche à côté de la zone avec les résultats. Ceux-ci vous permettent de limiter vos recherches sur un certain type de résultats comme les images sans devoir encore une fois effectuer votre requête dans le moteur de recherche d'images de Google. Et beaucoup d'autres fonctionnalités comme la possibilité de limiter les résultats affichés sur des liens découverts dans les dernières 24 heures. Chapitre 3 : Comment les moteurs de recherche sont utilisés par les internautes Comment procèdent les internautes? Existe-t-il un schéma qu'on a pu relever à la majorité des recherches effectuées? Ceci était très clairement le cas dans le passé et s'applique toujours pour une grande partie des recherches effectuées sur les moteurs. Souvent l'internaute commence sa recherche avec un mot-clé global et petit à petit ajoute des termes plus spécifiques pour cibler les résultats. De comprendre le comportement des internautes n'est pas seulement un point très important pour les moteurs de recherche qui investissent des ressources énormes dans ce domaine pour améliorer leurs algorithmes et de servir des résultats plus précis et plus rapides. La facilité d'utilisation est quelque chose qui est souvent étudiée en relation avec des interfaces graphiques de logiciels. Dans ces études l'application des outils "eyetracking" qui poursuit les mouvements des yeux de l'utilisateur génèrent des "heatmap" montrant les endroits les plus focalisés par l'utilisateur. L'entreprise Enquiro a réalisé ce même genre d'étude en analysant les SERPs des différents moteurs de recherche. Cette étude montre que les internautes donnent beaucoup plus d'attention aux titres et mots-clés accentués dans les résultats naturels qui s'affichent en haut de la page. En fait, les internautes scannent les résultats affichés dans une forme qui ressemble à la lettre F. 11 Official Google Blog. A spring metamorphosis : Google's new look http://bit.ly/google-2010 (consulté le 19.06.2010) Search Engine Optmization Nicolas MESSER 21/102 Ce concept est souvent référence sous le terme de "Golden Triangle" 12 et montre l'importance de l'optimisation pour obtenir des meilleurs positionnements dans les SERPs. Figure 1-8. Le triangle d'or de Google 12 Enquiro. Enquiro Develops Google's Golden Triangle. http://bit.ly/golden-triangle (consulté le 29.05.2010) Search Engine Optmization Nicolas MESSER 22/102 Dans ce même concept du triangle d'or, on parle également de la ligne de flottaison, en anglais "the fold" qui commence sur la figure précédente à partir de la zone noire. Le placement de celle-ci dépend très fort de la résolution de l'écran de l'utilisateur. Peu importe sur quelle page de résultats votre site se positionnera, il est préférable d'être placé en dessus de cette ligne. Encore plus parce que le nombre de liens affichés avant la ligne de flottaison peut changer suivant l'intégration de liens sponsorisés et des résultats verticaux s'affichant en tout début de la page de résultats. Il a également été observé qu'on veut absolument être présent dans les premières trente positions, donc les trois premières pages de résultats. Ceci car des études dans le passé ont montré que très peu d'internautes dépassent cette fatidique troisième page de résultats lors de leurs recherches. Pourtant ces conclusions datent d'un temps ou la majorité des recherches ont été effectuées avec un seul mot-clé. Ceci semble avoir changé dans les trois dernières années vu que la plupart des internautes utilisent entre deux et trois mots-clés pour leurs recherches. Ce phénomène semble être liée au désir de recevoir des résultats plus pertinents et on en déduit que de plus en plus de personnes sont également d'accord de consulter les pages de résultats arrières des moteurs de recherche. Figure 1-9. Nombre de mots-clés utilisés dans une requête en janvier 201013 Conclusion (partie 1) Les recherches qui se font par les internautes sur les moteurs comme Google sont réalisées avec intention. L'internaute a envie de retrouver son contenu par le chemin 13 Trellian. Keyword and Search Engine Statistics. http://bit.ly/keyword-stats (consulté le 29.05.2010) Search Engine Optmization Nicolas MESSER 23/102 direct plutôt que de tomber dessus par hasard. L'optimisation pour les moteurs de recherche est certainement une des meilleures et plus importantes méthodes pour atteindre les clients aujourd'hui peu importe la taille de l'entreprise en question. Comprendre le fonctionnement et étudier le comportement des moteurs de recherche est une partie importante du travail pour chaque référenceur sérieux. Les moteurs changent et améliorent leurs algorithmes en permanence et il faut suivre leurs évolutions pour avoir un succès continu et ne pas perdre de positions dans les SERPs. On a également appris que les spiders des moteurs de recherche ne sont en principe rien d'autre que des logiciels qui viennent inspecter votre site. Et comme tous les logiciels, ces spiders ont des forces qu'il faudra utiliser pour faciliter leurs travaux et des faiblesses qu'il faudra essayer de neutraliser. Il est important de comprendre que même si vos pages on été lues par un spider cela n'est pas une garantie qu'elle sera indexée. Mais dans le 1er chapitre de la 3ème partie de ce mémoire nous allons étudier comment on peut vérifier si votre site a correctement été indexé par les spiders. Apprendre tout sur les moteurs de recherche et savoir comment optimiser son site web pour atteindre des meilleurs positionnements est un processus difficile avec l'évolution permanente des meilleures pratiques et les nouvelles opportunités d'optimisation. Il existe une grande quantité de sources sur le web et un vaste choix de livres sur ce sujet. Avec le volume d'informations accessibles, il peut être difficile de séparer le bon grain de l'ivraie et savoir suivre les bonnes consignes. Dans la suite de ce mémoire, je présenterai le noyau dur et les bases de mes recherches à partir d'un cas d'étude avec le site de la Haute école de Gestion (HEG) qui faciliterait votre entrée dans ce domaine. Malheureusement, le monde de l'optimisation est trop grand pour découvrir tous les concepts et stratégies en détails. Mais vous retrouvez toutes mes sources dans les bas de page et la bibliographie et je vous donnerais également les références pour les parties qu'on n'aura pas le temps de développer en détails pour continuer votre lecture et agrandir vos connaissances et compétences dans ce domaine. Si j'ai appris une chose pendant mes recherches, c'est qu'il faut se méfier des gens qui vous vendent leurs services avec l'argument de vous placer en tête des SERPs. Donc, je ne peux pas vous promettre une montée spectaculaire de votre site web, mais je vous assure que les pratiques dans ce mémoire répondent aux normes des moteurs de recherche majeurs et vont vous aider dans le travail d'optimisation. Search Engine Optmization Nicolas MESSER 24/102 Partie 2 : Le cas d'étude HEG Comment développer un site accueillant le SEO? L'optimisation pour les moteurs de recherche commence bien avant le vrai projet de création d'un site web. Pourtant du travail d'optimisation sur un site déjà existent est la situation la plus courante qu'un référenceur est amené à faire. Mais les spécialistes du domaine confirment qu'il est beaucoup plus facile d'optimiser un site qui n'existe pas encore au lieu d'adapter les bonnes pratiques connues à un site qui est déjà en ligne. Ceci ne se limite pas à la stratégie globale du site en développement, mais à nos jours comporte également le choix d'un CMS, l'architecture et la rédaction du contenu du site en question. De plus, des facteurs autres que l'application des bonnes pratiques connues sont connus pour avoir une influence sur le classement des résultats des moteurs de recherche. Ce ne sont pas seulement les mots-clés dans le titre et la densité* des mots-clés dans le texte principal qui font foi. L'âge d'un site ou la relevance des liens et son texte d'ancrage vers un site font également partie de l'algorithme de classement des moteurs de recherche. En plus, l'autorité et la popularité générale d'un site sont aussi des facteurs qui sont pris en considération et ceux-là ne sont souvent pas gagnés dès la mise en ligne d'un site, mais sont atteints par le temps. On voit que l'optimisation d'un site web comporte beaucoup d'aspects différents de la vie d'une entreprise et nécessite la collaboration de multiples personnes (ou départements) comme ceux du marketing ou ceux du service des ventes pour des résultats optimaux. Utiliser une seule stratégie ne peut avoir qu'un petit impact sur vos résultats. Appliquer une palette des ces stratégies dans la bonne combinaison par contre peut se révéler comme un moyen puissant dans vos efforts d'optimisation. Ceci est la raison pour laquelle l'optimisation n'est pas seulement perçue comme une science, mais considérée un art. What matters is how these things are done, and understanding how far each will get you on its own, and in tandem with other strategies and tactics. – Scott Smith Search Engine Optmization Nicolas MESSER 25/102 Chapitre 1 : Considérations avant le projet Analyse des mots-clés Un travail important qui précède tout travail de développement est l'analyse des motsclés. L'analyse des mots-clés et les sites de vos concurrents vous permettront non seulement d'identifier les requêtes optimales, mais également d'apprendre l'une ou l'autre chose sur vos clients virtuels. Comme cela a été confirmé par les trois spécialistes que j'ai questionnés, l'analyse des mots-clés peut être un travail long et suivant le contexte plutôt difficile. Par contre, les fruits de ce travail vous apporteront un avantage dans la suite de l'optimisation de votre site web. Et rappelez-vous que vous ne pouvez pas optimiser un site, si vous ne savez pas pour quel type de recherche vous aimeriez apparaître dans les premières positions et quel est le langage utilisé par vos clients. Une partie de ces données pourront très probablement être obtenues par les autres départements de votre entreprise et il ne faudra pas hésiter à les utiliser en votre faveur. Il s'avère également de considérer des possibles fautes d'orthographe et des fautes de frappe connues pour vos mots-clés essentiels car cela peut générer du trafic important. Pensez seulement quand vous avez fait la dernière fois une faute de frappe ou utilisé une orthographe incorrecte pour retrouver quelques choses avec Google dont vous ne vous êtes plus rappelé à cent pour cent. Un autre très bon moyen d'analyser et obtenir des mots-clés est l'outil Keyword Tool du service AdWords proposé par Google. Cet outil peut vous générer automatiquement des propositions de mots-clés pour votre site ainsi qu'afficher le nombre de recherches mensuelles effectuées sur un mot-clé. Search Engine Optmization Nicolas MESSER 26/102 D'après les trois spécialistes que j'ai pu questionner sur ce sujet, l'efficacité de cet outil semble plutôt être contesté, par contre plutôt facile à utiliser pour celui qui aimerait faire son analyse de mots-clés. Et même si ces données sont dites ne pas être tout à fait exactes, Google est certainement l'entreprise qui devra avoir une expertise avant tout le monde dans ce domaine et il faudra donc ne pas manquer d'utiliser cet outil gratuit. Figure 2-1. Outil de recherche mots-clés AdWords de Google Il est hors questions que les mots-clés avec des centaines ou même des milliers de recherches par mois semblent être plus intéressantes, mais il est important de savoir que ces mots-clés populaires représentent effectivement seulement autour de 30% du total des recherches effectuées sur le web. Malheureusement, les meilleures positions de ces mots-clés sont souvent déjà occupées par des sites avec une grande influence et il serait de ce fait beaucoup plus difficile de placer son propre site dans la partie intéressant des SERPs. Bien choisir ses mots-clés consiste donc à trouver un mélange entre le potentiel des termes choisis et la faisabilité d'un bon positionnement sur ceux-ci. Il faut intégrer des mots-clés populaires, mais ne pas oublier la masse. Search Engine Optmization Nicolas MESSER 27/102 Ceci confirme l'importance d'une analyse de mots-clés approfondie pour obtenir un spectre large de requêtes qui chacune tout seule ne produira pas beaucoup de visite, mais toutes ensemble pourront représenter jusqu'à 70% des recherches effectuées pour votre site web. La longue traîne Ce concept est connu sous le terme de "Long Tail*" et de multiples études ont été consacrées à ce sujet. Mais je vous propose d'étudier la source mentionnée dans le pied de page pour plonger plus profondément dans ce sujet de la longue traîne. Figure 2-2. Le principe du "Long Tail"14 J'ai réalisé une analyse de mots-clés pour notre cas d'étude de la HEG où j'ai également analysé "les concurrents" et essayé de trouver des mots-clés faisant partie du concept du "Long Tail". 14 Wired, Chris Anderson. The Long Tail. http://bit.ly/the-long-tail (consulté le 29.05.2010) Search Engine Optmization Nicolas MESSER 28/102 Analyse mots-clés de la HEG Dans un premier temps il faudra mentionner que les mots-clés représentatifs pour la HEG sont presque tous de haute concurrence et que les mots-clés actuellement choisis représentent assez bien les mots retrouvés sur les différentes pages du site de la HEG. Voici donc la liste des mots-clés actuels du site de la HEG. Mot-clé HEG Haute école de gestion de Genève HES HESGE Genève Suisse informatique de gestion économiste d'entreprise spécialiste en information documentaire Business Administration with a Major in International Management master bachelor MAS CAS EMBA DAS école supérieure formation Concurrence élevée élevée élevée élevée élevée élevée élevée élevée élevée élevée élevée élevée élevée Recherches mensuelles 74 000 73 1 000 000 6 600 1 830 000 9 140 000 60 500 320 28 <10 68 000 000 7 480 000 55 600 000 5 000 000 450 000 68 000 000 49 500 13 600 000 Pour trouver des mots-clés qui pourront faire partie de la longue traîne, j'ai soit composé des mots-clés existants, soit interrogé le site de la HEG pour retrouver des possibles mots-clés pertinents non utilisés. Le but de ce travail d'analyse est d'identifier des mots-clés qui on une concurrence moyenne ou faible, mais quand même un nombre de recherches mensuelles assez élevés. Un meilleur positionnement dans les SERPs de ces mots-clés pourrait éventuellement être atteint plus rapidement et plus facilement. Search Engine Optmization Nicolas MESSER 29/102 Voici donc la liste des mots-clés correspondants que j'ai pu identifier. Mot-clé Haute école de gestion formation hes économie d'entreprise recherche appliquée mba suisse bachelor informatique bachelor gestion information documentaire formation documentaire formation bilingue enseignement bilingue interdisciplinaire crédits ects système bologne échange erasmus cap manager Concurrence Recherches mensuelles faible moyenne moyenne moyenne moyenne moyenne moyenne moyenne moyenne moyenne moyenne moyenne moyenne faible 1 000 480 5 400 2 900 880 880 1 900 2 400 2 900 1 300 1 300 12 100 8 100 110 390 2 900 Quelle est l'utilité de ces informations qu'on a obtenues à partir de cette analyse des "concurrents" et des mots-clés? Premièrement, j'ai pu constater que la majorité des sites web des autres Hautes écoles du réseau HES-SO n'utilisent pas les métas informations description ou/et keywords. Nous allons parler de la balise description dans le 2ème chapitre de cette partie en plus de détails. Voici l'extrait du code HTML du site de la Haute de gestion de Fribourg qui nous dévoile que les mots-clés sont ignorés. <title>Haute école de gestion - Fribourg :: </title> <meta name="description" content=""/> <meta name="keywords" content=""/> L'inefficacité de cette balise dans le code pour l'optimisation d'une page web pourrait être la source de ce phénomène. Ceci a également été confirmé par les trois spécialistes que j'ai questionnés dans le cadre de mon mémoire. Search Engine Optmization Nicolas MESSER 30/102 Dans le cas de la HEG Fribourg, cela semble tout simplement être oublié comme m'a confirmé le responsable de l'équipe web pendant notre entretien téléphonique. Par contre, ce travail d'analyse n'est pas du temps perdu. Il est même très important de connaître ces mots-clés car dans l'optimisation dans les balises de titre, les balises d'en-tête (h1, h2, etc.) et le contenu ce travail vous permettra de placer ces mots-clés à des endroits stratégique importants. "Doing keyword researches, and on-page SEO, are categories of work, not tactics. There are hundreds of keyword research tactics, and thousands of onpage tactics, and my personal experience is that very few people either know them all or do most or them well." – Scott Smith Choix du nom de domaine Un autre point à prendre en considération est le nom de domaine et son extension. Utiliser le nom de votre entreprise ou une combinaison de mots-clés proche à votre activé est indispensable. Avoir un nom de domaine propre est certainement quelque chose que la HEG pourrait améliorer. Notre autre exemple, la Haute de gestion de Fribourg, utilise par exemple le nom de domaine http://www.heg-fr.ch. J'ai fait une demande chez Switch pour enregistrer le nom de domaine http://www.hegge.ch, mais ce nom de domaine est déjà enregistré. Par une recherche Whois15, j'ai pu identifier que le détenteur est les Hautes écoles spécialisées Genève. J'imagine donc que ce changement est peut-être déjà prévu dans le futur. Dans le cas d'une organisation internationale, il peut être une bonne idée d'acheter le même nom de domaine avec plusieurs extensions (.com, .fr, .ch) et de mettre en place une redirection 301 pour avoir les meilleurs résultats possibles dans les recherches locales. 15 who.is. Informations du nom de domaine heg-ge.ch http://bit.ly/whois-heg Search Engine Optmization Nicolas MESSER 31/102 Bien sûr le site d'une telle organisation peut être différent suivant le pays et dans ce cas le processus d'optimisation devient plus complexe. Il existe une différence entre l'optimisation et le déploiement d'un site pour plusieurs pays différents ou pour un pays comme la Suisse où nous avons plusieurs langues nationales. 16 Le premier cas est connu sous le terme "Geo Trageting " et pour le deuxième cas il n'existe pas de terme officiel, mais le terme "Multi-Language Countries Targeting17" est souvent retrouvé sur le web. Nous n'aurons pas plus de temps d'entrer en matière sur ce sujet dans le cadre de ce mémoire, mais je vous suggère de consulter les deux articles du Search Engine Journal pour commencer votre lecture. D'après les dernières connaissances, l'âge du nom de domaine (la durée depuis laquelle le nom de domaine est enregistré) semble également avoir une influence sur le positionnement dans les SERPs. Donc si vous avez une idée pour un projet pour lequel vous pensez mettre en place un site internet, il peut être utile de réserver le nom de domaine même si vous n'allez pas vous en servir de suite. 18 Récemment, Google a annoncé que le temps de réponse de votre site web est également évalué. Ceci étant quelque chose qui ne sera probablement pas sous votre contrôle direct, il est donc important de bien étudier les différentes offres d'hébergement pour être du bon côté au niveau technique ou d'en parler à vos spécialistes informatique. 16 Search Engine Journal, Ann Smarty. What's Most Effective for Geo Targeting? http://bit.ly/geo-targeting (consulté le 21.06.2010) 17 Search Engine Journal, Ann Smarty. SEO Case Study : Dealing With Multi-Language Countries Targeting http://bit.ly/multi-language (consulté le 21.06.2010) 18 Official Google Webmaster Blog. Using site speed in web search ranking http://bit.ly/googlespeed (consulté le 22.06.2010) Search Engine Optmization Nicolas MESSER 32/102 Chapitre 2 : Applications des Best Practices Ce n'est pas par hasard que j'ai choisit de faire le tour des best practices. Il est important de connaître les directives et recommandations des moteurs de recherche pour réaliser des bons résultats peu importe si vous êtes un apprenti ou spécialiste du domaine. Finalement pour une grande partie, ce sont les moteurs de recherche qui déterminent les règles et vont vous fournir des visiteurs. Il est donc incontournable de suivre ces meilleures pratiques le plus près possible. 19 On distingue généralement deux types de facteurs d'influence dans l'optimisation d'un site web. "Off page", les optimisations que vous pouvez adopter sans même travailler sur les pages de votre site comme nous l'avons en partie vu dans le 1er chapitre de cette partie du mémoire. Et "On-page", les optimisations que vous faites pour les pages de votre site pour les positionner par rapport aux mots-clés du contenu. Dans la suite de notre cas d'étude de la HEG, nous allons nous concentrer sur les optimisations "On-site" de bases car nous n'aurons pas le temps d'entrer en détails sur tous les aspects du processus d'optimisation. Le site www.archive.org, connu sous le nom "Wayback Machine", m'a permis d'aller consulter l'état du site de la HEG avant les derniers changements apportés. Figure 2-3. Site HEG avant 2010 19 Direct Media Traffic. Off Page Optimization VS On-Page Optimization http://bit.ly/off-on-page (consulté le 22.06.2010) Search Engine Optmization Nicolas MESSER 33/102 Par la suite nous allons nous référencer au site de la HEG actuel et également faire des remarques par rapport aux changements apportés depuis la dernière version. Figure 2-4. Site HEG actuel La balise <title> Le placement de mots-clés dans le titre de la page est un des éléments le plus important dans le classement des pages web. En effet cette information qui se trouve dans la partie <head> du code HTML est le seul méta tag qui est pris en considération pour identifier la pertinence par rapport aux recherches effectuées. <title>Haute école de gestion de Genève - Bienvenue à la HEG</title> Il est recommandé que les titres aient une longueur maximale de 64 caractères (espaces comprises), même si Google affiche effectivement 66 caractères. Un plus long titre ne pénalisera pas votre positionnement, mais les internautes ne pourront peut-être lire que les premiers 66 caractères de votre titre suivi de trois points dans ce cas. Search Engine Optmization Nicolas MESSER 34/102 En plus, le titre devra être le plus pertinent possible par rapport au contenu de la page. Donc assurez vous qu'au moins une partie des mots-clés, si pas tous, peuvent aussi être retrouvés dans le contenu de la page. La balise Meta <description> Même si le méta tag qui fournit la description pour une page de votre site ne fait plus foi dans l'évaluation de la pertinence, il peut quand même être bénéfique pour vous de lui consacrer un peu de temps. La description est le petit extrait qui s'affiche en plus du titre dans les SERPs et peut convaincre un internaute à cliquer sur votre lien ou de choisir un autre résultat de la liste. La longueur maximale pour la description est de 155 caractères (espaces comprises) et il semble que Google affiche effectivement 160 caractères avant de couper le texte. Il est donc important que le texte pour les deux métadonnées soit clair et précis tout en donnant le plus d'informations pertinentes à l'internaute qui a effectué la recherche. Voici les métadonnées description du site de la HEG. <meta content="Haute école de gestion de Genève - Bienvenue à la HEG" name="Description"> Si on analyse ces métadonnées, on peut identifier un potentiel d'amélioration. Le titre est clair et contient tout les mots-clés importants pour la HEG avec le nom complet. La seule chose qu'on pourrait changer est de mettre en avant le nom en anglais au lieu du "Bienvenue à la HEG", comme il est fait dans le logo du site. Search Engine Optmization Nicolas MESSER 35/102 Personnellement, je pense que les métadonnées de la description ne sont pas efficaces du tout. Le titre est tout simplement répété et on peut voir que Google a ajouté une information supplémentaire depuis la page d'accueil qui ne contient pas beaucoup de mots-clés signifiants. Figure 2-5. Extrait du site de la HEG sur la page de résultat de Google Ce schéma peut être observé sur toutes les pages du site de la HEG et j'en tire la conclusion que les métadonnées sont probablement générées automatiquement ou ignorées. Il serait donc recommandable d'améliorer ce processus pour ajouter plus de précision pour les internautes. Pendant mon entretien avec Madame Murbach, conceptrice Web de la HEG, mes observations ont été confirmées. Ceci est effectivement encore un travail en cours depuis la mise en ligne de la nouvelle version du site de la HEG. Propositions d'amélioration des balises <title> et <description> Sur l'ancienne version du site de la HEG cette balise était mieux renseignée. Voici l'extrait du titre qui était clair et précis et contenait le mot-clé HES en plus. <title>HEG - Haute Ecole de Gestion de Genève (HES)</title> Voici une proposition d'un titre optimisé qui prend en compte le nom de l'école en français et en anglais comme on le trouve dans le logo sur le site actuel de la HEG. <title>Haute école de gestion de Genève - Geneva School of Business Administration</title> Pourtant cette proposition permettra d'ajouter quelques mots-clés anglais, le titre compte 75 caractères et une partie sera donc coupée dans la page des résultats. Search Engine Optmization Nicolas MESSER 36/102 La balise de description n'a pas changé dans les deux versions du site de la HEG. Voici une proposition pour la description avec 142 caractères à partir de laquelle l'internaute pourrait avoir une meilleure idée sur l'activité de la HEG dans les SERPs. <meta content="La Haute Ecole de Gestion de Genève (HEG) s’adresse aux universitaire étudiants de haut qui niveau veulent axée une formation la pratique." sur name="Description"> Voici une autre proposition d'optimisation de la description avec 158 caractères qui pourrait être intéressante dans le cas de la HEG car elle intègre directement les informations de contact. <meta content="La Haute Ecole de Gestion de Genève, Campus de Batelle, Batîment F, 7 route de Drize, 1227 Carouge Tél. +41 22 388 17 00 (Lun au Ven de 8h-12h et 13h30-17h)" name="Description"> Les balises d'en-tête Les balises d'en-tête ne sont pas seulement un outil visuel, mais permettent de créer une structure hiérarchique pour votre site et contenu. Il existe six tailles d'en-tête, de la balise <h1>, la plus importante jusqu'à la balise <h6>. Il est important de respecter quelques "règles" pour pouvoir tirer le plus grand avantage des ces balises d'en-tête. La balise <h1> est le titre principal d'une page et ne devra pas être utilisé plus d'une fois sur la même page. Les autres balises <h2> à <h6> peuvent être utilisées plusieurs fois, mais il faut faire attention de respecter l'ordre hiérarchique imbriqué avec les répétitions. En analysant le site actuel de la HEG pour notre cas d'étude, j'ai observé que la balise <h1> est seulement résignée par une image (le logo de la HEG). Search Engine Optmization Nicolas MESSER 37/102 Figure 2-6. Balise d'en-tête <h1> du site actuel de la HEG Ceci n'était pas le cas avec l'ancienne version du site, et la HEG laisse passer un moyen extrêmement simple et efficace de placer des mots-clés pour un bon positionnement dans les SERPs. Figure 2-7. Balise d'en-tête <h1> de l'ancien site de la HEG Search Engine Optmization Nicolas MESSER 38/102 Propositions d'amélioration de la balise <h1> La solution actuelle sera acceptable seulement une fois que Google est les autres moteurs de recherche sont capables de reconnaître les caractères dans des images (traité plus en détails dans le 2ème chapitre de la 5ème partie du mémoire qui est consacré aux futur de l'optimisation). Je recommande donc très fortement d'ajouter du vrai texte dans la balise <h1> et de le faire disparaître avec des instructions CSS. Cette petite astuce permettra aux spiders des moteurs de recherche d'indexer le texte de la balise et en même temps de le cacher pour les internautes. De plus, je propose d'optimiser le texte alternatif de l'image de "HEG" à "Haute école de gestion de Genève" (plus de détails concernant le sujet dans la section "Optimisation des images"). L'optimisation des liens Le texte d'ancrage des liens internes est une bonne opportunité pour utiliser des motsclés significatifs plutôt que des textes comme "cliquer ici" qu'on retrouve souvent sur des différents sites web. Voici l'exemple d'un lien du site de la HEG lesquels me semble être généralement bien optimisés. <a href="/heg/formation-base">Formation de base</a> Une chose qui pourrait être améliorée est l’ensemble des liens de la partie "Actualité HEG". Tous les liens ont le même texte d'ancrage, ce qui n'est pas très utile. Voici l'extrait de code pour la nouvelle "Une recherche HEG récompensée par le Prix ARDITI" du 15 juin 2010. <a class="link-web" title="lien internet" href="/heg/actualites/2010/20100615.asp">Plus d'info</a> Search Engine Optmization Nicolas MESSER 39/102 Voici l'extrait de code pour le lien de l'annonce de la formation continue de CISCO de l'ancienne version du site de la HEG où le texte d'ancrage a été mieux renseigné. <span class="textept"><br> > plus d'info href="http://www.hesge.ch/heg/cisco">site [<a CISCO HEG</a>]</span> Ceci est à prendre en considération pour la structure des URLs (expliqué en détails dans la partie "La structure des URL") qui est construit principalement par les noms de ces fichiers.. Ce principe s'applique également aux fichiers PDF (et toute autre type de fichiers) qui sont également indexés et référencés par les moteurs de recherche. La grande majorité des fichiers PDF qu'on peut retrouver dans cette partie du site de la HEG ont des noms plus pertinents contenant des mots-clés plutôt que la date de publication comme nous l'avons vu avec l'exemple précédent. Construction des liens Comme nous l'avons appris dans l'introduction beaucoup d'autres facteurs font foi dans l'évaluation d'un lien comme l'autorité et sa pertinence. L'optimisation des liens interne est importante, mais avoir des liens depuis un autre site est toujours une bonne affaire. Cette stratégie est appelée "Link Building*" et souvent confondue avec le PPC (pay per click). L'efficacité des liens sponsorisés ou achetés est un sujet controversé dans le monde de l'optimisation et ne sera pas traité plus en détails dans ce mémoire. Search Engine Optmization Nicolas MESSER 40/102 Figure 2-8. Abstraction du concept Link Building Mais réfléchir comment vous pourriez obtenir un lien pertinent ou avec qui vous pourriez faire un échange de liens fait partie de l'optimisation de votre site web. Dans le cas de la HEG qui fait partie du réseau HESSO des liens entre les différents sites des Hautes écoles genevoises dans la partie "footer" pourrait être une option. Figure 2-9. Application possible du link building pour le site de la HEG Cette stratégie est par exemple employée par les sites du réseau des Hautes écoles de Fribourg. La seule chose qu'il faut se rappeler est que 100 liens du même nom de domaine sont moins efficaces qu'un lien de 100 noms de domaines différents. Ce n'est donc pas la quantité, mais la qualité des liens vers votre site qui est importante. Search Engine Optmization Nicolas MESSER 41/102 L'optimisation des images Nous avons déjà parlé de l'importance du nom de fichiers dans la partie de l'optimisation des liens qui s'applique également pour les images. Ceci est donc le premier élément qui nous permet de placer des mots-clés et d'en tirer un bénéfice pour le positionnement. L'autre élément des images qui permet de faire la même chose est l'attribut "alt". C'est le texte alternatif qui sera affiché au cas où l'image rencontrait des problèmes pendant le chargement. Lors de ma proposition d'optimisation pour la balise d'en-tête <h1>, nous avons également vu l'exemple du logo de la HEG. Voici l'extrait de code pour cette image. <img alt="HEG" src="/heg/img/heg-logo.gif"> Au premier coup d'œil cette image semble être en ordre, mais on peut toute fois l'optimiser dans le contexte de la HEG. Voici le même extrait de code optimisé. <img src="/heg/img/heg-geneve.gif" alt="HEG - Haute école de gestion de Genève"> On peut constater que j'ai apporté deux optimisations à part de l'ordre des instructions qui ne devra pas avoir d'importance. J'ai ajouté le mot-clé "geneve" au nom du fichier et plusieurs mots-clés par l'ajout du nom complet de la HEG. Le plan du site La création d'un plan du site, appelé sitemap, surtout en format XML peut aider à augmenter le nombre de pages indexées par les spiders des moteurs de recherche, mais n'aidera pas directement à votre positionnement. Il existe deux types de plan du site différents. Celui pour les humains, que l'on retrouve également sur le site de la HEG, et celui pour les spiders de moteurs de recherche. Search Engine Optmization Nicolas MESSER 42/102 Figure 2-10. Extrait du code d'un sitemap exemple en format XML20 Je viens d'expliquer l'importance du plan site pour les spiders, lequel n'est pas existent pour le site de la HEG, mais le deuxième type n'est pas moins important car il permet à vos utilisateurs de rapidement et directement accéder aux informations dont ils ont besoin. En fait, il faut penser en proximité pour bien comprendre le concept du plan de site. Un click depuis la page d'accueil vers le plan du site et un deuxième pour atteindre n'importe quelle autre page – du caviar pour les spiders des moteurs de recherche! Figure 2-11. Plan du site HEG 20 Sitemaps.org. What are Sitemaps? http://bit.ly/sitemap-xml (consulté le 29.05.2010) Search Engine Optmization Nicolas MESSER 43/102 Arborescence d'un site L'implémentation du plan du site, fait également du sens si on considère toujours que le nombre de clicks associés à un lien toujours est un facteur important dans le processus d'optimisation. Même si les avis de mes trois experts ne pourront pas se différencier plus sur ce sujet, l'idée du concept en général semble plutôt claire et Google semble quand même y 21 mettre un peu d'importance . Utilisation du fichier robots.txt Le fichier robots.txt doit être placé à la racine de votre site et le nom du fichier doit absolument être en minuscule et en format texte. Si ce fichier se trouve dans n'importe quel autre endroit sur votre serveur ou dans un autre format, il ne sera pas pris en compte par les moteurs de recherche. L'impact du fichier robots.txt 22 est contesté parce qu'une mauvaise instruction dans ce fichier pourrait priver une partie ou la totalité de votre site de l'indexation par les spiders des moteurs. Sachez donc, où mettre les pieds avant d'appliquer n'importe quoi dans ce fichier pour votre site. 21 Google Webmaster Blog. Importance of link architecture. http://bit.ly/link-depth (consulté le 23.06.2010) 22 Robotstxt.org http://bit.ly/fichier-robots (consulté le 29.05.2010) Search Engine Optmization Nicolas MESSER 44/102 Figure 2-12. Principe du fichier robots.txt Mais d'après mes recherches et mes expériences personnelles, il n'y a pas encore de technologie équivalente qui pourrait remplacer ce fichier à l'heure actuelle. Et l'avis de mes trois spécialistes montre quand même un effet plutôt positif avec une bonne application. De plus, cette méthode est incontestée dans la protection contre du contenu dupliqué23 (sujet que nous n'aurons pas le temps de traiter en plus de détails) et un moyen efficace et facile de fournir votre plan du site, donc les liens vers votre contenu, aux Spiders des moteurs de recherche. Figure 2-13. Fichier robots simple du site Abondance 23 Google Webmaster Tools Help. Duplicate content. http://bit.ly/contenu-duplique (consulté le 29.05.2010) Search Engine Optmization Nicolas MESSER 45/102 Je n'ai pas pu trouver un fichier XML appliqué dans le cas de la HEG. Il serait donc recommandable de vérifier le rythme d'indexation dans les Google Webmaster Tools (si la HEG dispose d'un compte pour les services Google) et dans le cas échéant créer un tel fichier pour le site de la HEG. La structure des URL Si vous utilisez un CMS ou faites appels à une base de données pour afficher une partie du contenu de votre site web, il se peut que vous vous retrouvez avec des liens dynamiques. Ceci est le cas de l'annuaire des collaborateurs qui peut être consulté sur le site de la HEG. Les paramètres dans l'url pourraient désorienter les moteurs de recherche et il est préférable d'utiliser des liens statiques. La situation aujourd'hui semble être que les moteurs de recherche n'ont pas de problème, si votre URL ne contient pas plus de trois de ces paramètres, ce qui est le cas pour le site de la HEG. 24 Pourtant si vous hébergez votre site sur un serveur Apache , le module mod_rewrite supporte cette technique par l'ajout des instructions nécessaires dans le fichier 25 .htaccess. Le URL rewriting est également possible avec le ASP , la technologie utilisée pour le site de la HEG, mais est un peu plus avancée que sous Apache. Cette optimisation pourrait également vous permettre de placer quelques mots-clés dans vos URLs ce qui peut améliorer le positionnement de vos pages. 24 Apache Software Foundation. Apache Module mod_rewrite. http://bit.ly/mod-rewrite (consulté le 29.05.2010) 25 Microsoft. URL Rewriting in ASP.NET. http://bit.ly/asp-rewrite (consulté le 29.05.2010) Search Engine Optmization Nicolas MESSER 46/102 Proposition d'amélioration de la structure URL Dans l'exemple de l'URL choisi précédemment, c'est l'entrée de mon directeur de mémoire, Alexandre Boder, qui est référencé par l'identifiant 35. Une URL optimisée pourrait avoir l'apparence suivante. Faciliter la navigation Depuis la nouvelle version du site de la HEG ce point semble avoir été amélioré. Sur l'ancien site le premier niveau depuis la page d'accueil était bien accessible, mais de trouver plus de détails était de loin une tâche facile. Le site actuel permet d'accéder à tous les détails en quelques cliques. En plus l'implémentation d'un fil d'Ariane (en anglais "breadcrumbs*") permet de retourner facilement dans les différents niveaux du site. Respect des standards W3C Avoir du code qui valide avec les standards du consortium W3C* et avoir un site accessible qui répond à l'initiative WAI n'est pas un critère dans l'établissement des classements par les moteurs de recherche, mais ce dernier est inclu dans les lois de plusieurs pays et ne peut donc pas être complètement ignoré. Pour les institutions Suisses c'est l'article 10 de l'Ordonnance sur l’élimination des inégalités frappant les personnes handicapées qui fait foi.26 26 Art. 10 Ohand, RS 151.31 http://bit.ly/rs-art-10 Search Engine Optmization Nicolas MESSER 47/102 Joost de Valk, spécialiste d'optimisation, a publié un article 27 sur ce sujet le 13 juin 2010, lequel résume bien la problématique qui se pose avec les standards du consortium W3C. De manière générale et d'après le message vidéo de l'employé Google, Matt Cutts, dans le même article cela n'apporte aucun avantage pour le positionnement de votre site. Par contre, si vous faites appel au service d'optimisation d'un spécialiste pour votre site, vous pouvez attendre que le nombre d'erreurs soit réduit au minimum. Le consortium W3C met à disposition un service28 pour valider son code HTML. Si on fait valider le site actuel de la HEG on obtient en retour 32 erreurs lesquelles sont principalement liées au service AddThis et au widget de Facebook qui sont utilisés sur les pages du site. Figure 2-14. Résultat de la validation W3C Proposition d'autres améliorations En analysant le site de la HEG, j'ai identifié deux autres points qui ne sont pas directement en rapport avec le sujet de ce mémoire, mais qui pourront améliorer la perception et l'expérience des visiteurs du site. 27 Joost de Valk. W3C Validation & SEO. http://bit.ly/w3c-validation-seo (consulté le 23.06.2010) 28 W3C. Markup Validation Service http://bit.ly/w3c-validation Search Engine Optmization Nicolas MESSER 48/102 Premièrement, sur la page "Contact" l'ajout d'un formulaire qui permettra aux internautes de remplir une demande de contact directement sur le site pourrait éventuellement augmenter le nombre de prise de contact. Le fait de devoir ouvrir un logiciel de messagerie ou copier l'adresse souhaitée dans le champ destinataire d'une interface web d'un service de messagerie peut représenter un obstacle pour les internautes. Le deuxième point concerne la section avec les témoignages d'étudiant-es. Je pense que cette partie du site est spécialement importante pour attirer des nouveaux étudiants. Avoir des portraits est une bonne idée, mais peut-être une sorte de blog par les étudiants de la HEG avec leurs expériences tout au long de l'année académique pourrait intéresser beaucoup de monde et aider à convaincre des futurs étudiants. Chapitre 3 : "Black hat" – les stratégies à éviter Les stratégies artificielles d'optimisation, plus couramment connues sous le nom "black hat*" et jugées non éthiques ont pour but de tromper les moteurs de recherche et de propulser le positionnement d'un site web dans les SERPs. Des multiples stratégies de spamming avec des approches différentes ont été utilisées dans le passé pour améliorer la visibilité d'un site web. Certaines ont connu plus de succès que d'autres, en appliquant plus ou moins le même concept de fournir du contenu non relevant par rapport aux mots-clés recherchés. Commençons ce chapitre par une technique qui est souvent employée par les développeurs web. Ce sont des éléments HTML cachés29. L'utilisation de cette technique peut avoir plusieurs raisons qui ne sont pas forcements considérés comme mauvais. Les menus déroulants emploient même presque tous cette technique. Dans ce cas il semble évident que votre intention n'est pas de faire indexer des mots-clés ou du texte caché qui pourront aider à votre positionnement. Mais malheureusement, cette technique est de plus en plus abusée pour ce genre de chose et il circule des rumeurs que Google n'index plus ces éléments HTML cachés. 29 Google Webmaster Central. Hidden text and links. http://bit.ly/hidden-text (consulté le 26.06.2010) Search Engine Optmization Nicolas MESSER 49/102 Une autre technique qui n'appartient pas à cette catégorie mais a les mêmes effets sont les fonctionnalités proposées par le JavaScript et Ajax. L'utilisation de ces techniques permettra par exemple de rafraîchir une partie de votre site web sans devoir rafraîchir la page entière. Le problème avec ces fonctionnalités est que les spiders des moteurs de recherche ne vont pas exécuter le JavaScript nécessaire pour accéder à ce contenu. Il faut donc être sûr de maitriser cette technologie à fin d'éviter que votre site soit incorrectement indexé. Passons donc aux techniques qui auront avec une très grande possibilité pour conséquence une punition chez les moteurs de recherche et donc une influence pour votre positionnement actuel ou même l'exclusion des SERPs dans des cas extrêmes. Une stratégie d'optimisation qui s'est prouvé extrêmement efficace dans le passé est le "Cloaking*". Figure 2-15. Représentation visuelle du Cloaking Search Engine Optmization Nicolas MESSER 50/102 L'idée derrière cette stratégie est de présenter des contenus différents pour les vrais visiteurs de vos sites et les spiders des moteurs de recherche. Malheureusement, ceci a aussi été largement repris par les spammers et abusé excessivement dans le passé et est donc devenu un tabou dans le monde de l'optimisation. Pourtant, il y a des experts dans le domaine qui disent qu'il est toujours possible 30 31 d'utiliser cette stratégie avec prudence , mais la position des moteurs de recherche à ce sujet est très claire et les possibles punitions ne valent pas la peine de prendre le risque. L'autre stratégie qui a souvent été utilisée surtout en relation avec des produits pharmaceutiques est connue en anglais sous "Doorway pages*". Le terme français est l'utilisation des pages satellites qui a pour but d'utiliser une page extrêmement optimisée pour un certain mot-clé tout en appliquant une redirection vers la page officielle qui souvent n'a rien en commun avec le sujet de cette dernière. Une stratégie qui a été utilisée dans le passé, mais qui est dite de ne plus avoir d'impact du tout, est l'accumulation des mots-clés. Ceci semble être le cas déjà pour un certain moment et se confirme au moment où la balise méta des mots-clés a été ignorée par les moteurs de recherche. Pourtant, je pense qu'il faudra toujours mettre un œil sur ce point parce que Google a toujours une entrée 32 dans l'aide pour les webmasters, qui dit que ce comportement peut influencer votre positionnement. Conclusion (partie 2) Maîtriser le travail d'optimisation d'une part est seulement possible avec une compréhension profonde des directives et bonnes pratiques du domaine et nécessite de la patience. Avoir du succès avec l'optimisation d'autre part, nécessite une compréhension approfondie de l'entreprise en question. Quels sont les biens et services ou encore informations que vous avez à offrir? 30 SEOmoz, Rand Fishkin. White Hat Cloaking: It Exist. It's Permitted. It's Useful. http://bit.ly/white-cloaking (consulté le 26.06.2010) 31 Google Webmaster Central. Cloaking, sneaky JavaScript redirects, and doorway pages. http://bit.ly/google-cloaking (consulté le 26.06.2010) 32 Google Webmaster Central. Keyword stuffing. http://bit.ly/stuffing-keywords (consulté le 26.06.2010) Search Engine Optmization Nicolas MESSER 51/102 L'analyse des mots-clés qui devrait précéder chaque projet de création d'un site web est un travail complexe, long et souvent pénible, mais la récompense potentielle est très grande. Une fois ce travail de réflexions accomplit, vous pouvez commencer à réfléchir sur l'architecture et le développement de votre site. Avoir du contenu avec le plus de mots-clés possibles était la façon d'optimiser les sites web dans le passé. Des indicateurs comme la densité des mots-clés sont apparus pour évaluer le niveau d'optimisation du contenu d'un site. Aujourd'hui toujours efficace, ces indicateurs ont beaucoup moins d'influence sur le positionnement dans les SERPs et ne sont dans aucun cas une assurance pour avoir des visiteurs satisfaits. Ceci ne veut pas dire qu'il ne faut pas utiliser quelques-uns de vos mots-clés dans vos pages, mais rédiger votre contenu surtout pour les visiteurs de votre site et non pas pour les moteurs de recherche. Si vos efforts ne vous permettront pas de vous placer dans les meilleures positions des SERPs, vous succomberez peut-être à la tentation d'utiliser des stratégies artificielles d'optimisation. Le référencement "black hat" vise pour des résultats immédiats en trompant les moteurs de recherche. Avant de passer à ces stratégies, prenez en considération qu'une punition pour votre site par les moteurs de recherche est très probable dans ce cas de figure. Il se peut que vous violiez les recommandations par les moteurs de recherche sans le savoir car il existe une zone grise dont les frontières sont passablement brumeuses. Les moteurs de recherche sont conscients des stratégies existantes, mais ne peuvent pas connaître vos intentions. De plus, si votre unique but est simplement d'augmenter le nombre de visiteurs de votre site, il existe des moyens comme le PPC dont vous n'aurez pas à craindre d'inconvénient en les appliquant. Search Engine Optmization Nicolas MESSER 52/102 Même si les moteurs de recherche n'ont pas pu découvrir votre intention, vos concurrents ou des webmasters malveillants ont la possibilité de vous dénoncer à tout moment. Figure 2-16. Formulaire pour annoncer du spam à Google33 Et une fois attrapé, il est dit difficile de regagner la confiance des moteurs de recherche. Garder donc la distance des stratégies artificielles pour avoir le moins de risques et le plus de résultats possibles sur le long terme. 33 Google Webmaster Tools. Spam report http://bit.ly/spam-report Search Engine Optmization Nicolas MESSER 53/102 Partie 3 : Le suivi et l'évaluation des résultats Un des plus grands défis dans le suivi et l'évaluation des efforts d'optimisation est le délai important entre l'implémentation et le recueil des résultats. En général, les premiers résultats peuvent être visibles environs 24h plus tard, mais pour avoir une collection pertinente de données utilisables, des semaines ou même des mois sont nécessaires. Mais certains des outils peuvent être utilisés dès le début pour contrôler le travail de base pour l'optimisation d'un site web. En fait, les moteurs de recherche sont les outils les plus basiques à disposition des spécialistes du référencement. La majorité des moteurs disposent d'une boîte à outil riche qui permet de réaliser des recherches avancées, faire des interprétations et procéder à des analyses des concurrents. Nous allons découvrir les commandes mises à disposition par Google et d'autres outils plus avancés en plus de détails dans le chapitre inutile "Comment suivre les stratégies mise en place". Google favorise l'affichage de contenus divers dans les SERPs grâce à une méthode appelée "Query Derserves Diversity (QDD)"34. On peut anticiper de cela que pour avoir des bons résultats, spécialement chez Google, il faudra un travail plus conséquent. Le terme anglais souvent utilisé en rapport pour ce genre de travail est "Reputation Management ou Branding". Le suivi de la réputation de sa marque, peut donc représenter une autre partie importante du suivi de l'optimisation. Si tout a bien fonctionné, vos efforts d'optimisation auront attribué une plus grande attention à votre marque sur le web. En même temps que cela peut être positif et exactement ce que vous avez voulu, cela a certainement aussi attiré l'attention de ceux qui vous aiment un peu moins. Il se peut donc qu'en même temps que l'intérêt pour votre entreprise est devenu plus importante, les voix négatives se soient multipliées de leur côté. Pour l'identité de votre entreprise, il est critique de trouver ces résultats, et une fois identifiés de les traiter avec prudence et certitude. Des exemples dans le passé ont montré deux scénarios. Celui où l'absence d'une réaction adaptée a eu un impact énorme sur la réputation de l'entreprise en question. 34 SEOmoz, Rand Fishkin. Does "Query Deservse Diversity" Algorithm Exist at Google? http://bit.ly/query-diversity (consulté le 26.06.2010) Search Engine Optmization Nicolas MESSER 54/102 Ou alors l'inverse ou la perception et l'image de l'organisation se sont améliorées chez le grand public grâce à une réaction à temps et appropriée. L'exemple par excellence vient de l'entreprise américaine Blendtec avec leur campagne "Will it blend" 35 qui est même apparu dans le Bloomberg Business Week. 36 Chapitre 1 : Comment suivre les stratégies mises en place Google et les moteurs de recherche en général disposent d'une boîte à outils riche qui est accessible à tout le monde et permet de réaliser plusieurs tâches de base dans le suivi des stratégies d'optimisation. Je ne présenterai ici qu'une poignée de ces commandes en détails, mais vous retrouvez une liste complète avec les commandes les plus importantes dans la partie annexe de ce mémoire. Dans la plupart des projets, vous disposerez d'une idée du nombre de pages que comporte le site web. Il est donc très utile de savoir si vos efforts pour faciliter l'indexation de ces pages par les spiders des moteurs de recherche ont rencontré du succès. La commande (site:) peut vous donner une valeur approximative du nombre de pages qui ont été indexées par les spiders de Google. Dans l'exemple du site de la HEG, cette requête retourne 1'450 pages. Il faut prendre en considération que cette commande retourne également les fichiers comme des PDFs qui peuvent également être indexés par les spiders des moteurs de recherche s'ils sont références dans une page par un lien textuel. Cela représente également une opportunité de vérifier si vos instructions du fichier robots.txt sont bien appliquées. Si par exemple vous avez décidé de bloquer une certaine partie de votre site web et vous retrouvez une page appartenant à cette partie dans ces résultats, il y a certainement un problème avec les instructions ou le fichier robots.txt de votre site. 35 Portail "Will it blend" (http://bit.ly/will-blend) 36 Bloomberg Businessweek, Rachael King. Business Goes Straight to Video (http://bit.ly/bbwblend) Search Engine Optmization Nicolas MESSER 55/102 Si vous aimeriez savoir qui utilise un certain mot-clé, à priori les vôtres, dans son URL ou comme titre pour ses pages, les commandes (inurl:) et (allinrul:) ou alors (intitle:) et (allintitle:) vous fourniront les réponses désirées. Cette requête nous retourne environs 66'000 résultats. Mais dans le cas de la HEG cela n'est pas très représentatif car l'acronyme semble être utilisé dans une variété de domaines qui n'ont rien en commun avec la formation universitaire. Il serait donc plus adapté d'utiliser la combinaison de plusieurs mots-clés. Nous notons l'utilisation du mot-clé "geneve" sans accent car pourtant aujourd'hui il est possible d'enregistrer des noms de domaines avec des combinaisons de chiffres et lettres accentuées, cela n'est pas encore très répandu sur le net aussi à cause de la langue dominante qui est l'anglais. De même est vrai pour les majuscules. Ceci est pourtant plus utilisé, mais les moteurs de recherche ne sont généralement pas sensibles à la case pour le cas des URLs. Dans les deux cas évoqués, des différences plus ou moins importantes sont possible, dans les résultats obtenus qui dépendent de la région de l'internaute ou de la langue appliquée au terme recherché. Cette deuxième requête retourne environs 1'690 résultats et on constate qu'en général les résultats retournés semblent être plus pertinents pour retrouver des liens référençant le site de la HEG. Dans le cas des deux dernières commandes qui font la recherche à partir du titre de la page, on peut observer le même phénomène. La première version de la requête retourne un nombre beaucoup moins important. Cela est certainement dû à l'effet que, dans ce deuxième cas l'orthographe joue un rôle et donc le terme "heg geneve" ne retournera pas le même résultat que le terme "heg genève" que j'ai employé dans cet exemple. Search Engine Optmization Nicolas MESSER 56/102 Même si la précédente méthode vous permet de découvrir des liens vers votre site, il existe une méthode plus efficace pour avoir une idée sur le nombre de lien par la commande (inanchor:) et (allinanchor:). De nouveau la première requête nous retourne le nombre énorme d'environ 1'020'000 résultats ce qui ne semble pas être réaliste dans le cas de la HEG. La deuxième version de la requête semble plus pertinente en analysant les résultats retournés et le nombre d'environ 11'200 résultats. Comme dans le cas de la recherche dans les titres des pages, l'orthographe a une influence sur le nombre de résultats retournés et les résultats peuvent dépendre fortement de la langue appliquée au(x) mot(s)-clé(s) recherché(s). Enfin, même avec toutes ces informations accessibles directement par l'interface des moteurs de recherche, il est indispensable d'avoir un compte avec les outils pour les webmasters chez les moteurs majeurs comme Google, Yahoo! et Bing. Cela vous permettra d'accéder à une bonne partie de ces informations et d'autres qui ne sont pas accessibles par l'interface du moteur de recherche sans devoir interroger la requête à la main. Search Engine Optmization Nicolas MESSER 57/102 Figure 3-1. Aperçu du Dashboard de GWT L'outil Google Webmaster Tool (GWT) permet d'accéder à une représentation visuelle plus agréable de toutes des informations qu'on vient de voir précédemment ainsi que des informations supplémentaires importantes. Vous pouvez par exemple soumettre votre fichier sitemap en format XML et GWT vous affichera le nombre de pages indexés. Figure 3-2. Informations sitemap de GWT Des informations importantes pour les webmasters qu'on n'a pas pu exploiter par les commandes précédentes, sont les erreurs d'indexation. GWT vous informe si une de vos pages n'a pas pu être indexée et le type d'erreur rencontré. Figure 3-3. Erreurs d'indexation de GWT Search Engine Optmization Nicolas MESSER 58/102 Des autres outils encore plus spécialisés comme Google Analytics peuvent également vous fournir toute sorte de données. Dans la suite, je vais vous présenter les plus importantes qui méritent d'être suivies et analysées dès le début dans Analytics. Figure 3-4. Aperçu du Dashboard de Google Analytics Circulation par moteurs de recherche. Ceci pourra vous permettre de découvrir d'éventuels problèmes avec un moteur spécifique et/ou indiquer pour lequel des moteurs il faudra consacrer un peu plus de temps dans le futur. Figure 3-5. Aperçu de la circulation par moteurs de recherche Search Engine Optmization Nicolas MESSER 59/102 La circulation par mot-clé Cela fournit les données essentielles pour améliorer votre visibilité auprès des moteurs de recherche. Vous ne pouvez pas seulement vérifier si vos mots-clés choisis vous fournissent le nombre de visiteurs souhaités, mais également découvrir des mots-clés de la longue traîne omis dans votre sélection. Figure 3-6. Aperçu de la circulation par mot-clé L'utilisation des outils d'analyse en général semble plutôt être difficile par le fait qu'ils fournissent plus d'informations qu'on a effectivement besoin. Par contre l'importance d'avoir accès à un tel outil est grande, car c'est avec ces informations qu'on sera capable de faire des adaptations aux stratégies et continuer à améliorer son positionnement. Search Engine Optmization Nicolas MESSER 60/102 Chapitre 2 : ROI dans l'optimisation pour les moteurs de recherche Si vous vous êtes déjà un peu occupé des logiciels d'analyse, souvent installés par défaut avec les offres d'hébergement, ou si vous avez déjà eu l'occasion de voir l'interface d'un outils proposé par les moteurs de recherche comme Google Analytics, vous avez certainement observé qu'il y a un nombre de données presque infini. Je dirais même qu'il y a probablement trop de données pour le suivi d'un site de taille moyenne. Il est donc important de savoir lesquelles de ces données méritent d'être analysées et lesquelles vous pouvez ignorer avec bonne conscience (en tout cas au début de vos efforts d'optimisation). Indicateur : nombre de visiteurs Le nombre de visiteurs et visiteurs uniques de votre site vous permettra de voir si vos efforts attire des nouveaux visiteurs ou si ce sont toujours les mêmes qui viennent sur votre site. Cela ne veut pas dire que d'avoir des visiteurs fidèles est une mauvaise, mais l'objectif ultime de l'optimisation est de conduire le plus de clients potentiels vers votre site. La fidélisation de ces derniers est certainement à envisager, mais si votre site se présente pertinent à leurs recherches et offre du contenu intéressant cela est souvent une conséquence explicite. Indicateur : nombre de vues par pages Le nombre de vues par pages est une autre métrique importante. Avec ces données vous pourrez analyser quelles pages intéressent vos visiteurs et adapter votre contenu à leur goût. De même si vous vendez vos biens ou services en ligne vous pourriez calculer un vrai ROI en fonction du nombre de vue d'une page, ce qui devrait inciter le visiteur à acheter un bien ou service par le nombre de commandes effectuées. Exemple calcul rendement pour la HEG Dans le cas de la HEG, on pourrait par exemple suivre le nombre de vue de la page contenant le bulletin d'inscription (ou même le nombre de téléchargement de ce dernier) par rapport au nombre de dossiers effectivement reçus. Search Engine Optmization Nicolas MESSER 61/102 Google Analytics permet de faire ceci et le lien du fichier d'inscription qui actuellement a le mark-up suivant: <a class="link-pdf" target="_blank" title="document pdf" href="doc/ckd12_06_bulletin_inscription.pdf">Bulletin d’inscription</a> aura plutôt un mark-up qui correspond au suivant: <a class="link-pdf" d'inscription à target="_blank" la title="Bulletin HEG" href=" doc/ckd12_06_bulletin_inscription.pdf " onClick="javascript: pageTracker._trackPageview('/fichiers/bulletininscription'); "> Bulletin d’inscription</a> Ceci enregistrerait une vue pour la page /fichiers/bulletin-inscriptions dans l'interface de Google Analytics à chaque click (égal à un téléchargement) du fichier d'inscription. Chapitre 3 : Evaluer à quelle fin ? La difficulté de définir et calculer un ROI dans le monde du référencement est que très souvent les seules informations que vous avez à disposition sont des chiffres comme le nombre de visiteurs par jour ou la durée moyenne d'une visite sur votre site. Il est très difficile de quantifier ce type de données et de leurs attribuer une valeur. Si vous tenez à jour un blog sur votre site où vos visiteurs peuvent laisser des commentaires ou si vous disposez d'un formulaire de contact, vous disposeriez au moins d'un nombre total d'interactions par jour ou mois. Ce type de données vous permettra déjà de faire des conclusions plus précises sur la valeur de votre site. Et si en plus, vous proposez vos biens ou services directement dans une boutique en ligne, vous pourrez réaliser des évaluations du ROI beaucoup plus précises. De ceci on peut déduire cinq indicateurs principaux qui pourront vous aider à calculer un ROI. Ce sont la portée, la fréquence des visites, la sphère d'influence, les conversions (transactions effectuées) et la persistance. Search Engine Optmization Nicolas MESSER 62/102 Si en prend on considération une approche d'évaluation d'objective souvent utilisé dans le marketing traditionnel ou en gestion de projet, l'acronyme mnémotechnique SMART (spécifique, mesurable, atteignable, réaliste, temporellement défini) vient en tête. Je pense que cela montre très clairement que pour calculer le ROI dans le monde du référencement on ne peut généralement pas suivre des moyens de calcul connus. Chacun doit trouver et définir ses propres indicateurs qui vont permettre d'avoir une idée sur le ROI et de suivre les progrès. Conclusion (partie 3) Vous ne verrez pas de résultats le lendemain de votre travail, mais la patience et un engagement sur long terme est garant pour une amélioration de votre situation. Les outils d'analyse peuvent vous fournir un nombre de données précieuses dans le processus d'optimisation. De connaître et savoir utiliser ces outils peut vous aider à améliorer vos pages pour atteindre un meilleur positionnement dans les SERPs. Mais il ne faudra pas oublier que les moteurs de recherche et spécialement Google sont connus pour changer et améliorer leurs algorithmes en permanence ce qui peut contribuer à de petits changements réguliers des résultats. Il est donc important qu'avec le temps vous soyez capable d'identifier et cibler ces changements car ils n'ont aucune importance du point vu d'optimisation. Search Engine Optmization Nicolas MESSER 63/102 Partie 4 : L'influence des médias sociaux Aujourd'hui, la quantité des méthodes par lesquelles il est possible de favoriser son référencement est quasi infinie, et les médias sociaux sont pour une bonne partie la source de ce phénomène. Le terme médias/réseaux sociaux décrit les sites web qui réunissent des internautes de la même culture ou d'intérêts communs. Le concept général des médias sociaux est d'utiliser ces différents canaux de communication pour faire du marketing direct aux endroits où se trouve votre public cible. Tout ceci pointe dans la direction du management de la réputation et peut apporter du bénéfice à n'importe quelle entreprise. Avez-vous déjà recherché le nom de votre bien ou service sur Google? Savez-vous ce que les clients disent sur vos biens ou services ou votre marque? Si oui, est-ce que vous n'avez pas senti le désir de répondre à quelques remarques? Il est bien connu que les mauvaises nouvelles sont souvent plus rapidement partagées et font plus de bruits que des éloges. Avec les médias sociaux vous disposez d'un moyen de communication rapide et directe pour atteindre la communauté autour de votre marque et la possibilité de l'influencer en votre faveur. Les gens partageront leurs opinions peu importe si vous décidez de participer à ce dialogue ou pas. Et en même temps, cela vous permettra d'atteindre des groupes que vous n'auriez pas pu atteindre par les canaux de communication traditionnelle. Search Engine Optmization Nicolas MESSER 64/102 L'utilisation efficace des médias sociaux représente presque un travail spécialisé en plus de l'optimisation. L'idée n'est pas seulement d'augmenter sa visibilité, mais de construire des stratégies de marketing viral* qui ont subi un changement profond avec l'évolution de l'Internet. Figure 4-1. Le principe du marketing viral Search Engine Optmization Nicolas MESSER 65/102 Chapitre 1 : Aperçu des médias sociaux populaires Facebook Sans doute le réseau social le plus connu pour toutes sortes d'activités aujourd'hui est Facebook. Et clairement dans le contexte de la HEG ce réseau représente une plateforme indispensable pour entrer en contact avec les jeunes d'aujourd'hui qui fréquentent très fortement ce média. Figure 4-2. Site de la HEG sur Facebook Twitter Twitter est le leader dans l'émission des messages de textes, également appelé microblogging. Aujourd'hui beaucoup d'entreprises utilisent ce média pour une sorte de service client, non seulement avec le but d'être plus proche de la clientèle, mais de pouvoir réagir plus rapidement sur des voix critiques. Un exemple de ce type de service client d'une entreprise Suisse est les CFF37. En fait, j'ai fait l'expérience moi-même une fois après avoir envoyé un message que mon train avait du retard dans lequel j'avais annoncé de ne pas savoir si j'allais pouvoir prendre mon train de correspondance à Zurich. 37 CFF. @railservice sur Twitter. http://twitter.com/railservice Search Engine Optmization Nicolas MESSER 66/102 Figure 4-3. Réaction de la CFF sur Twitter LinkedIn LinkedIn est le leader pour connecter les professionnels. L'orientation business de ce média est probablement la source d'une particularité pour ce réseau social en proposant des niveaux de comptes d'utilisateurs différents sur cotisation mensuelle. Figure 4-4. Profile de la HEG chez LinkedIn Ce ne sont pas les fonctionnalités qui changent quand on est d'accord de payer une cotisation, mais le compte utilisateur aura moins de restriction pour entrer en contact avec d'autres utilisateurs. C'est comparable avec le principe d'une loge VIP lors d'un congrès où il serait probablement plus facile de contacter certaines personnalités. Search Engine Optmization Nicolas MESSER 67/102 Wikipedia La HEG dispose également d'une entrée chez Wikipedia qui est une source souvent utilisée par les internautes pour retrouver des informations. Le problème qui se pose avec Wikipedia est que n'importe qui peut y faire des changements et donc fausser l'information disponible. Figure 4-5. Page Wikipedia de la HEG Autres services sociaux Digg ou encore Delicious sont des endroits où vous pouvez partager vos favoris avec le monde. Et bien sûr YouTube qui a déjà produit des stars d'Internet par la diffusion et le partage de vidéos. Chapitre 2 : Quel gain apporté par les médias sociaux? Les médias sociaux sont avant tout un moyen de mettre en avant son contenu et augmenter sa popularité. Et même si pour la plupart des ces services les liens ne sont actuellement pas comptabilisés par les moteurs de recherche, ils apparaissent dans les SERPs et sont sûr de vous amener des visiteurs. C'est le point souvent révélé par les experts du domaine des médias sociaux, que ce sont finalement souvent ces services populaires qui recevront la référence (le vote) par un lien et non le site original. Donc l'amélioration de la visibilité chez les moteurs de recherche n'est pas transmise directement à votre site. Search Engine Optmization Nicolas MESSER 68/102 Par contre, vos profiles chez les médias sociaux ont une forte chance d'être très bien placé dans les SERPs. Ceci est en partie dû à l'introduction de la recherche universelle dont nous allons parler dans la partie suivante de ce mémoire. Et donc un lien sur votre profil pourra quand même rapporter indirectement plus de visibilité à votre site. Figure 4-6. Résultats Facebook et LinkedIn chez Google pour la HEG De plus, un outil comme Twitter ou un blog vous permettra de réagir et publier plus rapidement vos réactions à des événements comme nous l'avons vu dans l'exemple du chapitre précédent. Pour une fois le silence n'est pas d'or. Dans l'ère de l'Internet on attend de vous un communiqué officiel plutôt aujourd'hui que demain. Le laboratoire des Technologies et l'Information (LTI) dispose d'un blog38 qui reprend le design du site de la HEG, mais qui n'est malheureusement pas mentionné sur la page d'accueil de la HEG. Conclusion (partie 4) Dans le monde d'aujourd'hui les gens que vous aimeriez atteindre utilisent presque un nombre illimité des médias sociaux. C'est un environnement beaucoup plus complexe que les concepts utilisés dans les campagnes marketing traditionnelles. Développer et mettre en place des stratégies pour ces services nécessite parfois un investissement financier et peut prendre beaucoup de temps avant qu'on devienne un membre de confiance dans une communauté. Mais si ces stratégies sont bien implémentées et accueillies par les membres de la communauté, le bénéfice peut être plus grand que prévu au départ. Il faut voir l'utilisation et le marketing par les médias sociaux comme une forme de relations publique moderne. Vous pouvez atteindre plusieurs objectifs par les médias 38 Centre des Technologies et de l'Information. Le blog du LTI http://bit.ly/blog-lti Search Engine Optmization Nicolas MESSER 69/102 sociaux de la simple croissance des visiteurs sur votre site à l'augmentation des ventes de vos biens et services. Même si ces outils sont certainement plus faciles à gérer que le référencement, le temps est également un facteur important. Créer et soigner une relation avec les milliers de personnes présentes sur les médias sociaux, ainsi que participer activement à l'interaction peut occuper une personne à plein temps. Ce phénomène a donc donné naissance à un nouveau métier dans les grandes entreprises qui est souvent connu sous le nom "Community Manager"39. Cette personne est une voix officielle 40 de l'entreprise qui est en contact direct avec vos clients, actionnaires ou tout simplement les membres des communautés dans lesquelles vous êtes actif. Les médias sociaux ont pris même un rôle tellement important qu'il y a des spécialistes des deux domaines, référencement et médias sociaux, qui disent que l'ère où les classements des moteurs de recherche se font uniquement par un calcul purement algorithmique est finie. L'intégration des résultats en temps réel 41 fournit par les médias sociaux montrait la prise en compte du comportement des internautes. 39 WebWorkerDaily, Dawn Foster. Online Community Manager: Yes, It's Really A Job. http://bit.ly/com-man (consulté le 26.06.2010) 40 Chris Brogan. Essentials Skills of a Community Manager http://bit.ly/community-skills (consulté le 26.06.2010) 41 Official Google Blog. Relevance meets the real-time web. http://bit.ly/real-search (consulté le 26.06.2010) Search Engine Optmization Nicolas MESSER 70/102 Partie 5 : Le future de l'optimisation Le rôle des moteurs de recherche ne changera certainement pas avec l'évolution de technologies dans les années à venir. Mais les différentes méthodes d'optimisation à disposition vont grandir avec ces évolutions. A quel moment ces différentes évolutions techniques seront introduites est difficile à dire, mais de commencer à connaître la direction et comprendre les concepts pour ne pas être perdu quand le feu vert sera donné est indispensable. Chapitre 1 : La recherche universelle En mai 2007, Google a introduit 42 la notion "Universal Search" qui a été repris par les autres moteurs de recherche peu après, ce qui a donné naissance au concept de "Blended Search". Aujourd'hui ce phénomène est connu comme recherche vertical chez la majorité des moteurs de recherche. Le changement principal apporté était l'affichage d'autres types de résultats comme des photos et vidéos et pas simplement les liens les plus pertinents sur le web, qui sont maintenant appelés les "10 blue links". Ceci montre clairement l'effort des moteurs de recherche d'afficher des résultats de plus en plus ciblés et pertinents. Cette évolution a eu une influence sur les résultats des études avec les outils "eyetracking" mentionné dans le 3ème chapitre de la 1ère partie du mémoire. Les zones du "heat-map" obtenu ont souffert d'un effet de désassemblage autour des différents médias supplémentaires proposés dans les SERPs. 42 Search Engine Land, Danny Sullivan. Google 2.0: http://selnd.com/google-universal (consulté le 26.06.2010) Search Engine Optmization Nicolas MESSER Google Universal Search 71/102 Figure 5-1. Représentation visuelle du principe "Universal Search" L'influence de ce changement sur les résultats montre l'importance des SERPs en vue de l'amélioration de cette façon d'afficher des résultats. Dans le futur les internautes retrouveront plus de choix sur les SERPs pour accéder au contenu d'un site web. Search Engine Optmization Nicolas MESSER 72/102 L'affichage de ces résultats verticaux se fait soit en début de la page, soit entre les premiers liens affichés. Par conséquence les détenteurs de sites web doivent se rendre compte que pour un même mot-clé leur positionnement pourrait se dégrader. On pourrait très bien occuper la meilleure place dans l’énumération des résultats et ne plus se retrouver au début de la page de recherche. Mais ceci représente en même temps une opportunité, si on fait usage des ces types de médias. Sachant que des liens référençant des vidéos sont également intégrés dans les SERPs par ce changement, il est important de savoir que d'après ComScore,43 YouTube est devenu le deuxième plus grand moteur de recherche en août 2008. Ces chiffres ont été relevés pour les Etats-Unis, mais sont certainement généralement applicables si on considère l'énorme popularité de YouTube. Et il paraît logique que cette tendance de fournier plus de résultats divers continuera dans le futur et des nouvelles technologies seront probablement intégrées dans les SERPs par la recherche universelle. Chapitre 2 : Nouvelles technologies à venir et connaître SearchWiki – la recherche personnalisée Encore une nouveauté chez Google appelée SearchWiki 44 qui fait controverse dans le monde de l'optimisation. SearchWiki permet aux utilisateurs qui détiennent un compte utilisateur chez Google de personnaliser leurs résultats de recherches, donner un vote d'appréciation à un résultat individuel ou encore de faires des commentaires. 43 TG Daily, Joshua Hill. YouTube surpasses Yahoo as world's #2 search engine http://bit.ly/tgdaily (consulté le 29.05.2010) 44 Official Google Blog. SearchWiki: make search your own http://bit.ly/search-wiki (consulté le 29.05.2010) Search Engine Optmization Nicolas MESSER 73/102 Ceci est une problématique qui est sujette à caution pour les spécialistes du domaine car cette influence pourrait faire que plusieurs personnes obtiennent des résultats totalement différents pour un même mot-clé indépendant de la région ou de la langue employé par l'internaute. L'interprétation du Flash Une technologie très répandue sur le net est le Flash. De manière générale les moteurs de recherche ne sont pas capables d'interpréter les fichiers flash. Mais ceci est en train de changer car en juin 2008 Google a annoncé qu'ils sont capables d'extraire au moins une partie de l'information contenu dans les fichiers flash45. OCR – La reconnaissance optique de caractères Un autre souci dans le passé a été les images. Même si les moteurs sont capables d'interpréter le thème de l'image par le texte autour et son texte alternatif correspondant, souvent il se trouvait que l'image contenait une partie texte qui n'a pas pu être exploré par les spiders des moteurs. Ceci changera certainement dans le futur car les moteurs de recherche ont commencé des premières expérimentations avec des technologies de reconnaissance de caractère connu sous le nom de OCR (Optical 46 Character Recognition) . Les microformats 47 Les microformats , également connu sous le nom "rich snippets", sont une autre technologie à maîtriser dans le futur. Ce n'est pas une nouvelle technologie car elle existe déjà depuis un certain temps, sans avoir été vraiment exploitée à nos jours. 45 Google Webmaster Central. Flash and other rich media files http://bit.ly/google-flash (consulté le 29.05.2010) 46 Wikipedia. Reconnaissance optique de caractères http://bit.ly/wiki-ocr 47 Microformats http://bit.ly/rich-snippets Search Engine Optmization Nicolas MESSER 74/102 Le site de la HEG utilise le microformat hCard pour l'adresse de l'école dans la partie footer. Figure 5-2. Application du microformat hCard Pourtant un élément important de ce microformat, le champ "fn" semble manquer dans cette déclaration. Ceci et d'autres erreurs peuvent être évité en utilisant un créateur automatique proposé par le site des microformats. 48 L'importance et l'impact de ce format semble toujours être contesté dans le monde de l'optimisation, mais avec l'intégration de ceux-ci dans les résultats des moteurs de recherche certainement une technologie à connaître. De plus les trois spécialistes que j'ai questionnés pour ce mémoire, accordent une grande efficacité à l'utilisation des microformats pour l'optimisation. 48 Créateur du microformat hCard (http://bit.ly/hcard-creator) Search Engine Optmization Nicolas MESSER 75/102 Il y a certainement des autres technologies qui sont sur la voie montante, mais celles qu'on vient de voir sont les plus utilisées actuellement. La performance des sites web, temps de chargement, taux de rebond, deviendrons de nouveaux critères de positionnement dans les SERP's. – David Degrelle Chapitre 3 : Le monde mobile Avec l'explosion des "Smartphones" et surtout par le boom de l'iPhone l'utilisation de l'Internet à partir de ces gadgets a connu une croissance rapide. Et c'est vrai aussi pour les recherches effectuées par les internautes sur ces gadgets. Google propose déjà une page et application mobile et beaucoup d'organisations ont compris l'importance d'avoir un site optimisé pour ces outils mobile. Dans le cas de la HEG, il n'existe pas de site optimisé pour les browsers mobiles. Même si ce n’est pas impossible, il est plutôt difficile de naviguer sur le site par un browser mobile. Un bon exemple à mon avis pour un site optimisé pour les browsers mobiles est le site des Transport publics genevois (TPG) qui permet d'accéder à toutes les informations nécessaires quand on est sur la route. Search Engine Optmization Nicolas MESSER 76/102 Figure 5-3. Comparaison accès mobile entre les sites de la HEG et TPG Pourtant la HEG n'a peut-être pas un besoin urgent d'avoir un site mobile les statistiques et les tendances attendues pour l'utilisation du web mobile font croire que cela est un point indispensable dans un futur proche, pour tous ceux qui disposent d'un site web.49 49 GIGAOM, Mathew Ingram. Mary Meeker: Mobile Internet Will Soon Overtake Fixed Internet http://bit.ly/mobile-web (consulté le 26.06.2010) Search Engine Optmization Nicolas MESSER 77/102 Conclusion (partie 5) L'importance des moteurs de recherche ne devrait pas changer dans le futur. Le contraire sera certainement le cas. Chaque jour le nombre d'informations accessible sur l'Internet augmente et par ce fait, il devient toujours plus difficile de trouver l'information qu'on cherche. On fait donc tous confiance à Google (ou à un autre moteur de recherche) de nous retourner les résultats les plus pertinents et de nous guider dans l'infinitude de la toile. Même l'évolution des technologies ne pourrait pas changer ce comportement. Mais elle va influencer la façon dont nous allons effectuer nos recherches. Le monde devient de plus en plus mobile et l'Internet a pris place dans la poche des internautes. Aujourd'hui il est possible de faire une recherche peu importe si on se trouve à la maison devant son ordinateur ou sur la terrasse d'un café en ville. Search Engine Optmization Nicolas MESSER 78/102 Conclusion Le monde de l'optimisation pour les moteurs de recherche n'a pas connu de révolution, mais il est en constante évolution! On ne parle pas non plus d'une science exacte, mais d'un domaine que certains diraient empirique avec la suprématie de Google, où seuls le test de concepts et l'expérience permettent d'avancer. La réalité est que l'optimisation pour les moteurs de recherche est un sujet vaste et complexe et l'opportunité d'apprendre de nouveaux concepts et stratégies ne s'arrêtera jamais. Mais avec l'information en abondance disponible sur ce sujet, il est également important qu'on apprenne à filtrer et analyser ce flux d'informations. De multiples théories et recherches existent et on peut en conclure des avis différents dans ce monde en changement permanent. Pourtant quelques points sur lesquels tout le monde semble être d'accord existent après tout et ceux-là ne sont pas négligeables. Google est l'acteur principal du marché de recherche. Tous vos efforts d'optimisation n'auraient probablement peu de valeur sans l'existence de Google. La dominance de Google est souligné par le fait que le verbe anglais "to google" (et également souvent utilisé dans les autres langues) fait partie du dictionnaire officiel aujourd'hui et il est donc considéré comme un vrai mot. Les moteurs de recherche sont très populaires. Des millions d'internautes utilisent les moteurs tous les jours partout dans le monde. Peu importe si c'est pour faire de simples recherches ou pour chercher le meilleur tarif pour les prochaines vacances. L'ère où les internautes ont fait des recherches grossières avec un simple mot-clé est terminée. Les recherches deviennent de plus en plus spécifiques et par ce fait la chaîne des mots-clés employés de plus en plus longue. L'optimisation pour les moteurs de recherche est devenue un travail interdisciplinaire. L'importance de l'optimisation pour les moteurs, en particulier pour les entreprises, touche à plus que l'équipe du développement du site web. Ce n'est plus uniquement le programmeur web qui code le site web dans son coin et l'entreprise qui espère pour le mieux. Surtout pour les entreprises avec un but principalement lucratif, l'optimisation du site web est un effort commun et ne s'arrêtera pas en ligne. Search Engine Optmization Nicolas MESSER 79/102 Et avec l'importance croissante d'apparaître en bonne position pour atteindre le maximum de nouveaux clients potentiels, les spécialistes du domaine n'ont pas à craindre de se retrouver sans travail dans le futur. La maîtrise des médias sociaux est une exigence indispensable et en plus un facteur de différenciation pour les référenceurs dans le futur. La seule chose qu'on peut prédire pour le futur de l'optimisation est le changement permanent des moteurs de recherche. La façon de rechercher est grandement influencée par les tendances du net et seul un savoir-faire vif et à jour permettra de rester de front avec les technologies et survivre à ces évolutions. La véritable voie de réflexion pour l'avenir des stratégies d'optimisation est la création de pages et du contenu optimisé et non pas l'utilisation des stratégies frauduleuses. Les moteurs de recherche ont des méthodes de détection de plus en plus affinées et ne vont pas hésiter à vous punir ou exclure de leurs indexes. Et comme on dit sur Internet, "content is king!" – le contenu est le capital! Peu importe si vous allez vous consacrer au référencement propre, aux médias sociaux ou à une combinaison des deux, il faut toujours procéder aux manipulations avec précaution pour ne pas nuire à vous même. Search Engine Optmization Nicolas MESSER 80/102 Bilan personnel Arrivé à la fin de ce mémoire, je suis parfaitement conscient que certaines parties n’ont pu être développées comme elles le méritaient. Je m’aperçois qu’il me faudrait bien plus de pages ou presque un livre, pour pouvoir développer d’autres points à côté de l'optimisation pour les résultats naturels et étudier les outils proposés par les deux autres grands moteurs Yahoo! et Bing, pour que ce thème du référencement soit complètement couvert. Parmi les abandons que je regretterais le plus, figure l’aspect de l'interdisciplinarité de ce sujet lequel je pense sera vraiment un garant de succès dans le futur de ce domaine. C'est pour cette raison que j'aurai aimé m'attarder plus sur cette relation et par exemple travailler avec un étudiant de la filière économie du côté marketing traditionnel en faisant des comparaisons et des analyses des méthodes du référencement qui s'imbriquent les uns dans les autres. Ainsi que la notion de retour sur investissement qui n'est pas encore très évoluée dans le monde du référencement qui pourrait être intéressant d'étudier plus et analyser les impacts d'une présence optimisée sur Internet. L'enjeu du mémoire est le fait qu'un des trois grands moteurs de recherche (Google, Yahoo et Bing) pourrait apporter un changement majeur à son algorithme à n'importe quel moment et une grande partie des informations dans ce mémoire pourront de ce fait être obsolètes dans peu de temps. L'enjeu personnel de ce mémoire se trouve dans le fait que l’optimisation pour les moteurs de recherche à l’heure actuelle n’est pas une science exacte et il existe beaucoup d’opinions différentes sur le "comment faire" et le "comment obtenir" les meilleurs résultats. Par conséquence, on retrouve un grand nombre d’informations diverses qui sont à étudier, trier et évaluer, dans le but d’avoir une documentation la plus complète sur ce sujet. Et j'espère que mes recherches et réflexions m'ont permis de faire les bons choix pour déposer un mémoire "complet" et de qualité. En conclusion, j'espère que ce mémoire représentera une source fiable et "complète" pour qui aimerait s'investir dans l’optimisation pour les moteurs de recherche et renforcer sa présence de leur site sur Internet. Search Engine Optmization Nicolas MESSER 81/102 Bibliographie Livres (monographie) ANDRIEU, Olivier. Réussir son référencement web. 2e édition. Eyrolles, 2010. 442 p. ENGE, Eric et al. The Art of SEO : Mastering Search Engine Optimization. O'Reilly, 2009. 574 p. JERKOVIC, John I. SEO Warrior : Essential Techniques for Increasing Web Visibility, O'Reilly, 2009. 470 p. WEINBERG, Tamar. Social Media Marketing : Strategien für Twitter, Facebook & Co. O'Reilly, 2010. 388 p. Livres électroniques, e-books Beginner's Guide to SEO. FISHKIN Rand, SEOmoz.org, 2005. 30 p. http://bit.ly/guideSEOmoz (consulté le 23.03.2010) Guide de démarrage Google : Optmisation pour les moteurs de recherche. Version 1.1. Google, 2008. 23 p. http://bit.ly/guide-google (consulté le 23.03.2010) Le référencement naturel : évolution, intérêts et perspectives. Version 1.1. 1ère Position, 2005. 36 p. http://bit.ly/guide-position (consulté le 23.03.2010) Livre blanc de la création de site web optimisé. LSFinteractive, Version 1.0 – 12 février 2008. 8 p. http://bit.ly/LSFinteractive (consulté le 23.03.2010) New Features Relevant to Webmasters. Bing Webmaster Center Team, 2009. 24 p. http://bit.ly/guide-bing (consulté le 23.03.2010) Noms de domaines et référencement. AFNIC & Olivier Andrieu, Octobre 2007. 6 p. http://bit.ly/AFNIC-Andrieu (consulté le 23.03.2010) Référencement : la revanche du contenu. Dixit, 2007. 32 p. http://bit.ly/dixxit (consulté le 23.03.2010) Référencer son site internet : Comprendre les enjeux du référencement. Yann KERVAREC, 2007. 45 p. http://bit.ly/yann-kervarec (consulté le 23.03.2010) Sites web ou blogs Apache Software Foundation. Apache Module mod_rewrite. http://bit.ly/mod-rewrite (consulté le 29.05.2010) BBC News. 'Miserable failure' links to Bush http://bit.ly/miserable-failure (consulté le 23.03.2010) Bloomberg Businessweek, Rachael King. Business Goes Straight to Video (http://bit.ly/bbw-blend) Chris Brogan. Essentials Skills of a Community Manager http://bit.ly/community-skills (consulté le 26.06.2010) CERN. Le berceau du Web. http://bit.ly/berceau-Web (consulté le 15.05.2010) Direct Media Traffic. Off Page Optimization VS On-Page Optimization http://bit.ly/offon-page (consulté le 22.06.2010) Enquiro. Enquiro Develops Google's Golden Triangle. http://bit.ly/golden-triangle (consulté le 29.05.2010) Search Engine Optmization Nicolas MESSER 82/102 GIGAOM, Mathew Ingram. Mary Meeker: Mobile Internet Will Soon Overtake Fixed Internet http://bit.ly/mobile-web (consulté le 26.06.2010) Google. Informations sur la socitété : Technologie Google http://bit.ly/technologiegoogle (consulté le 29.05.2010) Google Blog. SearchWiki: make search your own http://bit.ly/search-wiki (consulté le 29.05.2010) Google Blog. A spring metamorphosis : Google's new look http://bit.ly/google-2010 (consulté le 19.06.2010) Google Blog. Relevance meets the real-time web. http://bit.ly/real-search (consulté le 26.06.2010) Google Webmaster Blog. Using site speed in web search ranking http://bit.ly/googlespeed (consulté le 22.06.2010) Google Webmaster Blog. Importance of link architecture. http://bit.ly/link-depth (consulté le 23.06.2010) Google Webmaster Central. Flash and other rich media files http://bit.ly/google-flash (consulté le 29.05.2010) Google Webmaster Central. Keyword stuffing. http://bit.ly/stuffing-keywords (consulté le 26.06.2010) Google Webmaster Central. Hidden text and links. http://bit.ly/hidden-text (consulté le 26.06.2010) Google Webmaster Central. Cloaking, sneaky JavaScript redirects, and doorway pages. http://bit.ly/google-cloaking (consulté le 26.06.2010) Google Webmaster Tools Help. Duplicate content. http://bit.ly/contenu-duplique (consulté le 29.05.2010) Google Webmaster Help YouTube Channel. How many search algorithm changes were made in 2009? http://bit.ly/google-changes (consulté le 15.05.2010) Joost de Valk. W3C Validation & SEO. http://bit.ly/w3c-validation-seo (consulté le 23.06.2010) Mashable. Yahoo-Microsoft Search Deal : The Key Facts http://bit.ly/yahoo-microsoft (consulté le 19.06.2010) Matt Cutts. Straight from Google: What you need to know http://bit.ly/page-rank (consulté le 29.05.2010) Microsoft. URL Rewriting in ASP.NET. http://bit.ly/asp-rewrite (consulté le 29.05.2010) Net Applications. Search Engine Market Share. http://bit.ly/market-share (consulté le 22.06.2010) Robotstxt.org http://bit.ly/fichier-robots (consulté le 29.05.2010) Search Engine Land. Google Kills Bush's Miserable Failure http://selnd.com/googlebomb (consulté le 29.05.2010) Search Engine Land, Danny Sullivan. Google 2.0: Google Universal Search http://selnd.com/google-universal (consulté le 26.06.2010) Search Engine Journal, Ann Smarty. What's Most Effective for Geo Targeting? http://bit.ly/geo-targeting (consulté le 21.06.2010) Search Engine Journal, Ann Smarty. SEO Case Study : Dealing With Multi-Language Countries Targeting http://bit.ly/multi-language (consulté le 21.06.2010) Search Engine Optmization Nicolas MESSER 83/102 SEOmoz, Rand Fishkin. White Hat Cloaking: It Exist. It's Permitted. It's Useful. http://bit.ly/white-cloaking (consulté le 26.06.2010) SEOmoz, Rand Fishkin. Does "Query Deservse Diversity" Algorithm Exist at Google? http://bit.ly/query-diversity (consulté le 26.06.2010) SEOmoz, Rand Fishkin et al. Search Engine Ranking Factors 2009 http://bit.ly/SEOmozsurvey (consulté le 22.05.2010) Sitemaps.org. What are Sitemaps? http://bit.ly/sitemap-xml (consulté le 29.05.2010) TG Daily, Joshua Hill. YouTube surpasses Yahoo as world's #2 search engine http://bit.ly/tg-daily (consulté le 29.05.2010) Trellian. Keyword and Search Engine Statistics. http://bit.ly/keyword-stats (consulté le 29.05.2010) WebWorkerDaily, Dawn Foster. Online Community Manager: Yes, It's Really A Job. http://bit.ly/com-man (consulté le 26.06.2010) Wired, Chris Anderson. The Long Tail. http://bit.ly/the-long-tail (consulté le 29.05.2010) Texte législatif Art. 10 Ohand, RS 151.31 http://bit.ly/rs-art-10 Article d'une encyclopédie en ligne Pay per click. In : Wikipedia http://bit.ly/liens-sponsorises (consulté le 20.06.2010) Périodique / Article de périodique Dye, K. SEO Attack : Website abuse for search engine optimisation. Network Security, March 2008, p 4-6. Malaga, R. A. 2008. Worst practices in search engine optimization. Commun. ACM 51, 12 (Dec. 2008), 147-150. DOI= http://doi.acm.org/10.1145/1409360.1409388 Noruzi, A. A Study of HTML Title Tag Ceation Behavio of Academic Web Sites, The Journal of Academic Librarianships, Volume 33, Number 4, pages 501 – 506. Actes de congrès (Proceedings) Abhishek, V. and Hosanagar, K. 2007. Keyword generation for search engine advertising using semantic similarity between terms. In Proceedings of the Ninth international Conference on Electronic Commerce (Minneapolis, MN, USA, August 19 22, 2007). ICEC '07, vol. 258. ACM, New York, NY, 89-94. DOI= http://doi.acm.org/10.1145/1282100.1282119 Cheng, Z., Gao, B., and Liu, T. 2010. Actively predicting diverse search intent from user browsing behaviors. In Proceedings of the 19th international Conference on World Wide Web (Raleigh, North Carolina, USA, April 26 - 30, 2010). WWW '10. ACM, New York, NY, 221-230. DOI= http://doi.acm.org/10.1145/1772690.1772714 Dahiwale, P., Mokhade, A., and Raghuwanshi, M. M. 2010. Intelligent web crawler. In Proceedings of the international Conference and Workshop on Emerging Trends in Technology (Mumbai, Maharashtra, India, February 26 - 27, 2010). ICWET '10. ACM, New York, NY, 613-617. DOI= http://doi.acm.org/10.1145/1741906.1742046 Freeman, R. T. 2007. Topological tree clustering of social network search results. In Proceedings of the 8th international Conference on intelligent Data Engineering and Automated Learning (Birmingham, UK, December 16 - 19, 2007). H. Yin, P. Tino, W. Search Engine Optmization Nicolas MESSER 84/102 Byrne, X. Yao, and E. Corchado, Eds. Lecture Notes In Computer Science. SpringerVerlag, Berlin, Heidelberg, 760-769. Ghose, A. and Yang, S. 2008. Comparing performance metrics in organic search with sponsored search advertising. In Proceedings of the 2nd international Workshop on Data Mining and Audience intelligence For Advertising (Las Vegas, Nevada, August 24 24, 2008). ADKDD '08. ACM, New York, NY, 18-26. DOI= http://doi.acm.org/10.1145/1517472.1517475 You, G. and Hwang, S. 2007. Personalized ranking: a contextual ranking approach. In Proceedings of the 2007 ACM Symposium on Applied Computing (Seoul, Korea, March 11 - 15, 2007). SAC '07. ACM, New York, NY, 506-510. DOI= http://doi.acm.org/10.1145/1244002.1244119 Wang, Y., Ma, M., Niu, Y., and Chen, H. 2007. Spam double-funnel: connecting web spammers with advertisers. In Proceedings of the 16th international Conference on World Wide Web (Banff, Alberta, Canada, May 08 - 12, 2007). WWW '07. ACM, New York, NY, 291-300. DOI= http://doi.acm.org/10.1145/1242572.1242612 Cahier de recherche (technical report) Höchstötter, N. and Lewandowski, D. What users see – Structures in search engine results pages. In Information Sciences 179, 1796 – 1812. Elsevier. DOI:10.1016/j.ins.2009.01.028 Skiera, B. et al. An analysis of the importance of the long tail in search engine marketing. Electron. Comm. Res. Appl. (2010), DOI:10.1016/j.elerap.2010.05.001 Zhang, J. and Dimitroff, A. 2005. The impact of webpage content characteristics on webpage visibility in search engine results (Part 1). In Information Processing and Management 41, 665 – 690. Elsevier. DOI:10.1016/j.ipm.2003.12.001 Zhang, J. and Dimitroff, A. 2005. The impact of metadata implémentation on webpage visibility in search engine results (Part II). In Information Processing and Management 41, 691 – 715. Elsevier. DOI:10.1016/j.ipm.2003.13.002 Documents audiovisuels (Podcasts) WebmasterRadio.FM, Ross Dunn et John Carcutt. SEO 101. http://bit.ly/wmr-101 WebmasterRadioFM, Daron Babin. SEO Rockstars. http://bit.ly/wmr-rockstars Search Engine Optmization Nicolas MESSER 85/102 Glossaire Accessibilité : L'accessibilité d'un site web désigne le respect d'un certain nombre de critères techniques (définis par le W3C) destinés à faciliter l'accès du site aux personnes porteuses de handicap. Analyse d'audience / Web Analytics : Les outils d'analyse d'audience mesurent le trafic sur un site web et fournissent de nombreux indicateurs: origine du trafic, pages vues, requêtes saisies … Balises méta : Le HTML est constitué de balises, permettant, par exemple de définir un titre pour une page. Les balises méta sont des balises qui sont généralement utilisées pur le référencement, en vue de définir le contenu d'une page, comme la balise méta description oul les mots-clés associés à la page, comme la balise méta keywords. Black Hat : Ensemble des pratiques douteuses du référencement, parmi lesquelles le spamdexing, le cloaking, etc. Breadcrumb / File d'Ariane : Donne une indication à l’internaute de sa situation sur le site. Cloaking : Technique désormais bannie par les moteurs de recherche, le cloaking ("masquage") permet de fournir aux robots une page web "optimisé", différente de celle proposé aux lecteurs humains. Contenu viral / Marketing viral : Un moyen efficace d'obtenir spontanément des liens entrants et consiste à mettre en œuvre des contenus de référence, inédits ou polémique, susceptibles d'être relayés par des médias, des institutions ou la blogospère. Densité : Dans le texte d'une page web, l'indice de densité d'un terme désigne le rapport entre l'occurrence de ce terme et le nombre total des mots. Google Bombing : C’est une technique qui utilise le processus d’indexation de Google pour influencer ses résultats de recherche. Google entre autres paramètres de mesure base la pertinence de ses réponses sur le nombre et la présence des expressions recherchées dans des sites et sur des hyperliens. Pour faire un bon Google bombing il vous faut donc rallier à votre cause un maximum de webmasters qui positionneront sur leur site des liens contenant une même expression vers la même page. Search Engine Optmization Nicolas MESSER 86/102 .htaccess : Fichier de configuration des serveurs web sous Apache utilisés pour contrôler les droits d’accès des répertoires où ils sont positionnés ou pour créer des redirections. Importance : fait référence au poids relatif apporté par une citation comme on le connaît du monde académique qui est dans ce cas un lien d'un autre site web. Ceci permet de décider sur l'ordre dans les pages de résultats quand un mot-clé produit plusieurs résultats pertinents. Indexation : Inscription, par les robots d'un moteur, des pages d'un site dans sa base de données (index). L'indexation est le préalable indispensable au positionnement des pages. Une page non indexée ne peut pas apparaître dans les résultats des moteurs. Lien entrant : Sur une page web donnée, est considéré comme "entrant" tout lien provenant d'une autre page, qu'elle appartienne au même site (lien entrant interne) ou à un autre (lien externe). Le nombre de liens entrants d'une page, et plus encore la qualité des pages dont ils proviennent, sont utilisées par les moteurs pour en déterminer la popularité et la pertinence. Lien sponsorisé : Lien provenant d'un achat de mot-clé auprès d'un moteur de recherche, et qui apparaît dans une zone spécifique de la page des résultats. Long Tail / Longue traîne : Est une notion statistique qui apparait dans les distributions. La traîne symbolise l’amortissement de la courbe de Gauss des répartitions statistiques. Appliquée au référencement elle met par exemple en évidence qu’il ne faut pas négliger de nombreux mots-clés générant chacun une seule visite au détriment d’un seul générant beaucoup de visites. La somme des mots faibles étant supérieure à un mot fort. Link Building / Linkbaiting : Ensemble des actions visant à obtenir des liens entrants (échange, achat …). Page satellite / Doorway pages : Optimisées "mécaniquement" pour le référencement, les pages satellites sont des pages web réservées aux robots (les visiteurs humains sont automatiquement redirigés vers une autre page du site). Destinées à améliorer de manière totalement artificielle le positionnement du site qui les héberge, elles sont désormais bannies par les moteurs. Search Engine Optmization Nicolas MESSER 87/102 Popularité / PageRank : La popularité d'une page web est fonction du nombre de liens pointant vers cette page, et de la propre popularité des pages dont ces liens proviennent. C'est un critère déterminant, utilisé par les moteurs de recherche lors de al détermination du positionnement d'une page dans leurs résultats. L'indice de popularité le plus célèbre est celui de Google, baptisé PageRank. Positionnement : Le positionnement d'une page web désigne son rang dans les résultats des moteurs de recherche, lors de la saisie d'une requête spécifique. Référencement naturel : Le référencement naturel est un ensemble de savoirs-faire et de techniques visant à positionner efficacement et durablement une page internet sur les bons mots-clés (c'est-à-dire sur les mots-clés correspondant à l'activité mais aussi à la demande des internautes) et ce, dans les pages de résultats naturels (organiques, c-à-d non sponsorisés) de l'ensemble des moteurs de recherche. Relevance : Est le degré de pertinence des résultats retournés dans une recherche par rapport à l'intention du mot-clé saisie par l'internaute. Requête : Ensemble de termes saisis par l'internaute dans un moteur de recherche. Longtemps cantonnées à un ou deux termes, les requêtes sont désormais de plus en plus complexes, ce qui limite l'efficacité d'un référencement basé sur une simple liste de mots-clés. ROI : Abréviation pour Return On Investment. Dans les plus simples termes, le ROI est un ratio permettant de mesurer l’argent perdu ou gagné dans une action de communication ou encore la fabrication d’un produit, par rapport à la somme investie à la base. SEO : On regroupe sous le terme de Search Engine Optimization, ou référencement naturel, les actions destinées à améliorer le positionnement d'un site dans les résultats des moteurs de recherche. SERP : Acronyme de l’anglais “Search Engine Result Page”. Ce sont les pages des résultats sur un moteur de recherche. Spider / Crawler / Robot : Un Bot est un robot au sens informatique du terme, c’est à dire un programme développé pour analyser le contenu des pages Web, les classer, les répertorier et les noter. Ce sont les bots qui renseignent les bases de données des moteurs de recherche. Search Engine Optmization Nicolas MESSER 88/102 Tri par pertinence (système de ranking) : Est le processus qui consiste à classer automatiquement les données de l'index de façon à ce que, suite à une interrogation, les pages les plus pertinentes apparaissent en premier dans la liste des résultats. Le but du classement est d'afficher dans les premières réponses les documents répondant au mieux à la requête. TrustRank : Ce terme déposé par Google désigne le résultat d'un algorithme destiné à mesurer la crédibilité des pages web. Contrairement au PageRank, essentiellement quantitatif, le TrustRank est qualitatif et privilégie les liens en provenance de sites considérés comme faisant référence. URL rewriting / Réécriture des URLs : Une technique consistant à réécrire les URLs d'un site, pour qu'elles soient plus compréhensibles par les robots des moteurs de recherche. W3C : Abréviation pour World Wide Web Consortium. Organisation qui définie la normalisation et donne des recommandations pour les standards de création de sites web. Web 2.0 : Concept aux contours flous, le Web 2.0 désigne une nouvelle génération d'outils (flux RSS, blogs, …) et de pratiques (création d'espaces communautaires, …) visant à centrer les fonctionnalités d'Internet sur ses utilisateurs. Parce qu'il offre une conception radicalement nouvelle de la création et de la diffusion des contenus, les Web 2.0 influence fortement les méthodes de référencement naturel. White Hat : Ensemble des bonnes pratiques du référencement. Ce sont par exemple les pratiques qui visent à augmenter la visibilité des informations de la page auprès des spiders. Search Engine Optmization Nicolas MESSER 89/102 Annexes Advanced Search Operators .......................................................................... 91 Charte de Qualité et de déontologie du métier de référenceur................... 94 Interview avec Véronique Murbach ............................................................... 97 Search Engine Optmization Nicolas MESSER 90/102 Advanced Search Operators Google advanced search operators Operator (site:) Domain-restricted search Short description Narrows a search to (a) specific domain(s)/directories SEO application Shows approximately how many URLs are indexed by Google From a directory Includes all subdomains Shows sites of a specific top-level domain (TLD) (inurl:)/(allin Narrows the results to url:) documents containing (a) search term(s) in URL keyword the URLs restricted search (intitle:)/(all Restricts the results to intitle:) documents containing (a) search term(s) in a Title keyword page title restricted search Restricts the results to (inanchor:)/(al documents containing linanchor:) (a) search term(s) in the anchor text of Anchor text keyword backlinks pointing to a restricted search page (intext:) Restricts the results to documents containing Body text keyword (a) search term(s) in restricted search the body text of a page Wildcard search (Related:) Similar URLs search Means “insert any word here” site:mit.edu/research/ site:google.com site:org Find web pages using intitle:seo intitle:company your keyword in a page = allintitle:seo company title Find pages having the inanchor:seo most backlinks/the most inanchor:company = powerful backlinks with allinanchor:seo company the keyword in the anchor text Find pages containing intext:seo the most relevant/most optimized body text Search for a phrase “partial match” Shows related pages by finding pages linking to the site and Evaluate how relevant looking at what else the site’s “neighbors” they tend to link to are (i.e., “co-citation”); usually 25 to 31 results are shown. Search Engine Optmization Nicolas MESSER site:www.google.com Find web pages having inurl:seo inurl:company = your keyword in a file allinurl:seo company path A few possible extensions/file types: PDF (Adobe Portable (ext:)/(filetyp Document Format) Narrows search results e:) HTML or .htm to the pages that end (Hypertext Markup in a particular file Language) File type restricted extension .xls (Microsoft Excel) search .ppt (Microsoft PowerPoint) .doc (Microsoft Word) (*) Examples filetype:pdf ext:pdf seo * directory returns “seo free directory”, “seo friendly directory”, etc. Compare: related:www.linkdi y.com and related:www.alchem istmedia.com 91/102 (Info:) Gives information Information about a about the given page URL search (Cache:) See what the page looked like when Google crawled it (~keyword) Learn whether the page has been indexed by Google; provides links for further URL information; this search can also alert you to possible site issues (duplicate content or possible DNS problems) info:netconcepts.c om will show you the page title and description, and invite you to view its related pages, incoming links, and page cached version Google’s text version of cache:www.stonetemple. Shows Google’s saved the page works the com copy of the page same way as SEO Browser Shows keywords Google thinks are related to keyword Can be very useful in uncovering related words that you should include on your page about keyword ~zoo ~trip will show you keywords related to zoo and trip Yahoo! advanced search operators Operator (Link:) URL backlinks restricted search (LinkDomain:) Domain backlinks restricted search Short description Finds any page backlinks (if used in isolation, redirects to Yahoo! Site Explorer) Finds any domain backlinks (if used in isolation, redirects to Yahoo! Site Explorer) SEO application Find most the relevant backlinks of any page Examples link:http://www.seomoz. org/blog seo linkdomain:www.alchemi Find the most relevant stmedia.com seo backlinks of any domain A few possible extensions/file types: PDF (Adobe Portable Document Format) originurlextension:pdf .xls (Microsoft Excel) .ppt (Microsoft PowerPoint) Narrows search results .doc (Microsoft Word) to the sites belonging Example regions: to a particular territory region:europe region:europe region:africa region:asia (OriginUrlExten sion:) Narrows search results to the pages that end File type restricted in a particular file extension search (Region:) Area restricted search (Url:) URL restricted search Finds a specific document in Yahoo!’s index Search Engine Optmization Nicolas MESSER url:http://www.netconcep Learn whether the page t.com was indexed by Yahoo! 92/102 Bing advanced operators Operator (LinkFromDomain:) Short description SEO application Examples Find most relevant Finds all pages the linkfromdomain:seomoz.org sites your given domain links seo Domain outbound links competitor links out out to restricted search to Narrows search Find pages linking (Contains:) results to pages to a specific contains:wma seo linking to a document document type File type restricted of the specified file containing relevant search type information Restricts the results (InBody:) Find pages to documents containing the most inbody:seo (equivalent to containing query Body text keyword relevant/best Google’s intext:) word(s) in the body restricted search optimized body text text of a page Narrows search results to a specified (Location:)/(loc:) location (multiple Find geospecific seo loc:AU location options can documents using Location specific be found under your keyword search Bing’s advanced search) (Feed:) Narrows search results to terms feed:seo Find relevant feeds Feed keyword contained in RSS restricted search feeds Narrows search (Hasfeed:) results to pages Find pages linking hasfeed:seo site:cnn.com linking to feeds that Feed keyword to relevant feeds contain the specified restricted search keywords Consolidé depuis le livre SEO Warrior et le site web d'accompagnement http://www.seowarrior.net de John Jerkovic. Search Engine Optmization Nicolas MESSER 93/102 Charte de Qualité et de déontologie du métier de référenceur © Abondance.com Les signataires de la "Charte de Qualité Abondance sur le référencement de sites web" devront accepter les conditions suivantes (O-R = Outils de Recherche) : Titre Contenu Réalisme / Garanties Les signataires s'engagent à une obligation de moyens à mettre en oeuvre et à ne pas promettre (garantir) de résultats de positionnement limités à une requête et un moteur, et plus généralement ne pas promettre de résultats qui ne pourront être tenus ou vérifiés par le client. Des garanties statistiques (X% de positionnements sur Y mots clés et Z moteurs) pourront cependant être proposés. Transparence Les signataires s'engagent à tenir à disposition de leurs clients - et à leur faire connaître sa disponibilité - un document clair et précis présentant leur méthodologie de travail : technologies mises en œuvre, méthodes d'optimisation, procédures de référencement, etc. Conseil Les signataires s'engagent à aider leurs clients dans la réflexion sur les informations qui seront fournies aux O-R (descriptif, mots clés, optimisation des titres et textes des pages, etc.) lors du référencement. Méthodologie Les signataires restent libres de la méthodologie mise en place pour référencer les sites de leurs clients, à partir du moment où elle respecte la présente charte, notamment en ce qui concerne la lutte contre le spam de la part des O-R (voir plus loin). Loyauté Les signataires s'engagent à suivre strictement les indications des O-R, publiées de façon spécifique sur leurs sites (et reprises ci-après dans la présente charte), dans le but d'effectuer une soumission efficace d'un site web dans leur index ou bases de données. Suivi Les signataires s'engagent à remettre à leurs clients de façon périodique des rapports clairs sur l'avancée des travaux de référencement de leur site web (suivi du positionnement, du trafic généré, du retour sur investissement, etc.), sous la forme qui leur semble la plus appropriée (tableaux Excel, extranet, outils en ligne, etc.). Autonomie Les signataires s'engagent à remettre tous les éléments relatifs aux travaux réalisés dans le cadre de la prestation de référencement de façon à permettre à leurs clients de changer de prestataire s'ils n'étaient pas satisfaits de la prestation effectuée. Comme pour toute prestation informatique ou de service, les travaux effectués appartiennent au client qui en a payé le montant. Veille Les signataires s'engagent à mettre en place des mécanismes de veille afin de se tenir au courant de l'évolution des outils de recherche et à en faire profiter leurs clients. Qualité Les signataires s'engagent auprès des O-R à ne soumettre à leur indexation que des sites dont le contenu et la pertinence sont suffisamment riches pour alimenter leur base de données en vue Search Engine Optmization Nicolas MESSER 94/102 d'apporter une information utile au visiteur. Mode de fonctionnement Les signataires s'engagent à n'effectuer pour leurs clients que des prestations de référencement manuel, sans l'aide d'aucun logiciel de soumission automatique, sauf dans le cas où cette prestation est explicitement indiquée dans la proposition commerciale, et uniquement si l'utilisation de logiciels n'intervient qu'en complément d'une prestation manuelle majeure et ce aussi bien en phase de référencement qu'en phase de suivi et de veille. Respect de la concurrence Les signataires s'engagent à ne pas nuire au référencement d'un concurrent pour le compte d'un client et à ne pas utiliser la marque de concurrents pour le référencement de leurs clients. En règle générale, les signataires s'engagent à ne pas nuire au référencement d'un site pour lequel ils n'auraient pas été mandatés. Combat contre le spam Les signataires acceptent de ne pas réaliser d'action de spamdexing (fraude sur les O-R). Une annexe (voir ci-après) décrit de façon précise ce qui est considéré comme du spamdexing et ce qui n'en est pas dans le domaine du référencement de site web. Les signataires s'engagent notamment à ne cacher aux O-R aucun contenu destiné au référencement à l'intérieur du code HTML (balise Noscript, utilisation de zones invisibles - visibility-hidden, display:none, etc.) du site de leur client. Information Les signataires s'engagent à remettre à leurs clients et prospects, dans leurs propositions commerciales, un exemplaire de la Charte ici présente, accompagnée d'un document expliquant le fonctionnement des O-R, détaillant en quoi consiste un référencement de site Web, ainsi que ses contraintes. Clarté Les signataires s'engagent à expliciter de façon claire les actions effectuées sur les moteurs de recherche et notamment à ne pas entretenir de flou entre des prestations de référencement manuel et d'éventuelles actions d'achat de mots clés dans le cadre de campagnes de liens sponsorisés. Les deux types d'actions, si elles cohabitent dans la prestation proposée au client, devront être clairement mentionnées et démarquées. Blacklistage Les signataires s'engagent à rembourser intégralement la prestation réalisée s'il est avéré que le site est exclu d'un moteur suite à une faute de leurs services. Echange de liens Les signataires s'engagent à ne pas mettre en place de lien vers leur site depuis le site du client, de façon visible ou invisible, sauf si cela est stipulé clairement dans le contrat signé entre les deux parties. Définition du spamdexing Les actions suivantes sont considérées comme étant du spam (ou spamdexing : fraude au référencement sur les O-R (= Outils de Recherche)), cette liste n'étant pas considérée comme limitative : Search Engine Optmization Nicolas MESSER 95/102 • Référencement d'un site faisant la promotion d'activités illicites ou dégradantes (piratage, racisme, sectes, pédophilie, etc.). • Mise en place d'une stratégie de référencement basée sur plusieurs noms de domaine différents (chaque nom de domaine pointant sur la même page) ou sous plusieurs adresses ou sous-domaines différents (www.site.com et actu.site.com par exemple, chaque adresse pointant sur la même page). • Répétition de façon abusive des mots clés à l'intérieur d'une page, que ce soit dans des zones cachées ou non du code HTML. • Répétition abusive de balises TITLE, META ou autres (commentaires). • Utilisation de mots clés inadéquats avec le contenu du site, utilisation de marques ou de noms sans liaison avec le site ou faisant mention de marques déposées sans autorisation. • Utilisation de texte invisible (blanc sur fond blanc par exemple) ou caché à l'intérieur du code HTML (balise Noscript, utilisation de zones invisibles - visibility-hidden, display:none, etc.). • Cloaking (technique instllée sur les serveurs web et permettant de délivrer aux spiders des pages spécifiquement réalisées pour les moteurs de recherche) à des fins de positionnement. • Copie sur son propre site de code HTML existant et n'appartenant pas au signataire. • Création de pages HTML ou de liens ayant pour unique but d'augmenter l'indice de popularité d'un site ou d'une page. • Achat de lien au prorata d'un indice de popularité (PageRank ou autre). • Pages de redirection (balise Meta Refresh, Javascript ou autre) notamment dans la cadre de création de pages satellites. • Popularité : toute manœuvre visant à tenter d'augmenter l'indice de popularité (ou PageRank) d'une page de façon artificielle. • Pages satellites, alias, fantômes, doorway pages, etc., et toutes techniques d'optimisation permettant de positionner une page dans les pages de résultats des moteurs, cette page redirigeant de façon automatique l'internaute sur une autre page "réelle". • Toute méthode de création massive et automatisée de pages web spécifiquement optimisées pour les moteurs de recherche, même sans redirection automatique, dans le cadre d'une stratégie de référencement. • D'une manière générale, non-respect des limites indiquées par les O-R et rappelées ici : Google : http://www.google.fr/support/webmasters/bin/answer.py?answer=35769&hl=fr http://www.google.fr/support/webmasters/bin/answer.py?answer=35291&hl=fr Yahoo! : http://eur.help.yahoo.com/help/fr/ysearch/deletions/index.html http://eur.help.yahoo.com/help/fr/ysearch/deletions/deletions-04.html http://eur.help.yahoo.com/help/fr/ysearch/deletions/deletions-05.html Microsoft Live Search: http://search.msn.fr/docs/siteowner.aspx?FORM=WMDD2 http://search.msn.fr/docs/siteowner.aspx?t=SEARCH_WEBMASTER_REF_GuidelinesforOptimi zingSite.htm&FORM=WGDD Search Engine Optmization Nicolas MESSER 96/102 Interview avec Véronique Murbach Interview du 29.06.2010 à la HEG Avec Véronique MURBACH, Ajointe au chef du laboratoire, Conceptrice en communication WEB Je réalise mon travail de diplôme sur le référencement/l'optimisation pour les moteurs de recherche avec le cas d'étude du site de la HEG. C'est M. Jean-Philippe Trabichet, responsable de la filière informatique de gestion et responsable du laboratoire, qui m'a proposé de vous contacter concernant mes questions par rapport à mon travail d'analyse du site de la HEG. Quelle est votre rôle? Je suis la webmaster de la HEG. Mon travail, et celui de mon équipe, est la maintenance et la mise à jour du site de la HEG. Actuellement la HEG n'utilise pas de CMS pour son site web et tous les changements et mise à jour passent obligatoirement par mes collaborateurs ou moi-même. Mais nous ne sommes évidemment pas responsables pour le contenu lui-même. Quel est l'objectif principal du site de la HEG? Attirer les futurs étudiants de la HEG et promouvoir les travaux de recherche réalisés par la HEG. Mais le site est également un moyen de communication sur les différentes nouvelles et événements au sein de la HEG. Est-ce que la HEG à une stratégie d'optimisation? Oui, nous essayons au mieux d'optimiser le site de la HEG. Mais depuis le passage à la nouvelle version du site de la HEG, les changements apportés à la structure ne nous ont pas encore permit d'achever tout le travail nécessaire pour avoir un site particulièrement optimisé. Et il faudra évidemment un peu de temps pour que la totalité du nouveau site soit correctement indexé chez les moteurs de recherche. Le site de la HEG est développé entièrement en interne et nous sommes "limités" au niveau des technologies par les serveurs mises à disposition par la Haute école. En ce moment, c'est soit du .ASP (choix technologie du site actuel), soit du PHP. Search Engine Optmization Nicolas MESSER 97/102 Tout le travail de référencement est réalisé par nos collaborateurs. La direction s'intéresse au listing dans les résultats des moteurs de recherche par rapport à des mots-clés défnis, mais ne nous a pas donné des directives plus détaillés pour l'optimisation des pages du site de la HEG. Au delà, ils ne donnent pas une grande priorité à cela, mais nous essayons de mettre en place les bonnes pratiques que nous jugeons importantes. Est-ce que la HEG, fait un effort pour utiliser les médias sociaux? Oui, c'est un travail qui a été réalisé pour un travail de maturité professionnelle et mise en place avec la version actuelle du site de la HEG. Le résultat de ce travail est que nous avons maintenant une page officielle sur Facebook où nous proposons égalments toutes les nouvelles de la HEG et nous espérons atteindre des futurs candidats qui sont amis avec les étudiants actuels de la HEG. Et depuis quelques temps, nous proposons aux visiteurs du site de partager notre contenu directement sur les différents réseaux sociaux par le widget du service AddThis. Est-ce que la HEG utilise des outils comme Google Analytics pour analyser la circulation du site web? Je sais qu'on exploite les méthodes d'analyse avec Analytics, mais c'est un collègue qui s'occupe de cela. Mais, est-ce que vous savez si la HEG à mis en place des métriques (valeur de référencement) pour calculer une sorte de rendement sur le site web? Je sais qu'on a analysé la durée des visites et toutes ces données standards qu'on peut retrouver par l'outil Analytics. Est-ce que vous auriez un exemple plus concret pour votre question? Oui, je me suis demandé si par exemple la HEG avait mis en place un système pour compter le nombre de fois le fichier PDF pour les inscriptions est téléchargé pour le comparer avec le nombre de dossiers effectivement reçus? Non, alors je ne pense pas que cela est actuellement réalisé, mais c'est une bonne idée. Par contre, je pense que ce ne sera pas si facile à réaliser parce qu'il y a toujours des dossiers en retour qui ne sont pas téléchargés depuis le site. Search Engine Optmization Nicolas MESSER 98/102 Est-ce que la HEG fait une analyse des "concurrents" pour savoir où elle se place par rapport aux autres hautes écoles? Oui, bien sûr nous essayons de regarder ce que font les autres hautes écoles et où on se positionne par rapport à eux. Mais depuis le changement sur la nouvelle version du site, nous ne l'avons pas encore fait parce que nous avons perdu beaucoup de liens et pefereons attendre encore un moment pour que le site soit de nouveau bien indexé. Quelques questions par rapport aux analyses que j'ai réalisées au cours de mon mémoire. Pour réprendre l'élément de l'analyse des concurrents pour un moment. Une chose que j'ai remarquée est que la HEG n'a pas de nom de domaine independant. Par contre, j'ai pu constater que le nom de domaine www.heg-ge.ch est reservé par les Hautes écoles spécialisée de Genève. Est-ce que c'est prévu d'utiliser ce nom de domaine dans le futur pour améliorer cet élément qui est quand même assez important du côté référencement? Vous avez raison que le nom de domaine est réservé et pas utilisé à ce jour. C'est la direction des Hautes écoles génévoises qui a décider de reserver ces noms de domaines pour proteger que ce n'est pas quelqu'un d'autres qui le fait. Mais a mes connaissances, les Hautes écoles génévoises sont obligées de suivre le modèle du nom de domaine qu'utilise la HEG actuellement. Je pense que nous ne pourrons donc pas changer cela dans le futur. J'ai pu constater que le nouveau site de la HEG n'a plus les mots-clés (nom de l'école) en clair dans la balise d'en-tête <h1>, mais au lieu utilise le logo officiel avec le nom en français et anglais dans un format image. Est-ce que cela à été un choix volontaire ou cela a été décidé par quelqu'un d'autre (la direction par exemple) parce que vous perdez quand même l'opportunité de placer des mots-clés dans la partie la plus importante du site? Non, c'était décidé parce que ce logo est utilisé par tout et parce que c'était comme cela sur la maquette de la nouvelle version. Et il y a toujours le texte alternatif de l'image pour placer quelques mots-clés. Si j'ai bien vu, le site de la HEG n'exploite pas un plan du site en format XML pour essayer de faciliter l'indexation par les moteurs de recherche? Non, nous avons le plan du site traditionnel en format HTML qui est accessible sur le site. Search Engine Optmization Nicolas MESSER 99/102 Est-ce que le site de la HEG utilise un fichier robots.txt? Non, nous n'utilisons pas cela. Le site de la HEG ne dispose actuellement pas d'une partie privée à la quelle il faudra bloquer l'accès aux spiders des moteurs de recherche. De plus, je dirais que nous n'avons pas le problème de contenu dupliquée. Nous en avons déjà parlé un peu, mais j'ai pu constater que les métadonnées en général ne sont pas très optimisées pour le site de la HEG. Est-ce que des informations comme les titres et/ou descriptions des pages sont générées automatiquement en ce moment? Et quelle importance donner vous à ces données parce que j'ai vu que des autres hautes écoles ont carrément ignoré complètement les descriptions par exemple? Ces données sont toujours importantes pour les informations qui s'affichent dans les pages de résultats des moteurs de recherche. Pour le site de la HEG, les données pour la description sont créées automatiquement. Mais comme vous l'avez remarqué, il y en a d'autres qui ne sont pas encore optimisées par tout car il faut les mettre à jour manuellement. Mais nous avons un schéma en place pour cela. Est-ce que vous avez considéré de faire de la reécriture des URLs dans le cas de l'annuaire et/ou optimiser les noms des fichiers pour avoir des URLs optimisées? Non, cela n'est pas prévu pour cette version du site de la HEG. Peut-être avec une prochaine version qui sera basé sur un CMS on pourrait améliorer ce point (et d'autres que vous avez mentionnés avant). Quelques questions sur des améliorations/propositions qui sont apparues lors des analyses pour mon travail de diplôme, mais qui ne sont pas directement en relation avec le référencement. Est-ce que vous avez considéré de mettre un formulaire pour la prise de contact sur le site de la HEG plutôt que d'y mettre les différents adresses e-mails (comme cela se fait pour contacter les collaborateurs)? Non, nous n'y avons pas pensé, mais c'est à réfléchir si on veut le faire. Parce que je comprends tout à fait votre point de vue pour les gens qui ne sont pas sur leur poste de travail à eux ou n'ont pas de programme de messagerie installé. Une autre chose qu'on a prévu d'améliorer dans cette même ligne est le bulletin d'inscription. On veut bien qu'on puisse le remplir directement sur ordinateur. Search Engine Optmization Nicolas MESSER 100/102 La "fraicheur" du contenu d'un site est également importante dans le référencement pour les moteurs de recherche. J'ai constaté que les témoignages des étudiants ont récemment été actualisés. Est-ce que vous pensez que d'avoir une sorte de blog rédigé par les étudiants au lieu de la page plutôt statique qui ne change pas souvent pourrait être un autre moyen pour attirer des futur candidats? Oui, peut-être. Mais mon équipe et moi, nous ne nous occupons pas du tout du contenu (ni la rédaction de celui). Donc, ce n'est de toute façon pas à nous de prendre une telle décision. Et ma dernière question. Quel est le futur du site de la HEG? Nous envisageons de passer à un CMS pour la prochaine version. Mais pour ce qui concerne le site actuel, nous aimerions remettre à disposition la possibilité de faire des recherches sur le site et également mettre à disposition des flux RSS. Je vous remercie de m'avoir acceuili pour répondre à mes questions. Vos réponses vont beaucoup m'aider à clarifier quelques points dans mon mémoire. Encore une fois, merci pour votre temps. Search Engine Optmization Nicolas MESSER 101/102