DUT GEA. – Informatique – D`après le document de Laurent GILI
Transcription
DUT GEA. – Informatique – D`après le document de Laurent GILI
DUT GEA. – Informatique – D’après le document de Laurent GILI / Lycée Prévert « Google n’est un moteur de recherche, c’est un système de gestion de la réputation » Leslie Gaines-Ross Auteure de « Corporate Reputation » LE REFERENCEMENT NATUREL D’UN SITE WEB1 Introduction au concept de « référencement » « Tentons une explication de ce mot au travers d’une analogie avec la grande distribution : lorsque vous allez faire vos course s dans un supermarché, vous vous promenez dans les rayons et y voyez un certain nombre de produits. On dit d’ailleurs, dans le ja rgon commercial, que ces produits sont « référencés » auprès de la grande surface. En d’autres termes, ils sont « trouvables ». Cependant, ils sont placés parmi des centaines, des milliers d’autres, tous rangés au départ de la même façon dans de nombreu x rayons. Pour mettre en évidence certains d’entre eux, les responsables commerciaux des supermarchés ont alors eu l’idée de les placer au niveau des yeux du consommateur – ou en « tête de gondole », ou encore au niveau des caisses de paiement –, ce qui les rend plus visibles. Certains produits sont alors mis en avant à des endroits stratégiques, beaucoup plus facilement « trouvables » par les clients potentiels. Ils sont ainsi bien « positionnés »… Vous voyez où nous voulons en venir ? Pour ce qui est du référencement de votre site web, il en sera de même : lorsque votre site sera « présent » dans les bases de données d’un moteur, on dira qu’il est « référencé ». C’est une première étape, nécessaire mais pas suffisante, dans le processus de gain de visibilité de votre source d’information. Disons qu’il est « prêt à être vu »… *…+ Une phase toute aussi importante sera *…+, dans un deuxième temps, de mettre en « tête de gondole » votre site en le positionnant au mieux dans les résultats de recherche pour les mots-clés les plus importants pour votre activité. Enfin, il faudra une troisième étape, malheureusement souvent négligée, pour vérifier in fine que le positionnement a porté ses fruits en évaluant le trafic généré par vos efforts d’optimisation. Croyez-vous que les responsables de supermarchés ne vérifient pas si leurs produits se vendent mieux ou non en fonction de leur emplacement ? En effet, ce n’est pas parce qu’un produit est pl acé en tête de gondole qu’il est obligatoirement plus vendu. Tout dépend de l’endroit où se trouve la gondole et du nombre, voire du type, de personnes qui passent devant. En d’autres termes, il ne servira à rien d’être bien positionné sur des mots -clés que personne ne saisit ou sur des moteurs que personne n’utilise… » ème Olivier Andrieu, Réussir son référencement web, 2 édition, Ed. Eyrolles. Pour résumer ! Un processus de référencement s’effectue en 4 phases essentielles : 1. Référencement : votre site doit être « trouvable » (« en rayon ») dans l’index du moteur, de la façon la plus complète possible. 2. Identification : une ou plusieurs des pages de votre site doivent se trouver « dans le lot » des pages identifiées car contenant les mots-clés constituant la requête de l’internaute. 3. Positionnement : vos pages doivent être optimisées en fonction des critères de pertinence des moteurs afin d’être c dans les pages de résultats pour vos mots-clés choisis au préalable. l 4. Contrôle et suivi des résultats. a s s é e s a u m i e u x DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected] I/ Distinguer liens naturels et liens sponsorisés Voici un extrait de la page affichée par Yahoo suite à la saisie de la requête : «agence immobilière ». Zones A Zones B Zones A : Les zones A sont occupées par des liens sponsorisés, ou liens commerciaux, baptisés AdWords chez Google et qui sont des zones publicitaires payées par des annonceurs selon un système de paiement au clic. On parle ici de référencement payant, ou référencement SEM (Search Engine Marketing). Zone B : La zone B représente, elle, ce que l’on appelle les liens organiques ou naturels, qui sont fournis par l’algorithme mathématique de pertinence du moteur de recherche. Ils n’ont rien à voir avec la publicité affichée dans les zones ci-dessus. On parle ici de référencement naturel, ou référencement SEO (Search Engine Optimization). Définition : Liens « organiques » ou « naturels » On appelle liens « organiques » ou « naturels » (car aucun processus publicitaire n’intervient dans leur classement), les résultats affichés par le moteur de recherche en dehors de toute publicité ou promotion pour les services de l’outil de recherche. A retenir ! 1) Le référencement naturel est indépendant des liens sponsorisés Il est important de bien comprendre que les deux sources principales d’information dans les pages de résultats des moteurs (liens sponsorisés et liens organiques) sont indépendantes les unes des autres. Être un gros annonceur sur Google ou Yahoo! n’influe donc en rien de façon directe le positionnement de votre site web dans les liens organiques du moteur en question. Heureusement d’ailleurs, car la seule façon d’être pérenne pour un moteur de recherche est de présenter des résultats objectifs et indépendants des budgets publicitaires… 2) Une stratégie de référencement dit « naturel » ou « traditionnel » aura donc pour vocation de positionner une ou plusieurs page(s) de votre site web dans les meilleurs résultats des liens organiques lorsque les mots-clés importants pour votre activité sont saisis par les internautes. DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected] II/ Préparer le référencement A. Les trois étapes à respecter lors d’un référencement sur un moteur de recherche L’affichage des résultats par un moteur se décompose en trois étapes : 1. -Extraction, depuis son index, des pages répondant aux mots de la requête tapée par l’utilisateur. 2. Classement des résultats par pertinence. 3. Affichage. . B. Les premiers pas en pratique 1. Méthodologie générale http://methodologies.abondance.com/referencement.html http://www.rankspirit.com/referencement.php http://www.siteduzero.com/tutoriel-3-13666-apprenez-a-creer-votre-site-web.html 2. Le choix des mots-clés Les mots-clés que vous allez choisir sont extrêmement importants et doivent répondre à deux notions essentielles : · L’intérêt : ils doivent être souvent (le plus possible) tapés par les utilisateurs des moteurs de recherche. · La faisabilité : il doit être techniquement possible de positionner une page web dans les premiers résultats des moteurs pour ce terme dans des délais acceptables. Bien sûr, les termes choisis doivent décrire votre activité et le contenu de votre site web, cela va sans dire… Outils ! Pour trouver des mots-clés avec AdWords, de Google : AdWords Pour trouver les mots-clés qui sont « tendances » (par zone géographique) : http://www.google.com/insights/search/ 3. Les zones chaudes à examiner Zone chaude 1 : balise <title> Zone chaude 2 : texte visible Zone chaude 3 : adresse (URL) des pages Zone chaude 4 : balises meta Zone chaude 5 : attributs alt et title Voici quelques conseils techniques tirés du site rankspirit.com (http://www.rankspirit.com/realisation-site-web.php) : Syntaxe irréprochable Un code incorrect peut causer des problèmes d'affichage ou de ralentissement de chargement. Il peut aussi empêcher l'indexation de tout ou partie de votre site. De nombreux systèmes de vérification de code sont disponibles en ligne, utilisez-les. Liens en javascript ou en Ils sont visibles et utilisables par les visiteurs mais ne sont pas interprétés par les moteurs. Flash Certaines pages risquent donc d'être purement et simplement inaccessibles aux moteurs. Une solution simple consiste à réaliser une page "plan de site" qui comporte des liens HTML vers TOUTES les pages de votre site. Un lien HTML de la page d'index vers cette page "plan de site" permettra aux moteurs d'explorer et d'indexer l'intégralité de votre site. Si votre site comporte peu de texte et beaucoup d'images, il est impératif de compléter Balises "Alt" les balises "Alt" de toutes vos images pour avoir une chance de figurer dans les résultats des moteurs de recherche. Le fait de compléter ces balises vous permettra dans tous les cas de gagner de la pertinence. DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected] Titres de pages et les Ces zones ne jouent pas un rôle important pour l'indexation des pages. Elles jouent pourtant un descriptifs (balises <Title> rôle capital dans vos résultats de fréquentation. Les moteurs utilisent en effet souvent le contenu et <Description> de ces balises pour présenter un "résumé" de vos pages aux internautes. La balise "description" est également utilisée par certains annuaires. Il est donc impératif d'individualiser ces balises et d'y loger un texte clair et attractif pour chaque page. Sources Faites des liens vers les pages dont vous vous êtes inspiré. C'est la moindre des politesses et c'est un moyen de gagner de la pertinence vis-à-vis des moteurs de recherche. Pages dynamiques Les pages générées par les langages évolués tels que le PHP ou l'ASP ont parfois des URLs (adresses) trop complexes pour être reconnues par les moteurs de recherche. Il est alors indispensable de pratiquer l'"URL Rewriting" pour simplifier ces adresses aux yeux des moteurs. Les URLs "nettoyées" de cette façon doivent figurer dans votre plan de site ou sur une autre page. Structure du site Faites en sorte que n'importe quelle page de votre site soit accessible en 3 clics maximum depuis la page d'accueil. Noms de fichier Donnez à vos fichiers image et à vos pages des titres explicites et évocateurs. Si vous utilisez des noms composés, séparez les mots par des tirets. Exemple : axel-red-en-vacances.htm Frames Elles peuvent compliquer l'indexation de certaines pages. Le plan de site vous permettra, une fois encore, d'être certain de voir toutes vos pages indexées. L'utilisation des frames pose malheureusement beaucoup d'autres problèmes et nous vous la déconseillons vivement. 4. Le référencement auprès des moteurs 4.1. Les méthodes de référencement Il existe trois méthodes pour être référencé naturellement auprès des moteurs de recherche : a) Le référencement automatique : réalisé par des sites ou des logiciels spécialisés. En général, cette méthode est peu recommandable, sauf pour des webmasters expérimentés. b) Le référencement manuel : il est simple à réaliser mais consomme un temps considérable si vous ambitionnez d'obtenir un nombre important de liens par ce moyen. c) Le référencement payant : des professionnels s'occupent de faire ce travail pour vous. Cette solution, très onéreuse, est toutefois intéressante pour un site commercial à condition de choisir son prestataire avec un grand soin. Outils ! Les outils de soumission automatique Il existe plusieurs outils permettant de soumettre de façon automatique votre site à des centaines, voire parfois des milliers, d’annuaires. En voici quatre, classés par ordre alphabétique : · Linkomatic – http://www.linkomatic.org/ · SubmitWolf – http://www.trellian.fr/swolf/ · Website Submitter – http://www.submitsuite.com/products/website-submitter.htm · Yooda Submit – http://www.yooda.com/outils_referencement/submit_center_yooda/ Ces outils sont plutôt à éviter, les moteurs ne les appréciant que de façon très modérée… Les outils de soumission manuelle · Google – http://www.google.fr/addurl/?hl=fr&continue=/addurl · Yahoo! (nécessite un compte Yahoo!) – http://siteexplorer.search.yahoo.com/submit · Bing – http://www.bing.com/docs/submit.aspx?FORM=WSDD2 · Exalead – http://www.exalead.fr/search/web/submit/ DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected] 4.2. Le choix des moteurs Baromètre moteurs USA Juin 2011 (source : http://barometre.secrets2moteurs.com/) Baromètre France - Juin 2011 (source : http://barometre.secrets2moteurs.com/) ComScore - Part entités Mai 2011 / Juin 2011 Entité de recherche Mai 2011 Juin 2011 1 - Google 63.3% 64.5% 2 - Yahoo! 19.6% 17.5% 3 - Microsoft 13.1% 14.1% 4 - Ask Network 2.6% 2.6% 5 - AOL LLC Network 1.3% 1.3% 5. Le diagnostic et le suivi du référencement Outils ! http://www.outiref.com/ ; http://www.soumission-manuelle.com/fr/ ; outils pour webmaster Google DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected] III/ Travailler le positionnement A. Comprendre le système de ranking Le ranking est un processus qui consiste pour le moteur à classer automatiquement les données de l’index de façon à ce que, suite à une interrogation, les pages les plus pertinentes apparaissent en premier dans la liste de résultats. Le but du classement est d’afficher dans les 10 premières réponses les documents répondant le mieux à la question. Pour cela, les moteurs élaborent en permanence de nouveaux algorithmes (des formules mathématiques utilisées pour classer les documents). Ces algorithmes sont un véritable facteur différenciant. Ils ne sont donc que très rarement rendus publics. Il existe plusieurs grandes méthodes de ranking des résultats et les moteurs utilisent pour la plupart un mélange de ces différentes techniques. On citera, en particulier : · Le tri par pertinence Les résultats d’une requête sont triés en fonction de six principaux facteurs appliqués aux termes de la question : – localisation d’un mot dans le document (exemple : le poids est maximal si le mot apparaît dans le titre ou au début du texte) ou son adresse (URL) ; – densité d’un mot, calculée en fonction de la fréquence d’occurrences du mot par rapport au nombre total de mots dans le document ; – mise en exergue d’un mot : gras (balise <STRONG>), titre éditorial (balise <Hn>), lien, etc. ; – poids d’un mot dans la base de données calculé en fonction de sa fréquence d’occurrences dans l’index (les mots peu fréquents sont alors favorisés) ; – correspondance d’expression basée sur la similarité entre l’expression de la question et l’expression correspondante dans un document (un document est privilégié lorsqu’il contient une expression similaire à celle de la question, notamment pour des requêtes à plusieurs mots-clés) ; – relation de proximité entre les termes de la question et les termes utilisés dans le document (les termes proches l’un de l’autre sont favorisés). Le tri par popularité (indice de popularité) Popularisé – mais pas inventé – par Google en 1998 (pour contrer entre autres les abus possibles des méthodes de tri par pertinence) avec son PageRank, le tri par popularité s’appuie sur une méthode basée sur la « citation » – l’analyse de l’interconnexion des pages web par l’intermédiaire des liens hypertextes – et il est a priori indépendant du contenu. Ainsi, Google classe les documents notamment en fonction de leur PageRank (nombre et qualité des liens pointant vers ces documents). Le moteur analyse alors les pages contenant les liens : ceux émanant de pages issues de sites considérés comme importants « pèsent plus lourd » que ceux de pages de certains forums ou de pages perso jugées secondaires, par exemple. Plus une page est pointée par des liens émanant de pages populaires, plus sa popularité est grande et meilleur est son classement. Cette méthode de tri des résultats est aujourd’hui utilisée par de nombreux moteurs (pour ne pas dire tous les principaux moteurs). La question du PageRank (ou tri par popularité) de Google « Comme l'explique Larry Page,notre but est de vous fournir "exactement ce que vous souhaitez". À l'époque de la création de Google, l'une de nos innovations phares était la technologie PageRank. Celle-ci permettait d'évaluer l'"importance" d'une page Web, notamment en fonction du nombre de liens pointant vers elle. Aujourd'hui, nous nous appuyons sur plus de 200 signaux, dont PageRank, pour classer les sites Web, et nous mettons à jour leurs algorithmes chaque semaine. Par exemple, nous pouvons proposer des résultats de recherche personnalisés en fonction de votre historique Web ou de votre situation géographique. » · Le tri par mesure d’audience (indice de clic) Créée par la société DirectHit en 1998, cette méthode permet de trier les pages en fonction du nombre et de la « qualité » des visites qu’elles reçoivent. Cette méthode semble être utilisée encore aujourd’hui par certains moteurs dont Google. A noter Les moteurs sont également amenés à ajuster en permanence leurs algorithmes afin de contrer le spamdexing, c’est -à-dire les techniques peu scrupuleuses de spam utilisées par certains webmasters pour tromper les moteurs de recherche et améliorer artificiell ement le positionnement d’une page. Parmi ces techniques, nous pouvons citer : - le fait de multiplier les mots-clés dans les balises meta des pages HTML, qui a certainement amené les moteurs à ne plus prendre en compte ce champ ; - le fait d’intégrer un texte invisible sur une page (en blanc sur fond blanc, par exemple ; - la création de sites miroirs ou de liens fictifs ou invisibles pointant vers une page (ce qui permet de détourner l’indice de popularité) ; - les pages satellites ; la mise en place de faux portails contenant en fait des liens commerciaux ; la création de faux communiqués de presse… B. Les objectifs d’un bon positionnement Objectif n° 1 : apparaître dans les trois premières pages de résultats des outils de recherche, soit entre la première et la trentième position. Être classé après la 30e position sur un mot-clé donné équivaut à un trafic quasi nul. 62 % des utilisateurs de moteurs de recherche cliquent sur un résultat proposé sur la première page de leur moteur favori sans aller plus loin, et ils sont 90 % à ne jamais Objectif n° 2 : Objectif n° 3 : apparaître uniquement dans les dix premiers liens affichés, soit dans la première page de résultats. dépasser la troisième page de résultats. être « au-dessus de la ligne de flottaison » (above the Source : iProspect – Search Engine fold en anglais). Cela signifie que votre lien sera visible User Behavior Study (avril 2006). dans la fenêtre du navigateur de l’internaute sans que celui-ci ait à utiliser l’ascenseur. Par exemple, en résolution 1 024 × 768 (la plus courante à l’heure actuelle), une page de résultats de Google pour les mots-clés « agence immobilière » apparaît comme sur la figure suivante. DUT GEA. – Informatique – D’après le document de L. GILI – Adaptation [email protected] Objectif n° 4 : tenter de se positionner encore mieux en plaçant un site dans le « triangle d’or » des pages de résultats. Selon une étude menée par les sociétés Enquiro et Dit-It.com en collaboration avec la société EyeTool2, l’œil de l’internaute explore en priorité un « triangle d’or », situé en haut à gauche des pages de résultats de Google. Ainsi, il est possible d’indiquer un taux de visibilité pour chaque rang des liens proposés par le moteur : · positions 1, 2 et 3 : 100 % · position 5 : 60 % · positions 8 et 9 : 30 % · position 4 : 85 % · positions 6 et 7 : 50 % · position 10 : 20 %. La difficulté pour obtenir un bon positionnement sera proportionnelle au caractère concurrentiel des mots-clés représentant le site. Sur des mots-clés non concurrentiels, une bonne optimisation des pages (bien étudier leur titre, leur texte, leurs liens, leur URL => optimisation « à la source » du code HTML) peut suffire pour obtenir un positionnement parmi les premiers liens naturels proposés par un moteur de recherche. Sur des mots-clés concurrentiels, il faudra, en plus d’une bonne optimisation des pages, l’obtention de backlinks, c’est à dire la présence de liens vers nos pages sur des sites web tiers. Le triangle d’or de la page de résultats de Google : plus le rouge est vif, plus la zone est lue instinctivement par l’œil des internautes (le trait horizontal épais représente la ligne de flottaison). L’étude est consultable à : http://www.prweb.com/releases/2005/3/prweb213516.htm Conclusion Il convient de distinguer deux types essentiels de publicité en ligne : la publicité « display », qui consiste à afficher des messages sur des espaces publicitaires (ex. bannières) et la publicité « search », qui propose des liens vers les sites web. La publicité « search » implique un travail de référencement, visant à optimiser la visibilité du site web. Référencement commercial (SEM) Référencement naturel (SEO) Dans le cadre de ce chapitre, nous avons abordé les principes du référencement naturel (SEO), qui conduit à l’optimisation du site afin qu’il soit indexé au mieux par les moteurs de recherche. Le chapitre suivant montrera qu’il existe d’autres axes de référencement : - le référencement payant (SEM3), qui désigne l’optimisation de la visibilité d’un site web au travers d’une campagne de liens sponsorisés sur un moteur de recherche ; - le référencement vers les médias sociaux (SMO4), visant à assurer la visibilité d’un site web sur les réseaux sociaux. 2 Société spécialisée dans les systèmes d’eye-tracking (analyse des mouvements de l’oeil). SEM : Search Engine Marketing 4 SMO : Social Media Optimization 3 Référencement sur les réseaux sociaux (SMO)