FAIRE DES RECHERCHES DANS GOOGLE

Commentaires

Transcription

FAIRE DES RECHERCHES DANS GOOGLE
FAIRE DES RECHERCHES DANS GOOGLE
GÉNÉRALITÉS
Le bouton « j’ai de la chance » : Plutôt que de donner une liste de résultats pour la
recherche, Google va vous indiquer la page qu’il considère comme la plus pertinente
compte tenu de votre requête.
La « casse » : Google n’est pas sensible à la casse des lettres avec lesquelles les
requêtes sont écrites. Que vous recherchiez Trois, trois, TROIS, vous obtiendrez le
même résultat.
10 mots maximum : Google n’accepte pas les requêtes de plus de dix mots. (Si
vous utilisez plus de 10 mots, ceux-ci seront ignorés). Il existe un moyen de
détourner cette contrainte via un « hacks » que je ne détaille pas ici ».
Les « stop words » : Les mots communs du style « je », « un », « le » et « de » ne
sont d’aucune utilité. Ils sont dénommés « stop words » et sont totalement ignorés
par Google. Pour forcer Google à prendre en compte un de ces mots, faite-le
précéder d’un caractère + (plus), exemple : +la table.
Pas de « stemming » : Google ne supporte pas la capacité à utiliser un astérisque
ou tout autre joker à la place de lettres dans une requête. (Donc ne pas faire de
recherches avec par exemple ta*le pour table) Par contre, on peut formuler une
requête comme trois * souris qui permet à Google de trouver « trois grosses souris »,
« trois belles souris », « trois petites souris ».
Recherche avancée : La recherche avancée dans Google permet d’aller au-delà de
la simple recherche, en choisissant dans les menus différentes options : langue,
filtrage, format des fichiers, date. Vous pouvez régler vos préférences via cette url :
http://www.google.com/language_tools?hl=fr (note : il faut avoir vos cookies activés).
SPÉCIFICITÉ : BOOLÉEN
Le booléen de base dans Google c’est le AND ; donc, si vous tapez 2 ou 3 mots
sans aucun modificateurs, Google va faire une recherche sur tous les motsclés sans modificateurs : Google va rechercher tous les mots :
automobile renault mégane
Si vous voulez préciser une recherche sur l’un des deux mots, insérez OR
entre chacun des termes :
Automobile OR Renault OR mégane
Si vous souhaitez absolument avoir un mot complété par un des deux autres, il
faut regrouper ces derniers à l’intérieur de parenthèses, ainsi :
Automobile (Renault OR mégane)
Automobile (Renault |mégane)
Si vous souhaitez spécifier qu’un des termes de la requête n’apparaisse pas
dans vos résultats, il vous faut utiliser un signe moins ou tiret. Une telle
requête signifie que le moteur va rechercher les pages qui contiennent à la fois
des mots « automobile » et « Renault », mais non le mot « mégane » :
Automobile Renaut – mégane
2
SPÉCIFICITÉ : SYNTAXE
Dans la mesure où Google est un moteur qui effectue des recherches dans tout
le texte, il indexe les pages web dans leur entier plutôt que de se contenter de
leur titre et de leur description. Des commandes supplémentaires, dénommées
syntaxes spéciales, permettent aux utilisateurs de Google d’effectuer des
recherches dans des parties spécifiques des pages ou encore de rechercehr
des types particuliers d’informations. Certaines de ces syntaxes fonctionnent
très bien lorsqu’elles sont utilisées ensemble, d’autres moins.
intitle: Restreint votre recherché aux titres des pages Web. la variation de cette
syntaxe, allintitle, vous permet de trouver toutes les pages dans lesquelles tous les
termes spécifiés constituent le titre de la page. (Note : allintitle se combine mal avec
d’autres syntaxes)
intitle :bonbons vert
allintitle : »théorie de l’offre » économie
inurl: Limite votre recherché aux URL des pages Web. Cette syntaxte fonctionne
bien lorsu’il s’agit de trouver des pages d’aide et de recherche car leur composition
tend à être assez régulière. Idem ici pour, allinurl, qui permet de trouver tous les mots
contenus dans une URL mais se combine mal avec d’autres syntaxes spéciales.
inurl :aide
allinurl :recherche aide
intext: vous permet d’effectuer des recherches uniquement dans le corps du texte.
En d’autres termes, le texte des liens, les URL et les titres sont ignorés. (Remarque
idem pour l’utilisation de allintext).
intext:«yahoo»
allintext:html
3
inanchor: Permet de rechercher du texte dans les ancres des liens d’une page,
c’est-à-dire dans le descriptif d’un lien. Exemple : l’ancre du lien du code HTML <a
href=’http://www.nosource.com »>le site nosource</a> est « le site nosource ».
inanchor:«alex moreau»
site: Permet de restreindre votre recherche, soit à un nom de domaine, soit au
niveau supérieur d’un nom de domaine.
site:loc.gov
site:edu
site:thomas.loc.gov
link : Vous renvoi une liste de pages ayant un lien avec l’URL spécifié. Si vous
entrez la requête link:www.nosource.com vous obtiendrez une liste des pages qui
contiennent des liens sur Google. (pas besoin d’inclure http:// dans votre requête).
cache: Vous permet de trouver une copie de la page que Google a indexée quand
bien même cette page n’est plus disponible à son URL d’origine ou a, depuis,
complètement changé de contenu. (Note : il existe un moteur de recherche qui traite
les anciennes versions de sites qui ne sont plus disponible, le WAYBACK
MACHINE : http://web.archive.org/collections/web/advanced.html )
cache:www.nosource.com
related: Vous permet de trouver des pages qui sont liées à celle qui est spécifiée.
Une recherche formulée related:google.com vous obtiendrez toute une variété de
moteur de recherche comme HotBot, Yahoo ! et Northern Light.
related:www.cnn.com
4
daterange: Vous offre la possibilité de limiter votre recherche en fonction de la date,
ou d’une gamme de dates auxquelles une page aurait été indexée.
*Note : On parle bien ici d’une recherche qui ne ce limite pas à la date à laquelle la
page a été créée, mais en fonction de celle à laquelle elle a été indexée par Google.
Par conséquent, une page qui aurait été créée le 2 février, mais que Google n’aurait
indexée que le 11 avril ne peut être trouvée qu’avec une recherche daterange:
portant sur cette dernière date.). De plus, la fonction daterange: fonctionne avec les
dates du calendrier julien et non avec celle du calendrier grégorien.
«jacques chirac» daterange:2452389-2452389
neurochirurgie daterange:2452389-2452389
filetype: Vous permet de rechercher des suffixes ou des extensions de nom de
fichier. On peut utiliser différents types de générateurs de pages (html,asp, php, cgi)
ou encore des types de format Microsoft (ppt, pps, xls, doc)
cours filetype:pdf
«indicateurs économiques» filetype:ppt
info: Vous fournit une page de liens permettant d’obtenir plus d’information à propos
de l’URL que vous avez spécifiée.
Info:www.nosource.com
phonebook: La commande permettant de rechercher des numéros de téléphone.
phonebook: Jacques Dupont
phonebook: (02)4273637
5