version PDF - Flash informatique

Transcription

version PDF - Flash informatique
Les chiffres sont aux analystes ce que
les lampadaires sont aux ivrognes
Ils fournissent bien plus un appui qu’un éclairage
[email protected], Domaine IT
Vous
pouvez consulter les statistiques de fréquentation de votre site Web via le service Webalizer
mis en place à l’Ecole pour les sites Jahia (et www.epfl.ch).
Il suffit d’ajouter le suffixe /stats à l’adresse (url) de votre
page d’entrée.
Exemple:Portail Collaborateurs > collaborateurs.epfl.ch
> collaborateurs.epfl.ch/stats/ .
Comme toute statistique, les chiffres proposés sont à
prendre avec des pincettes. La plupart des termes employés
ont une définition plutôt obscure et ne fournissent pas des
informations immédiatement décodables. Vous pourrez
trouver intéressant de comparer les flux de visites selon les
heures de la journée ou les jours du mois. Vous serez curieux
de connaître les mots-clé qui ont conduit les internautes sur
votre site, ainsi que leur provenance. Si vous cherchez un
moyen infaillible pour vous renseigner sur votre visibilité et
la fonctionnalité de vos pages, mieux vaut mener une petite
enquête auprès de votre public-cible.
Quelles sont les caractéristiques de Webalizer
❚ Tout d’abord, les statistiques sont faites globalement pour
un site, et non pas pour chaque page.
❚ Webalizer produit des statistiques mensuelles et un tableau récapitulatif pour les 12 derniers mois.
❚ Les statistiques du mois en cours sont mises à jour toutes
les nuits avec les données des connexions de la veille.
❚ Comme elles prennent en compte les accès faits par les
robots des moteurs de recherche, ce qui n’est pas négligeable (ces robots visitent toutes les pages), les statistiques
n’ont donc qu’une valeur relative.
Petit lexique
�������
���������
�������������
������
Voici une définition des termes classés par leur ordre
d’apparition:
(total) Hits: Toute requête au serveur qui héberge votre site
est un hit (fichier de tout type, HTML, PHP, image,
script CGI,...)
Exemple: votre page contient 10 images et une feuille de
style, cela est donc comptabilisé comme 12 hits (> page
html + css + images). A noter que si une image est déjà
apparue précédemment, soit sur une même page, soit
sur des pages différentes (pixel.gif, le logo de l’epfl, …),
elle est stockée dans le cache de votre navigateur et ne
compte que pour un hit. Le nombre de hits n’a donc pas
beaucoup de sens.
(total) Files: Tout document (fichier ou document dynamique) renvoyé par le serveur en réponse à une requête.
Toute requête (=hits) n’aboutit pas à l’envoi d’un fichier:
elle peut correspondre à une erreur.
(total) Pages: Tout fichier renvoyé de type HTML ou HTM,
c’est-à-dire toute page, sans les fichiers individuels qui la
composent (images, clips audio,…). Webaliser compte
cela approximativement en se basant sur le suffixe de
l’objet demandé, et inclut les pages PHP.
(total) Visits: Une visite consiste en la consultation successive
d’une ou plusieurs pages sur le même site et par le même
client (visiteur), dans un laps de temps raisonnable (30
minutes).
Exemple: Une personne qui consulte à la suite dix pages
de votre site compte pour une visite. Mais si plus de
30 minutes s’écoule entre deux clicks, une nouvelle visite
est alors comptabilisée.
(total) Kbytes: Donne le volume des fichiers renvoyés en
kilo-octets (1 Ko = 1024 octets).
������������������
���������������
������
����������
�����������������������
Web est en fait décomposé en une série d’objets distincts
possédant chacun leur propre adresse (images, pages, css,
fichiers audio ou pdf,…).
�������
���
���������������������
���������������������
Webalizer fait des statistiques sur les hits, les fichiers,
les pages, les visites, etc. Ces termes nécessitent quelques
éclaircissements. En effet, ce qui est analysé est le flux entre
la machine de votre visiteur et le serveur qui héberge votre
site. Ce que vous voyez à l’écran et que vous appelez page
(total) Unique Sites: Nombre d’adresses IP (de clients) différentes. Ici le mot site n’a rien n’à voir avec votre site,
mais désigne la machine de votre client.
(total) Unique URLs: Le nombre d’adresses (url des pages
+ des fichiers) consultées sur votre site.
(total) Unique Referrers: Un référent est le document que
consultait le visiteur lorsqu’il a cliqué sur un lien l’amenant sur une de vos pages Web. Webalizer sait (plus ou
moins bien) agréger les référents venant de moteurs de
fi 4 – 4 mai 2004 – page 19
Les chiffres sont aux analystes ce que les lampadaires sont aux ivrognes: ils fournissent bien plus un appui qu’un éclairage
recherche tels que Google. La navigation à l’intérieur de
votre propre site n’est pas prise en compte.
(total) Unique User Agents: Un autre nom pour désigner
les navigateurs.
Top 30 of Total URLs: Chaque élément de votre site (page
html, image, fichier audio,…) a sa propre adresse, ou
URL. Cette rubrique donne la liste des adresses les plus
consultées sur votre site.
Quelques exemples d’adresses:
◗Le signe / indique la page d’entrée du site. Attention, pour les sites Jahia, la page d’accueil a à la fois une
adresse générique (monsite.epfl.ch ) et une adresse Jahia
(monsite.epfl.ch/page12346.html);
◗/favicon.ico est une requête pour la petite image qui
s’affiche (sur certains navigateurs) à côté de l’url dans la
barre d’adresse et dans la liste des favoris;
◗/robots.txt est une requête venant des moteurs de
recherche pour consulter le fichier définissant les règles de
recherche (définition des robots.txt, voir bas de page);
◗des demandes de type /_vti_bin/owsssvr.dll,
/MSOffice/cltreq.asp sont produites par des agents
(agent = logiciel envoyé sur un réseau pour effectuer
une tâche à la place de l’utilisateur et sans son intervention.)
◗/label.php, sur les sites Jahia, est une requête pour
les images-titres (dans le bandeau, les boîtes)
◗/cgi-bin/csoldap est une demande à l’annuaire,
depuis la boîte de recherche
◗…
Top 15 of Total User Agent: En principe, le navigateur
employé par le visiteur, bien que la plupart ne s’annonce
pas sous leur vrai nom. Ces données n’ont donc pas beaucoup de réalité.
Top 30 of Total Countries: La provenance (géographique)
des visiteurs selon leur TLD (top level domain, exemple:
.ch . fr, .com,…).
Top 10 of Total URLs by KBytes: Classement des pages et
fichiers selon leur poids (une page contenant de nombreuses images aura plus de poids qu’un simple fichier
favicon.)
Top 10 of Total Entry Pages: La première page lue lors d’une
visite. Le signe / indique qu’il s’agit de la page d’accueil
(homepage) de votre site.
Top 10 of Total Exit Pages: La dernière page lue lors d’une
visite. Le signe / indique qu’il s’agit de la page d’accueil
(homepage) de votre site.
Top 30 of Total Sites: Soit les serveurs auxquels sont rattachés les visiteurs de votre site, soit leur fournisseur
d’accès, soit leur IP.
Exemple: bibpc34.epfl.ch > le serveur des postes publics
de la bibliothèque centrale.
Top 10 of Total Sites by KBytes: La provenance des visiteurs en fonction de leur serveur selon le volume des
requêtes.
Top 30 of Total Referrers: Les pages sur lesquels se trouvaient
vos visiteurs lorsqu’ils ont utilisé un lien les conduisant à
votre site. Direct request: le visiteur a écrit directement
votre adresse dans la barre de navigation.
Top 15 of Total Search string: Il s’agit des mots-clés employés par les utilisateurs sur des moteurs de recherche.
fi 4 – 4 mai 2004 – page 20
Sources
Ces informations sont issues d’une page de la CICT, qui
utilise également Webalizer. Vous pouvez consulter cette page
in extenso ou chercher plus d’informations sur le site même
de l’outil (en anglais) www.cict.fr/WWW/statistiques.html
et www.mrunix.net/webalizer/.
Vulgarisation scientifique: tout ce que vous n’osez plus
demander au sujet d’Internet: www.commentcamarche.net/
internet/
Plus d’information sur les robots et les moteurs de recherche: article de Francis Lapique dans le FI/1-2: dit.epfl.ch/
publications-spip/article.php3?id_article=363. ■