Web sémantique

Transcription

Web sémantique
SRETI :
Les Nouvelles Technologies de l’Information et
de la Communication
Morgan MAGNIN
Bureau S214
morgan.magnin CHEZ irccyn.ec-nantes.fr
http://www.irccyn.ec-nantes.fr/~magnin/
Vendredi 2 décembre 2005
Public : EI3 Info
- p. 1 -
Petit historique d’Internet (1)
1962 : l’US Air Force souhaite la création d’un réseau de
communication militaire capable de résister à une attaque
nucléaire.
1964, modèle de Paul Baran : réseau sous forme de grande toile
(et non plus centralisé).
1969 : réseau expérimental ARPANET, créé par l'Advanced
Research Projects Agency dépendant du Department of Defense
1972 : invention du courrier électronique par Ray Tomlinson
Morgan MAGNIN - 2 décembre 2005
- p. 2 -
Petit historique d’Internet (2)
1972 : débuts du travail autour du protocole TCP pour
acheminer des données sur un réseau en les fragmentant en petits
paquets.
1978 : le protocole TCP est scindé en deux protocoles : TCP et IP
1984 : introduction du système de nommage Domain Name
Service (DNS)
1980 : mise au point d’un système de navigation hypertexte par
Tim Berners-Lee, chercheur au CERN de Genève.
1989 : Tim Berners-Lee met au point le protocole HTTP (Hyper
Text Tranfer Protocol), ainsi que le langage HTML (HyperText
Markup Language) permettant de naviguer à l'aide de liens
hypertextes, à travers les réseaux.
Morgan MAGNIN - 2 décembre 2005
- p. 3 -
Fonctionnement d’Internet : rappels
(1)
Internet : modèle en couches, calqué sur le modèle OSI.
Protocole : ensemble de règles qui définissent un langage afin de
faire communiquer plusieurs ordinateurs. Définis par des normes
ouvertes, les RFC.
IP (Internet Protocol) : définition du mode d'échange élémentaire
entre les ordinateurs participant au réseau en leur donnant une
adresse unique sur le réseau.
 TCP (Transmission Control Protocol) : établissement de la
connexion et du contrôle de la transmission. Protocole de remise
fiable (s'assure que le destinataire a bien reçu les données).
– HTTP (HyperText Transfer Protocol) : chargement des pages Web.
– HTTPS : pendant sécurisé du HTTP.
Morgan MAGNIN - 2 décembre 2005
- p. 4 -
Fonctionnement d’Internet : rappels
(2)
–
–
–
–
–
–
FTP (File Transfer Protocol) : transfert de fichiers sur Internet
SMTP (Simple Mail Transfer Protocol) : échange du courriel en envoi.
POP3 (Post Office Protocol version 3) : mode d'échange du courriel en réception.
IMAP (Internet Message Access Protocol)
IRC (Internet Relay Chat) : discussion instantanée.
NNTP (Network News Transfert Protocol) : transfert de message utilisé par les
forums de discussion Usenet
– DNS (Domain Name System) : système de résolution de noms Internet.
Morgan MAGNIN - 2 décembre 2005
- p. 5 -
Bibliographie autour de l’histoire
d’Internet
http://www.commentcamarche.net/histoire/internet.php3
http://fr.wikipedia.org/wiki/Internet#Histoire
http://www.7-dragons.com/portail/internet/histoire-internet.php
Morgan MAGNIN - 2 décembre 2005
- p. 6 -
Sommaire
Introduction
Vers un nouvel Internet ?
Communiquer
Collaborer
Le nerf de la guerre : l’indexation
Conclusion
Morgan MAGNIN - 2 décembre 2005
- p. 7 -
Sommaire
Introduction
Vers un nouvel Internet ?
 Web 2.0
 Web sémantique
Communiquer
Collaborer
Le nerf de la guerre : l’indexation
Conclusion
Morgan MAGNIN - 2 décembre 2005
- p. 8 -
Vers un nouvel Internet ?
W3C : World Wide Web Consortium
 Fondé en octobre 1994
 Promotion de la compatibilité des technologies du World Wide Web
 Emet des recommandations, pas des normes
 Gestion conjointe : MIT, European Research Consortium for
Informatics and Mathematics (ERCIM) et l'Université Keio.
Intérêts pas toujours convergents avec les intérêts économiques
Web 2.0 …
Et/ou Web sémantique ?
Morgan MAGNIN - 2 décembre 2005
- p. 9 -
Qu’est-ce que le Web 2.0 ?
Terme fourre-tout (buzzword)
Désigne la manière dont nous allons travailler et interagir avec
l’information sur le web.
Technologies qui permettent aux données de devenir
indépendantes de la personne qui les produit ou du site dont elles
viennent.
L’information peut être tranchée en unités qui jaillissent
librement d’un site à un autre, souvent avec des manières que le
producteur n’avait pas prévu.
Source : http://www.elanceur.org/
Morgan MAGNIN - 2 décembre 2005
- p. 10 -
Quelques définitions (1)
Selon Kevin Kelly :
« Le web 2.0 repose sur un ensemble de modèles de conception :
des systèmes architecturaux plus intelligents qui permettent aux
gens de les utiliser, des modèles d’affaires légers qui rendent
possible la syndication et la coopération des données et des
services… Le web 2.0 c’est le moment où les gens réalisent que ce
n’est pas le logiciel qui fait le web, mais les services ! »
Source : http://blogs.zdnet.fr/index.php/2005/10/30/web-20/
Morgan MAGNIN - 2 décembre 2005
- p. 11 -
Quelques définitions (2)
Selon Cyril Fievet :
Deux aspects caractérisent le web 2.0 :
 les usages, marqués par le partage et la prise de parole des individus :
peer to peer, blogs, wikis, réseaux sociaux, etc.
 les techniques, démultipliant le champ des possibles et notamment
l’interactivité du Web : ce sont souvent des langages ou standards
anciens mais qui parviennent à maturité, sont mieux maîtrisés ou
utilisés conjointement pour produire des choses nouvelles (RSS,
AJAX, Ruby…)
Source : http://blogs.zdnet.fr/index.php/2005/09/28/le-web-20-lafranaise/
Morgan MAGNIN - 2 décembre 2005
- p. 12 -
Quelques définitions (3)
Selon Anicet Mbida :
Web 1.0 :
 Type de Web : statique.
 Période : 1994-1997
 Technologies associées : HTML, GIF
 Caractéristiques : pages Web = documents statiques rarement mis à
jour.
Web 1.5
 Type de Web : dynamique
 Période : 1997-2003
 Technologies associées : DHTML, ASP, CSS
 Caractéristiques : pages Web : construites à la volée à partir d'une ou
plusieurs bases de données.
Morgan MAGNIN - 2 décembre 2005
- p. 13 -
Quelques définitions (4)
Web 2.0
 Type de Web : collaboratif
 Période : 2003
 Technologies associées : Ajax, DHTML, XML, Soap
 Caractéristiques : l'utilisateur devient contributeur, il publie des
informations et manipule les données.
Source : http://www.01net.com/article/294819.html
Morgan MAGNIN - 2 décembre 2005
- p. 14 -
AJAX (1)
Asynchronous JavaScript And XML : méthode informatique de
développement d'applications Web.
Représente l’utilisation conjointe de :
 HTML (ou XHTML) et CSS pour la présentation des informations ;
 DOM et JavaScript pour afficher et interagir dynamiquement avec
l'information présentée ;
 XML, XSLT et l'objet XMLHttpRequest pour échanger et
manipuler les données de manière asynchrone avec le serveur web.
Utilisation de ces applications au sein de navigateurs Web.
Morgan MAGNIN - 2 décembre 2005
- p. 15 -
AJAX (2)
Traditionnellement :
 Requête envoyée au serveur HTTP, qui agit en fonction de l'action
et des données reçues, et retourne une nouvelle page.
 Consommation inutile de bande passante
 Temps de réponse de l'application dépendant fortement du temps de
réponse du serveur HTTP.
Avec AJAX :
 Envoie de requêtes au serveur HTTP pour récupérer uniquement
les données nécessaires en utilisant la requête HTTP
XMLHttpRequest
 Feuilles de style (CSS) et langage Javascript côté client pour
interpreter la réponse du serveur HTTP.
 Plus de réactivité
 Seul le chargement initial peut être pénalisé.
Morgan MAGNIN - 2 décembre 2005
- p. 16 -
AJAX (3)
XMLHttpRequest :
 Objet Javascript permettant d'obtenir des données au format XML
à l'aide de requêtes HTTP
 Permettant de charger des données depuis une autre page sans pour
autant quitter celle où l’on se trouve !
 Ce n’est pas un standard du W3C !
Applications AJAX : doivent être testées de manière très
complète à cause des différences entre navigateurs.
Idée principale : proposer des interfaces plus réactives et plus
riches
Morgan MAGNIN - 2 décembre 2005
- p. 17 -
AJAX (4)
Une révolution…
… ou un « buzz » marketing ?
 Désigne le bon sens, l’utilisabilité et l’utilisation conjointe de
techniques loin d’être nouvelles.
 Remplace le HTML
Maître mots :
 Réactivité
 Utilisabilité
Quid des standards et de l’accessibilité ?
Morgan MAGNIN - 2 décembre 2005
- p. 18 -
Bibliographie sur les technologies du
Web 2.0
Définition : http://fr.wikipedia.org/wiki/AJAX
http://www.framasoft.net/article3991.html
Ajax : http://www.01net.com/article/294818_a.html
http://www.01net.com/article/294818.html
http://blogs.zdnet.fr/index.php
/2005/09/05/ajax-vers-un-nouveau-web/
http://www.internetactu.net/index.php?p=6144
Morgan MAGNIN - 2 décembre 2005
- p. 19 -
Un exemple de site Web 2.0 (1)
Google Maps - http://maps.google.com/
1 - Chargement par le navigateur d’une carte beaucoup plus
grande que celle affichée et du code Javascript permettant de la
manipuler.
2 - Quand on clique sur les boutons pour déplacer la carte,
aucune requête n'est envoyée au serveur.
Le code Javascript déplace la grande carte stockée en mémoire en
utilisant DHTML.
Morgan MAGNIN - 2 décembre 2005
- p. 20 -
Un exemple de site Web 2.0 (2)
3 - Quand l'internaute zoome sur la carte ou qu'il la déplace dans
une zone limitrophe, le code Javascript envoie une requête au
serveur via la fonction XMLHTTPRequest pour recevoir les
prochains morceaux de carte à afficher. Il invoque alors un
service Web sur le serveur.
4 - Ce dernier renvoie les morceaux manquants dans un format
JSON, une sorte de Javascript binaire.
5 - Les données reçues sont interprétées et affichées par
Javascript dans la fenêtre du navigateur. Si l'on repart en arrière,
l'affichage est immédiat, car les données sont déjà dans
l'antémémoire.
Source : http://www.01net.com/article/294821.html
Morgan MAGNIN - 2 décembre 2005
- p. 21 -
D’autres exemples de sites web 2.0
http://www.meebo.com/ : accès en ligne à différentes messageries
instantanées
http://www.writely.com/ : traitement de textes en ligne (Word,
OpenOffice, etc.)
http://www.zimbra.com/ : gestion calendrier/clients/etc. à la
Outlook
http://webserver002.goowy.com/ : environnement de travail en
ligne
http://www.andale.com/ : analyse l’information des ventes venant
d’eBay
http://www.housingmaps.com : combine les annonces
immobilières de la Craigslist avec la capacité des Google Maps
pour visualiser rapidement une carte satellite de l’adresse exacte.
Morgan MAGNIN - 2 décembre 2005
- p. 22 -
Fonctionnement pratique
Construction de nouveaux services à partir de :
 L’information existante
 De données
 De services
Réutilisation des informations d’une manière non prévue par les
créateurs initiaux
Morgan MAGNIN - 2 décembre 2005
- p. 23 -
Web 1.0 vs Web 2.0
Web 1.0 --> Web 2.0
DoubleClick --> Google AdSense
Ofoto --> Flickr
Akamai --> BitTorrent
mp3.com --> Napster
Britannica Online --> Wikipedia
personal websites --> blogging
domain name speculation --> search engine optimization
page views --> cost per click
content management systems --> wikis
• Source : http://www.oreillynet.com/pub/a/oreilly/tim/news/2005/09/30/what-isweb-20.html
Morgan MAGNIN - 2 décembre 2005
- p. 24 -
Web 2.0 : pour
Emergence d’un système de recommandation : filtrage de
l’information
Plate-forme d'échange
Soutien du web sémantique
Monétarisation accrue
Ajax et/ou Flash ?
Morgan MAGNIN - 2 décembre 2005
- p. 25 -
Web 2.0 : contre
Tout le monde en parle…
Mais qu’est-ce véritablement ?
Techniquement : du HTML, du Javascipt, des feuilles de style
CSS, des bases de données, etc., i.e. c’est le Web !
Créer une entreprise Web 2.0, c’est créer une boîte dans le seul
espoir qu'elle soit rachetée par Yahoo ou Google ?
Morgan MAGNIN - 2 décembre 2005
- p. 26 -
Bibliographie sur le Web 2.0
Guide du Web 2.0 : http://www.elanceur.org/
Article fondateur du Web 2.0, par Tim O’Reilly : http://www.
oreillynet.com/pub/a/oreilly/tim/news/2005/09/30/what-is
-web-20.html
Collectif recensant les experts francophones du Web 2.0 :
http://louvre-boite.viabloga.com/texts/phenix.shtml
Dossier consacré au Web 2.0 par 01net. : http://www.01net.com
/article/294818.html
Morgan MAGNIN - 2 décembre 2005
- p. 27 -
De l’utilité de l’évolution du web (1)
Recommandations du W3C pour présentation des contenus et
leur proximité symbolique par les liens hypertextuels.
Même partiellement respectées, une certaine efficacité.
Mais déficit de maîtrise des contenus en raison même de leur
volume.
Morgan MAGNIN - 2 décembre 2005
- p. 28 -
De l’utilité de l’évolution du Web (2)
Déplacement des objectifs de standardisation
De la perspective du rapprochement pratique des informations
Vers celle de leur distinction via toutes sortes de discriminations
informatiques et humaines.
Source : http://websemantique.org/ReperePointDepart
Morgan MAGNIN - 2 décembre 2005
- p. 29 -
Limites du Web actuel (1)
Actuellement, le contenu du Web est fait pour des lecteurs
humains, mais pas pour des ordinateurs.
 Problème pour les recherches, le moteur de recherche ne
comprenant pas le sens des documents indexés .
Généralement, les moteurs ne savent répondre qu'à deux
questions :
 Quelles sont les pages contenant le terme X ?
 Quelles sont les pages les plus populaires au sujet de Y ?
Morgan MAGNIN - 2 décembre 2005
- p. 30 -
Limites du Web actuel (2)
Incapacité à répondre à des questions telles que
« Quelle est le club de sport la plus proche ayant un cours de
squash ? »
Morgan MAGNIN - 2 décembre 2005
- p. 31 -
Idée sous-jacente au web sémantique
Ce n'est pas :
 faire en sorte que les ordinateurs puissent comprendre le
langage humain ou fonctionner en langage naturel ;
 programmer une intelligence artificielle permettant au Web de
réfléchir.
C’est : regrouper l'information de manière utile, comme pour une
gigantesque base de données, où tout est écrit en langage structuré.
Autrement dit : donner aux informations un sens que même les
ordinateurs peuvent « comprendre ».
Morgan MAGNIN - 2 décembre 2005
- p. 32 -
Problématique du Web sémantique
(1)
Enjeu : mettre au point un langage universel afin de décrire les
données et les rendre interopérables.
Faire en sorte que la machine soit capable d’établir des relations
avec des objets.
Pour ce faire, l'humain doit aider l'ordinateur à « comprendre et
interpréter ».
Morgan MAGNIN - 2 décembre 2005
- p. 33 -
Problématique du Web sémantique
(2)
A terme, les ordinateurs accèderont à une variété d'informations
diverses et multiples, des informations souvent contradictoires.
Et devront être capable de les discriminer : production de
synthèse compréhensible pour le cerveau humain.
Les meta-tags : une première avancée, très minime
Principe : mettre à disposition un langage de recherche, qui
complète le web d'aujourd'hui, et qui rende son contenu
intelligible par des applications différentes.
Autrement dit : donner du sens au web (d’où le terme
« sémantique »)
Morgan MAGNIN - 2 décembre 2005
- p. 34 -
Web sémantique (1)
 « Le Web sémantique n'est pas un Web séparé, mais une extension du
Web actuel dans lequel l'information est munie d'une signification bien
définie permettant aux ordinateurs et aux personnes de mieux travailler
en coopération. » T. Berners-Lee , J. Hendler et O.Lassila, Scientific American
2001
Entièrement fondé sur le Web « classique » : un moyen de publier
et consulter des documents.
Mais les documents traités par le Web sémantique contiennent :
 Non pas des textes en langage naturel (français, espagnol, chinois,
etc.)
 Mais des informations formalisées pour être traitées
automatiquement.
Morgan MAGNIN - 2 décembre 2005
- p. 35 -
Web sémantique (2)
 Documents générés, traités, échangés par des logiciels qui permettent,
souvent sans connaissance informatique :
 de générer des données sémantiques à partir de la saisie
d'information par les utilisateurs
 d'agréger des données sémantiques afin d'être publiées ou traitées
 de publier des données sémantiques avec une mise en forme
personnalisée ou spécialisée
 d'échanger automatiquement des données en fonction de leurs
relations sémantiques
 de générer des données sémantiques automatiquement, sans saisie
humaine, à partir de règles d'inférences.
 Source : Wikipedia - http://fr.wikipedia.org/wiki/Web_sémantique
Morgan MAGNIN - 2 décembre 2005
- p. 36 -
Intérêt du web sémantique
Objectif : arriver à un Web « intelligent », où les informations ne
seraient plus stockées mais « comprises » par les ordinateurs afin
d'apporter à l'utilisateur ce qu'il cherche vraiment.
Source : http://developpeur.journaldunet.com/tutoriel/xml
/021115xml_websemantique1a.shtml
Morgan MAGNIN - 2 décembre 2005
- p. 37 -
Le web sémantique concrètement
 Rendre sémantique le web, c'est :
 Compléter les balises HTML par des balises porteuses de sens
(XML) ;
 Multiplier et organiser les mots-clés dans le document même (sans
que le lecteur ne voit de différence) ;
 Substituer à certaines animations Flash des animations SVG dont le
texte est lisible pour les moteurs de recherche.
A un niveau plus élevé : indexer toutes les ressources du web,
documents et services (norme Resource Description Framework),
pour une exploitation optimale.
Source : http://websemantique.org/GuideWikiDifferences
Morgan MAGNIN - 2 décembre 2005
- p. 38 -
Pourquoi sémantique ?
Parce que l'accès discriminé aux données constitue une longue
perspective au cheminement incertain et ambitieux en
comparaison de la relative facilité du succès quantitatif du
premier web et au regard des faibles retombées de cet effort qui
n'en n'est qu'à ses débuts.
Parler de web sémantique, c'est supposer un potentiel
extrêmement prometteur centré sur les possibilités de maîtrise
des contenus.
Source : http://websemantique.org/ReperePointDepart
Morgan MAGNIN - 2 décembre 2005
- p. 39 -
Ce que change le web sémantique (1)
Grâce au Web sémantique, les moteurs de recherche n'auront
plus à interpréter les pages HTML et à tenter d'y découvrir des
mots clés.
Chaque document (page XHTML, fiche XML) se décrit à l'aide
d'un vocabulaire normé, reposant sur une ontologie.
Une ontologie est un dictionnaire de définitions, qui découple le
sens d'un concept de son « implémentation » linguistique : bon de
commande, purchase order, Schein von Bestellung, etc.
Morgan MAGNIN - 2 décembre 2005
- p. 40 -
Ce que change le web sémantique (2)
La langue et les différences culturelles ne devraient ainsi plus être
un frein aux interactions automatiques entre machines.
Le Web sémantique s'appuie sur les standards RDF et OWL :
 RDF fournit le mécanisme technique pour représenter des relations
entre ressources ;
 OWL s'appuie sur RDF pour guider les entreprises dans la
construction d'ontologies.
Source : http://www.01net.com/article/242540.html
Morgan MAGNIN - 2 décembre 2005
- p. 41 -
Les outils du web sémantique
XML ne suffit pas :
 Langage de description de document
 Permet de structurer l’information
 Mais il ne donne pas la signification de ses structures !
C’est RDF qui permet de définir les structures :
 Triplets de type sujet/verbe/complément
 Mode de stockage des définitions
 Comparable, dans l’esprit, à une feuille de style CSS
Morgan MAGNIN - 2 décembre 2005
- p. 42 -
Rôle des concepteurs de sites web
Selon Karl Dubost (in http://www.ledevoir.com
/2004/07/26/59857.html),
 les concepteurs de sites Web devront permettre aux machines
d'accéder aux données en structurant et en organisant les
diverses informations qui composent une page Web
Exemple : joconde.jpg
L’ordinateur, contrairement à l’humain, ne sait rien du tableau
par la seule donnée du fichier :
 Historique
 Créateur
 Lieu d’exposition, …
Une première solution : introduction de méta-données
Actuellement, peu d’applications concrètes de Web sémantique.
Celles qui existent sont surtout destinées à des professionnels.
Morgan MAGNIN - 2 décembre 2005
- p. 43 -
Principes techniques du web
sémantique
Fondations : les protocoles et langages standards du Web :
 le protocole HTTP
 les URI
 le langage XML
À ces standards s'ajoutent ceux qui sont propres au Web
sémantique :
 RDF : modèle conceptuel permettant de décrire toute donnée
 RDF Schema : langage permettant de créer des vocabulaires,
ensembles de termes utilisés pour décrire des choses
 OWL : langage permettant de créer des vocabulaires complexes à
des fins de traitements logiques poussés (inférences)
Standards ouverts issus du W3C
Morgan MAGNIN - 2 décembre 2005
- p. 44 -
Quelques applications du web
sémantique
RSS
Réseaux sociaux et FOAF (Friend of a Friend)
Open Directory - DMOZ
Voir http://sig.levillage.org/index.php?p=536
Morgan MAGNIN - 2 décembre 2005
- p. 45 -
FOAF (1)
Friend Of A Friend
Application du web sémantique
Vocabulaire permettant de décrire les personnes et les relations
qu’elles entretiennent.
L’utilisateur crée son fichier FOAF avec les informations de son
choix :
 État civil
 Entreprise
 Liens avec d’autres personnes, nature de ces liens
 Projets
 Etudes
Morgan MAGNIN - 2 décembre 2005
- p. 46 -
FOAF (2)
Des moteurs utilisant les données FOAF peuvent alors répondre à
des questions telles que :
« Quelles sont les personnes de moins de 30 ans habitant à Nantes,
ayant un site web et aimant jouer au go ? »
Exemple : http://iokanaan.net/iokanaan-foaf.xrdf
Morgan MAGNIN - 2 décembre 2005
- p. 47 -
Bibliographie Web Sémantique
Définition Wikipedia : http://fr.wikipedia.org/wiki
/Web_s%C3%A9mantique
Pour une première approche technique : http://www.internenettes
.fr/savoir/websemantic.html
Présentation grand public du web sémantique : http://www.
ledevoir.com/2004/07/26/59857.html
Créer un site web sémantique : http://xmlfr.org
/documentations/articles/010312-0001
Cours de Serge Stinkwich : http://www.iutc3.unicaen.fr/~stincs
/2003-06-19.pdf
Texte fondateur : http://www.urfist.cict.fr
/lettres/lettre28/lettre28-22.html
Morgan MAGNIN - 2 décembre 2005
- p. 48 -
Introduction à RDF (1)
 RDF = Resource Description Framework
 RDF est un mode de stockage des définitions, basé sur la théorie des
triplets.
 Tout document est décrit par les occurrences des trois données
sujet/verbe/complement… ou plutôt : sujet, prédicat, objet (ou objet,
attribut, valeur)
 A chaque tag XML correspond un triplet dans RDF.
 Représentation graphique de RDF :
 Sujet et objet sont représentés par des ellipses appelées « nœuds »
 Prédicat par une flèche qui va du sujet à l’objet
Morgan MAGNIN - 2 décembre 2005
- p. 49 -
Introduction à RDF (2)
RDF permet de définir des méta-données afin de préciser les
caractéristiques d'une information, comme le typage de certains
termes et expressions.
Des « triplets » se chargent d'associer les meta-données définies
en amont (par groupe de trois).
Les triplets combinent les termes par trois afin de composer des
concepts de base.
Morgan MAGNIN - 2 décembre 2005
- p. 50 -
Introduction à RDF (3)
Les liens Web : utilisent des paires, comme l'association "Tim
Berners-Lee" + "W3C".
Le Web sémantique ajoute un troisième terme pour « typer »
l'information:
 <Tim Berners-Lee> <fondateur> <W3C>
 <Morgan Magnin> <enseignant><Centrale Nantes>
 <Xavier Borderie> <employé> <Journal du Net>
 <François> <ami> <Jacques>
Bien programmé, un ordinateur peut parfaitement décider
quel fait doit logiquement être rattaché à un autre.
Morgan MAGNIN - 2 décembre 2005
- p. 51 -
RDF et URI (1)
Différence avec l’Intelligence Artificielle :
 IA : centralisation des données dans une BDD
 Web sémantique : les données peuvent être n’importe où, l’agent
intelligent les récupère au cours de son parcours sans qu’elles aient
besoin d’être stockées.
Chaque partie du triplet RDF possède un identifiant baptisé
Uniform Resource Identifier (URI) qui permet à l’agent de le
repérer.
Morgan MAGNIN - 2 décembre 2005
- p. 52 -
RDF et URI (2)
Rôle des URI :
 Assurer que les concepts ne sont pas simplement des mots dans un
document
 Mais plutôt qu’ils sont attachés à une définition unique trouvable
sur le web.
Possibilité, si les ordinateurs partagent les mêmes définitions, de
travailler en peer to peer.
Morgan MAGNIN - 2 décembre 2005
- p. 53 -
Place de XML, RDF et URI dans le
web sémantique
Un support qui organise le document : XML
Un « langage » définissant la structure, i.e. la signification des
tags XML : RDF
Un univers non centralisé, mondial, qui partage ses définitions
grâce, notamment, aux URIs
Morgan MAGNIN - 2 décembre 2005
- p. 54 -
Pourquoi parler d’ontologie ? (1)
En philosophie : étude de l’être en tant qu’être
Mais ici, terme emprunté au vocabulaire de la logique formelle.
Une ontologie est la spécification formelle de la représentation des
concepts, objets et entités, et de leurs relations.
Taxonomie : définition de classes d’objets et de leurs relations
 Exemple : classification des animaux en embranchements, classes,
ordres, familles, genres, espèces et sous-espèces
Règles d’inférence telle que « si un code département est associé
avec un code région et qu’une adresse utilise ce code département,
alors cette adresse est associée avec le code région »
Morgan MAGNIN - 2 décembre 2005
- p. 55 -
Pourquoi parler d’ontologie ? (2)
Une ontologie :
 Une taxonomie ;
 Un répertoire de règles d’inférence dans un domaine de
connaissance donné.
Langage permettant d’écrire des ontologies : OWL (Web
Ontology Language)
Combinaison OWL + RDF : création d’applications capables
d’utiliser et de traiter les informations contenues dans des
documents, indépendamment des humains.
Morgan MAGNIN - 2 décembre 2005
- p. 56 -
Pourquoi parler d’ontologie ? (3)
Illustration dans le commerce électronique :
 Un agent intelligent cherche les voitures correspondants à mes
critères, compare les prix, vérifie la disponibilité, les délais de
livraison, …
Appel sur mon téléphone -> les autres appareils sonores voient
leur volume baissé automatiquement.
Morgan MAGNIN - 2 décembre 2005
- p. 57 -
RDF et ontologies
RDF et OWL tentent de décrire des ontologies.
L'ontologie est la description précise des termes et des relations
d'un sujet précis.
Avec des ontologies précises et complètes, les ordinateurs peuvent
agir comme s'ils comprenaient les informations qu'ils
transmettent.
Morgan MAGNIN - 2 décembre 2005
- p. 58 -
Bibliographie sur RDF
Présentation « RDF in real life » par le W3C : http://www.w3.org
/2003/Talks/semtour-athens-rdfapp/Overview.html
Les avantages de RDF : http://www.w3.org/2003/Talks/semtourathens-rdfapp/Overview.html
Morgan MAGNIN - 2 décembre 2005
- p. 59 -
URI (1)
Protocole mis en place pour le World Wide Web qui normalise la
syntaxe de courtes chaînes de caractères désignant un nom ou
une adresse d'une ressource, physique ou abstraite.
URL : cas particulier des URI.
Tous les hyperliens du Web sont exprimés sous forme d'URI.
Morgan MAGNIN - 2 décembre 2005
- p. 60 -
URI (2)
URI d'usage courant :
 ftp://ftp.ec-nantes.fr : schéma ftp pour le service FTP
 http://www.ec-nantes.fr : schéma http pour le service HTTP
 mailto:[email protected] : schéma mailto pour
les adresses électroniques
 news:comp.infosystems.www.servers.unix : schéma news pour les
newsgroups Usenet
 telnet://melvyl.ucop.edu/ : schéma telnet pour les services interactifs
via le protocole telnet
Morgan MAGNIN - 2 décembre 2005
- p. 61 -
OWL
Basé sur la recherche effectuée dans le domaine des logiques de
description.
Format de fichier pour certaines logiques de descriptions.
Permet de définir des terminologies (concepts et propriétés) pour
décrire des domaines concrets.
Morgan MAGNIN - 2 décembre 2005
- p. 62 -
Bibliographie sur URI et OWL
 http://fr.wikipedia.org/wiki/URI
http://www.lacot.org/public/introduction_a_owl.pdf
http://fr.wikipedia.org/wiki/Web_Ontology_Language
 http://www.la-grange.net/2004/08/05#rdf-poete
Morgan MAGNIN - 2 décembre 2005
- p. 63 -
Qu’est-ce que la syndication de
contenu ?
Procédé permettant à l'éditeur d'un site Web de proposer tout ou
partie de son contenu pour la publication (généralement
automatisée) sur un autre site Web.
Plusieurs formats :
 RSS (RDF Site Summary, Rich Site Summary, Really Simple
Syndication)
 ATOM
Parallèle avec Google News
Morgan MAGNIN - 2 décembre 2005
- p. 64 -
Un peu d’histoire
1999: portail My Netscape Network (MNN)
Juillet 1999 : RSS 0.91
Dès lors, développements dans deux directions différentes.
 0.92, 0.93, 0.94 et enfin 2.0.
 RSS 1.0 par le groupe de travail RSS-DEV
Morgan MAGNIN - 2 décembre 2005
- p. 65 -
Introduction à RSS
Format XML de syndication le plus utilisé actuellement sur
Internet
Moyen de décrire le contenu d’un site à l’aide de balises
spécifiques.
Gestion manuelle ou automatique (Content Management System
- CMS)
Icône
Morgan MAGNIN - 2 décembre 2005
- p. 66 -
Structure d’un fichier RSS
<?xml version="1.0"?>
<rss version="0.92">
<channel>
<title>Titre du site Web/du flux syndiqué</title>
<link>Adresse du site</link>
<description>Description du site/flux</description>
<lastBuildDate>Dernière date de publication du flux</lastBuildDate>
<language>fr-fr</language>
<webMaster>Le nom du webmaster</webMaster>
<item>
<title>Titre de l'article 1</title>
<description>Description rapide du contenu de l'article
1</description>
<link>Adresse absolue (lien permanent) de l'article 1</link>
</item>
</channel>
</rss>
Morgan MAGNIN - 2 décembre 2005
- p. 67 -
Différences RSS/ATOM
Dans RSS :
title, link, date, language, creator, subject, description, content
Dans ATOM :
title, link, issued, modified, id, author, subject, summary, content
ATOM : soutenu par le W3C, Google…
Morgan MAGNIN - 2 décembre 2005
- p. 68 -
Utilisations possibles de la
syndication
Affichage automatique, sur un site Internet donné,
d'informations provenant d'un autre site.
Lecture dans un logiciel dédié, appelé « agrégateur » ou « lecteur
RSS »
 API
 Agrégateurs en ligne
Morgan MAGNIN - 2 décembre 2005
- p. 69 -
Inconvénients de la syndication
La lecture d’un flux RSS dépend du bon vouloir du visiteur.
Technologie encore trop « neuve » du point de vue des
néophytes ?
Morgan MAGNIN - 2 décembre 2005
- p. 70 -
Avantages de la syndication
Alternative au spam
Accéder plus rapidement à l’information
Fidéliser les visiteurs
Segmentation des contenus
Morgan MAGNIN - 2 décembre 2005
- p. 71 -
Bibliographie sur la syndication
RSS, Blogs - Un nouvel outil pour le management, par JeanClaude Morand, M2 Editions, novembre 2005
Définition : http://fr.wikipedia.org/wiki/Syndication
http://planetes.joueb.com/news/12.shtml
Morgan MAGNIN - 2 décembre 2005
- p. 72 -
Sommaire
 Introduction
 Vers un nouvel Internet ?
 Communiquer
 Présentation des blogs
 Blogs et enseignement/politique/entreprise
 Conseils et cas d’étude
 Collaborer
 Le nerf de la guerre : l’indexation
Conclusion
Morgan
MAGNIN - 2 décembre 2005
- p. 73 -
L’essor des blogs
1996 : Les premiers blogs - http://oldweblogscomblog.scripting.
com/historyOfWeblogs
1999 : Lancement de Blogger
11 septembre 2001
Janvier 2003 : Skyrock propose ses Skyblogs
Septembre 2003 : Europe 2
Courant 2004 : des journalistes du Monde, du Nouvel Obs et de
Libé bloguent officiellement.
11 décembre 2004 : Libération titre sur La blog génération
15 décembre 2004 : M6 lance son service de blog, juste après Le
Monde
http://embruns.net/blogosphere/petite_histoire_blogosphere.html
Morgan MAGNIN - 2 décembre 2005
- p. 74 -
Un vaste public
Adolescent tenant son journal en ligne
Journaliste
Homme politique
Expert d’un domaine publiant régulièrement l’actualité et ses
analyses
Morgan MAGNIN - 2 décembre 2005
- p. 75 -
Quelques chiffres
1000 blogs se créent chaque jour
1070 millions d’internautes en 2005
54 millions de weblogs à la fin 2005
Morgan MAGNIN - 2 décembre 2005
- p. 76 -
Qu’est-ce qu’un weblog ?
Plusieurs définitions, selon qu’on s’attache :
 Au fond
 A la forme
Morgan MAGNIN - 2 décembre 2005
- p. 77 -
Qu’est-ce qu’un weblog, sur le fond ?
Site Internet sur lequel des informations sont publiées
fréquemment.
Présentation par ordre ante-chronologique et par catégories.
Informations très diverses :
 articles,
 brèves,
 sorties de disques,
 agenda de clubs, …
Weblogs personnel, d'entreprise, d'école, etc.
Morgan MAGNIN - 2 décembre 2005
- p. 78 -
Qu’est-ce qu’un weblog, sur la
forme ?
Outil permettant tout internaute de s’exprimer sur Internet en
tenant un journal, son outil ne nécessitant aucune compétence
technique.
Famille des outils de gestion de contenu - Content Management
System (CMS)
Source : Les Blogs, par Benoît Desavoye
Morgan MAGNIN - 2 décembre 2005
- p. 79 -
Illustration : un weblog
Exemple : http://www.pointblog.com
Liste de notes avec :
 Lien permanent : url unique permettant d’accéder de façon
permanente à la note
 Commentaire(s)
 Catégorie(s)
 Trackback(s)
Archives
Liste de liens : blogroll
Syndication de contenu
Morgan MAGNIN - 2 décembre 2005
- p. 80 -
Quelques fonctionnalités avancées
Mise à jour :
 Par courriel
 Par téléphone portable (moblog)
Podcasting
 Abonnement, via RSS, pour recevoir directement les fichiers sons
Videoblogging
Morgan MAGNIN - 2 décembre 2005
- p. 81 -
Quelques idées importantes
Les Internautes reprennent le pouvoir
 Une présence plus marquée des individus
 Non seulement consommateurs, mais aussi producteurs
Morgan MAGNIN - 2 décembre 2005
- p. 82 -
Un blog n’est pas un forum
Blog : un auteur écrit et échange éventuellement avec ses lecteurs
 Auteur identifiable
 Correspond à la pensée de l’auteur
Forum : échanges basés sur la participation des membres de la
communauté
 Groupe plus difficilement identifiable : déroutant
 Fils de discussion plus anarchiques
Morgan MAGNIN - 2 décembre 2005
- p. 83 -
Pourquoi bloguer ?
Satisfaction de l’ego
S’affirmer
Lecteur narcissique
S’évader : créer, se défouler,…
Partager avec les autres
Lutter contre le désoeuvrement
Valoriser du contenu
Evoluer dans une communauté : notion de « blogosphère »
 Créer du lien social
 Un type d’échange particulier
Morgan MAGNIN - 2 décembre 2005
- p. 84 -
Outils techniques
Des plates-formes hébergeant des ensembles de blogs : des
« fermes »
 Typepad : http://www.typepad.com/fr/
 Viabloga : http://www.viabloga.com/
 Skyrock : http://www.skyblog.com/
Outil de gestion de contenu à installer sur un serveur web :
 Wordpress : http://www.wordpress.org
 Dotclear : http://www.dotclear.net
 Movable Type : http://www.movabletype.org
Technologies généralement utilisées :
 PHP ou Perl pour la gestion dynamique des pages
ou XML
 MySQL
Morgan
MAGNIN - 2 décembre
2005 pour la gestion des données
- p. 85 -
Blogs et medias traditionnels
Surinformation ?
Filtrage réalisé par les blogueurs
Meilleure connaissance de l’auteur
Problème des blogs : trouver ceux qui sont utiles et pertinents
Les médias traditionnels : sélection des journalistes en amont
Le blog, concurrent du journalisme ?
 http://www.robinsloan.com/epic/
Morgan MAGNIN - 2 décembre 2005
- p. 86 -
Blogs et politique (1)
La France a mis du temps à s’y mettre.
Balbutiements lors des élections régionales de mars 2004
Quelques hommes politiques d’envergure nationale :
 Alain Juppé
 Alain Lipietz
 Dominique Strauss-Kahn
Le blog est considéré comme une tribune.
Aux Etats-Unis (campagne présidentielle), le blog est plus central,
sollicitant la participation des visiteurs :
 L’exemple Howard Dean
Morgan MAGNIN - 2 décembre 2005
- p. 87 -
Blogs et politique (2)
Outils de débat… mais aussi de marketing !
Les blogs : un contre-pouvoir envers medias et politiques ?
 Le Rathergate
 Puteaux : une ville en avance sur son temps
 Blogs locaux
Risques quand les règles du jeu ne sont pas respectées :
 Auteur difficile à authentifier
 Non respect des codes du blog
Des limites de la « démocratie émergente »
Morgan MAGNIN - 2 décembre 2005
- p. 88 -
Blogs et enseignement
Institut St Joseph, Quebec, sous l’impulsion de Mario Asselin
 Weblogs
 Wikis
Blogs à l’EPFL : http://blogs.epfl.ch/
Partager, valoriser, communiquer
Morgan MAGNIN - 2 décembre 2005
- p. 89 -
Blogs et entreprise
Communication interne
Communication externe
Morgan MAGNIN - 2 décembre 2005
- p. 90 -
Blog et communication interne (1)
Intranet : généralement ennuyeux !
Objectif : humaniser l’intranet
Blog : technologie de bas niveau pour faciliter communication et
coopération
« klog » : weblog sur intranet
Morgan MAGNIN - 2 décembre 2005
- p. 91 -
Blog et communication interne (2)
BBC Londres : 50 blogs internes avec 150 auteurs
Nécessité d’une charte définissant les règles du jeu
Blog projet ? Pas forcément la panacée. Recourir plutôt aux wikis
Bientôt des blogs syndicaux ?
Morgan MAGNIN - 2 décembre 2005
- p. 92 -
Comment mettre en place un blog en
interne ? (1)
Repérer les « potentiels »
Assister et encourager
Insister sur le partage : histoire, photos, …
Promouvoir le langage visuel
Morgan MAGNIN - 2 décembre 2005
- p. 93 -
Comment mettre en place un blog en
interne ? (2)
Vaincre les freins :
 Inertie
 Nouvelle technologie à appréhender
 Langue de bois
 Communication trop formelle
 Garder l’information pour soi
Eventuellement, commencer par passer par le courriel
Miser sur l’aspect « viral »
Morgan MAGNIN - 2 décembre 2005
- p. 94 -
Blog et communication externe (1)
Objectifs :
 Extension de la notoriété de la marque
 Recruter de nouveaux visiteurs et clients
 Fidéliser les visiteurs et clients existants
 Echanger pour mieux connaître
Morgan MAGNIN - 2 décembre 2005
- p. 95 -
Blog et communication externe (2)
« Corporate blogging » …
 Randy Beseler (Boeing, division marketing) cible : les connaisseurs,
les analyses de l’aviation, les collaborateurs de Boeing mais aussi
ceux d’Airbus
 Michel-Edouard Leclerc
… ou outil marketing ?
Morgan MAGNIN - 2 décembre 2005
- p. 96 -
Blog et marketing (1)
Marketing tribal : soutenir le lien entre clients en les aidant à
partager leur passion
Identifier les groupes sur lesquels se concentrer
S’adapter aux codes des blogueurs
Faire de son produit un élément renforçant les liens au sein de la
communauté
Prendre garde à ne pas s’enfermer dans quelques communautés
Morgan MAGNIN - 2 décembre 2005
- p. 97 -
Blog et marketing (2)
The Daily Snkr : http://www.thedailysnkr.com/
 Collaboratif
 Soutenu par Nike
 Objectif : « revaloriser l’image de Nike auprès des leaders
d’opinion »
Sony, Spiderman et Blogger/LiveJournal
Contre-exemple : Raging Cow
 Des blogueurs en fait payés pour dire du bien de la boisson
Morgan MAGNIN - 2 décembre 2005
- p. 98 -
Blog et marketing (3)
Pire contre-exemple francophone : Vichy
 Le « Journal de ma peau »
Tenu par Claire, personnage fictif commentant les produits
Commentaires trop modérés
Manque d’authenticité
Sauvé par un revirement complet
Morgan MAGNIN - 2 décembre 2005
- p. 99 -
Blog et communication
professionnelle
Communiquer et informer : gestion de la relation client
 Michel de Guilhermier, pour Photoways
 La Fraise, vendeur de T-shirts
Mais encore… ?
 Consultants
 Informaticiens
 Spécialistes des ressources humaines
 Dessinateurs
 Et bientôt artisans, commerçants ?
Morgan MAGNIN - 2 décembre 2005
- p. 100 -
Quelques conseils
Aller lentement pour éviter les dérapages
Charte éditoriale
Quelle licence pour le contenu ?
Que dit-on de vous ?
 Moteurs de recherche
 Statistiques
 Technorati : http://www.technorati.com
Morgan MAGNIN - 2 décembre 2005
- p. 101 -
Quelques idées
Blog de veille technologique
Eventuellement sous la simple forme d’un blog de liens
Avantages :
 Structuration de l’information
 Pense-bête
 « Preuve » de votre travail
Morgan MAGNIN - 2 décembre 2005
- p. 102 -
Bibliographie sur les blogs (1)
Blog Story, par Cyril Fievet et Emily Turrettini, Eyrolles,
septembre 2004
Les Blogs - Nouveau média pour tous, par Benoît Desavoye,
Christophe Ducamp, Xavier de Mazenod, Xavier Moissant, M2
Editions, mars 2005
Blogs pour les pros, par Loïc Le Meur et Laurence Beauvais,
Dunod, novembre 2005
Institut St Joseph : http://www.st-joseph.qc.ca/
Blogs : http://blogs.epfl.ch/
EPFL
Morgan MAGNIN - 2 décembre 2005
- p. 103 -
Bibliographie sur les blogs (2)
Les blogs d’entreprise : http://www.cyber.ccip.fr/arch_tr220905.
asp
Le Journal de ma Peau : http://www.journaldemapeau.fr/blog/
Charte Yahoo! : http://jeremy.zawodny.com/yahoo/yahoo-blog
-guidelines.pdf
Projet ECN : http://planetes.joueb.com/
Morgan MAGNIN - 2 décembre 2005
- p. 104 -
Sommaire
 Introduction
 Vers un nouvel Internet ?
 Communiquer
 Collaborer
 Wikis
 Réseaux sociaux
 Le nerf de la guerre : l’indexation
 Conclusion
Morgan MAGNIN - 2 décembre 2005
- p. 105 -
Qu’est-ce qu’un wiki ?
Terme dérivé de l'hawaïen wikiwiki qui signifie « rapide »
Site web dynamique dont tout visiteur peut modifier les pages
comme bon lui semble.
Tout visiteur peut contribuer à l'édifice : communication et
diffusion de l'information
Modèle collaboratif
Le plus connu : l'encyclopédie libre Wikipedia (http://fr.
wikipedia.org pour la version française)
Morgan MAGNIN - 2 décembre 2005
- p. 106 -
Dans quels cadres utiliser un wiki ?
Travail collaboratif
Amélioration continue de documents
Gestion de documentation
Exemples :
 http://dim.ec-nantes.fr/ei3-info/
 http://romeo.rts-software.org/trac
 http://easybindings.net
Morgan MAGNIN - 2 décembre 2005
- p. 107 -
Bibliographie sur les wikis
Les Wikis, par Jérôme Delacroix, M2 Editions, mars 2005
L’Actualité des Wikis : http://pointwiki.viabloga.com/
Morgan MAGNIN - 2 décembre 2005
- p. 108 -
Relations sociales en ligne - Social
Networking (1)
 Des individus qui utilisent Internet pour :
 Se présenter
 Nouer des contacts
 Travailler ensemble sur des projets de groupe
 Charnière : 2002/2003
 Travail en groupe : les wikis
Morgan MAGNIN - 2 décembre 2005
- p. 109 -
Relations sociales en ligne - Social
Networking (2)
Sites de réseaux sociaux :
 Friendster - http://www.friendster.com
 Viaduc - http://www.viaduc.com
 LinkedIn - https://www.linkedin.com/
 Orkut - https://www.orkut.com
 .node - http://www.dotnode.com
Mais aussi Copains d’Avant ! http://copainsdavant.linternaute.
com/
Morgan MAGNIN - 2 décembre 2005
- p. 110 -
Les sites de réseaux sociaux
Précept de base : la théorie des six degrés, du psychologue
Stanley Milgram (années 60)
A l’inscription, l’utilisateur saisit les informations de son CV.
Création de connexions :
 Avec des membres déjà inscrits
 En invitant des connaissances
Il devient dès lors possible d’entrer en relation avec les contacts
de ses contacts.
Mécanisme de co-optation
Morgan MAGNIN - 2 décembre 2005
- p. 111 -
Etat des lieux des réseaux sociaux
Utilisation de langages propriétaires et non interopérables
Pour une meilleure « couverture », nécessité de s’inscrire à
plusieurs de ces « annuaires »
Outil complémentaire : les blogs
Les blogs, utilisés avec FOAF, devraient constituer une
alternative à ces sites.
Mais, à l’heure actuelle, tout le monde ne dispose pas de blog, ni
de FOAF.
Morgan MAGNIN - 2 décembre 2005
- p. 112 -
Quelques chiffres sur les réseaux
sociaux
Interview de Thierry Lunati, fondateur de Viaduc
(in Les Blogs de Benoît Desavoye)
 500 demandes de mise en relation par jour
 40% des demandes de mises en relations dédiées à l’emploi
 30% de demandes d’expertise
 30% de recherche de fournisseurs, de clients ou de partenaires.
Morgan MAGNIN - 2 décembre 2005
- p. 113 -
Bibliographie sur les réseaux sociaux
Toile : l'Université de Columbia confirme la théorie des « six
degrés » : http://www.journaldunet.com/0308/030826sixdegrees.
shtml
Les Réseaux Sociaux - Pivot de l’Internet 2.0, par Alain Lefebvre,
M2 Editions, octobre 2005
Morgan MAGNIN - 2 décembre 2005
- p. 114 -
Sommaire
 Introduction
 Vers un nouvel Internet ?
 Communiquer
 Collaborer
 Le nerf de la guerre : l’indexation
 Annuaires Web, moteurs de recherche et méta-moteurs
 Mieux maîtriser son indexation
 Conclusion
Morgan MAGNIN - 2 décembre 2005
- p. 115 -
Annuaires Web
Site Web proposant une liste classée de sites Web
Classement dans une arborescence de catégories.
Annuaires généralistes ou thématiques
Contrairement aux moteurs de recherche, la classification est
réalisée par des humains.
Modèle « entreprise » : Yahoo!
Modèle « communautaire » : DMOZ (ou ODP)
Morgan MAGNIN - 2 décembre 2005
- p. 116 -
Moteurs de recherche (1)
Outils de recherche constitué de « robots » (spiders, crawlers ou
agents) qui parcourent les sites à intervalles réguliers et de façon
automatique pour indexer les différentes pages.
Fonctionnement :
 Exploration récursive du Web par des robots d’indexation qui
suivent tous les liens
 Indexation des ressources en extrayant les mots considérés comme
significatifs.
 Mise en place d’un critère de pertinence (algorithme secret) pour
définir la correspondance entre un mot et une page.
Morgan MAGNIN - 2 décembre 2005
- p. 117 -
Moteurs de recherche (2)
Moteur de recherche à recherche par racine : AltaVista
Moteur de recherche à mot dans un contexte : Google
Annuaire/Moteur de recherche : Yahoo!
Financement :
 Publicité
 Vente de technologie
Morgan MAGNIN - 2 décembre 2005
- p. 118 -
Les meta-moteurs
Logiciel qui puise ses informations à travers plusieurs moteurs de
recherche.
Le meta-moteur envoie ses requêtes à plusieurs moteurs de
recherche, et retourne les résultats obtenus (après analyse et/ou
filtrage éventuels).
Quelques meta-moteurs :
 Meta-moteur de recherche à graphe sémantique : http://www.
kartoo.com/
 http://www.startissimo.com/
 http://www.seek.fr/
 http://www.franceevasion.com/
Morgan MAGNIN - 2 décembre 2005
- p. 119 -
Bibliographie autour des annuaires et
moteurs de recherche
http://fr.wikipedia.org/wiki/Annuaire_web
http://dmoz.org/
http://fr.wikipedia.org/wiki/Moteur_de_recherche
http://www.lesmoteursderecherche.com
http://fr.wikipedia.org/wiki/Métamoteur
http://www.google.fr/intl/fr/why_use.html
http://www.vaughns-1-pagers.com/internet/google-rankingfactors.htm
http://www.webrankinfo.com/google/pagerank/augmenter.php
Morgan MAGNIN - 2 décembre 2005
- p. 120 -
L’ogre Google
Google, moteur de recherche : près de 80% de parts de trafic en
France et en Europe, indexe 8 milliards de documents
Aperçu de l’offre :
 Gmail : courrier électronique
 Google Desktop : moteur de recherche local
 Google Maps : plans
 Google Earth : images satellite
 Google Print : bibliothèque en ligne
 Google Reader : syndication
 Google Analytics : statistiques
 Google Base
Où mènera une telle hégémonie ?
Morgan MAGNIN - 2 décembre 2005
- p. 121 -
L’enjeu de l’indexation (1)
Bien classé dans Google -> meilleure connaissance de la marque
-> image renforcée -> gains financiers
Evaluation de la pertinence d’une page web via le PageRank
Principe du PageRank
Des dangers de la fraude
Qu’est-ce qu’une Google Bomb ?
Morgan MAGNIN - 2 décembre 2005
- p. 122 -
L’enjeu de l’indexation (2)
Développement d’un vrai marché du référencement :
 http://www.lasorcieredureferencement.com/
 Livres et autres sites
…
Problème du spam
 De commentaires dans les weblogs
 De wikis
Parade des moteurs de recherche : soutien de l’attribut
rel=”nofollow”
Morgan MAGNIN - 2 décembre 2005
- p. 123 -
Google Adwords
Publicité ciblée par Google
Liens commerciaux apparaissant lors de la recherche de certains
mots clefs
Choix d’un certain nombre de mots-clefs et d’une certaine somme
qui sera payée par clic
Paiement seulement lors du clic
Morgan MAGNIN - 2 décembre 2005
- p. 124 -
Google Adsense (1)
Installer de la publicité (contre revenu) sur son site web
Même si l’audience du site est limitée
Morceau de code à intégrer sur sa page
Analyse automatique du contenu de la page par Google afin de
générer une publicité ciblée
Rémunération au clic (et non à l’affichage)
Quelques chiffres :
 Taux de clics généralement constaté : entre 0.2 et 1%
 Revenus générés pour 1000 pages vues : moins de 1 euros
Quelques exemples :
 Pascal Weeks, recettes de cuisine (100 000 pages/mois) : 10/15$ par
mois
 Richard Menneveux, annonces recrutement : 614$ en six mois
: -http://www.internetactu.net/index.php?p=6035
Source
Morgan MAGNIN
2 décembre 2005
- p. 125 -
Google Adsense (2)
Tarif du clic : fonction du prix que l’annonceur est prêt à payer
Positionnement des annonceurs : dépend de ce prix
Certains thèmes sont plus porteurs que d’autres.
L’anglais est beaucoup plus rémunérateur (facteur 10 à 20) :
 Exemple de blogueur anglophone (400 000 pages/mois) : 400$ par
mois
 Emily Turrettini, téléphonie mobile (1 500 000 pages par mois) :
3 500/4 000 $ par mois
Morgan MAGNIN - 2 décembre 2005
- p. 126 -
Mieux maîtriser son indexation
Faire apparaître les mots pertinents dans l’URL de la page
Faire apparaître les mots pertinents au niveau de l’attribut
<title> de la page
Faire apparaître les mots pertinents en <h1>, <h2> ou <h3>
Se faire référencer dans l’annuaire DMOZ
Susciter des liens entrants venant de sites bien référencés
Bien formater les liens conduisant vers ses propres pages
 Bannir les <a href="page2.htm">ici</a>
Ne pas recourir aux méthodes « interdites »
Morgan MAGNIN - 2 décembre 2005
- p. 127 -
Notion d’identité numérique
L’illusion de l’anonymat : que peut-on encore cacher ?
Un nouveau sport lors des recrutements : googler le candidat
Une question de crédibilité
De la cohérence d’un projet
Exemples
A quand une identité numérique unique ?
 Problème de l’usurpation d’identité
Morgan MAGNIN - 2 décembre 2005
- p. 128 -
Bibliographie
http://embruns.net/internet/reponse_au_spam_nofollow.html
http://padawan.info/fr/web/nofollow
_contre_le_spam_traduction_geekneuneu.html
http://earth.google.com/
http://print.google.com/
http://www.google.com/analytics/
http://maps.google.com/
http://desktop.google.fr
Morgan MAGNIN - 2 décembre 2005
- p. 129 -
Sommaire
Introduction
Vers un nouvel Internet ?
Communiquer
Collaborer
Le nerf de la guerre : l’indexation
Conclusion
Morgan MAGNIN - 2 décembre 2005
- p. 130 -
Conclusion
Le Web est plus mouvant que jamais.
Web 2.0, Web sémantique : des évolutions antogonistes ?
Indexer et classer pertinemment : un défi sans cesse renouvelé
Lors de l’introduction de nouvelles technologies, accompagner les
utilisateurs !
 Des freins tant techniques que psychologiques à vaincre.
A suivre…
Morgan MAGNIN - 2 décembre 2005
- p. 131 -

Documents pareils