Web Usage Mining: Discovery and Applications of Usage Patterns

Transcription

Web Usage Mining: Discovery and Applications of Usage Patterns
Utilisation du Web Mining
en E-Commerce
Par Jianfeng NIE
Mars 29, 2006
Plan
Introduction
„ Taxonomie du Web Mining
„ Processus d’extraire des
connaissances dans Web Mining
„ Application du Web Mining en Ecommerce
„ Conclusion
„
29 Mars, 2006
Utilisation du Web Mining en E-commerce
2
Plan
„
Introduction
Définition du Web Mining
‰ Problématique
‰ Histoire
Taxonomie du Web Mining
Processus d’extracter des connaissances dans
Web Mining
Application du Web Mining en E-commerce
Conclusion
‰
„
„
„
„
29 Mars, 2006
Utilisation du Web Mining en E-commerce
3
Introduction (1/3)
Web Mining:
s’est développé à la fin des années 90. ce
domaine consiste à utiliser l’ensemble des
techniques du Data Mining afin de
développer des approches et des outils,
permettant d’extraire des informations
pertinentes à partir de données du web
(documents, traces d’interactions,
structure des pages, des liens……)
29 Mars, 2006
Utilisation du Web Mining en E-commerce
4
Introduction (2/3)
Problématique : Pourquoi Web Mining
‰
Trouver l’information du web n’est plus facile.
‰
‰
‰
Information est trop.
Structure du web est complexe.
Changement est fréquent
‰
Data Mining vise souvent à traiter des données
déjà organisées dans une base de données.
‰
E-Commerce is the killer of the informaion.
‰
‰
29 Mars, 2006
Stratégie, business intélligent
Sérvices personalisé
Utilisation du Web Mining en E-commerce
5
Introduction (3/3)
Histoire:
‰
‰
Terme créé par Etzioni en 1996
Taxonomie du Web Mining (Chang et al., 2001;
Chakrabarti, 2003)
29 Mars, 2006
Utilisation du Web Mining en E-commerce
6
Plan
„
Introduction
„
Taxonomie du Web Mining
‰
‰
‰
„
„
„
Web Content Mining
Web structure Mining
Web Usage Mining
Processus d’extraire des connaissances dans
Web Mining
Application du Web Mining en E-commerce
Conclusion
29 Mars, 2006
Utilisation du Web Mining en E-commerce
7
Taxonomie du Web Mining
Web
WebMining
Mining
Web
WebContent
Content
Mining
Mining
29 Mars, 2006
Web
Web
Structure
Structure
Mining
Mining
Web
WebUsage
Usage
Mining
Mining
Utilisation du Web Mining en E-commerce
8
Web Content Mining (3-1)
Web Content
Web
Content
Mining
Mining
„
Web Mining
Web Mining
Web
Web
Structure
Structure
Mining
Mining
Web Usage
Web
Usage
Mining
Mining
Recherche d’information (RI) (1/2)
„
Précision = documents pertinents retrouvés / documents
retrouvés
„
Rappel = documents pertinents retrouvés / documents
pertinents
29 Mars, 2006
Utilisation du Web Mining en E-commerce
9
Web Mining
Web Mining
Web Content Mining (3-1)
Web Content
Web
Content
Mining
Mining
„
Web
Web
Structure
Structure
Mining
Mining
Web Usage
Web
Usage
Mining
Mining
Classification du Contenu (2/2)
Yahoo home page
Education
College University ……
Business
Science
Companies Finance
News
Jobs
Exemple: Pour trouver le site web de l’U de M
Directory > Regional > Countries > Canada > Provinces and
Territories > Québec > Regions > Montréal > Cities >
Montréal > Education > College and University
29 Mars, 2006
Utilisation du Web Mining en E-commerce
10
Web Structure Mining (3-2)
Web Content
Web
Content
Mining
Mining
Web Mining
Web Mining
Web
Web
Structure
Structure
Mining
Mining
Web Usage
Web
Usage
Mining
Mining
Visualization du web (1/4)
Source: Grobelnik, Marko (2001) Web-Mining…searching for the knowledge on
the Internet…
29 Mars, 2006
Utilisation du Web Mining en E-commerce
11
Web Structure Mining (3-2)
Web Content
Web
Content
Mining
Mining
Web Mining
Web Mining
Web
Web
Structure
Structure
Mining
Mining
Web Usage
Web
Usage
Mining
Mining
Structure du Web (2/4)
Source:Linoff, Gordon S. et Berry, Michael J.A. (2001) Mining the Web: Transforming customer Data into Customer Value
29 Mars, 2006
Utilisation du Web Mining en E-commerce
12
Web Structure Mining (3-2)
Web Content
Web
Content
Mining
Mining
Web Mining
Web Mining
Web
Web
Structure
Structure
Mining
Mining
Web Usage
Web
Usage
Mining
Mining
Hubs et Autorités (3/4)
Hubs
29 Mars, 2006
Authorités
Utilisation du Web Mining en E-commerce
13
Web Mining
Web Mining
Web Structure Mining (3-2)
Web Content
Web
Content
Mining
Mining
Web
Web
Structure
Structure
Mining
Mining
Web Usage
Web
Usage
Mining
Mining
Algorithme de HITS (4/4)
‰
Sommation
∑
a (u ) =
∑
a (u ) =
h (v )
u :( v , u )∈ E
a (v )
u :( v , u )∈ E
(v, u) est un lien de citation : la page v cite la page u
‰
Normalisation
a (u ) =
a (u )
∑ [a ( q ) ]
2
et
a (u ) =
q
29 Mars, 2006
h (v)
∑ [h ( q ) ]2
q
Utilisation du Web Mining en E-commerce
14
Problème: Web Mining =RI ?
Non:
Il y a des différences
importantes:
„
„
„
„
29 Mars, 2006
Résultat et But
Tâche
Fonction
Etc.
Utilisation du Web Mining en E-commerce
15
Web Mining
Web Mining
Web Usage Mining (3-3)
Web Content
Web
Content
Mining
Mining
Web
Web
Structure
Structure
Mining
Mining
Web Usage
Web
Usage
Mining
Mining
Web Usage Mining
Analyse du comportement de l’utilisateur à
travers sa navigation et notamment
l’ensemble des clics effectués sur le site
(clickstream).
29 Mars, 2006
Utilisation du Web Mining en E-commerce
16
Web Mining
Web Mining
Web Usage Mining (3-3)
Web Content
Web
Content
Mining
Mining
Web
Web
Structure
Structure
Mining
Mining
Web Usage
Web
Usage
Mining
Mining
Serveur Log
Source: Sanjay Kumar Madria (2002) Web Mining: A Bird’s Eye View, University of Missouri-Rolla
29 Mars, 2006
Utilisation du Web Mining en E-commerce
17
Plan
„
Introduction
„
Taxonomie du Web Mining
„
Processus d’extraire des
connaissances dans Web Mining
Préparation de données
‰ OLAP
‰ Analyse (Data Mining)
Application du Web Mining en E-commerce
Conclusion
‰
„
„
29 Mars, 2006
Utilisation du Web Mining en E-commerce
18
Processus d’extraire des
connaissances dans Web Mining
Source: Zaiane Osmar R. and Cai JiAn (2001), ‘Web Mining: From
Concepts to Practical Systems’, DASFAA’2001
29 Mars, 2006
Utilisation du Web Mining en E-commerce
19
Processus d’extraire des
connaissances dans Web Mining(3-1)
Préparation de données (1/2)
‰
Capturer les données
‰
Nettoyer les données
‰
Transformer les données
29 Mars, 2006
Utilisation du Web Mining en E-commerce
20
Processus d’extraire des
connaissances dans Web Mining(3-1)
Préparation de données (2/2)
‰
Un exemple de la data transformé
Source:Zaiane Osmar R., Xin Man and Han Jiawei (1998)
29 Mars, 2006
Utilisation du Web Mining en E-commerce
21
Processus d’extraire des
connaissances dans Web Mining(3-2)
OLAP (1/3)
Source: Zhang Zhongping (2001) Introduction of OLAP
29 Mars, 2006
Utilisation du Web Mining en E-commerce
22
Processus d’extraire des
connaissances dans Web Mining(3-2)
Cube de données (2/3)
Salaire
B.C.
Province Prairies
Ontario
sum
0-20K20-40K 40-60K60K- sum
Agrigolture
Accounting
… ...
Industrie
sum
Source:Zaiane Osmar R. and Cai JiAn (2001), ‘Web Mining: From
Practical Systems’, DASFAA’2001
29 Mars, 2006
Utilisation du Web Mining en E-commerce
Concepts to
23
Processus d’extraire des
connaissances dans Web Mining(3-2)
Cube de données (3/3)
Salaire
B.C.
Province Prairies
Ontario
sum
0-20K20-40K 40-60K60K- sum
Agrigolture
Accounting
… ...
Industrie
sum
29 Mars, 2006
Utilisation du Web Mining en E-commerce
24
Processus d’extraire des
connaissances dans Web Mining(3-3)
Analyse (Data Mining)
‰
Analyse de route
‰
Association
‰
Classification et prédiction
‰
Clustering
29 Mars, 2006
Utilisation du Web Mining en E-commerce
25
Processus d’extraire des
connaissances dans Web Mining(3-3)
Analyse (Data Mining)(1/4)
‰
Analyse de route
„
„
„
29 Mars, 2006
80% clients visite le site par ‘compagnie/produit2 ’, mais
pas par la page d’accueil.
55% clients visite moins de 5 pages web avant sortir.
……
Utilisation du Web Mining en E-commerce
26
Processus d’extraire des
connaissances dans Web Mining(3-3)
Analyse (Data Mining) (2/4)
‰
Association
[N (ii ), right, N (it )]
I = {i1 , i 2 ,..., i n }
pour mesurer l’association entre deux items. ‘right’ est le poids
de transformer du nceud ‘i’ au nceud ‘t’. Si la valeur de ‘right’ >
0.5, on pense que les deux noeuds ont un lien fort. Ce lien
signifie qu’un client qui visite la page A va souvent visiter la
page B aussi.
29 Mars, 2006
Utilisation du Web Mining en E-commerce
27
Processus d’extraire des
connaissances dans Web Mining(3-3)
Analyse (Data Mining) (3/4)
Classification Bayesianne
„
„
Idea: assign to example X the class label C
such that P(C|X) is maximal
Computes the distribution of an input
associated with each class, for example,
given the variable X with a value at xi the
probability of it being in Class A is greater
than it being in Class B
Source: Auvil, Loreta et Searsmith Duane (2003)
29 Mars, 2006
Mathematically speaking — If one knows
how P(X | C), and the densities P(xi) and
P(cj) (prior probabilities) are known
then the classifier is one which assigns
class cj to datum xi if cj has the highest
posterior probability given the data.
Utilisation du Web Mining en E-commerce
28
Processus d’extraire des
connaissances dans Web Mining(3-3)
Analyse (Data Mining) (4/4)
‰
Clustering
L=(ip, uid, url, time)
Ip, uid, url, time sont l’adresse du client,
l’identification du client, l’ URL qui est demandé par le client, le
temps de navigation du visiteur
M
29 Mars, 2006
m×n
6 4 4 44UID
74444
8
C 12 ... C 1 n ⎤ ⎫
⎡ C 11
⎥⎪
⎢C
C
C
...
21
22
2n ⎥⎪
⎢
=
⎬URL
⎥
⎢ ...
...
...
... ⎪
⎥⎪
⎢
C
C
C
...
m2
mn ⎦ ⎭
⎣ m1
Utilisation du Web Mining en E-commerce
29
Plan
„
„
„
„
Introduction
Taxonomie du Web Mining
Processus d’extraire des connaissances
dans Web Mining
Application du Web Mining en Ecommerce
Système de recommandation
Conclusion
‰
„
29 Mars, 2006
Utilisation du Web Mining en E-commerce
30
Application du Web Mining
Web Usage
Mining
Personalization
Site H elper
Letizia
Web Watcher
M obasher
Analog
Krishnapuram
System
Improvement
R exford
Schecter
Ag g arwal
WebSIFT
WU M
SpeedTracer
WebLog M iner
Shahabi
Site
M odification
Adaptive Sites
Business
Intellig ence
SurfAid
Buchner
Tuzhilin
U sag e
C haracterization
Pitkow
Arlitt
M anley
Almeida
Source: J. Srivastava, R. Cooley, M. Deshpande et PN Tan (2000) Web Usage Mining:
Discovery and Applications of Usage Patterns from Web Data, SIGKDD Explorations
29 Mars, 2006
Utilisation du Web Mining en E-commerce
31
Application du Web Mining en Ecommerce
Système de Recommandation
le magasin peut recommander le produit qui peut être
intéressant au client selon plusieurs critères :
„
„
„
29 Mars, 2006
la correspondance du produit au profil du client ;
la similarité du produit aux produits que le client a déjà
achetés auparavant ;
l’appréciation des autres clients similaires au client.
Utilisation du Web Mining en E-commerce
32
Application du Web Mining en Ecommerce
Système de Recommandation
„
Architecture
Source: Markellou, Mousourouli, Sirmakessis et Tsakalidis (2005)
29 Mars, 2006
Utilisation du Web Mining en E-commerce
33
Plan
„
„
„
„
„
Introduction
Taxonomie du Web Mining
Processus d’extraire des connaissances
dans Web Mining
Application du Web Mining en Ecommerce
Conclusion
29 Mars, 2006
Utilisation du Web Mining en E-commerce
34
Conclusion
„
„
„
Il y a lien forte entre Web Mining et Ecommerce
Web Mining utilise des outils mûres, par
exemple, des méthodes de RI, Data Mining
etc.
Il y a des limitations du Web Mining
‰
‰
‰
Dépendre très forte sur le ficher de log
Le bruite d’information
OLAP est complexe et cher
29 Mars, 2006
Utilisation du Web Mining en E-commerce
35
Références
„
„
„
„
„
„
Auvil, Loretta et Searsmith Duane (2003) Using Text Mining for Spam Filtering, University of
Illinois
Grobelnik, Marko (2001) Web-Mining…searching for the knowledge on the Internet… , Institut
Jožef Stefan http://www-ai.ijs.si/MarkoGrobelnik/
J. Srivastava, R. Cooley, M. Deshpande et PN Tan (2000) Web Usage Mining: Discovery and
Applications of Usage Patterns from Web Data, SIGKDD Explorations
Sanjay Kumar Madria (2002) Web Mining: A Bird’s Eye View, University of Missouri-Rolla
Vipin Kumar (2002) Army High Performance Computing Research Center,
University of Minnesota
Zhang Zhongping (2001), Introduction of OLAP
http://www.dmgroup.org.cn/pptdown050322/OLAPIntr.ppt
29 Mars, 2006
Utilisation du Web Mining en E-commerce
36
Référence
„
„
„
„
„
„
„
„
„
„
„
„
„
„
„
„
„
„
„
„
„
[1]Amazon.com (2004), Annual Report
[2]Abraham Ajith (2003), ‘Business Intelligence from Web Usage Mining’, Journal of Information & Knowledge Management, Vol. 2, No. 4, PP375-390
[3]Ansari Suhail, Kohavi Ron, Mason Llew and Zheng Zijian (2000), ‘Integrating E-commerce and Data Mining: Architecture and Challenges’, WEBKDD
‘2000 Workshop
[4]Baraglia Ranieri and Palmerini Paolo (2002), ‘Suggest: A Web Usage Mining System’, IEEE International Conference on Information Technology
(ITCC’02)
[5]Barnes & Noble.com (2004), Annual Report
[6]Buchner Alex G. and Mulvenna Maurice D. (1998), ‘Discovering Internet Marketing Intelligence through Online Analytical Web Usage Mining’,
SIGMOD Record, Vol. 27, No. 4
[7]Castellano Marcello, Pastore Nicola and Arcieri Francesco (2005), ‘A Flexible Mining Architecture for Providing New E-knowledge Services’, IEEE
38th Hawaii International Conference on System Sciences
[8]Chakrabarti Soumen (2000), ‘Data Mining for Hypertext: A Tutorial Survey’, ACM SIGKDD, Volume 1, Issue 2
[9]Chie Ed H., Rosien Adam and Heer Jeffrey (2000), ‘Lumber Jack: Intelligent Discovery and Analysis of Web User Traffic Composition’, Working Paper
[10]Cooley Robert, Mobasher Bamshad and Srivastava Jaideep (1999), ‘Data Preparation for Mining World Wide Web Browsing Patterns’, Working
Paper, University of Minnesota
[11]Ebay.com (2004), Annual Report
[12]Eirinaki, M. and Vazirgiannis, M. (2003), ‘Web Mining for Web Personalization’, ACM Transactions on Internet Technology, 2003, 3(1), PP1-27
[13]Gomory Stephen, Hoch Robert, Lee Juhnyoung, Podlaseck Mark and Schonberg Edith(1999), ‘E-commerce Intelligence: Measuring, Analyzing, and
Reporting on Merchandising Effectiveness of Online Stores’, Working Paper, IBM T. J. Watson Research Center
[14]Grcar Miha(2004), ‘User Profiling: Web Usage Mining’, SIKDD’2004 at Multiconference, IS 2004, PP12-15
[15]Hu Xiaohua and Cercone Nick (2002), ‘An OLAM Framework for Web Usage Mining and Business Intelligence Reporting’, IEEE Volume 2, PP 950 955
[16]Jespersen Soren E., Thorhauge Jesper and Pedersen Torben Bach (2002), ‘A Hybrid Approach to Web Usage Mining’, Technical Report 02-5002,
Aalborg University
[17]Ji Junzhong, Sha Zhiqiang, Liu Chunnian and Zhong Ning (2003), ‘Online Recommendation Based on Customer Shopping Model in E-commerce’,
IEEE/WIC, WI’03
[18]Joo Dongkwon and Moon Songchun (2001), ‘Scalable Web Mining Architecture for Backward Induction in Data Warehouse Environment’, IEEE
Catalogue No. 01CH37239
[19]Kawano Hiroyuki (2004), ‘Applications of Web Mining: From Web Search Engine to P2P Filtering’, IEEE 12th International conference on Informatics
Research for Development of Knowledge Society Infrastructure (ICKS’04)
[20]Kohavi Ron (2001), ‘Mining E-commerce Data: The Good, the Bad, and the Ugly’, 7th ACM SIGKDD Intl' Conf. on Knowledge Discovery and Data
Mining (KDD '01)
[21]Kohavi Ron, Provost Foster (2001), ‘Applications of Data Mining to Electronic Commerce’, Data Mining and Knowledge Discovery, 5, 5-10, Kluwer
Academic Publishers
29 Mars, 2006
Utilisation du Web Mining en E-commerce
37
Référence
„
„
„
„
„
„
„
„
„
„
„
„
„
„
„
„
„
„
„
„
„
„
[22]Kohavi Ron, Mason Llew, Parekh Rajesh and Zheng Zijian (2004), ‘Lessons and Challenges from Mining Retail E-commerce Data’, Machine
Learning Journal, Special Issue on Data Mining lessons learned
[23]Kosala Raymond and Blockeel Hendrik (2000), ‘Web Mining Research: A Survey’, SIGKDD Explorations, Volume 2, Issue 1
[24]Kwan Irene S. Y. (2005), ‘Towards Effective Web Resources Management: An Empirical Study and a Web Mining Approach’, IEEE the Fifth
International Conference on System Sciences
[25]Lee Chung-Hong and Yang Hsin-Chang (2001), ‘Developing an Adaptive Search Engine for E-commerce Using a Web Mining Approach’, IEEE
[26]Linoff Gordon S. and Berry Michael J.A. (2001), ‘Mining the Web: Transforming Customer Data into Customer Value’, John Wiley & Sons
[27]Liu Lizhen, Chen Junjie and Song Hantao (2001), ‘The Research of Web Mining’, IEEE 4th World Congress on Intelligent Control and Automation
[28]Liu Jian-guo, Huang Zheng-hong and Wu Wei-ping (2003), ‘Web Mining for Electronic Business Application’, IEEE
[29]Li Jia and Zaiane Osmar. R (2004), ‘Using Distinctive Information Channels for a Mission-based Web Recommender System’, 6th ACM SIGKDD
workshop on Webmining and Web Analysis (WebKDD 2004), PP 35-46
[30]Markellou Penelope, Mousourouli Ioanna, Sirmakessis Spiros and Tsakalidis Athanasios (2005), ‘Personalized E-commerce Recommendations’,
IEEE International Conference on E-business Engineering (ICEBE’05)
[31]Mena Jesus (1999), ‘Mining E-custor Behavior’, DB2 Magazine, Vol. 4, Issue 4, http://www.db2mag.com/db_area/archives/1999/q4/mena.shtml
[32]Mobasher Bamshad, Jain Namit, Han Eui-Hong and Srivastava Jaideep (1997), ‘Web Mining: Pattern Discovery from World Wide Web
Transactions’, Working paper, University of Minnesota
[33]Pal Sankar K, Talwar Varun and Mitra Pabitra (2002), ‘Web Mining in Soft Computing Framework: Relevance, State of the Art and Future
Directions’, IEEE Transactions on Neural Networds, Vol. 13, No. 5
[34]Perner Petra (2002), ‘Advances in Data Mining: Applications in E-commerce, Medicine, and Knowledge Management’, Springer, LNAI2394
[35]Punin John R., Krishnamoorthy Mukkai S. and Zaki Mohammed J. (2001), ‘Web Usage Mining – Languages and Algorithms’, In Studies in
Classification, Data Analysis and Knowledge Organization, Springer-Verlag, 2001. RPI Tech Report 01-3
[36]Roy Nivedita and Mphapaatra Tapas (2005), ‘Web Mining: A Key Enabler in E-business’, IEEE ICSSSM '05 International Conference
[37]Sarwar Badrul, Darypis George, Konstan Joseph and Riedl John (2000), ‘Analysis of Recommendation Algorithms for E-commerce’, Technical
Report, ACM, University of Minnesota
[38]Scime Anthony (2005), ‘Web Mining : Applications and Techniques’, Idea Group Publishing
[39]Stefani A., Vassiliadis B. and Xenos M. (2004), ‘Behavioral Patterns in Hypermedia Systems: A Short Study of E-commerce vs. E-learning
Practices’, EPEAEKII Iraklitos programme at HOU
[40]Wang Jicheng, Huang Yuan, Wu Gangshan and Zhang Fuyan (1999), ‘Web Mining: Knowledge Discovery on the Web’, IEEE, Volume. 2, PP 137 141 vol.2
[41]Web-datamining.net, ‘FAQ, web mining’
http://www.web-datamining.net/forum/faq_wm.asp
[42]Yun Chin-Huang and Chen Ming-Syan (2000), ‘Mining Web Transaction Patterns in an Electronic Commerce Environment’, Pacific-Asia Conference
on Knowledge Discovery and Data Mining
29 Mars, 2006
Utilisation du Web Mining en E-commerce
38
Référence
„
„
„
[43]Zaiane Osmar R., Xin Man and Han Jiawei (1998), ‘Discovering Web Access Patterns and Trends by Applying OLAP and Data Mining Technology
on Web logs’, Advances in Digital Libraries Conference, PP 19--29
[44]Zaiane Osmar R. (2001), ‘Web Usage Mining for a Better Web-Based Learning Environment’, Conference on Advanced Technology for Education,
pages 60--64
[45]Zaiane Osmar R. and Cai JiAn (2001), ‘Web Mining: From Concepts to Practical Systems’, DASFAA’2001
29 Mars, 2006
Utilisation du Web Mining en E-commerce
39
Merci à Votre Attention
29 Mars, 2006
Utilisation du Web Mining en E-commerce
40
Bienvenu votre
Conseil et Question
29 Mars, 2006
Utilisation du Web Mining en E-commerce
41