en éducation - Université de Montréal

Transcription

en éducation - Université de Montréal
Systèmes de
recommendation et « data
mining » en éducation
Pierre CHALFOUN
IFT-6261 :: Hiver 2006
1
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Plan de la présentation
•
Pourquoi recommander
•
Recommandation traditionnelle
•
Un peu plus d’intelligence svp
•
Recommandation + éducation =
•
Et alors ?
&
2
Pourquoi
Recommander
Intelligence
Éducation
Et alors
™
™
Besoin naturel
Et de nos jours ?
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Besoin naturel
Résumer et
expliquer
TOUTE la loi
fiscale ?
Stagiaire en droit
Argent..
Or… non
plutôt un
diamant !
Le mari qui a oublié
l’anniversaire de sa femme
Qu’est-ce
qu’on
mange
aujourd’hui?
L’étudiant
3
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Besoin naturel
Et de nos jours ?
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Et de nos jours ?
•
Miniaturisation
– Réduction des coûts
– Taille des supports informatiques
– Quantité abondante de données
•
Émergence de l’Internet
•
Émergence du commerce électronique
•
Émergence de l’enseignement à distance
4
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Origines
Techniques
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Origines
•
Sciences cognitives (Rich, E. 1979)
– Concept de stéréotypes* pour construire des modèles de
l’usager.
– Ordinateur s’adapte aux particularités des individus
– « Recommender » : 18 fois en 12 pages !
•
Envol suite aux travaux de GroupLens et « Word Of Mouth »
(Resnick, P. et al 1994; Shardanand, U. et al. 1995)
•
Importance accordée à la personnalisation avec les notions de
corrélation usager-usager et algorithmes du plus proche voisin
* Stéréotypes – groupe de caractéristiques. Selon l’auteur, on pourrait supposer
qu’un juge est une personne de plus de 40 ahns, bien éduquée, relativement
influente, honnête et bien respectée par sa communauté. (Rich, E, 1979)
5
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Origine
Techniques z{{
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Mise en situation
•
Le cas exemple
Table 1 – Recommandation de Sushis
Kanda
Sushi Shop
Mikado
Katsura
Peter
9
7
0
0
Paul
7
0
7
7
Wendy
0
0
10
9
Rosalina
5
4
0
5
Source: (Chalfoun, P. 2006)
•
1000 usagers, 50 restaurants : maximum de 50 000 notes !
•
Note attribuée de 0 (aucune évaluation) à 10 (excellent).
6
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Origine
z{{
Techniques zz{
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Par contenu (1/3)
•
Origines
– « Information filtering » (Belkin, N. and Croft, B. 1992)
– « Information retrieval » (Salton, G. 1989)
•
Importance de pertinence , ressemblance et historique
7
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Origine
zz{
Techniques zz{
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Par contenu (2/3)
•
Application à notre exemple
Table 1 – Recommandation de Sushis
Kanda
Sushi Shop
Mikado
Katsura
Peter
9
7
0
0
Paul
7
0
7
7
Wendy
0
0
10
9
Rosalina
5
4
0
5
Source: (Chalfoun, P. 2006)
•
Pierre désire le restaurant avec la meilleure atmosphère. Il hésite entre Mikado et
Katsura. Le système consulte les données semblables et lui présente le meilleur.
•
Kanda : Atmosphère chaleureuse ( 9 / 10 )
•
Sushi Shop : Atmosphère amicale ( 7 / 10 )
•
Mikado : Atmosphère amicale
•
Katsura : Atmosphère chaleureuse
Le système
recommandera Katsura
8
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Origine
zzz
Techniques zz{
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Par contenu (3/3)
•
Problèmes
– Indexage
• Certains contenus informatiques sont difficiles à indexer,
comme les vidéos et le multimédia en général
– Sur-spécialisation
• Le système devient expert de son domaine et ne pourra
conseiller autre chose qu’un restaurant Sushi !
– Sur-généralisation
• Opposé de sur-spécialisation. Le système recommande
n’importe quel restaurant à n’importe quel usager !
– Nouvel usager
• Quoi recommander à un nouvel usager n’ayant rien visité
9
Pourquoi
Recommander
Intelligence
Éducation
Et alors
z{{{{{
Origine
Techniques zzz
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Par collaboration (1/6)
•
La plus populaire, alias filtrage collaboratif
•
Basée sur le principe de similarité entre usagers
•
Application à notre exemple
Table 1 – Recommandation de Sushis
Kanda
Sushi Shop
Mikado
Katsura
Peter
9
7
0
0
Paul
7
0
7
7
Wendy
0
0
10
9
Rosalina
5
4
0
5
Nouvel usager
Source: [URL 2]
Source: (Chalfoun, P. 2006)
10
Pourquoi
Recommander
Intelligence
Éducation
Et alors
zz{{{{
Origine
Techniques zzz
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Par collaboration (2/6)
•
Basée mémoire (Breeze, J.S. et al. 1998)
– Prédiction sur l’ensemble des éléments notés
– Lorsqu’on retrouve une note inexistante pour un item I :
• Calcul basé sur la composition des notes d’usagers U
similaires pour l’item I.
11
Pourquoi
Recommander
Intelligence
Éducation
Et alors
zzz{{{
Origine
Techniques zzz
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Par collaboration (3/6)
•
Application à notre exemple
Table 1 – Recommandation de Sushis
Kanda
Sushi Shop
Mikado
Katsura
Peter
9
7
0
0
Paul
7
0
7
7
Wendy
0
0
10
9
Rosalina
5
4
0
5
Source: (Chalfoun, P. 2006)
1. Trouver les usagers les plus similaires à Wendy : Peter et Paul
2. Appliquer une fonction qui extrapole la valeur selon les notes
de Peter et Paul
12
Pourquoi
Recommander
Intelligence
Éducation
Et alors
zzzz{{
Origine
Techniques zzz
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Par collaboration (4/6)
•
Basée modèle (Breeze, J.S. et al. 1998)
– Prédiction sur un modèle déterminé suite aux notes
existantes
– Aucune formule spécifique : méthodes probabilistes
• Construction du profil
• Prédiction de la note
13
Pourquoi
Recommander
Intelligence
Éducation
Et alors
zzzzz{
Origine
Techniques zzz
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Par collaboration (5/6)
•
Problèmes de la recommandation par collaboration
– Nouvel usager
• Exemple du nouvel étudiant en classe
– Nouvel item
• Pas de note = pas de recommandation
– Données clairsemées
• Absence et/ou rareté de données
14
Pourquoi
Recommander
Intelligence
Éducation
Et alors
zzzzzz
Origine
Techniques zzz
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Par collaboration (6/6)
•
Hybride – Classification selon (Adomavicius, G. 2005)
– Combiner les sorties des systèmes de recommandation
– Recommander non seulement selon la similitude entre les
items, mais selon les ressemblances entre les profils des
usagers.
– Méthodes probabilistes pour standardiser la
recommandation
• Combinaison des deux techniques de recommandation
15
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Origine
Techniques
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Domaines d’application
•
Amazon.com – Presque tout … (Linden, G. et al. 2003)
•
MovieLens
•
Recommendz – Les films (URL 3)
•
VERSIFI
– Les films (Miller, B.N. et al. 2003)
– Les nouvelles (Billsus, D. et al. 2002)
16
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Origine
Techniques
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Transition
•
Combinaison de plusieurs facteurs
– Explosion du commerce électronique
– Réduction du coût d’entreposage -> journaux !
– Volonté de connaître le client selon ses actions
– Quantité de données écrasante
•
Nécessaire d’apprendre et donc d’être un peu plus intelligent
•
« Data mining » à la rescousse !
17
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Théorie
Techniques
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Théorie
•
Qu’est-ce que le « data mining » ?
– Créer un site complet de commerce électronique
45 000 $
– Acheter et entreposer 100 TB de transactions
125 000 $
– Transformer tout ceci en connaissance
Ça n’a pas de prix !
•
«Extraction de connaissance d’un grand réservoir de
données » (Han, J. et Kamber, M. 2001)
•
Personnalisation !
18
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Théorie
Techniques z{{
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Techniques (1/3)
•
Élaboration de modèle pour la prise de décision
– Arbres de décisions : arbre inversé
– Classificateurs Bayesiens : effet d’un nœud sur un autre
– Réseaux de neurones : propagation
– Règles d’association : suivi dans les transactions
– Raisonnement à base de cas : résoudre le présent par les
expériences passées
– Clustering : regroupement des entités
19
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Théorie
Techniques zz{
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Techniques (2/3)
•
Valeurs ajoutées
– « Clustering »
ƒ Repérage de préférences et de goûts communs dans
un groupe d’usagers
ƒ Recommandation restreinte à cet espace
Préfèrent le saké chaud
Saké
chaud
Table 1 – Recommandation de Sushis
Kanda
Sushi Shop
Mikado
Katsura
Peter
9
7
0
0
Paul
7
0
7
7
Wendy
0
0
10
9
Rosalina
5
4
0
5
Source: (Chalfoun, P. 2006)
Préfèrent le saké froid
Nouvel usager
Source: [URL 2]
20
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Théorie
Techniques zzz
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Techniques (3/3)
•
Valeurs ajoutées
– Règles d’associations
ƒ Lien entre les items d’intérêt à l’usager
ƒ Processus hors ligne compte tenu de la quantité de
données
Table 1 – Recommandation de Sushis
Kanda
Sushi Shop
Mikado
Katsura
Peter
9
7
0
0
Paul
7
0
7
7
Wendy
0
0
10
9
Rosalina
5
4
0
5
Source: (Chalfoun, P. 2006)
21
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Théorie
Techniques
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Domaines d’application
•
Biomédical
•
Secteur financier
– Fraude
– Détection de crédit à risque
•
Gestion de la connaissance
– Recommandation de ressources électroniques utiles
•
Commerce électronique
•
Études en Marketing
22
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Théorie
Techniques
Domaines d’application
Transition
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Transition
•
Systèmes de recommandation
– Par contenu
– Par collaboration
ƒ Mémoire vs Modèle
•
« Data mining »
– Intelligence : extraction de connaissance
– Valeur ajoutée aux système de recommandation
•
Importance de l’émergence du E-Learning
•
Complexité des données pédagogiques (Zaïane, O.R. 2002)
23
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Valeur ajoutée
Aide à l’enseignant
Recommandation académique
Personnalisation
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Valeur ajoutée
•
Aide à l’enseignant
– Permettre une réflexion sur le matériel enseigné.
– Apprendre est un exercice bi-directionnel : les deux parties
apprennent
•
Recommandation académique
– Recommander des cours selon les aptitudes et intérêts de chaque
étudiant
•
Personnaliser le contenu aux comportements des étudiants
– Limiter et filtrer tout contenu à enseigner selon les habitudes et
comportements d’autres étudiants semblables
24
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Valeur ajoutée
Aide à l’enseignant z{
Recommandation académique
Personnalisation
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Aide à l’enseignant (1/2)
•
Travaux de (Merceron, A. and Yasef, K. 2005) :
– TADA-Ed : Outil pour l’analyse avancée en éducation
Source: (Merceron, A. and Yasef, K. 2005)
25
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Valeur ajoutée
Aide à l’enseignant zz
Recommandation académique
Personnalisation
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Aide à l’enseignant (2/2)
•
Travaux de (Merceron, A. and Yasef, K. 2005) :
– TADA-Ed : Outil pour l’analyse avancée en éducation
Source: (Merceron, A. and Yasef, K. 2005)
26
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Valeur ajoutée
Aide à l’enseignant
Recommandation académique
Personnalisation
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Recommandation académique
•
Recommandation de cours
– AACORN : Raisonnement à base de cas. Université DePaul.
(JJ. Sandvig and R. Burke 2005)
– SCR : Apprentissage machine par réseaux Bayesiens.
Université de Lulea en Suède (Ekdahl, M. et al. 2002)
– Travaux en cours par des étudiants d’Esma Aïmeur
27
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Valeur ajoutée
Aide à l’enseignant
Recommandation académique
Personnalisation
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Personnalisation
•
Données de l’enseignement à distance « E-learning » sont
complexes, volumineux et difficile à extraire, voire impossible.
•
Une déduction est donc nécessaire et des comportements
doivent être extraits
•
Travaux de (Zaïane, O.R. 2002)
Source (Zaïane, O.R. 2002)
Source (Zaïane, O.R. 2002)
28
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Tendances futures
Conférences
Références
Questions
™
™
™
™
z{
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Tendances futures (1/2)
•
Méta-Recommandeurs : création de règles et de protocoles
d’échanges entre les différents systèmes de recommandation
(Schafer, B.J. 2005).
•
Éducation : présence moins intrusive et mise en place d’une
intelligence sociale. Ex: C.A.S.E (Farmer, R.A. and Hughes, B. 2005)
29
Source (Farmer,R.A. and Hughes 2005)
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Tendances futures
Conférences
Références
Questions
™
™
™
™
zz
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Tendances futures (2/2)
•
Recommandation multi-dimensionnelle : aller plus loin que la
recommandation Item x Note. L’ajout de dimensions
supplémentaires est la clé ! (Adomavicius, G. et al. 2005)
Source : (Adomavicius, G. et al. 2005)
30
Pourquoi
Recommander
Intelligence
Éducation
Et alors
Tendances futures
Conférences
Références
Questions
™
™
™
™
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Conférences
•
AAAI 2006 – American association for artificial intelligence
http://www.aaai.org/Conferences/AAAI/aaai06.php
•
IEEE Transaction on Knowledge and Data Engineering
http://www.computer.org/tkde
• IJAIED 2005 – International journal of AI in education
http://aied.inf.ed.ac.uk
•
ICML 2006 – International conference in machine learning
http://www.icml2006.org
•
ACM SIGKDD – Conference on knowledge discovery and data mining
http://www.acm.org/sigkdd/
•
AIED 2005 – Artificial intelligence in education
http://hcs.science.uva.nl/AIED2005
31
Pourquoi
Recommander
Intelligence
Éducation
Et alors
™
™
™
™
Tendances futures
Conférences
Références z{{{
Questions
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Références
•
Adomavicius, G., Sankaranarayanan, R., Sen, S. and Tuzhilin, A. 2005.
‘Incorporating Contextual Information in Recommender Systems Using a
Multidimensional Approach’, in ACM Transactions on Information Systems
(TOIS), vol. 23, Issue 1, pp. 103-145.
•
Belkin, N. and Croft, B. 1992. ‘Information Filtering and Information Retrieval,’
Communications of the ACM, vol. 35, no. 12, pp. 29-37.
•
Billsus, D., Brunk, C.A., Evans, C., Gladish, B. and Pazzani, M. 2002. ‘Adaptive
Interfaces for Ubiquitous Web Access,’ in Communications of the ACM, vol. 45,
no. 5, pp. 34-38.
•
Breeze, J.S., Heckerman, D. and Kadie,C. 1998. ‘Empirical Analysis of Predictive
Algorithms for Collaborative Filtering’, Proc. Of the 14th conf. on Uncertainty in
Artificial Intelligence.
•
Chalfoun, P. 2006. ‘Litterature Review in Recommender Systems and data mining
in Education’. Personal Work for the course IFT-6261
32
Pourquoi
Recommander
Intelligence
Éducation
Et alors
™
™
™
™
Tendances futures
Conférences
Références zz{{
Questions
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Références
•
Ekdahl, M., Lindström, S., Svensson, C. 2002. ‘A Student Course Recommender’,
Master of Science Programme, LULEA UNIVERSITY OF TECHNOLOGY,
Department of Computer Science and Electrical Engineering / Division of
Computer Science and Networking.
•
Farmer, R.A. and Hughes, B. 2005. CASE: A Framework for Evaluating
LearnerComputer Interaction in ComputerAssisted Language Learning in CHINZ
’05, July 6-8, 2005. Auckland, New Zealand.
•
Han, J. and M. Kamber, M. 2001. ‘Data mining, concepts and techniques’,
Academic Press.
•
Hill, W., Stead, L., Rosenstein, M. and Furnas, G. 1995. ‘Recommending and
Evaluating Choices in a Virtual Community of Use’, Proc. Conf. Human Factors in
Computing Systems.
•
Linden, G., Smith, B. and Yorke, J. 2003. ‘Amazon.com Recommendations: itemto-item collaborative filtering’ in IEEE Internet Computing.
33
Pourquoi
Recommander
Intelligence
Éducation
Et alors
™
™
™
™
Tendances futures
Conférences
Références zzz{
Questions
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Références
•
Merceron, A. and Yacef, K. 2005. ‘Mining Student Data Captured from a WebBased Tutoring Tool: Initial Exploration and Results.’ Journal of Interactive
Learning Research (JILR), vol. 15, no 4, pp. 319-346.
•
Miller, B.N., Albert, I., Lam, S.K., Konstan, J.A. and Riedl, J. 2003. ‘MovieLens
Unplugged: Experiences with an occasionally connected Recommender System’
in Proc. International Conf. on Intelligent User Interfaces.
•
Resnick, P., Iakovou,N., Sushak,M., Bergstrom, P. and Rield, J. 1994.
‘GroupLens: An Open Architecture for Collaborative Filtering of Netnews’, Proc.
Computer Supported Cooperative Work Conf.
•
Rich E. 1979. ‘User modeling via Stereotypes’, Cognitive Science, vol. 3, no. 4,
pp. 329-354.
•
Salton, G. 1989. ‘Automatic Text Processing’. Addison-Wesley.
•
Sandvig, J.J. and Burke, R. 2005. ‘AACORN: A CBR Recommender for Academic
Advising’, technical report, DePaul University.
34
Pourquoi
Recommander
Intelligence
Éducation
Et alors
™
™
™
™
Tendances futures
Conférences
Références zzzz
Questions
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Références
•
Shardanand, U. and Maes, P. 1995. ‘Social Information Filtering: Algorithms for
Automating “Word of Mouth” ’, Proc. Conf. Human Factors in Computing
Systems.
•
Zaïane, O.R. 2002. ‘Building a Recommender Agent for e-Learning Systems’, in
Proc. of the 7th Intl. Conf. on Computers in Education, Auckland, New Zealand,
pp 55-59
Les URLs
•
[ URL 1 ] Jian-Yun Nie 2006. Information Retrieval, IFT-6261
http://www.iro.umontreal.ca/~aimeur/cours/ift6261/CH5-Information-Retrieval.pdf
•
[ URL 2 ] Esma Aïmeur 2006. Université de Montréal
http://www.iro.umontreal.ca/~aimeur/
•
[URL3] Mobile Robotics Lab McGill. Recommendz – the movie recommender
http://www.recommendz.com:8080/prototype/
35
Pourquoi
Recommander
Intelligence
Éducation
Et alors
™
™
™
™
Tendances futures
Conférences
Références
Questions
Pierre CHALFOUN
Systèmes de recommandation en éducation
Mercredi le 5 avril 2006
Questions – à vous la parole
MERCI !
36