en éducation - Université de Montréal
Transcription
en éducation - Université de Montréal
Systèmes de recommendation et « data mining » en éducation Pierre CHALFOUN IFT-6261 :: Hiver 2006 1 Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Plan de la présentation • Pourquoi recommander • Recommandation traditionnelle • Un peu plus d’intelligence svp • Recommandation + éducation = • Et alors ? & 2 Pourquoi Recommander Intelligence Éducation Et alors Besoin naturel Et de nos jours ? Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Besoin naturel Résumer et expliquer TOUTE la loi fiscale ? Stagiaire en droit Argent.. Or… non plutôt un diamant ! Le mari qui a oublié l’anniversaire de sa femme Qu’est-ce qu’on mange aujourd’hui? L’étudiant 3 Pourquoi Recommander Intelligence Éducation Et alors Besoin naturel Et de nos jours ? Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Et de nos jours ? • Miniaturisation – Réduction des coûts – Taille des supports informatiques – Quantité abondante de données • Émergence de l’Internet • Émergence du commerce électronique • Émergence de l’enseignement à distance 4 Pourquoi Recommander Intelligence Éducation Et alors Origines Techniques Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Origines • Sciences cognitives (Rich, E. 1979) – Concept de stéréotypes* pour construire des modèles de l’usager. – Ordinateur s’adapte aux particularités des individus – « Recommender » : 18 fois en 12 pages ! • Envol suite aux travaux de GroupLens et « Word Of Mouth » (Resnick, P. et al 1994; Shardanand, U. et al. 1995) • Importance accordée à la personnalisation avec les notions de corrélation usager-usager et algorithmes du plus proche voisin * Stéréotypes – groupe de caractéristiques. Selon l’auteur, on pourrait supposer qu’un juge est une personne de plus de 40 ahns, bien éduquée, relativement influente, honnête et bien respectée par sa communauté. (Rich, E, 1979) 5 Pourquoi Recommander Intelligence Éducation Et alors Origine Techniques z{{ Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Mise en situation • Le cas exemple Table 1 – Recommandation de Sushis Kanda Sushi Shop Mikado Katsura Peter 9 7 0 0 Paul 7 0 7 7 Wendy 0 0 10 9 Rosalina 5 4 0 5 Source: (Chalfoun, P. 2006) • 1000 usagers, 50 restaurants : maximum de 50 000 notes ! • Note attribuée de 0 (aucune évaluation) à 10 (excellent). 6 Pourquoi Recommander Intelligence Éducation Et alors Origine z{{ Techniques zz{ Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Par contenu (1/3) • Origines – « Information filtering » (Belkin, N. and Croft, B. 1992) – « Information retrieval » (Salton, G. 1989) • Importance de pertinence , ressemblance et historique 7 Pourquoi Recommander Intelligence Éducation Et alors Origine zz{ Techniques zz{ Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Par contenu (2/3) • Application à notre exemple Table 1 – Recommandation de Sushis Kanda Sushi Shop Mikado Katsura Peter 9 7 0 0 Paul 7 0 7 7 Wendy 0 0 10 9 Rosalina 5 4 0 5 Source: (Chalfoun, P. 2006) • Pierre désire le restaurant avec la meilleure atmosphère. Il hésite entre Mikado et Katsura. Le système consulte les données semblables et lui présente le meilleur. • Kanda : Atmosphère chaleureuse ( 9 / 10 ) • Sushi Shop : Atmosphère amicale ( 7 / 10 ) • Mikado : Atmosphère amicale • Katsura : Atmosphère chaleureuse Le système recommandera Katsura 8 Pourquoi Recommander Intelligence Éducation Et alors Origine zzz Techniques zz{ Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Par contenu (3/3) • Problèmes – Indexage • Certains contenus informatiques sont difficiles à indexer, comme les vidéos et le multimédia en général – Sur-spécialisation • Le système devient expert de son domaine et ne pourra conseiller autre chose qu’un restaurant Sushi ! – Sur-généralisation • Opposé de sur-spécialisation. Le système recommande n’importe quel restaurant à n’importe quel usager ! – Nouvel usager • Quoi recommander à un nouvel usager n’ayant rien visité 9 Pourquoi Recommander Intelligence Éducation Et alors z{{{{{ Origine Techniques zzz Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Par collaboration (1/6) • La plus populaire, alias filtrage collaboratif • Basée sur le principe de similarité entre usagers • Application à notre exemple Table 1 – Recommandation de Sushis Kanda Sushi Shop Mikado Katsura Peter 9 7 0 0 Paul 7 0 7 7 Wendy 0 0 10 9 Rosalina 5 4 0 5 Nouvel usager Source: [URL 2] Source: (Chalfoun, P. 2006) 10 Pourquoi Recommander Intelligence Éducation Et alors zz{{{{ Origine Techniques zzz Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Par collaboration (2/6) • Basée mémoire (Breeze, J.S. et al. 1998) – Prédiction sur l’ensemble des éléments notés – Lorsqu’on retrouve une note inexistante pour un item I : • Calcul basé sur la composition des notes d’usagers U similaires pour l’item I. 11 Pourquoi Recommander Intelligence Éducation Et alors zzz{{{ Origine Techniques zzz Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Par collaboration (3/6) • Application à notre exemple Table 1 – Recommandation de Sushis Kanda Sushi Shop Mikado Katsura Peter 9 7 0 0 Paul 7 0 7 7 Wendy 0 0 10 9 Rosalina 5 4 0 5 Source: (Chalfoun, P. 2006) 1. Trouver les usagers les plus similaires à Wendy : Peter et Paul 2. Appliquer une fonction qui extrapole la valeur selon les notes de Peter et Paul 12 Pourquoi Recommander Intelligence Éducation Et alors zzzz{{ Origine Techniques zzz Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Par collaboration (4/6) • Basée modèle (Breeze, J.S. et al. 1998) – Prédiction sur un modèle déterminé suite aux notes existantes – Aucune formule spécifique : méthodes probabilistes • Construction du profil • Prédiction de la note 13 Pourquoi Recommander Intelligence Éducation Et alors zzzzz{ Origine Techniques zzz Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Par collaboration (5/6) • Problèmes de la recommandation par collaboration – Nouvel usager • Exemple du nouvel étudiant en classe – Nouvel item • Pas de note = pas de recommandation – Données clairsemées • Absence et/ou rareté de données 14 Pourquoi Recommander Intelligence Éducation Et alors zzzzzz Origine Techniques zzz Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Par collaboration (6/6) • Hybride – Classification selon (Adomavicius, G. 2005) – Combiner les sorties des systèmes de recommandation – Recommander non seulement selon la similitude entre les items, mais selon les ressemblances entre les profils des usagers. – Méthodes probabilistes pour standardiser la recommandation • Combinaison des deux techniques de recommandation 15 Pourquoi Recommander Intelligence Éducation Et alors Origine Techniques Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Domaines d’application • Amazon.com – Presque tout … (Linden, G. et al. 2003) • MovieLens • Recommendz – Les films (URL 3) • VERSIFI – Les films (Miller, B.N. et al. 2003) – Les nouvelles (Billsus, D. et al. 2002) 16 Pourquoi Recommander Intelligence Éducation Et alors Origine Techniques Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Transition • Combinaison de plusieurs facteurs – Explosion du commerce électronique – Réduction du coût d’entreposage -> journaux ! – Volonté de connaître le client selon ses actions – Quantité de données écrasante • Nécessaire d’apprendre et donc d’être un peu plus intelligent • « Data mining » à la rescousse ! 17 Pourquoi Recommander Intelligence Éducation Et alors Théorie Techniques Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Théorie • Qu’est-ce que le « data mining » ? – Créer un site complet de commerce électronique 45 000 $ – Acheter et entreposer 100 TB de transactions 125 000 $ – Transformer tout ceci en connaissance Ça n’a pas de prix ! • «Extraction de connaissance d’un grand réservoir de données » (Han, J. et Kamber, M. 2001) • Personnalisation ! 18 Pourquoi Recommander Intelligence Éducation Et alors Théorie Techniques z{{ Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Techniques (1/3) • Élaboration de modèle pour la prise de décision – Arbres de décisions : arbre inversé – Classificateurs Bayesiens : effet d’un nœud sur un autre – Réseaux de neurones : propagation – Règles d’association : suivi dans les transactions – Raisonnement à base de cas : résoudre le présent par les expériences passées – Clustering : regroupement des entités 19 Pourquoi Recommander Intelligence Éducation Et alors Théorie Techniques zz{ Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Techniques (2/3) • Valeurs ajoutées – « Clustering » Repérage de préférences et de goûts communs dans un groupe d’usagers Recommandation restreinte à cet espace Préfèrent le saké chaud Saké chaud Table 1 – Recommandation de Sushis Kanda Sushi Shop Mikado Katsura Peter 9 7 0 0 Paul 7 0 7 7 Wendy 0 0 10 9 Rosalina 5 4 0 5 Source: (Chalfoun, P. 2006) Préfèrent le saké froid Nouvel usager Source: [URL 2] 20 Pourquoi Recommander Intelligence Éducation Et alors Théorie Techniques zzz Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Techniques (3/3) • Valeurs ajoutées – Règles d’associations Lien entre les items d’intérêt à l’usager Processus hors ligne compte tenu de la quantité de données Table 1 – Recommandation de Sushis Kanda Sushi Shop Mikado Katsura Peter 9 7 0 0 Paul 7 0 7 7 Wendy 0 0 10 9 Rosalina 5 4 0 5 Source: (Chalfoun, P. 2006) 21 Pourquoi Recommander Intelligence Éducation Et alors Théorie Techniques Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Domaines d’application • Biomédical • Secteur financier – Fraude – Détection de crédit à risque • Gestion de la connaissance – Recommandation de ressources électroniques utiles • Commerce électronique • Études en Marketing 22 Pourquoi Recommander Intelligence Éducation Et alors Théorie Techniques Domaines d’application Transition Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Transition • Systèmes de recommandation – Par contenu – Par collaboration Mémoire vs Modèle • « Data mining » – Intelligence : extraction de connaissance – Valeur ajoutée aux système de recommandation • Importance de l’émergence du E-Learning • Complexité des données pédagogiques (Zaïane, O.R. 2002) 23 Pourquoi Recommander Intelligence Éducation Et alors Valeur ajoutée Aide à l’enseignant Recommandation académique Personnalisation Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Valeur ajoutée • Aide à l’enseignant – Permettre une réflexion sur le matériel enseigné. – Apprendre est un exercice bi-directionnel : les deux parties apprennent • Recommandation académique – Recommander des cours selon les aptitudes et intérêts de chaque étudiant • Personnaliser le contenu aux comportements des étudiants – Limiter et filtrer tout contenu à enseigner selon les habitudes et comportements d’autres étudiants semblables 24 Pourquoi Recommander Intelligence Éducation Et alors Valeur ajoutée Aide à l’enseignant z{ Recommandation académique Personnalisation Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Aide à l’enseignant (1/2) • Travaux de (Merceron, A. and Yasef, K. 2005) : – TADA-Ed : Outil pour l’analyse avancée en éducation Source: (Merceron, A. and Yasef, K. 2005) 25 Pourquoi Recommander Intelligence Éducation Et alors Valeur ajoutée Aide à l’enseignant zz Recommandation académique Personnalisation Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Aide à l’enseignant (2/2) • Travaux de (Merceron, A. and Yasef, K. 2005) : – TADA-Ed : Outil pour l’analyse avancée en éducation Source: (Merceron, A. and Yasef, K. 2005) 26 Pourquoi Recommander Intelligence Éducation Et alors Valeur ajoutée Aide à l’enseignant Recommandation académique Personnalisation Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Recommandation académique • Recommandation de cours – AACORN : Raisonnement à base de cas. Université DePaul. (JJ. Sandvig and R. Burke 2005) – SCR : Apprentissage machine par réseaux Bayesiens. Université de Lulea en Suède (Ekdahl, M. et al. 2002) – Travaux en cours par des étudiants d’Esma Aïmeur 27 Pourquoi Recommander Intelligence Éducation Et alors Valeur ajoutée Aide à l’enseignant Recommandation académique Personnalisation Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Personnalisation • Données de l’enseignement à distance « E-learning » sont complexes, volumineux et difficile à extraire, voire impossible. • Une déduction est donc nécessaire et des comportements doivent être extraits • Travaux de (Zaïane, O.R. 2002) Source (Zaïane, O.R. 2002) Source (Zaïane, O.R. 2002) 28 Pourquoi Recommander Intelligence Éducation Et alors Tendances futures Conférences Références Questions z{ Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Tendances futures (1/2) • Méta-Recommandeurs : création de règles et de protocoles d’échanges entre les différents systèmes de recommandation (Schafer, B.J. 2005). • Éducation : présence moins intrusive et mise en place d’une intelligence sociale. Ex: C.A.S.E (Farmer, R.A. and Hughes, B. 2005) 29 Source (Farmer,R.A. and Hughes 2005) Pourquoi Recommander Intelligence Éducation Et alors Tendances futures Conférences Références Questions zz Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Tendances futures (2/2) • Recommandation multi-dimensionnelle : aller plus loin que la recommandation Item x Note. L’ajout de dimensions supplémentaires est la clé ! (Adomavicius, G. et al. 2005) Source : (Adomavicius, G. et al. 2005) 30 Pourquoi Recommander Intelligence Éducation Et alors Tendances futures Conférences Références Questions Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Conférences • AAAI 2006 – American association for artificial intelligence http://www.aaai.org/Conferences/AAAI/aaai06.php • IEEE Transaction on Knowledge and Data Engineering http://www.computer.org/tkde • IJAIED 2005 – International journal of AI in education http://aied.inf.ed.ac.uk • ICML 2006 – International conference in machine learning http://www.icml2006.org • ACM SIGKDD – Conference on knowledge discovery and data mining http://www.acm.org/sigkdd/ • AIED 2005 – Artificial intelligence in education http://hcs.science.uva.nl/AIED2005 31 Pourquoi Recommander Intelligence Éducation Et alors Tendances futures Conférences Références z{{{ Questions Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Références • Adomavicius, G., Sankaranarayanan, R., Sen, S. and Tuzhilin, A. 2005. ‘Incorporating Contextual Information in Recommender Systems Using a Multidimensional Approach’, in ACM Transactions on Information Systems (TOIS), vol. 23, Issue 1, pp. 103-145. • Belkin, N. and Croft, B. 1992. ‘Information Filtering and Information Retrieval,’ Communications of the ACM, vol. 35, no. 12, pp. 29-37. • Billsus, D., Brunk, C.A., Evans, C., Gladish, B. and Pazzani, M. 2002. ‘Adaptive Interfaces for Ubiquitous Web Access,’ in Communications of the ACM, vol. 45, no. 5, pp. 34-38. • Breeze, J.S., Heckerman, D. and Kadie,C. 1998. ‘Empirical Analysis of Predictive Algorithms for Collaborative Filtering’, Proc. Of the 14th conf. on Uncertainty in Artificial Intelligence. • Chalfoun, P. 2006. ‘Litterature Review in Recommender Systems and data mining in Education’. Personal Work for the course IFT-6261 32 Pourquoi Recommander Intelligence Éducation Et alors Tendances futures Conférences Références zz{{ Questions Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Références • Ekdahl, M., Lindström, S., Svensson, C. 2002. ‘A Student Course Recommender’, Master of Science Programme, LULEA UNIVERSITY OF TECHNOLOGY, Department of Computer Science and Electrical Engineering / Division of Computer Science and Networking. • Farmer, R.A. and Hughes, B. 2005. CASE: A Framework for Evaluating LearnerComputer Interaction in ComputerAssisted Language Learning in CHINZ ’05, July 6-8, 2005. Auckland, New Zealand. • Han, J. and M. Kamber, M. 2001. ‘Data mining, concepts and techniques’, Academic Press. • Hill, W., Stead, L., Rosenstein, M. and Furnas, G. 1995. ‘Recommending and Evaluating Choices in a Virtual Community of Use’, Proc. Conf. Human Factors in Computing Systems. • Linden, G., Smith, B. and Yorke, J. 2003. ‘Amazon.com Recommendations: itemto-item collaborative filtering’ in IEEE Internet Computing. 33 Pourquoi Recommander Intelligence Éducation Et alors Tendances futures Conférences Références zzz{ Questions Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Références • Merceron, A. and Yacef, K. 2005. ‘Mining Student Data Captured from a WebBased Tutoring Tool: Initial Exploration and Results.’ Journal of Interactive Learning Research (JILR), vol. 15, no 4, pp. 319-346. • Miller, B.N., Albert, I., Lam, S.K., Konstan, J.A. and Riedl, J. 2003. ‘MovieLens Unplugged: Experiences with an occasionally connected Recommender System’ in Proc. International Conf. on Intelligent User Interfaces. • Resnick, P., Iakovou,N., Sushak,M., Bergstrom, P. and Rield, J. 1994. ‘GroupLens: An Open Architecture for Collaborative Filtering of Netnews’, Proc. Computer Supported Cooperative Work Conf. • Rich E. 1979. ‘User modeling via Stereotypes’, Cognitive Science, vol. 3, no. 4, pp. 329-354. • Salton, G. 1989. ‘Automatic Text Processing’. Addison-Wesley. • Sandvig, J.J. and Burke, R. 2005. ‘AACORN: A CBR Recommender for Academic Advising’, technical report, DePaul University. 34 Pourquoi Recommander Intelligence Éducation Et alors Tendances futures Conférences Références zzzz Questions Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Références • Shardanand, U. and Maes, P. 1995. ‘Social Information Filtering: Algorithms for Automating “Word of Mouth” ’, Proc. Conf. Human Factors in Computing Systems. • Zaïane, O.R. 2002. ‘Building a Recommender Agent for e-Learning Systems’, in Proc. of the 7th Intl. Conf. on Computers in Education, Auckland, New Zealand, pp 55-59 Les URLs • [ URL 1 ] Jian-Yun Nie 2006. Information Retrieval, IFT-6261 http://www.iro.umontreal.ca/~aimeur/cours/ift6261/CH5-Information-Retrieval.pdf • [ URL 2 ] Esma Aïmeur 2006. Université de Montréal http://www.iro.umontreal.ca/~aimeur/ • [URL3] Mobile Robotics Lab McGill. Recommendz – the movie recommender http://www.recommendz.com:8080/prototype/ 35 Pourquoi Recommander Intelligence Éducation Et alors Tendances futures Conférences Références Questions Pierre CHALFOUN Systèmes de recommandation en éducation Mercredi le 5 avril 2006 Questions – à vous la parole MERCI ! 36