PhD Thesis
Transcription
PhD Thesis
PhD Thesis Title: Joint analysis of eye-movements and EEGs using coupled hidden Markov and topic models Doctoral School: Mathematics, Information Sciences and Technologies, and Computer Science, University of Grenoble (MSTII). Supervisors: Anne Guérin-Dugué(1), Marianne Clausel(2a) and Jean-Baptiste Durand(2b) E-mail: [email protected], [Marianne.Clausel|Jean-Baptiste.Durand]@imag.fr Location of PhD: GIPSA-lab or Laboratoire Jean Kuntzmann (1) GIPSA-lab / Dépt. DIS, 11 rue des Mathématiques, Saint Martin d’Hères. +33 (0)4 76 57 43 73 (2) Laboratoire Jean Kuntzmann, Saint Martin d’Hères. (a) +33(0)4 76 63 56 93 / (b) +33(0)4 76 63 57 09 Scientific background: Recently, GIPSA-lab has developed computational models of information search in web-like materials, using data from both eye-tracking to get eye movements during the search and electroencephalograms (EEGs) to analyze the related neural activities. These joint datasets were obtained from experiments, in which subjects had to make some kinds of press reviews (Frey et al., 2013). In such information seeking tasks, reading process and decision making are closely related. Two kinds of decision are expected: A positive decision if the meaning of the text matches with the goal of information search, and a negative decision otherwise. Statistical analysis of such data aims at: deciphering underlying cognitive phases in the cognitive process, characterize these phases with eye movements and EEG properties, explain the phase changes by the local text properties and quantify the individual variability of the phase properties, as well as the variability due to different texts. Hidden Markov models (HMMs) have been used on eye movement series to infer phases in the reading process that can be interpreted as steps in the cognitive processes leading to decision – see for example Simola et al. (2008). In HMMs, each phase is associated with a state of the Markov chain. The states are observed indirectly through eye-movements. However, the characteristics of eye movements within each phase tend to be poorly discriminated. As a result, high uncertainty in the phase changes arises, and it can be difficult to relate phases to known patterns in EEGs. HMMs were also used for the analysis of EEGs (Obermaier et al., 2001) but coupling eye movements, EEGs and text properties in a coherent model is an unaddressed challenge. Tasks: The aim of the PhD is to develop an integrated model coupling EEG and eye movements within one single HMM for better identification of the phases. Coupled HMMs are based on several dependent Markov chains such that at each time t, observations only depend on the states at time t (Zhong & Ghosh, 2001). Here, the coupling should incorporate some delay between the transitions in both chains, since EEG patterns associated to cognitive processes may occur with some delay with respect to eye-movement phases. To better relate the human reading process to some intrinsic characteristics of the reviewed text, we propose an interpretation of our two experimental models based on a well-known hierarchical generative model, called LDA, used in the data mining context (Blei et al., 2003) and thereafter extending to the image setting (Fei-Fei & Perona, 2005). We want to model “human data mining” for text or image as a variant of LDA, modifying in a convenient way the generative process and involving a random choice of the cognitive phase. The main goal is to take into account the fact that, in a text, a given word can be either read or not. The same question can also be raised in the image setting since a region of interest corresponding to a specific visual word can be explored or not. For this, a joint database with eye movements and EEG signals has been also recording during a visual search task according to a similar design as the information seeking task. Prerequisites: A master or engineer degree is required, and an applicant with a strong background in probability and statistics or machine learning, as well a strong interest in cognitive science. Skills in Matlab, C++ or python would be appreciated. Funding: This PhD is supported by a 3-year Persyval Fellowship, (http://persyval-lab.org/research/action/adm), according to French standards (about 1400 euros net/month), starting 01.10.2015 at the earliest. Context: The research will be undertaken in the context of an interdisciplinary project involving three research laboratories (GIPSA-lab, LJK, and LPNC) from the University of Grenoble Alpes. The consortium has scientific expertise on statistics, information processing, and cognitive sciences, providing a stimulating scientific environment for this thesis. Last but not least, Grenoble is a very pleasant place to study and work. Grenoble is rated each year as the best place in France for studying. References: D. Blei, A. Ng, and M. Jordan. Latent Dirichlet allocation. Journal of Machine Learning Research, 3, 993–1022 (January 2003). L. Fei-Fei and P. Perona. A Bayesian hierarchical model for learning natural scene categories. IEEE Computer vision and Pattern Recognition (2005) A. Frey, G. Ionescu, B. Lemaire, F. Lopez Orozco, T. Baccino and A. Guérin-Dugué. Decision-making in information seeking on texts: an Eye-Fixation-Related Potentials investigation. Frontiers in Systems Neuroscience, 7, pp.Article 39 (2013). B. Obermaier, C. Guger, C. Neuper and G. Pfurtscheller. Hidden Markov models for online classification of single trial EEG data. Pattern Recognition Letters, 22, 1299-1309 (2001). J. Simola, J. Salojärvi and I. Kojo. Using hidden Markov model to uncover processing states from eye movements in information search tasks. Cognitive Systems Research 9(4), 237-251 (October 2008) S. Zhong and J. Ghosh. A New Formulation of Coupled Hidden Markov Models, Technical report, Dept. of Electrical and Computer Eng., Univ. of Texas at Austin (2001) Sujet de thèse Titre : Analyse conjointe de traces oculométriques et d’EEG à l’aide de modèles de Markov cachés couplés et de modèles de sujets École doctorale : Mathématiques, Sciences et Technologies de l’Information et Informatique, Université de Grenoble (MSTII). Encadrants : Anne Guérin-Dugué(1), Marianne Clausel(2a) et Jean-Baptiste Durand(2b) E-mail: [email protected], [Marianne.Clausel|Jean-Baptiste.Durand]@imag.fr Lieu de la thèse : GIPSA-lab ou Laboratoire Jean-Kuntzmann (1) GIPSA-lab / Dépt. DIS, 11 rue des Mathématiques, Saint Martin d’Hères. +33 (0)4 76 57 43 73 (2) Laboratoire Jean Kuntzmann, Saint Martin d’Hères. (a) +33(0)4 76 63 56 93 / (b) +33(0)4 76 63 57 09 Contexte Scientifique : Récemment, le GIPSA-lab a développé des modèles computationnels de recherche d’information dans des documents de type web, à l’aide de données provenant à la fois de mesures oculométriques (acquisition du mouvement des yeux pendant la recherche) et d’électroencéphalogrammes (EEG) pour analyser l’activité cérébrale associée. Ces jeux de données bimodaux ont été obtenus à partir d’expériences dans lesquelles les individus avaient à accomplir une sorte de revue de presse (Frey et al., 2013). Dans de telles tâches de recherche d’information, les processus de lecture et de décision sont intimement liés. Deux types de décision sont attendus : une décision positive si le sens du texte correspond à la cible de la recherche d’information, une décision négative sinon. L’analyse statistique de ces données vise à : • Mettre en évidence des étapes dans le processus cognitif. • Caractériser ces phases en termes de mouvements des yeux et de propriétés d’EEG. • Expliquer les changements d’étape à l’aide des propriétés locales du texte. • Quantifier la variabilité individuelle des propriétés des phases, ainsi que la variabilité due aux différents textes. Des modèles de Markov cachés (MMC) ont été utilisés sur des séquences oculométriques afin d’identifier des phases dans le processus de lecture, qui puissent être interprétées comme des étapes dans les processus cognitifs menant à la décision - voir par exemple Simola et al. (2008). Dans les MMC, chaque phase est associée à un état de la chaîne de Markov. Les états sont observés indirectement par l'intermédiaire des mouvements oculaires. Cependant, les caractéristiques des mouvements oculaires ont tendance à être mal séparées d’un état à l’autre. Une grande incertitude dans les changements d’état en résulte, et il est difficile de relier ces états à des motifs dans les EEG répertoriés dans la littérature. Des MMC ont également déjà été utilisés dans d’autres études pour l'analyse d’EEG (Obermaier et al., 2001), mais le couplage de l’analyse de mouvements oculaires, d’EEG et de propriétés des textes dans un modèle cohérent reste aujourd’hui encore un défi. Tâches : L'objectif de cette thèse est de développer un modèle intégré couplant les EEG et les séquences de mouvements oculaires dans un seul MMC pour une meilleure identification des phases. Les MMC couplés sont basés sur plusieurs chaînes de Markov dépendantes telles qu’à chaque instant t, les observations ne dépendent que des états à l'instant t (Zhong et Ghosh, 2001). Ici, le couplage doit intégrer un certain décalage dans les transitions d’une chaîne à l’autre, étant donné que dans les EEG, les motifs associés à des processus cognitifs peuvent se produire avec un certain retard par rapport aux changements de phase des mouvements oculaires. Afin de mieux relier le processus de lecture à certaines caractéristiques intrinsèques du texte considéré, nous proposons une interprétation de nos deux modèles expérimentaux basés sur un modèle génératif hiérarchique bien connu, appelé LDA, utilisé dans le contexte de la fouille de données (Blei et al., 2003) et étendu par la suite au cadre des images (Fei-Fei et Perona, 2005). Nous voulons modéliser « la fouille de données par des personnes » dans des textes ou des images, comme une variante de la LDA, en modifiant de manière appropriée le processus génératif et en faisant intervenir un choix aléatoire dans la phase cognitive. L'objectif principal est de prendre en compte le fait que, dans un texte, un mot donné peut être lu ou non. La même problématique survient également dans le cadre d'images, puisqu’une région d'intérêt correspondant à un mot visuel spécifique peut être explorée ou non. Pour cela, une base de données couplant mouvements oculaires et signaux EEG a été également acquise au cours d’une tâche de recherche visuelle, selon un protocole similaire à celui de la tâche de recherche d'information textuelle. Pré-requis: Un diplôme de master ou d’ingénieur est requis. Nous cherchons un(e) candidat(e) avec des compétences solides en probabilités et statistiques ou apprentissage machine, ainsi qu’un intérêt marqué pour les sciences cognitives. Des compétences en Matlab, C++ ou python sont un plus. Financement : Cette thèse est financée par une bourse Persyval de 3 ans, (http://persyval-lab.org/research/action/adm), d’un montant correspondant aux standards français (environ1 400 euros nets/mois), pour commencer le 01/10/2015 au plus tôt. Contexte : Cette recherche sera conduite dans le contexte d’un projet interdisciplinaire impliquant trois laboratoires de recherche (GIPSA-lab, LJK et LPNC) de l’Université de Grenoble Alpes. Ce consortium a une expertise scientifique en statistique, traitement du signal et sciences cognitives, ce qui fournit un environnement scientifique stimulant pour cette thèse. Par ailleurs, Grenoble est une ville où il fait vraiment bon travailler et étudier, la ville étant classée chaque année en tête du classement des meilleures villes en France pour les études. Bibliographie : D. Blei, A. Ng, and M. Jordan. Latent Dirichlet allocation. Journal of Machine Learning Research, 3, 993–1022 (January 2003). L. Fei-Fei and P. Perona. A Bayesian hierarchical model for learning natural scene categories. IEEE Computer vision and Pattern Recognition (2005) A. Frey, G. Ionescu, B. Lemaire, F. Lopez Orozco, T. Baccino and A. Guérin-Dugué. Decision-making in information seeking on texts: an Eye-Fixation-Related Potentials investigation. Frontiers in Systems Neuroscience, 7, pp.Article 39 (2013). B. Obermaier, C. Guger, C. Neuper and G. Pfurtscheller. Hidden Markov models for online classification of single trial EEG data. Pattern Recognition Letters, 22, 1299-1309 (2001). J. Simola, J. Salojärvi and I. Kojo. Using hidden Markov model to uncover processing states from eye movements in information search tasks. Cognitive Systems Research 9(4), 237-251 (October 2008) S. Zhong and J. Ghosh. A New Formulation of Coupled Hidden Markov Models, Technical report, Dept. of Electrical and Computer Eng., Univ. of Texas at Austin (2001)