DOCTEUR EN INFORMATIQUE
Transcription
DOCTEUR EN INFORMATIQUE
Najeh HAJLAOUI Chargé de recherche postdoctorale à l’université de Wolverhampton Mobile: + 33 (0)6 62 20 66 49 Mel : [email protected] Site Web : http://www-clips.imag.fr/geta/User/najeh.hajlaoui/ DOCTEUR EN INFORMATIQUE Maîtrise de l’activité d’enseignement en informatique Expériences en Traitement Automatique des Langues Naturelles et Traduction Automatique Sens du travail en équipe Quadrilingue (arabe, français, anglais, italien) EXPERIENCES & FORMATIONS 01/2011aujourd’hui Chargé de recherche postdoctorale à l’université de Wolverhampton Angleterre « Estimation de l’adéquation de la traduction statistique Arabe – anglais, projet GALE, financé par DARPA, comme partenaire de l’équipe IBM New York, USA ». Juin 2011 Chercheur invité à l’université de Qatar - Doha « Collaboration autour du traitement de la langue Arabe et préparation d’une proposition de projet à soumettre ». 12/2009-11/2010 Postdoctorat à France Télécom R&D Lannion « Acquisition de terminologie adéquate par extension multiniveau de corpus applicatif ». Juillet 2010 Chercheur invité au NII « National Institute of Informatics » à Tokyo au Japon « Expérimentation systématique de l'utilité de systèmes de traduction statistique ». 2007-2009 Poste ATER à l’UJM « Université Jean Monnet », ISEAG « Institut Supérieur d'Economie, d'Administration et de Gestion » à Saint Etienne. Chercheur au LHC « Laboratoire Hubert Curien » à Saint Etienne « Classification supervisée de documents basée sur les liens interdocuments ». 2003- 2009 Chercheur au laboratoire LIG « Laboratoire Informatique Grenoble » Équipe GETALP « Groupe d’Etude en Traduction/Traitement Automatique des Langues et de la Parole»- à Grenoble. Court Postdoctorat 3 mois « Évaluation liée à la tâche du portage linguistique des systèmes de gestion de contenu ». Doctorat en informatique « Multilinguïsation de systèmes de ecommerce traitant des énoncés spontanés en langue naturelle » à l’UJF « Université Joseph Fourier » - Grenoble 1 sous la direction du Professeur Christian BOITET. Thèse sélectionnée et publiée par les Editions Universitaires Européennes. 1/7 2001-2002 Diplôme d’Etudes Approfondies (DEA) "système d'information" à l’université Joseph Fourier – Grenoble : mention assez bien. Diplôme Européen MATIS (Management And Technology of Information Systems) à l’université de Genève et l’université de Lausanne en Suisse, Université Joseph Fourier (UJF) - Grenoble, université de Savoie - Annecy en France : mention assez bien. Stage de DEA au laboratoire CSI « Conception des Circuits Intégrés » à Grenoble, projet de recherche de 10 mois sous la direction du Professeur Gabrielle SAUCIER : « Echange de composants électroniques virtuels via Intranet / Internet ». 1996-2000 Enseignement supérieur : maîtrise informatique à la faculté des sciences de Monastir - Tunisie, mention assez bien. Stage de PFE « Projet de Fin d’Etudes », 5 mois dans la Société Industrielle de TEXtiles « SITEX » à Sousse-Tunisie : « GPAO : Gestion de Production Assisté par Ordinateur ». Stage d’été : 2 mois à l’ATS ( Advanced Technical of informatique Systems) Sidi Bouzid - Tunisie. 1989-1996 Enseignement secondaire, Baccalauréat mathématique au Lycée Lessouda Sidi-Bouzid Tunisie : mention passable. ACTIVITES DE RECHERCHES Centres d’intérêts Domaines : TALN « Traitement Automatique des Langues Naturelles », TA « Traduction Automatique », Multilinguisme, Localisation… Traitement Autmatique de la Langue Arabe. Multilinguïsation de systèmes de gestion de contenu traitant des énoncés spontanés en langue naturelle. • Génération de corpus réels (corpus naturel) pour le test et la construction de systèmes de TA statistique. • Traitement automatique des sous-langages. • Traduction Automatique en particulier statistique. • Gestion de corpus multilingues. • Acquisition de corpus adéquats. • Extraction d’information • Classification des documents Mots clés : énoncés spontanés, langue naturelle, e-commerce, portage linguistique, sous-langage, extraction de contenu, traduction statistique, acquisition de corpus, analyse de corpus, acquisition de corpus. • • Encadrement 9 stagiaires : • 2009-2010 : Prem-Kumar CASIMIR, Master 2 informatique « Évaluation des outils d’acquisition de terminologie dans une application multimédia », Université Pierre et Marie Curie Jussieu, Paris VI. 2/7 • • • • • • • Publications 2008-2009 : Xiang YIN, TER « Évaluation liée à la tâche de systèmes de gestion de contenu », UJF « Université Joseph Fourier ». 2007-2008 : Sana HAJLAOUI, Imen YOUSFI, PFE « Recherche d’Information dans une Bibliothèque Numérique, Multilingue, et Multilmédia », ISIMS « Institut Supérieur d’Informatique et de Multimédia de Sfax» 2007-2008 : Houssem ZAIR, TER « évaluation interne et externe du portage linguistique d’un système de traitement de contenu », UJF « Université Joseph Fourier ». 2004-2005 : Yan WANG, TER « évaluation des aides aux traducteurs, en local et sur le Web, et première étude d’UNL », UJF « Université Joseph Fourier ». 2003-2004 : Mélanie PINEAU, TER « Comparaison de résultats de traduction (automatique ou non) », UJF « Université Joseph Fourier ». 2002-2003 : Song ZHICHAO, TER « Traduction de corpus de phrases parallèles », UJF « Université Joseph Fourier ». 2002-2003 : Kamel AMIROU, TER « Système d’aide a la traduction humaine assistée par machine », UJF « Université Joseph Fourier ». Un article de livre, 1 revue internationale, 17 conférences internationales (MT-Summit, COLING x 2, EGC x 3, IBIMA x 2, LREC, TOTh x 2, NLDB, MEDES, etc). Article de livre • Hajlaoui, N. and C. Boitet (2003), A "pivot" XML-based architecture for multilingual, multiversion documents : parallel monolingual documents aligned through a central correspondence descriptor and possible use of UNL. Convergences ’03, Alexandria, 2-6 December 2003. 8p. (http://www.cicling.org/2005/UNL-book/) Revues internationales • Hajlaoui, N. (2011). Automatic Acquisition of Corpus for Multimedia Applications. Journal of CIBIMA (Communications of International Business Information Management Association). Volume 2011 (2011), Article ID 254926, 12 p. (http://www.ibimapublishing.com/journals/CIBIMA/2011/254926/a254926.html) Conférences internationales • • Specia, L., Hajlaoui, N., Hallett, C. and Aziz, W. (2011) Predicting Machine Translation Adequacy. Proc. Machine Translation Summit XIII. Xiamen, China. 19-23 September 2011. 8 p. Hajlaoui, N. (2011). Système de recherche de musique adaptable à la perception de chaque utilisateur. Proc. EGC-2011_Demos. Démonstration de logiciels dans la 11ème Conférence Internationale Francophone sur l'Extraction et la Gestion des Connaissances. Brest, France. 25-28 janvier 2011. 3 p. 3/7 • • • • • • • • • • • • Hajlaoui, N. (2011). Extraction d’information à partir des SMS. Proc. EGC-2011 (11ème Conférence Internationale Francophone sur l'Extraction et la Gestion des Connaissances). Atelier SoS'2011 (Sources ouvertes et services). Brest, France. 25-28-janvier 2011. 10 p. Hajlaoui, N. (2011). Acquisition de terminologie adéquate par extension multiniveau de corpus. Proc. EGC-2011. (11ème Conférence Internationale Francophone sur l'Extraction et la Gestion des Connaissances) Atelier QDC'2011 (Qualité des Données et des Connaissances). Brest, France. 25-28-janvier 2011. 12 p. Hajlaoui, N. (2010). Extension multiniveau de corpus applicatif. Proc. IBIMA (15th International Business Information Management Association) Conference. Caire, Egypt. 6-7 Novembre 2010. 11 p. Hajlaoui, N. and C. Boitet (2010). Multilinguization and Personalization of NL-based Systems. Proc. COLING Workshop CLIA (Cross Lingual Information Access). Chine, août 23-28, 2010. 9 p. Hajlaoui, N. (2009). End to end evaluation of Impression based Music retrieval service. Proc. ACM MEDES'09 (The international ACM Conference on Management of Emergent Digital EcoSystems). Lyon, France. October 27-30, 2009. 5 p. Hajlaoui, N. and C. Boitet (2009). Portage linguistique de l’arabe et vers l’arabe. Proc. Infol@ngues III 2009 Conférence sur l’informatique et les langues. Tabarka, Tunisie. 20-21 février 2009. 10 p. Hajlaoui, N. and C. Boitet (2008). TA statistique à petits corpus pour des petits sous-langages. Proc. TOTh 2008 Conférence sur la Terminologie & Ontologie : Théories et Applications. Annecy, France. 5-6 juin 2008. 15 p. Hajlaoui, N., D. M. Daoud, et al. (2008). Methods for porting NLbased restricted e-commerce systems into other languages. Proc. LREC 2008 (Language Resources and Evaluation Conference). Marrakech, Maroc. june 26-31, 2008. 7 p. Hajlaoui, N. (2007), Multilinguïsation de services de gestion de contenu. Proc. IC (Ingénierie des Connaissances) dans le cadre de la plate-forme AFIA (Association Française pour l’Intelligence Artificielle), France, Grenoble 2-6 juillet 2007. Hajlaoui, N. (2007), Localizing content management application for spontaneous textual utterances in natural language, Proc. NLDB (12th international conference on Applications of Natural Language to Information Systems) France, Paris 27-29 juin 2007. Hajlaoui, N. and C. Boitet (2007). Portage linguistique d'applications de gestion de contenu. Proc. TOTh 2007 Conférence sur la Terminologie & Ontologie : Théories et Applications. Annecy, France. 1 juin 2007. 13 p. Hajlaoui, N. (2006). Recherche et production de corpus de messages pour la multilinguisation de sites de e-commerce en SMS, initialement en arabe. Proc. IBIMA (6th International Business Management Information Association) Conference. Bonn, Allemagne. 5-6 juin 2006. 11 p. 4/7 • • • Membre du comité scientifique Hajlaoui, N. (2006), PolyphraZ, un outil pour la gestion de corpus multilingues parallèles à travers le web, CALS (Colloque international d’Albi Langages et Signification), France, Albi, 10-14 juillet 2006. Hajlaoui, N. and C. Boitet (2004). PolyphraZ: a tool for the quantitaive and subjective evaluation of parallel corpora. Proc. IWSLT 2004: International Workshop on Spoken Language Translation. Kyoto, Japan. September 30–October 01, 2004. 8p. Hajlaoui, N. and C. Boitet (2004), PolyphraZ : a tool for the management of parallel corpora. Proc. COLING Workshop MLR2004 (on Multilingual Linguistic Resources). Geneva. August 28th 2004. 8p. RANLP 2011, RANLP SRW 2011 TALN 2010, TALN 2011. IBIMA 2010, IBIMA 2011. LREC 2010, workshop sur les langues sémitiques. CORIA 2010. COSI 2010 • • • • • • ENSEIGNEMENTS : 636 H TD 2009-2010 Chargé de cours, à l’école privée « Sup2i » Grenoble : 16 H de cours. • 2008-2009 ATER à l’UJM, ISEAG à Saint Etienne : 96 h TD • 2007-2008 Cours et TD outils et logiciels, Licence 1 Economie et gestion : 96 h de TD ATER à l’UJM, ISEAG à Saint Etienne : 96 h TD • • 2003-2007 Module « systèmes à temps réel et embarqués» : 16 H cours. Cours et TD systèmes d’informations et base de données, Master 1 Economie et Management : 48 h de TD . Cours et TD technologies Web, outils et langages : licence AES « Administration Economique et Sociale : 48 h de TD. Chargé d’enseignement vacataire à l’UPMF « Université Pierre Mendès France », Grenoble 2 : 428 h TD • • Initiation en informatique, logiciels de bureautiques, notions théoriques de base sur les réseaux et les bases de données, DEUG psychologie : 146 h de TD = (56 h de TD en 02/03 + 90 h de TD en 03/04) Conception et définition du programme d’un cours « informatique et documentation » : DEUG sociologie (96 h de C/TD = (32 h de TD en 02/03 + 64 h de TD en 03/04)), Licence première année (L1) sociologie (120 h de C/TD en 04/05) 5/7 • • TD d’animation et de gestion d’application Web dynamique et base de données (XHTML/CSS/PHP5/Postgres), Licence Professionnelle SIL « Systèmes Informatiques et Logiciels » à l’IUT2 (18 h de TD) Enseignement à distance (e-learning) : C2I « Certificat Informatique et Internet » à l’UPMF (48 h de TD) CHARGES COLLECTIVES 2011-2012 Soumission de projet : suite à mon séjour, en tant que chercheur invité à l’université de Qatar, une proposition de projet est encours de soumission. 2004-2006 Fonction élective : représentant élu de tout les doctorants au conseil du laboratoire CLIPS nommé actuellement LIG. 2003-2004 Responsable de proposition de projet : dans le cadre d’un projet interne à l’équipe GETA, TraCorpeX « Traduction de Corpus d’eXemples », préparation et soumission de deux propositions de projets dans le cadre de la coopération franco-tunisienne CMCU « Comité Mixte de Coopération Universitaire ». 2003Aujourd’hui Membre élu du CA « Conseil d’Administration » de l’association Champollion, association pour soutenir la recherche en TALN et TA. COMPETENCES SCIENTIFIQUES COMPETENCES Systèmes : Windows, Linux, Unix, Mac Os X. INFORMATIQUE Environnements : Visual BASIC 6, Visual C++ 6, AMC*Designer 6, Developer 2000. SGBD : ORACLE 7-8, MYSQL, ACCESS. POSTGRES… Langages : C/C++, SQL, XML, HTML,XHTML, Xpath, CSS, PHP, Java, Java script, Visual Basic, Prolog, Perl, TclTk… Architecture : Enhydra/Postgres, PHP/MySQL/Postgres Méthodes : UML, MERISE. Langage Spécialisé pour la Programmation Linguistique (LSPL) : EnCo (environnement d’EnConversion), et DeCo (environnement de Déconversion) : deux LSPL diffusés par le centre UNL « Universal Networking Language » de Tokyo). LANGUES MAITRISEES Arabe : Langue maternelle Français : bilingue Anglais : Lu (bien), parlé (bien), écrit (bien) Italien : Lu (faible), parlé (faible), écrit (faible) 6/7 INFORMATIONS COMPLEMENTAIRES ETAT CIVIL Date de naissance : 21/01/1978 Nationalité : Tunisienne, Française Permis de conduire : catégorie B État civil : célibataire CENTRE D’INTERET Sport : Football, Voyages Nouvelles technologies PROJETS OBJECTIFS A COURT TERME Finir mon expérience de chargé de recherche à l’étranger. OBJECTIFS A MOYEN TERME Affiner les technologies de portage linguistiques sur lesquelles j’ai travaillé dans ma thèse doctorat. Poursuite des recherches sur les types de sous-languages pour lesquels il est possible de développer des systèmes de traduction automatique statistiques efficaces (utilisables) dans le contexte des applications d’extraction de contenu à partir des énoncés spontanés. OBJECTIFS A LONG TERME Rejoindre et intégrer un établissement offrant un environnement de recherche et/ou de développement adéquat. 7/7