DOCTEUR EN INFORMATIQUE

Transcription

DOCTEUR EN INFORMATIQUE
Najeh HAJLAOUI
Chargé de recherche postdoctorale à l’université de Wolverhampton
Mobile: + 33 (0)6 62 20 66 49
Mel : [email protected]
Site Web : http://www-clips.imag.fr/geta/User/najeh.hajlaoui/
DOCTEUR EN INFORMATIQUE
 Maîtrise de l’activité d’enseignement en informatique
 Expériences en Traitement Automatique des Langues Naturelles et
Traduction Automatique
 Sens du travail en équipe
 Quadrilingue (arabe, français, anglais, italien)
EXPERIENCES & FORMATIONS
01/2011aujourd’hui
Chargé de recherche postdoctorale à l’université de Wolverhampton Angleterre « Estimation de l’adéquation de la traduction statistique
Arabe – anglais, projet GALE, financé par DARPA, comme partenaire de
l’équipe IBM New York, USA ».
Juin 2011
Chercheur invité à l’université de Qatar - Doha « Collaboration autour
du traitement de la langue Arabe et préparation d’une proposition de
projet à soumettre ».
12/2009-11/2010
Postdoctorat à France Télécom R&D Lannion « Acquisition de
terminologie adéquate par extension multiniveau de corpus applicatif ».
Juillet 2010
Chercheur invité au NII « National Institute of Informatics » à Tokyo au
Japon « Expérimentation systématique de l'utilité de systèmes de
traduction statistique ».
2007-2009
Poste ATER à l’UJM « Université Jean Monnet », ISEAG « Institut
Supérieur d'Economie, d'Administration et de Gestion » à Saint Etienne.
Chercheur au LHC « Laboratoire Hubert Curien » à Saint Etienne
« Classification supervisée de documents basée sur les liens interdocuments ».
2003- 2009
Chercheur au laboratoire LIG « Laboratoire Informatique Grenoble »
Équipe GETALP « Groupe d’Etude en Traduction/Traitement
Automatique des Langues et de la Parole»- à Grenoble.
Court Postdoctorat 3 mois « Évaluation liée à la tâche du portage
linguistique des systèmes de gestion de contenu ».
Doctorat en informatique « Multilinguïsation de systèmes de ecommerce traitant des énoncés spontanés en langue naturelle » à l’UJF
« Université Joseph Fourier » - Grenoble 1 sous la direction du
Professeur Christian BOITET. Thèse sélectionnée et publiée par les
Editions Universitaires Européennes.
1/7
2001-2002
Diplôme d’Etudes Approfondies (DEA) "système d'information" à
l’université Joseph Fourier – Grenoble : mention assez bien.
Diplôme Européen MATIS (Management And Technology of
Information Systems) à l’université de Genève et l’université de Lausanne
en Suisse, Université Joseph Fourier (UJF) - Grenoble, université de
Savoie - Annecy en France : mention assez bien.
Stage de DEA au laboratoire CSI « Conception des Circuits
Intégrés » à Grenoble, projet de recherche de 10 mois sous la direction
du Professeur Gabrielle SAUCIER : « Echange de composants
électroniques virtuels via Intranet / Internet ».
1996-2000
Enseignement supérieur : maîtrise informatique à la faculté des sciences
de Monastir - Tunisie, mention assez bien.
Stage de PFE « Projet de Fin d’Etudes », 5 mois dans la Société
Industrielle de TEXtiles « SITEX » à Sousse-Tunisie : « GPAO : Gestion
de Production Assisté par Ordinateur ».
Stage d’été : 2 mois à l’ATS ( Advanced Technical of informatique
Systems) Sidi Bouzid - Tunisie.
1989-1996
Enseignement secondaire, Baccalauréat mathématique au Lycée
Lessouda Sidi-Bouzid Tunisie : mention passable.
ACTIVITES DE RECHERCHES
Centres
d’intérêts
Domaines : TALN « Traitement Automatique des Langues Naturelles », TA
« Traduction Automatique », Multilinguisme, Localisation…
Traitement Autmatique de la Langue Arabe.
Multilinguïsation de systèmes de gestion de contenu traitant des
énoncés spontanés en langue naturelle.
• Génération de corpus réels (corpus naturel) pour le test et la
construction de systèmes de TA statistique.
• Traitement automatique des sous-langages.
• Traduction Automatique en particulier statistique.
• Gestion de corpus multilingues.
• Acquisition de corpus adéquats.
• Extraction d’information
• Classification des documents
Mots clés : énoncés spontanés, langue naturelle, e-commerce, portage
linguistique, sous-langage, extraction de contenu, traduction statistique,
acquisition de corpus, analyse de corpus, acquisition de corpus.
•
•
Encadrement
9 stagiaires :
•
2009-2010 : Prem-Kumar CASIMIR, Master 2 informatique
« Évaluation des outils d’acquisition de terminologie dans une
application multimédia », Université Pierre et Marie Curie Jussieu,
Paris VI.
2/7
•
•
•
•
•
•
•
Publications
2008-2009 : Xiang YIN, TER « Évaluation liée à la tâche de
systèmes de gestion de contenu », UJF « Université Joseph
Fourier ».
2007-2008 : Sana HAJLAOUI, Imen YOUSFI, PFE « Recherche
d’Information dans une Bibliothèque Numérique, Multilingue, et
Multilmédia », ISIMS « Institut Supérieur d’Informatique et de
Multimédia de Sfax»
2007-2008 : Houssem ZAIR, TER « évaluation interne et externe
du portage linguistique d’un système de traitement de contenu »,
UJF « Université Joseph Fourier ».
2004-2005 : Yan WANG, TER « évaluation des aides aux
traducteurs, en local et sur le Web, et première étude d’UNL », UJF
« Université Joseph Fourier ».
2003-2004 : Mélanie PINEAU, TER « Comparaison de résultats de
traduction (automatique ou non) », UJF « Université Joseph
Fourier ».
2002-2003 : Song ZHICHAO, TER « Traduction de corpus de
phrases parallèles », UJF « Université Joseph Fourier ».
2002-2003 : Kamel AMIROU, TER « Système d’aide a la
traduction humaine assistée par machine », UJF « Université Joseph
Fourier ».
Un article de livre, 1 revue internationale, 17 conférences internationales
(MT-Summit, COLING x 2, EGC x 3, IBIMA x 2, LREC, TOTh x 2, NLDB,
MEDES, etc).
Article de livre
•
Hajlaoui, N. and C. Boitet (2003), A "pivot" XML-based
architecture for multilingual, multiversion documents : parallel
monolingual documents aligned through a central correspondence
descriptor and possible use of UNL. Convergences ’03, Alexandria,
2-6 December 2003. 8p. (http://www.cicling.org/2005/UNL-book/)
Revues internationales
•
Hajlaoui, N. (2011). Automatic Acquisition of Corpus for
Multimedia Applications. Journal of CIBIMA (Communications of
International Business Information Management Association).
Volume
2011
(2011),
Article
ID
254926,
12 p.
(http://www.ibimapublishing.com/journals/CIBIMA/2011/254926/a254926.html)
Conférences internationales
•
•
Specia, L., Hajlaoui, N., Hallett, C. and Aziz, W. (2011) Predicting
Machine Translation Adequacy. Proc. Machine Translation Summit
XIII. Xiamen, China. 19-23 September 2011. 8 p.
Hajlaoui, N. (2011). Système de recherche de musique adaptable à
la perception de chaque utilisateur. Proc. EGC-2011_Demos.
Démonstration de logiciels dans la 11ème Conférence
Internationale Francophone sur l'Extraction et la Gestion des
Connaissances. Brest, France. 25-28 janvier 2011. 3 p.
3/7
•
•
•
•
•
•
•
•
•
•
•
•
Hajlaoui, N. (2011). Extraction d’information à partir des SMS.
Proc. EGC-2011 (11ème Conférence Internationale Francophone
sur l'Extraction et la Gestion des Connaissances). Atelier SoS'2011
(Sources ouvertes et services). Brest, France. 25-28-janvier 2011.
10 p.
Hajlaoui, N. (2011). Acquisition de terminologie adéquate par
extension multiniveau de corpus. Proc. EGC-2011. (11ème
Conférence Internationale Francophone sur l'Extraction et la
Gestion des Connaissances) Atelier QDC'2011 (Qualité des
Données et des Connaissances). Brest, France. 25-28-janvier 2011.
12 p.
Hajlaoui, N. (2010). Extension multiniveau de corpus applicatif.
Proc. IBIMA (15th International Business Information Management
Association) Conference. Caire, Egypt. 6-7 Novembre 2010. 11 p.
Hajlaoui, N. and C. Boitet (2010). Multilinguization and
Personalization of NL-based Systems. Proc. COLING Workshop
CLIA (Cross Lingual Information Access). Chine, août 23-28,
2010. 9 p.
Hajlaoui, N. (2009). End to end evaluation of Impression based
Music retrieval service. Proc. ACM MEDES'09 (The international
ACM Conference on Management of Emergent Digital
EcoSystems). Lyon, France. October 27-30, 2009. 5 p.
Hajlaoui, N. and C. Boitet (2009). Portage linguistique de l’arabe
et vers l’arabe. Proc. Infol@ngues III 2009 Conférence sur
l’informatique et les langues. Tabarka, Tunisie. 20-21 février 2009.
10 p.
Hajlaoui, N. and C. Boitet (2008). TA statistique à petits corpus
pour des petits sous-langages. Proc. TOTh 2008 Conférence sur la
Terminologie & Ontologie : Théories et Applications. Annecy,
France. 5-6 juin 2008. 15 p.
Hajlaoui, N., D. M. Daoud, et al. (2008). Methods for porting NLbased restricted e-commerce systems into other languages. Proc.
LREC 2008 (Language Resources and Evaluation Conference).
Marrakech, Maroc. june 26-31, 2008. 7 p.
Hajlaoui, N. (2007), Multilinguïsation de services de gestion de
contenu. Proc. IC (Ingénierie des Connaissances) dans le cadre de la
plate-forme AFIA (Association Française pour l’Intelligence
Artificielle), France, Grenoble 2-6 juillet 2007.
Hajlaoui, N. (2007), Localizing content management application
for spontaneous textual utterances in natural language, Proc.
NLDB (12th international conference on Applications of Natural
Language to Information Systems) France, Paris 27-29 juin 2007.
Hajlaoui, N. and C. Boitet (2007). Portage linguistique
d'applications de gestion de contenu. Proc. TOTh 2007 Conférence
sur la Terminologie & Ontologie : Théories et Applications.
Annecy, France. 1 juin 2007. 13 p.
Hajlaoui, N. (2006). Recherche et production de corpus de
messages pour la multilinguisation de sites de e-commerce en SMS,
initialement en arabe. Proc. IBIMA (6th International Business
Management Information Association) Conference. Bonn,
Allemagne. 5-6 juin 2006. 11 p.
4/7
•
•
•
Membre du
comité
scientifique
Hajlaoui, N. (2006), PolyphraZ, un outil pour la gestion de corpus
multilingues parallèles à travers le web, CALS (Colloque
international d’Albi Langages et Signification), France, Albi, 10-14
juillet 2006.
Hajlaoui, N. and C. Boitet (2004). PolyphraZ: a tool for the
quantitaive and subjective evaluation of parallel corpora. Proc.
IWSLT 2004: International Workshop on Spoken Language
Translation. Kyoto, Japan. September 30–October 01, 2004. 8p.
Hajlaoui, N. and C. Boitet (2004), PolyphraZ : a tool for the
management of parallel corpora. Proc. COLING Workshop
MLR2004 (on Multilingual Linguistic Resources). Geneva. August
28th 2004. 8p.
RANLP 2011, RANLP SRW 2011
TALN 2010, TALN 2011.
IBIMA 2010, IBIMA 2011.
LREC 2010, workshop sur les langues sémitiques.
CORIA 2010.
COSI 2010
•
•
•
•
•
•
ENSEIGNEMENTS : 636 H TD
2009-2010
Chargé de cours, à l’école privée « Sup2i » Grenoble : 16 H de cours.
•
2008-2009
ATER à l’UJM, ISEAG à Saint Etienne : 96 h TD
•
2007-2008
Cours et TD outils et logiciels, Licence 1 Economie et gestion :
96 h de TD
ATER à l’UJM, ISEAG à Saint Etienne : 96 h TD
•
•
2003-2007
Module « systèmes à temps réel et embarqués» : 16 H cours.
Cours et TD systèmes d’informations et base de données,
Master 1 Economie et Management : 48 h de TD .
Cours et TD technologies Web, outils et langages : licence AES
« Administration Economique et Sociale : 48 h de TD.
Chargé d’enseignement vacataire à l’UPMF « Université Pierre
Mendès France », Grenoble 2 : 428 h TD
•
•
Initiation en informatique, logiciels de bureautiques, notions
théoriques de base sur les réseaux et les bases de données,
DEUG psychologie : 146 h de TD = (56 h de TD en 02/03 + 90
h de TD en 03/04)
Conception et définition du programme d’un cours «
informatique et documentation » : DEUG sociologie (96 h de
C/TD = (32 h de TD en 02/03 + 64 h de TD en 03/04)), Licence
première année (L1) sociologie (120 h de C/TD en 04/05)
5/7
•
•
TD d’animation et de gestion d’application Web dynamique et
base de données (XHTML/CSS/PHP5/Postgres),
Licence
Professionnelle SIL « Systèmes Informatiques et Logiciels » à
l’IUT2 (18 h de TD)
Enseignement à distance (e-learning) : C2I « Certificat
Informatique et Internet » à l’UPMF (48 h de TD)
CHARGES COLLECTIVES
2011-2012
Soumission de projet : suite à mon séjour, en tant que chercheur invité à
l’université de Qatar, une proposition de projet est encours de soumission.
2004-2006
Fonction élective : représentant élu de tout les doctorants au conseil du
laboratoire CLIPS nommé actuellement LIG.
2003-2004
Responsable de proposition de projet : dans le cadre d’un projet interne
à l’équipe GETA, TraCorpeX « Traduction de Corpus d’eXemples »,
préparation et soumission de deux propositions de projets dans le cadre de
la coopération franco-tunisienne CMCU « Comité Mixte de Coopération
Universitaire ».
2003Aujourd’hui
Membre élu du CA « Conseil d’Administration » de l’association
Champollion, association pour soutenir la recherche en TALN et TA.
COMPETENCES SCIENTIFIQUES
COMPETENCES Systèmes : Windows, Linux, Unix, Mac Os X.
INFORMATIQUE Environnements : Visual BASIC 6, Visual C++ 6, AMC*Designer 6,
Developer 2000.
SGBD : ORACLE 7-8, MYSQL, ACCESS. POSTGRES…
Langages : C/C++, SQL, XML, HTML,XHTML, Xpath, CSS, PHP,
Java, Java script, Visual Basic, Prolog, Perl, TclTk…
Architecture : Enhydra/Postgres, PHP/MySQL/Postgres
Méthodes : UML, MERISE.
Langage Spécialisé pour la Programmation Linguistique (LSPL) :
EnCo (environnement d’EnConversion), et DeCo (environnement de
Déconversion) : deux LSPL diffusés par le centre UNL « Universal
Networking Language » de Tokyo).
LANGUES
MAITRISEES
Arabe : Langue maternelle
Français : bilingue
Anglais : Lu (bien), parlé (bien), écrit (bien)
Italien : Lu (faible), parlé (faible), écrit (faible)
6/7
INFORMATIONS COMPLEMENTAIRES
ETAT CIVIL
Date de naissance : 21/01/1978
Nationalité : Tunisienne, Française
Permis de conduire : catégorie B
État civil : célibataire
CENTRE
D’INTERET
Sport : Football,
Voyages
Nouvelles technologies
PROJETS
OBJECTIFS A
COURT TERME
 Finir mon expérience de chargé de recherche à l’étranger.
OBJECTIFS A
MOYEN TERME
 Affiner les technologies de portage linguistiques sur lesquelles
j’ai travaillé dans ma thèse doctorat.
 Poursuite des recherches sur les types de sous-languages pour
lesquels il est possible de développer des systèmes de traduction
automatique statistiques efficaces (utilisables) dans le contexte
des applications d’extraction de contenu à partir des énoncés
spontanés.
OBJECTIFS A
LONG TERME
 Rejoindre et intégrer un établissement offrant un environnement
de recherche et/ou de développement adéquat.
7/7