Ingénieur de recherche en traitement et analyse de bases de

Transcription

Ingénieur de recherche en traitement et analyse de bases de
BAP D Sciences humaines et sociales
Ingénieur de recherche en traitement et analyse de bases de données D1A21
Traitement et analyse de bases de données - IR
Spécialité - Linguistique
Domaine d’application - Corpus numérique, Français médiéval
Mission :
Compétences :
Il/elle a pour mission de pérenniser le développement et la
logistique des corpus de la Base de Français Médiéval et
d'autres corpus numériques, ainsi qu'assister l'animation
d’un consortium international
• Posséder de solides connaissances en linguistique de corpus, philologie numérique
Avoir une expérience avec :
- des outils de TAL : étiqueteurs
morphosyntaxiques et lemmatiseurs ;
- des technologies de feuilles de style XSLT 1.0 et
2.0 ; CSS ;
- des scripts de transformation et d'intégration des
textes (expressions régulières, langages Perl, TCL)
- des moteurs de requêtes de base de données
textuelles (CQP, Stella, XPATH)
- des DTD et Schémas standards (TEI P4 et P5,
usage de Roma )
- des outils d'édition Web (technologie SPIP,
Wikimedia)
• Savoir mettre en pratique les techniques de gestion de
projet
• Animer les participants à la chaîne de numérisation de la
BFM : vacataires ou prestataires (relecture philologique,
balisage XML-TEI, enrichissement linguistique, catalogage)
• Savoir restituer les résultats de ses travaux de manière
adaptée aux finalités et aux différents publics concernés
• Maîtriser l'anglais
Activités :
• Assurer le suivi du projet et des projets de recherche
associés
• Assister la coordination du projet
• Elaborer et mettre à jour la documentation de référence ;
• Gérer et encadrer la chaîne de numérisation,
d'enrichissement et d'intégration des textes à la Base ;
• Organiser la conservation des données (archivage) et les
modes d'accès à la base;
• Conseiller et assister les chercheurs et les étudiants
utilisant les données ;
• Mobiliser et intégrer les apports de différentes branches
de la linguistique et de l'informatique pour enrichir la base
et ses outils d'exploitation ;
• Transférer aux partenaires du consortium et aux
laboratoires les méthodologies et les technologies
développées
• Assurer l’encodage XML des textes selon les
recommandations de la Text Encoding Initiative (TEI);
• Procéder aux annotations linguistiques diverses selon les
projets de recherche ;
• Diffuser et valoriser les réalisations du projet :
• Suivre et participer aux discussions sur les listes de
diffusion
Contexte de travail
L’ingénieur(e) exerce ses activité au sein d’une équipe
regroupant 7 personnes et nécessite une collaboration
étroite avec les partenaires internationaux des projets
(Allemagne, Canada, Etats-Unis, Grande Bretagne, ...).
Exemple d e f ic h e d e p os te i s s u d e l a di ve rs i té d e l a ré alit é d es u n it és d e rech erch e. C e n ’es t p as u n m od èle à rep rod ui r e e n l ’ é ta t.
S o u rce s e xpe rts o bs e r va to i re d es m ét iers et d e l’em p loi s cien t if iq u e C NRS 2 0 0 9
BAP D Sciences humaines et sociales
Ingénieur de recherche en traitement et analyse de bases de données D1A21
Traitement et analyse de bases de données - IR
Spécialité - Linguistique
Domaine d’application - Corpus de textes français médiéval
Mission :
Compétences :
Il/elle a pour mission de pérenniser le développement et la
logistique des corpus de la Base de Français Médiéval
(BFM) et d'autres corpus numériques de l'équipe, ainsi
qu’assister l'animation d’une société savante pour les
Corpus de Français Médiéval (CCFM).
• Posséder des connaissances en linguistique de corpus et
en philologie numérique (édition de manuscrits et d'éditions
critiques) ;
• Savoir utiliser les :
- outils de TAL : étiqueteurs morphosyntaxiques et
lemmatiseurs ;
- technologies de feuilles de style ;
- scripts de transformation et d'intégration des
textes (expressions régulières, langages Perl, TCL) ;
- moteurs de requêtes de base de données
textuelles ;
- DTD et Schémas standard ;
- outils d'édition Web ;
• Savoir mettre en pratique les techniques de gestion de
projet ;
• Animer l’équipe contribuant à la chaîne de numérisation
de la BFM : vacataires ou prestataires (relecture
philologique, balisage, enrichissement linguistique,
catalogage)
• Savoir restituer les résultats de ses travaux de manière
adaptée aux différents publics concernés : chercheurs et
enseignants en linguistique et en littérature, étudiants en
sciences humaines et en informatique, organismes de
financement ;
• Maîtriser l'anglais
Activités :
• Assurer le suivi du projet BFM et des projets de
recherche associés ;
• Assister la coordination du projet ;
• Elaborer et mettre à jour la documentation de référence ;
• Gérer et encadrer la chaîne de numérisation,
d'enrichissement et d'intégration des textes à la Base ;
• Organiser la conservation des données (archivage) et les
modes d'accès à la base (gestion des abonnés) ;
• Conseiller et assister les chercheurs et les étudiants
utilisant les données de la BFM et des corpus des
partenaires ; piloter les formations à l'utilisation de la base ;
• Mobiliser et intégrer les apports de différentes branches
de la linguistique et de l'informatique pour enrichir la BFM
et ses outils d'exploitation ;
• Transférer aux partenaires et aux laboratoires les
méthodologies et les technologies développées ;
• Assurer l’encodage XML des textes selon les
recommandations ;
• Effectuer les annotations linguistiques diverses selon les
projets de recherche ;
• Diffuser et valoriser les réalisations du projet ;
• Editer les sites Web institutionnels de la BFM, animer les
sites de travail collaboratif ;
• Actualiser et renforcer ses connaissances en linguistique
et informatique ;
• Participer aux formations et écoles d'été dans ces
disciplines.
Contexte de travail
Il/elle exerce ses activités au sein d’une équipe de
7 personnes. Ses activités impliquent une collaboration
étroite avec les partenaires du Pôle de Recherche
d'Enseignement Supérieur et les partenaires internationaux
du projet (Allemagne, Canada, Etats-Unis, Grande Bretagne,
etc..).
Exemple d e f ic h e d e p os te i s s u d e l a di ve rs i té d e l a ré alit é d es u n it és d e rech erch e. C e n ’es t p as u n m od èle à rep rod ui r e e n l ’ é ta t.
S o u rce s e xpe rts o bs e r va to i re d es m ét iers et d e l’em p loi s cien t if iq u e C NRS 2 0 0 9
BAP D Sciences humaines et sociales
Ingénieur d’études en traitement et analyse de base de données D2A21
Traitement et analyse de bases de données - IE
Mission :
Compétences :
Il/elle participe à l'édition électronique relative aux
manuscrits et aux archives, en particulier au développement
d'applications XML et de bases de données, à leur mise en
ligne en assurant le lien entre les informaticiens et les
équipes
• Connaissance des sources médiévales
• Connaissance du milieu de l'édition électronique en SHS
• Connaissance des systèmes d'exploitation informatiques
standards, des solutions logicielles, des langages de programmation de base (XML, SQL) et des logiciels afférents
(Oxygen, MySQl...), des DTD en sciences humaines (TEI,
EAD).)
• Connaissance de la réglementation en matière de
détention de données, de stockage et d'usage, de l'éthique
en matière de diffusion de données.
• Maîtriser les méthodes d'analyse de données numériques,
graphiques et autres
• Maîtriser l'anglais
Activités :
• Réaliser le développement d'applications d'édition
électronique innovantes (bases de données et ensembles
documentaires XML,...) : maquettage, spécification,
conception, codage et tests, et assurer leur publication
électronique
• Maintenir les applications d'édition électronique
(diagnostiquer les défauts, les corriger,...) et les faire
évoluer
• Assister chercheurs et équipes dans le choix des
solutions d'édition électronique des bases de données, les
encadrer dans le montage de l'outil, les assister dans leurs
pratiques d'entrée de données
• Définir l'architecture matérielle et logicielle nécessaire, en
collaboration avec les chercheurs, les informaticiens et avec
les spécialistes d'édition électronique de la communauté
scientifique
• Assurer une veille scientifique et technologique en édition
électronique, y participer de manière active
• Encadrer et former les chercheurs à l'édition électronique
et à l'utilisation des applications d'édition électronique
• Promouvoir les outils et applications d'édition
électronique ainsi conçus et publiés
Contexte de travail
Le laboratoire comprenant plusieurs implantations en
France, l'ingénieur(e) sera amené à se déplacer
fréquemment pour travailler avec les différentes équipes.
Il /elle sera placé(e) sous l'autorité directe du directeur
d'unité
Exemple d e f ic h e d e p os te i s s u d e l a di ve rs i té d e l a ré alit é d es u n it és d e rech erch e. C e n ’es t p as u n m od èle à rep rod ui r e e n l ’ é ta t.
S o u rce s e xpe rts o bs e r va to i re d es m ét iers et d e l’em p loi s cien t if iq u e C NRS 2 0 0 9
BAP D Sciences humaines et sociales
Ingénieur d'études en analyse de sources
D2A21
Traitement et analyse de bases de données - IE
Spécialité - Histoire de l’art
Domaine d’application - Corpus iconographique médiéval
Mission :
Contexte de travail
Il/elle a pour mission principale d’assurer la valorisation, la
conservation et la diffusion des collections iconographiques.
Cette mission s’inscrit dans le cadre du pôle documentaire
et plus particulièrement de la Photothèque et de
l'« Inscripthèque ».
Il/elle aura également pour mission de développer un travail
d'indexation, en vue de faire évoluer de façon significative
l'actuelle base de données de la Photothèque.
L’unité participe à un programme dont l'un des objectifs est
de fournir des outils d'aide à l'analyse et à la gestion des
corpus iconographiques. Intégrant la reconnaissance
automatique et l'indexation des images médiévales.
Ces outils doivent ouvrir de nouvelles perspectives de
recherche applicables à de nombreuses disciplines telles
que l'iconographie, l'architecture, la sculpture, l'épigraphie
L’ingénieur(e) exercera son activité sous le contrôle de la
responsable d'équipe de la Photothèque.
Il/elle sera affecté(e) principalement à la Photothèque, qui
dispose actuellement d'un fonds iconographique d'art
roman constitué de 150 000 documents en cours
d'indexation et de numérisation.
Activités :
• Répertorier la bibliographie spécifique au sujet traité,
localiser les sources, les analyser, les identifier et indexer et,
occasionnellement, les numériser.
• Participer à l'élaboration des outils de traitement et les
alimentera - bases de données, thésaurus informatisés, etc.
• Participer à la diffusion des sources auprès de la
communauté scientifique nationale et internationale :
publications personnelles ou collectives, colloques, tables
rondes, etc…
• Co-organiser des manifestations scientifiques auprès
d'un plus large public.
• Assurer le suivi et la gestion des collections
iconographiques
• Conseiller et orienter les chercheurs et étudiants, et
participer le cas échéant à des formations dans le domaine.
Compétences :
• Formation universitaire et scientifique en sciences
humaines,
• Connaissances dans le domaine de l'histoire de l'art et
des sources médiévales.
• Posséder une expérience de recherche dans les
bibliothèques et dans les fonds d'archives.
• Maîtriser la ou les langues anciennes ou modernes du
domaine étudié (ancien français, latin).
• Maîtriser les techniques d'indexation et de méthodes
d'analyse des données iconographiques.
• Maîtrise des logiciels courants de bureautiques ainsi que
des logiciels de traitement de données et d'images.
Exemple d e f ic h e d e p os te i s s u d e l a di ve rs i té d e l a ré alit é d es u n it és d e rech erch e. C e n ’es t p as u n m od èle à rep rod ui r e e n l ’ é ta t.
S o u rce s e xpe rts o bs e r va to i re d es m ét iers et d e l’em p loi s cien t if iq u e C NRS 2 0 0 9