Ingénieur de recherche en traitement et analyse de bases de
Transcription
Ingénieur de recherche en traitement et analyse de bases de
BAP D Sciences humaines et sociales Ingénieur de recherche en traitement et analyse de bases de données D1A21 Traitement et analyse de bases de données - IR Spécialité - Linguistique Domaine d’application - Corpus numérique, Français médiéval Mission : Compétences : Il/elle a pour mission de pérenniser le développement et la logistique des corpus de la Base de Français Médiéval et d'autres corpus numériques, ainsi qu'assister l'animation d’un consortium international • Posséder de solides connaissances en linguistique de corpus, philologie numérique Avoir une expérience avec : - des outils de TAL : étiqueteurs morphosyntaxiques et lemmatiseurs ; - des technologies de feuilles de style XSLT 1.0 et 2.0 ; CSS ; - des scripts de transformation et d'intégration des textes (expressions régulières, langages Perl, TCL) - des moteurs de requêtes de base de données textuelles (CQP, Stella, XPATH) - des DTD et Schémas standards (TEI P4 et P5, usage de Roma ) - des outils d'édition Web (technologie SPIP, Wikimedia) • Savoir mettre en pratique les techniques de gestion de projet • Animer les participants à la chaîne de numérisation de la BFM : vacataires ou prestataires (relecture philologique, balisage XML-TEI, enrichissement linguistique, catalogage) • Savoir restituer les résultats de ses travaux de manière adaptée aux finalités et aux différents publics concernés • Maîtriser l'anglais Activités : • Assurer le suivi du projet et des projets de recherche associés • Assister la coordination du projet • Elaborer et mettre à jour la documentation de référence ; • Gérer et encadrer la chaîne de numérisation, d'enrichissement et d'intégration des textes à la Base ; • Organiser la conservation des données (archivage) et les modes d'accès à la base; • Conseiller et assister les chercheurs et les étudiants utilisant les données ; • Mobiliser et intégrer les apports de différentes branches de la linguistique et de l'informatique pour enrichir la base et ses outils d'exploitation ; • Transférer aux partenaires du consortium et aux laboratoires les méthodologies et les technologies développées • Assurer l’encodage XML des textes selon les recommandations de la Text Encoding Initiative (TEI); • Procéder aux annotations linguistiques diverses selon les projets de recherche ; • Diffuser et valoriser les réalisations du projet : • Suivre et participer aux discussions sur les listes de diffusion Contexte de travail L’ingénieur(e) exerce ses activité au sein d’une équipe regroupant 7 personnes et nécessite une collaboration étroite avec les partenaires internationaux des projets (Allemagne, Canada, Etats-Unis, Grande Bretagne, ...). Exemple d e f ic h e d e p os te i s s u d e l a di ve rs i té d e l a ré alit é d es u n it és d e rech erch e. C e n ’es t p as u n m od èle à rep rod ui r e e n l ’ é ta t. S o u rce s e xpe rts o bs e r va to i re d es m ét iers et d e l’em p loi s cien t if iq u e C NRS 2 0 0 9 BAP D Sciences humaines et sociales Ingénieur de recherche en traitement et analyse de bases de données D1A21 Traitement et analyse de bases de données - IR Spécialité - Linguistique Domaine d’application - Corpus de textes français médiéval Mission : Compétences : Il/elle a pour mission de pérenniser le développement et la logistique des corpus de la Base de Français Médiéval (BFM) et d'autres corpus numériques de l'équipe, ainsi qu’assister l'animation d’une société savante pour les Corpus de Français Médiéval (CCFM). • Posséder des connaissances en linguistique de corpus et en philologie numérique (édition de manuscrits et d'éditions critiques) ; • Savoir utiliser les : - outils de TAL : étiqueteurs morphosyntaxiques et lemmatiseurs ; - technologies de feuilles de style ; - scripts de transformation et d'intégration des textes (expressions régulières, langages Perl, TCL) ; - moteurs de requêtes de base de données textuelles ; - DTD et Schémas standard ; - outils d'édition Web ; • Savoir mettre en pratique les techniques de gestion de projet ; • Animer l’équipe contribuant à la chaîne de numérisation de la BFM : vacataires ou prestataires (relecture philologique, balisage, enrichissement linguistique, catalogage) • Savoir restituer les résultats de ses travaux de manière adaptée aux différents publics concernés : chercheurs et enseignants en linguistique et en littérature, étudiants en sciences humaines et en informatique, organismes de financement ; • Maîtriser l'anglais Activités : • Assurer le suivi du projet BFM et des projets de recherche associés ; • Assister la coordination du projet ; • Elaborer et mettre à jour la documentation de référence ; • Gérer et encadrer la chaîne de numérisation, d'enrichissement et d'intégration des textes à la Base ; • Organiser la conservation des données (archivage) et les modes d'accès à la base (gestion des abonnés) ; • Conseiller et assister les chercheurs et les étudiants utilisant les données de la BFM et des corpus des partenaires ; piloter les formations à l'utilisation de la base ; • Mobiliser et intégrer les apports de différentes branches de la linguistique et de l'informatique pour enrichir la BFM et ses outils d'exploitation ; • Transférer aux partenaires et aux laboratoires les méthodologies et les technologies développées ; • Assurer l’encodage XML des textes selon les recommandations ; • Effectuer les annotations linguistiques diverses selon les projets de recherche ; • Diffuser et valoriser les réalisations du projet ; • Editer les sites Web institutionnels de la BFM, animer les sites de travail collaboratif ; • Actualiser et renforcer ses connaissances en linguistique et informatique ; • Participer aux formations et écoles d'été dans ces disciplines. Contexte de travail Il/elle exerce ses activités au sein d’une équipe de 7 personnes. Ses activités impliquent une collaboration étroite avec les partenaires du Pôle de Recherche d'Enseignement Supérieur et les partenaires internationaux du projet (Allemagne, Canada, Etats-Unis, Grande Bretagne, etc..). Exemple d e f ic h e d e p os te i s s u d e l a di ve rs i té d e l a ré alit é d es u n it és d e rech erch e. C e n ’es t p as u n m od èle à rep rod ui r e e n l ’ é ta t. S o u rce s e xpe rts o bs e r va to i re d es m ét iers et d e l’em p loi s cien t if iq u e C NRS 2 0 0 9 BAP D Sciences humaines et sociales Ingénieur d’études en traitement et analyse de base de données D2A21 Traitement et analyse de bases de données - IE Mission : Compétences : Il/elle participe à l'édition électronique relative aux manuscrits et aux archives, en particulier au développement d'applications XML et de bases de données, à leur mise en ligne en assurant le lien entre les informaticiens et les équipes • Connaissance des sources médiévales • Connaissance du milieu de l'édition électronique en SHS • Connaissance des systèmes d'exploitation informatiques standards, des solutions logicielles, des langages de programmation de base (XML, SQL) et des logiciels afférents (Oxygen, MySQl...), des DTD en sciences humaines (TEI, EAD).) • Connaissance de la réglementation en matière de détention de données, de stockage et d'usage, de l'éthique en matière de diffusion de données. • Maîtriser les méthodes d'analyse de données numériques, graphiques et autres • Maîtriser l'anglais Activités : • Réaliser le développement d'applications d'édition électronique innovantes (bases de données et ensembles documentaires XML,...) : maquettage, spécification, conception, codage et tests, et assurer leur publication électronique • Maintenir les applications d'édition électronique (diagnostiquer les défauts, les corriger,...) et les faire évoluer • Assister chercheurs et équipes dans le choix des solutions d'édition électronique des bases de données, les encadrer dans le montage de l'outil, les assister dans leurs pratiques d'entrée de données • Définir l'architecture matérielle et logicielle nécessaire, en collaboration avec les chercheurs, les informaticiens et avec les spécialistes d'édition électronique de la communauté scientifique • Assurer une veille scientifique et technologique en édition électronique, y participer de manière active • Encadrer et former les chercheurs à l'édition électronique et à l'utilisation des applications d'édition électronique • Promouvoir les outils et applications d'édition électronique ainsi conçus et publiés Contexte de travail Le laboratoire comprenant plusieurs implantations en France, l'ingénieur(e) sera amené à se déplacer fréquemment pour travailler avec les différentes équipes. Il /elle sera placé(e) sous l'autorité directe du directeur d'unité Exemple d e f ic h e d e p os te i s s u d e l a di ve rs i té d e l a ré alit é d es u n it és d e rech erch e. C e n ’es t p as u n m od èle à rep rod ui r e e n l ’ é ta t. S o u rce s e xpe rts o bs e r va to i re d es m ét iers et d e l’em p loi s cien t if iq u e C NRS 2 0 0 9 BAP D Sciences humaines et sociales Ingénieur d'études en analyse de sources D2A21 Traitement et analyse de bases de données - IE Spécialité - Histoire de l’art Domaine d’application - Corpus iconographique médiéval Mission : Contexte de travail Il/elle a pour mission principale d’assurer la valorisation, la conservation et la diffusion des collections iconographiques. Cette mission s’inscrit dans le cadre du pôle documentaire et plus particulièrement de la Photothèque et de l'« Inscripthèque ». Il/elle aura également pour mission de développer un travail d'indexation, en vue de faire évoluer de façon significative l'actuelle base de données de la Photothèque. L’unité participe à un programme dont l'un des objectifs est de fournir des outils d'aide à l'analyse et à la gestion des corpus iconographiques. Intégrant la reconnaissance automatique et l'indexation des images médiévales. Ces outils doivent ouvrir de nouvelles perspectives de recherche applicables à de nombreuses disciplines telles que l'iconographie, l'architecture, la sculpture, l'épigraphie L’ingénieur(e) exercera son activité sous le contrôle de la responsable d'équipe de la Photothèque. Il/elle sera affecté(e) principalement à la Photothèque, qui dispose actuellement d'un fonds iconographique d'art roman constitué de 150 000 documents en cours d'indexation et de numérisation. Activités : • Répertorier la bibliographie spécifique au sujet traité, localiser les sources, les analyser, les identifier et indexer et, occasionnellement, les numériser. • Participer à l'élaboration des outils de traitement et les alimentera - bases de données, thésaurus informatisés, etc. • Participer à la diffusion des sources auprès de la communauté scientifique nationale et internationale : publications personnelles ou collectives, colloques, tables rondes, etc… • Co-organiser des manifestations scientifiques auprès d'un plus large public. • Assurer le suivi et la gestion des collections iconographiques • Conseiller et orienter les chercheurs et étudiants, et participer le cas échéant à des formations dans le domaine. Compétences : • Formation universitaire et scientifique en sciences humaines, • Connaissances dans le domaine de l'histoire de l'art et des sources médiévales. • Posséder une expérience de recherche dans les bibliothèques et dans les fonds d'archives. • Maîtriser la ou les langues anciennes ou modernes du domaine étudié (ancien français, latin). • Maîtriser les techniques d'indexation et de méthodes d'analyse des données iconographiques. • Maîtrise des logiciels courants de bureautiques ainsi que des logiciels de traitement de données et d'images. Exemple d e f ic h e d e p os te i s s u d e l a di ve rs i té d e l a ré alit é d es u n it és d e rech erch e. C e n ’es t p as u n m od èle à rep rod ui r e e n l ’ é ta t. S o u rce s e xpe rts o bs e r va to i re d es m ét iers et d e l’em p loi s cien t if iq u e C NRS 2 0 0 9