Projet à déposer au plus tard le 29 janvier 2010 à

Transcription

Projet à déposer au plus tard le 29 janvier 2010 à
Formulaire – Appel à manifestation d'intérêt 2013
MASTODONS
Masses de Données Scientifiques
Formulaire obligatoire relatif aux manifestations d’intérêt
Libellé : AMI2013-MASTODONS – Jean-Pierre FERAL sous format word et ou pdf
DATE LIMITE de CANDIDATURE : le 15 avril 2013 à minuit
Identification
Civilité et Nom du
porteur du projet
Titre long (max 150
caractères)
Acronyme
Jean-Pierre FERAL, directeur de recherche IMBE
Développement de points nodaux d'indexation massive et de qualification des
données sur l’environnement littoral et marin méditerranéen
IndexMed
Résumé du projet : (6 lignes maxi)
IndexMed consiste en l’indexation, la qualification, la cartographie et l’interfaçage des données de l’environnement littoral et
marin méditerranéen pour la recherche en écologie et l’aide à la gestion du patrimoine naturel, dans le contexte de la
construction de systèmes d’informations sur la biodiversité portés par le SINP, l’INEE, et celui du rapportage des directives
européennes (DCSMM, DCE, DHFF). Le projet permettra de développer un service de résolution qui valorisera les résultats de la
recherche en écologie en répondant aux nouvelles demandes d’utilisation sociétale. Il s’appuiera sur les grands catalogues
d’acteurs, de données et de compétences développés actuellement.
Exposé scientifique du projet (3 à 5 pages) explicitant les points suivants :
-
Vision scientifique de l’équipe/consortium sur les thèmes du défi,
Les verrous scientifiques et les axes de recherche à moyen terme, avec un focus particulier sur la première année,
Les acquis scientifiques dans le domaine ou dans un domaine connexe susceptible de contribuer aux problèmes scientifiques ou sociétaux
posés (publications significatives, projets passés ou en cours, applications réalisées, logiciels, brevets…),
Les différentes disciplines impliquées et leurs contributions respectives au projet,
Une liste de 3 à 5 chercheurs séniors impliqués de façon significative dans la recherche.
Contexte du défi
Les données issues de la recherche dans les domaines de l’écologie et de la biodiversité sont par nature très
abondantes, hétérogènes et dispersées. Leur production fut un temps limitée au temps et à l’espace définis par le
projet de recherche qui en était l’origine ; elles étaient in fine majoritairement stockées par leurs producteurs sans être
réutilisées ou réutilisables.
Dans le contexte actuel de redéfinition du droit à l’accès à la connaissance et de la prise d’importance de la donnée
environnementale, une demande de réutilisation de ces données et de rationalisation de leur production a émergé, et
se fait chaque jour plus pressante.
L’enjeu, afin de mieux décrire la variabilité d’un type de donnée et de pouvoir la relier avec des contextes complexes,
est aujourd’hui de produire des jeux de données comparables et efficaces à de plus grandes échelles (régionales,
nationales, européennes…) et de produire des séries chronologiques longues et plus denses. Ce constat est d’autant
plus valable sur les milieux soumis à de nombreux changements comme les milieux littoraux et marins, cibles de cette
manifestation d’intérêt.
Afin d’alimenter les rapportages nationaux et européens, de nouveaux programmes de suivi et de surveillance sont
développés et portés par les pouvoirs publics (Programme de Suivi de la DCSMM, Plan d’Action du Milieu Marin).
Pourtant, leur origine et donc leur encadrement scientifique est parfois incertain. A contrario, les experts juristes
n’excluent plus la possibilité de futures condamnations de responsables scientifiques portant sur des manquements à
leurs responsabilités concernant la bonne conservation de la donnée financée par l’argent public.
Objectif
Force est de constater que la donnée utilisée par les scientifiques dans le domaine de l’écologie n’est plus
entièrement produite par les institutions scientifiques, qui s’appuient sur des réseaux extérieurs d’acteurs et de
compétences. Les sciences participatives se développent en laissant sans réponse les questions liées à la propriété
intellectuelle et aux notions de responsabilité par rapport à ce patrimoine commun. L’accessibilité de ces données est
variable, et les processus de qualification qui évaluent leur utilisabilité et leur efficacité sont encore rares.
Inversement, la production de données scientifiques est de plus en plus financée sous condition de mise à disposition
(depuis plusieurs décennies pour les données de biologie moléculaire, mais encore de façon balbutiante pour les
données écologiques et environnementales), sans que des outils appropriés soient proposés (même GenBank croule
sous le déluge de données et doit faire face à un danger de collapsus).
L’objectif de ce défi est donc de mettre en place une plateforme d’indexation des données sur la biodiversité
méditerranéenne et leur environnement ayant un intérêt pour la recherche. Cette indexation utilisera les outils et
méthodes préconisés nationalement (SINP, MNHN/GBIF, RBDD), et s’appuiera autant que possible sur les
catalogues développés nationalement (IDCNP du SINP, Réseaux d’acteurs de la FRB).
Objectifs secondaires
- Réseaux thématiques, répertoires de compétences, processus d’adaptation des BDD et des réseaux d’acteurs
- Bancarisation de données d’acteurs partenaires et qualification de leurs compétences (format open data)
- Alimentation des bases de données nationales et internationales à partir de flux RSS/XML (OBIS, GBIF…)
Axes concernés
Majoritairement les axes 2 et 4 de l’appel à manifestation d’intérêt
(2) Recherche, indexation, exploration et visualisation de grandes masses de données et de connaissances,
(4) Sémantique des données et des connaissances résultant de processus de requête ou de fouille de données
L’objectif de ce serveur d’indexation est de permettre de multiples cartographies basées sur les qualifications.
Et intrinsèquement l’axe 3
(3) Qualité des données, confidentialité et sécurité ; problèmes de propriété, de droit et d’usage des données.
Les problèmes de droit et de propriété intellectuelle seront pris en compte dans le cadre du processus de qualification
en suivant les préconisations nationales et internationales. Il en va de même de la problématique de qualité de la
donnée, qui sera étudiée et qualifiée en fonction des usages repérés et de leur contraintes.
Périmètres de l’indexation
Etant donné les impératifs d’organisation de l’accès à la donnée associés aux lancements des programmes de
surveillance liés à la mise en place de la DCSMM, et de la prévision de mise à jour des ZNIEFFs Mer et de la DHFF,
l’indexation des données priorisera les données marines. Elle s’appliquera particulièrement au travers de plusieurs
prototypes concernant le benthos (descripteurs D1, D2 et D6 de la DCSMM) et les problématiques liées aux réseaux
trophiques (D4 de la DCSMM). Elle prendra en compte de grands programmes d’acquisition de données lancés par
l’agence des aires marines protégées pour l’aide à la gestion (Cartham, Cardobs…)
Afin d’élargir de manière expérimentale pour l’instant le périmètre aux données terrestres, et à un format de données
géographiques contextualisées, l’indexation pourrait concerner dans un premier temps des bases de données de
l’IMBE telle que BASECO (base de données floristiques méditerranéennes), puis l’EPD (base de données polliniques
européenne). Ultérieurement, et en leur appliquant les mêmes outils, il est envisagé de s’intéresser à de plus grands
jeux de données tels que ceux des programmes CarHab (cartographie nationale des habitats terrestres) et VegFrance
(base de données sur la végétation à l’échelle de la France). Ces perspectives doivent être confirmées ou infirmées
lors des consultations.
Les outils développés doivent garder suffisamment de généricité pour pouvoir être adaptés à d’autres
thématiques.
Mise en œuvre
Acquis et contraintes liées :
L’indexation n’est pas un processus d’uniformisation des bases de données (format, technologie, schéma
relationnel…), mais repose sur l’interconnexion des outils, des acteurs existants, et des bases de données au format
où elles existent, grâce à des index qualifiés avec une typologie partagée. L’outil d’indexation nécessitera néanmoins
une participation effective des réseaux d’acteurs qui l’utiliseront (un certain nombre sont identifiés dans cette
manifestation d’intérêt) et la prise en compte des standards, des méthodes et des outils prédéveloppés. Elle permettra
d’enrichir les données avec des qualifications les rendant propre à l’utilisation par de nouveaux cercles d’utilisateurs.
Ce processus et les outils associés favoriseront le déploiement des standards et des méthodes du SINP.
Cet outil d’indexation utilisera en premier lieu les bases de données de l’IMBE : Les outils en cours de développement
en parallèle permettront de bancariser et de sécuriser les données tout en respectant
- le périmètre de partage désiré par chaque contributeur
- les règles applicables émanant notamment du code de la propriété intellectuelle et du droit sui generis.
Il s'agit essentiellement de relevés de terrain (occurrences, densités, biomasses, dominances d'espèces) et de
paramètres contextuels (biotiques, abiotiques, humains) appropriés.
Bases de données prioritaires :
SI marin : Cartham, CIGESMED (projet SeasEra financé par l’ANR), Réseau thématique coralligène (façade
méditerranéenne françaises), la partie marseillaise du SI de l’OHM Littoral Méditerranéen, base photo du service
plongée de Pytheas (23500 photos), Répertoire de vidéos de l’IMBE, Card’obs dès sa mise en ligne.
SI terrestre : BASECO, EPD, Données régionales PACA, LR et Corse (sous réserve des résultats de la consultation
avec les DREALS concernées), et potentiellement BDD des Baronnies Provençales.
Les interfaces doivent pouvoir être rendues accessibles à tout observateur actif sur la façade méditerranéenne
désirant valoriser ses données pour des utilisations multiples (Plans locaux de gestion, SINP Régionaux, DCSMM et
mise en œuvre des réseaux de suivi). Il est probable que les interfaces utilisant cette indexation se multiplieront en
fonction des besoins des nouveaux utilisateurs. Chaque interface pourra apporter des services se basant sur une
nouvelle ontologie.
Les outils utilisés respecteront les principes de mise en œuvre préconisés par les GT du SINP et s’appuieront sur la
veille technologique et les pratiques proposées par le RBDD du CNRS (notamment les logiciels libres). Ils se baseront
sur les référentiels nationaux et internationaux, ainsi que sur les normes de métadonnées et de données en cours de
définition. Les fonctionnalités des interfaces s'inspireront par exemple des résultats des travaux du GT "outils
naturaliste" du SINP (spécifications fonctionnelles). Les outils permettront l'indexation des données (LSID) et la mise
en place de systèmes de résolution nécessaires à l'amélioration de l'accessibilité de l'information sur la biodiversité
rendue obligatoire par différents textes (convention d'Aarhus, directive INSPIRE, Grenelles de l’environnement et de
la mer). Ils permettront CHEZ l’ACTEUR la génération de flux paramétrables de manière à organiser l'alimentation
des centres régionaux, thématiques, nationaux et internationaux d'agrégation de données.
Le développement bénéficiera de l’aide de l'équipe de l'UMS BBEES du CNRS/Muséum et nous proposerons la mise
en place d'une forge au sein du RBDD de la mission Interdisciplinarité du CNRS pour en enrichir les fonctionnalités.
Les bases et leurs interfaces seront physiquement hébergées et supportées par les infrastructures de l'OSU Pythéas,
dont fait partie l’IMBE, pendant cette phase de développement. Les solutions ainsi préparées seront mises à
1
disposition sous licence d'utilisation libre sous condition de citation des auteurs (CC BY-SA) . In fine, des processus
de qualification de données cohérents avec les besoins d'utilisation à chaque échelle seront validés par tous les
spécialistes et ceci pour chaque thématique. Le GBIF (système mondial d’information sur la biodiversité) au travers du
GBIF France apportera des outils libres d’indexation (HIT) et de connexion de données (IPT) pour les données
primaires de biodiversité (spécimens et observations). Il pourra également apporter son expertise sur les standards
d’échanges internationaux (TDWG) et la gestion de base de données volumineuses (portail GBIF : 396 millions de
données, portail GBIF France : 16 millions).
Tâches 2013
Choix de méthodes d’identification (dont le LSID)
Développement d’un outil d’attribution d’identifiant automatisé
Conception d’une méthode de qualification (requalification /surqualification en cas de changement d’échelle) en
suivant les préconisations existantes
Développement de flux prototypes descendants paramétrables (intégration et synchronisation des référentiels)
Développement de plugins de saisie/import/export/génération de flux réutilisant ces flux descendants
Développement de flux prototypes ascendants paramétrables
Tâches 2014
Essais de tatouage de jeux de données / systèmes de traçabilité (qualification / marquage)
Mise en place de services de résolutions permettant d’accéder chez chaque producteur volontaire
- en premier lieu, à un flux de métadonnées (à installer en fonction des logiciels)
- à moyen terme, à de la donnée agrégée (Donnée Elémentaire d’Echange – D.E.E. au sens du SINP)
- à terme, à de la donnée brute sous tout format/flux lorsque les droits associés le permettent
. Cartographie des compétences du réseau (arbres de connaissances)
. Cartographie de la connaissance
. Interfaçage de l’index et syndication
Verrous scientifiques
Les enjeux scientifiques sont liés à la gestion de données rendues complexes par
- leur volume, et la dynamique de leur mise à jour, des mises à jour des référentiels et des normes qui permettent de
les administrer
- leur hétérogénéité et leur complexité intrinsèques, notamment liées au croisement de données biodiversité et
métriques contextuelles,
- l’hétérogénéité des utilisateurs, des réseaux d’acteurs producteurs et leurs motivations à maintenir et alimenter leurs
systèmes d’information.
L’efficacité des services répondant aux contraintes contradictoires (modèles des bases de données, optimisation des
flux grâce à des services d’administration et des outils de paramétrages, gestion de droits d’utilisation en fonction des
statuts) peut être gérée par une indexation globale appuyée par des méthodes de qualifications définies et validées
par les acteurs sous forme de communautés thématiques. Un soin particulier sera apporté aux aspects suivants :
- objectifs de chaque qualification, rapport coûts / avantages,
- inter-calibration de protocoles, d’observateurs, typologie adaptée,
- qualités des tatouages de jeux de données /systèmes de traçabilité (qualification / marquage) et rapports
coûts / avantages.
1
http://creativecommons.org/licenses/by-sa/3.0/fr/legalcode
Deux principes seront mis en œuvre dans le cadre du projet : (i) les systèmes répartis d'informations (e.g. non
centralisés) et (ii) les processus d'adaptation des modèles de données afin de couvrir les usages présents et
d'anticiper les besoins des usages futurs.
Outils nécessaires
Cette demande doit permettre de financer les équipements nécessaires au déploiement de ce point nodal, ainsi
qu’une capacité minimale d’hébergement de données pour les partenaires ne disposant pas de ressources en propre.
Elle permettra en outre l’équipement informatique de 3 personnes (développement et GIS), l’achat de documentation
et le financement de déplacements pour la nécessaire rencontre des acteurs.
Matériel
Prix Unitaire
2 postes
développement
1 poste SIG
2 serveurs HQ
2 NAS
2 périph mobiles
Petit matériel
Documentation
TOTAL MATERIEL
Montant
1 500 euros
3 000 euros
3 000 euros
7 000 euros
6 000 euros
600 euros
3 000 euros
14 000 euros
12 000 euros
1 200 euros
500 euros
1 000 euros
34 700 euros
Contributions animation
12 participations à des
groupes de travail nationaux
40 rencontres d’acteurs
2 rencontres par acteur
2 formations techniques
Séminaire d’échange au bout
d’un an (60 part/2jours)
TOTAL ANIMATION
Prix
Unitaire
200 euros
Montant
2400 euros
200 euros
8000 euros
2800 euros
5600 euros
8500 euros
24 500 euros
Total en prévisionnel : 59 200 euros
Logiciel : Utilisation exclusive de programmes open source pour les bases, les traitements de données, les SIG.
Partenaires / consortium
Equipe principale
Axe transversal : aide à la gestion (IMBE)
30% Jean-Pierre FERAL Directeur de recherche en écologie Marine, ressource sur la thématique « données marines »
5% Thierry TATONI, Directeur de l’IMBE, Professeur en écologie Terrestre, ressource sur « réseaux d’acteurs », ORB, SILENE
10% Denise BELLAN-SANTINI Directeur de recherche émérite en écologie Marine ressource sur les « données Crustacés »
10% Gérard BELLAN Directeur de recherche émérite en écologie Marine ressource sur les « données Vers Polychètes»
10% Jean VACELET Directeur de recherche émérite en écologie Marine ressource sur les « données éponges »
10% Sophie GACHET, Maître de Conférences : écologie des communautés, bases de données naturalistes, analyses de données,
ressource sur la thématique « données littorales et utilisation »
10% Agathe LERICHE, Maître de Conférences, modélisation, SIG, macro écologie, ressource sur la thématique « données
littorales et utilisation »
30% Romain DAVID, Ingénieur doctorant, ressource sur les thématiques « indexation, normalisation, qualification »
10% Alrick DIAS, Ingénieur d’étude, ressource sur le « développement d’interfaces et les frameworks »
10% Christian MARSCHALL, Assistant Ingénieur, ressource sur la « donnée vidéo »
5% Leïta TSCHANZ, Doctorante ressource sur les « données des Baronnies Provençales »
Soutiens techniques
SIP (OSU Pytheas)
10% Maurice LIBES Ingénieur de Recherche, ressource sur la thématique « gestion des systèmes »
10% Cyrille BLANPAIN Ingénieur de Recherche, ressource sur la thématique « data mining »
Service Plongée (OSU Pytheas)
10% Frédéric ZUBERER Responsable du service plongée, Assistant ingénieur, ressource sur la thématique «photos sousmarines »
UMS BBEES (MNHN)
10% Cécile CALLOU Directrice UMS 3468, Maître de Conférences, Chargée de conservation, ressource sur les SI nationaux
10% Chloé MARTIN Ingénieur de Recherche, UMS 3468, animatrice du réseau Bases de données (RBDD) de la Mission
Interdisciplinarité
GBIF France
10% Anne-Sophie ARCHAMBEAU Ingénieur de Recherche ressource « standards internationaux et agrégation de flux »
5% Régine VIGNES-LEBBE : Coordinatrice scientifique du GBIF France, Professeur à l’UPMC, Informatique appliquée à la
biodiversité (bases de données et bases de connaissances - méthodes de classification, d'identification et d'analyse des
descriptions morphologiques)
Consultations programmées et utilisateurs / ressources à associer potentiellement (liste contactée et non exhaustive)
AAMP Agence des Aires Marines Protégées
Alain PIBOT Directeur de l’antenne méditerranée de l’Agence des Aires Marines Protégées
(www.aires-marines.fr)
[email protected],
Boris DANIEL Chargé de Mission - Antenne Méditerranée [email protected]
CESAB (www.cesab.org ) & CEFE-CNRS
Eric GARNIER, Directeur de recherche : écophysiologie des plantes terrestres, écoinformatique, ontologies relatives à la biodiversité [email protected]
Bruno Fady, attaché scientifique du CESAB [email protected]
Baptiste Laporte, ingénieur «système d’information», [email protected]
Ecoscope, UMR 212 EME : base de
Julien BARDE, Chargé de Recherche (IRD et Centre de Recherche Méditerranéenne et
connaissance sur les écosystèmes exploités
Natural-Solutions (http://www.naturalsolutions.eu/)
OHM Littoral méditerranéen
Parc Nationnal des Calanques
Planète Mer (Association)
Réseau des Observatoires Hommes-Milieux
(www.ohm-inee.cnrs.fr)
UMR ESPACE DEV Montpellier
Tropicale) [email protected]
Julie CHABALIER, Docteur en biologie, responsable R&D : web sémantique appliqué à la
biodiversité [email protected]
Samuel ROBERT, Chargé de recherche OHM, [email protected]
Dr Lidwine LEMIRE-PECHEUX Chargée Mission au PN Calanques
Ecologie terrestre, accès aux données naturalistes et cartographiques terrestres, analyses
écologiques & Concertations [email protected]
Laurent DEBAS, Directeur général de Planète Mer, Docteur en océanographie,
[email protected]
Lilita VONG, Chargée de mission, Docteur en océanographie [email protected]
Maxime MAIGNAN, Ingénieur d’étude : génie de l’environnement, géomatique, web de
données, animateur du GT OGIIS des OHM (Outil de Gestion Intégré de l’Information
Scientifique) [email protected]
Laure BERTI-EQUILLE, Directeur de Recherche IRD : Exploration de la qualité des données
dans des bases de données de taille extrême, Fouille incrémentale et distribuée
Intégration des données multi-échelle [email protected]
Isabelle MOUGENOT, Maître de Conférences : bioinformatique, éco informatique
[email protected]
Outils et réseaux à prendre en compte (liste non exhaustive)
SILENE PACA (DREAL PACA), SINP LR (DREAL LR), ORB PACA (ARPE PACA), ORE Corse
GIS Coralligène, GIS Posidonie, GIS3M (Mammifères Marins Méditerranéens), GEM, RESOMAR, MEDPAN
Sciences participatives : Planète Mer (Programme Biolit), Cybelle, Vigie-Nature (http://vigienature.mnhn.fr)
UMS 3462 Observatoire Pélagis, forum des Aires Marines Protégées, Parc des calanques, AAMP côte bleue, Port Cros
Répertoire des acteurs de la FRB et BDD organisées du CESAB (www.cesab.org)
Inventaire des dispositifs de collecte sur la nature et les paysages (IDCNP) du SINP, Glossaire IDCNP (V3.5)_03-2011,
rendus des Groupes de travail Nationaux (GT) du SINP [architecture, normalisation des données ; normalisation des
métadonnées, spécification de l’outil naturaliste (www.naturefrance.fr)]
INPN (MNHN), SPN (MNHN), Bases de données de l’INEE, RBDD du CNRS
ecoOnto-Med project : Trilingual online glossary for sustainable development in the Mediterranean
(http://ecoonto.cmimarseille.org/index.php/Main_Page/fr)
GBIF, OBIS, MEDOBIS, EMODNET, Open Data consortiums
Sélection de Références
-
-
-
Berti-Équille L., Multi-Scale Data Integration Challenges in the Open Science Data Space. Special issue on Data Integration of the iT Information Technology Journal, Vol. 54, No. 3, 05/2012.
Chabalier J. (2010), EcoOnto : une ontologie pour la biodiversité. Acte du colloque national d’écologie scientifique (Ecologie 2010).
Dameron O., Chabalier J. (2008) Bio-ontologies Tutorial. DILS 2008 (Data Integration in the Life Sciences), volume 5109 of LNBI, page 208
Conruyt N., Sébastien D., Cosadia S., Vignes Lebbe R., Touraïvane. 2009. Moving from Biodiversity information systems to biodiversity
information services. In Information and Communication Technologies for Biodiversity Conservation and Agriculture, Lisa Maurer, Klaus
Tochtermann (Eds.), Shaker, Aachen 2009 (ISBN: 978-3-8322-8459-6)
Conruyt, N., Grosser D., and Vignes-Lebbe R., 2012. "Knowledge Discovery for Biodiversity: from Data Mining to Sign Management." In
International Environmental Modelling and Software Society (iEMSs), edited by R. Seppelt, A. A. Voinov, S. Lange and D. Bankamp. 2012
International Congress on Environmental Modelling and Software Managing Resources of a Limited Planet, Sixth Biennial Meeting. Leipzig,
Germany, 2012.
Dieye, M, Rafik Doulache, M.,Floussi, M., Chabalier, J. Mougenot, I., Roche, M., Construction d'un dictionnaire multilingue de biodiversité à
partir de dires d'experts, INFORSID, Mai 2012, Montpellier, France
Heip, C.,Hummel, H.,Van avesaath, P.,Appeltans, W.,Arvanitidis, C.,Aspden, R.,Austen, M.,Boero, F.,Bouma, T.J.,Boxshall, G.,Buchholz,
F.,Crowe, T.,Delaney, A.,Deprez, T.,Emblow, C.,Féral, (J.-P.), Gasol, ,Gooday, ,Harder, ,Ianora, ,Kraberg, ,Mackenzie, ,Ojaveer, ,Paterson,
,Rumohr, ,Schiedek, ,Sokolowski, ,Somerfield, ,Sousa pinto, ,Vincx, ,Weslawski, ,Nash, (2009) Marine Biodiversity and Ecosystem
Functioning. Printbase, Dublin, Ireland, ISSN 2009-2539
Gachet S., Véla E. & Tatoni T. (2005). BASECO: a floristic and ecological database of Mediterranean French flora. Biodiversity and
Conservation 14 :1023-1034.
Laporte M.A. (2011) Définition de standards de données relatifs aux traits fonctionnels des végétaux pour l’étude de la biodiversité. Thèse de
doctorat de l’Université Montpellier II.
Laporte M.A., Mougenot I., Garnier E. (2011) ThesauForm – Traits: a web based collaborative tool to develop a thesaurus for plant functional
diversity research. Ecological Informatics, Special Issue on “Data platforms in integrative biodiversity research”
Laporte, M.-A., Garnier, E., Mougenot, I. (2011) Construction collective de standards de données en écologie Standards de données en
écologie. Proceedings of Journées Francophones sur les Ontologies (JFO 2011).
Michener W.K. & Jones M.B. (2012). Ecoinformatics : supporting ecology as a data-intensive science. Trends in Ecology & Evolution, 27, 8593.
Michener, W.K. (2006) Meta-information concepts for ecological data management. Ecological Informatics, 1, 3-7.
Pavoine S., Vallet J., Dufour A.B., Gachet S. & Daniel H. (2009). On the challenge of treating various types of variables and its consequence
in functional ecology. Oïkos 118:391-402.
Sean Martin, Moses M. Hohman, Ted Liefeld, The impact of Life Science Identifier on informatics data, Drug Discovery Today, Volume 10,
Issue 22, 15 November 2005, Pages 1566-1572, ISSN 1359-6446, 10.1016/S1359-6446(05)03651-2.
Smith D.J., B.J. Benson, D.F. Balsiger: Designing Web Database Applications for Ecological Research. Pages 408-413 in The Sixth World
Multiconference on Systemics, Cybernetics and Informatics. International Institute of Informatics and Systemics, Orlando, Florida, July 2002.
TASSIN P. (dir.), 2010. Chapitre 7 : Le système d'information durable. Systèmes d'information et développement durable. Économie, société
et environnement. Collection Études informatiques et logiciels. Lavoisier, pp. 209- 246. )
Ung V., Dubus G., Zaragüeta-Bagils R. & Vignes-Lebbe R., 2010 : Xper²: introducing e-Taxonomy. Bioinformatics, Vol. 26, Num.5: 703-704.
Ouvrages et Recommendations
Berti-Équille L., La qualité et la gouvernance des données au service de la performance des entreprises, Traité IC2, Hermès, ISBN 978-27462-2510-7, ISS 2111-0360.
Chignard S. , L'open data, comprendre l’ouverture des données publiques, Fyp Éditions, 2012
Féral (J.-P.) (Ed.) 2001 - Concepts and methods for studying marine biodiversity, from gene to ecosystem. European TMR / CNRS practical
training course. Océanis 24 (4): 1-420 (1998)
GBIF : bonnes pratiques en gestion de données, numérisation, identifiants permanents http://www.gbif.fr/?page_id=225
-
Klyne G., Carroll J. J., rédacteurs « Le cadre de description de ressources (RDF) : Concepts et syntaxe abstraite » , recommandation du
W3C, 10 février 2004, http://www.w3.org/TR/2004/REC-rdf-concepts-20040210/ . Latest version available at http://www.w3.org/TR/rdfconcepts/
Lacombe R., Pierre-Henri Bertin, François Vauglin et Alice Vieillefosse, Pour une politique ambitieuse des données publiques, La
Documentation française, 2011
Nimis P.L., Vignes Lebbe R. (eds.), 2010 : Tools for Identifying Biodiversity: Progress and Problems. ISBN 978-88-8303-295-0, EUT, 455 pp.
Smith, D. Szekely B. Apr. 2005. LSID Best Practices: A guide to deploying life science identifiers. IBM developerworks.
Références sur l’interopérabilité : http://rbdd.cnrs.fr/spip.php?article98
Informations pratiques :
▪ Sur l’application SIGAP, dans le cas des appels à manifestations d’intérêt sans demande budgétaire, vous devez
indiquer 0 € dans le champ obligatoire « budget demandé».
▪ Le formulaire de réponse (au format word ou pdf) ne doit pas dépasser 6 pages
▪ Le projet doit être rédigé préférentiellement en français.
▪ L'implication des équipes doit être clairement précisée; les contributions doivent être quantitativement renseignées dans
l’application SIGAP (% temps projet par équipe en considérant le statut des personnes impliquées : agents CNRS: pourcentage
de temps travaillé sur le projet compris entre 0 et 100 ; personnels ayant une charge autre que la recherche, enseignant
chercheur par exemple : l’activité travaillée sur le projet est comprise entre 0 et 50).
▪ En déposant une proposition le porteur s’engage à tenir informé son directeur d’unité sur cette initiative; il s’engage
également à fournir un rapport scientifique qui sera évalué dans le cadre du suivi des actions interdisciplinaires du CNRS ainsi
qu’un rapport financier des dépenses jusqu’au 31/12/2013. Ces deux documents seront adressés au coordinateur scientifique
du défi ([email protected])
▪ Procédure d’information aux candidats : à la fin du processus d'évaluation des projets, les porteurs seront informés par
courriel de la décision prise.
▪ Les montants alloués par le CNRS seront notifiés directement et intégralement au porteur du projet; ce dernier aura la
responsabilité de ventiler les crédits en fonction des besoins des équipes impliquées.
▪ Les frais de personnels (CDD, salaires doctorants, post doctorants…) et les indemnités de stage ne pourront pas être financés
sur ces crédits.
▪ Les projets devront être réalisés (scientifiquement et financièrement) sur l’année. Les crédits destinés à l’exécution du projet,
de type subvention d’Etat (SE) devront être entièrement payés à la date de la clôture de l’année budgétaire, et ceci quel que
soit le moment de la notification. Aucune dérogation ne pourra être accordée.