Organisation de l`archive mission

Transcription

Organisation de l`archive mission
Organisation de l’archive mission
CMC/CNES
fichiers
Stockage
N1 & N2
Gestion des
requêtes
ftp
Catalogue
Ingestion
metadata?
« Outreach »
Utilisateurs
Production N2
Interfaces
requêtes
Transfert
Outils de
« Help »
visualisation
CNES LESIA
LAEFF
« Long Term
Archive »
CDS IAS
Un logo pour l’archive?
• Systèmes « hardouaire »:
-stockage (propre a COROT ou moyen de
stockage massif du CD/IAS)
-2 machines pour l’interface utilisateurs et la
gestion des requêtes + catalogue et ingestion des
données
• Interfaces :
- avec le CMC/CNES (à optimiser)
- avec la machine de production des N2 (2 sens)
- avec les utilisateurs
- avec la LTA (à préparer dès maintenant)
1
• Interface utilisateur :
- interfaces graphiques N1/N2, sismo/exo,
rapide/approfondie…
- help : écriture d’un manuel d’utilisation
disponible en
ligne, vers où pointent des
liens à partir de l’interface
graphique
- outils de visualisation
- outreach
• Liens avec autres bases :
- GAUDI
- base étalonnage à Meudon
- SIMBAD (incluant une requête automatique)
- Exodat (idem)
- 2MASS
- autres?
Architecture informatique
Machines d’archivage
2
Phase d’exploitation
• 2 machines
– Base de données + ingestions N1/N2
(+
réplique interface utilisateur)
– Réplique de la base de données + interface
utilsateurs (requêtes comprises)
• Variante possible : intégration interface utilisateur
sur un site web plus général (centre de données).
• 1 système de stockage TBD
Intérêts majeurs
• Accès base de données catalogue quasi
continu
– Ingestion et validation sur une machine.
– Accès via interface sur le catalogue répliqué.
• Sauvegarde 1er niveau
– Répliques croisées des 2 machines.
3
Protection physique
• Protection electrique
– Double alimentation
– Branchement sur onduleur
• Protection des données
– Disques en raid 10
– Sauvegarde 1er niveau (répliques croisées)
– Sauvegarde distante
INGESTION DE DONNEES
4
Décomposition
• Extraction des données
– Création d’un fichier intermédiaire : metadata
• Contient les champs nécessaires à la mise à jour du
catalogue
• Syntaxe simple
– 1 ligne par fichier
– 1 séparateur (ex : « | ») entre chaque champs
• Ingestion réelle dans la base de données
catalogue à partir des « metadata »
Avantages
• Indépendance entre
extraction
des champs de données et mise à jour base
catalogue
– Gestion plus simple des problèmes éventuels
– Traitement asynchrone possible des 2 étapes
• Si le CMC propose avec les données N1, des
fichiers « metadata » associés…
– Gain de temps de développement et de traitement
5
Echanges de données CMC/CDC
CMC / IAS (N1)
LESIA / IAS (N2)
Procédure proposée
• Envoi d’un mail par l’entité disposant de données
prêtes.
– Envoi à une adresse spécifique qui pourrait être [email protected]
– Subject: Données corot N1
– Liste des fichiers à récupérer dans le corps du mail
• Déclenchement automatique (par l’arrivée du mail)
du rapatriement (ftp) des fichiers concernés.
• Envoi d’un mail d’acquittement de réception de
fichiers ?
6