Recommandations de la direction des Archives de
Transcription
Recommandations de la direction des Archives de
Projet PIL@E Gestion des Formats de Fichier Version du 25 avril 2007 Ce document a été réalisé par le département de l’innovation technologique et de la normalisation de la Direction des Archives de France (DAF) du ministère de la culture et de la communication Avec le concours de la Direction générale pour la modernisation de l’Etat (DGME) du ministère de l’Economie, des finances et de l’industrie Sur la base d’une prestation de Cecurity.com et de Hénon Conseil 2/8 SOMMAIRE 1. INTRODUCTION ..............................................................................................................................4 2. VOCABULAIRE ................................................................................................................................4 3. APPROCHE EN MATIERE DE GESTION DE FORMATS ........................................................5 4. PRINCIPES DE SELECTION DES FORMATS EN ENTREE ....................................................5 5. PRINCIPES DE SELECTION DES FORMATS CIBLES D'ARCHIVAGE ...............................6 6. LES FORMATS EN ENTREE..........................................................................................................7 7. LES FORMATS CIBLES D'ARCHIVAGE ....................................................................................8 3/8 1. INTRODUCTION Le présent document vise à présenter la stratégie retenue par la Direction des Archives de France en matière de sélection des formats de fichiers pour l'archivage à long terme. Elle respecte les principes d’intéropérabilité édictés pour l’Administration. Ce document fournit les principes de sélection des formats en entrée d'un système d'archivage et les formats d'archivage cibles ainsi que les listes des formats en entrée et des formats cibles retenus à ce jour. 2. VOCABULAIRE Les définitions suivantes s'appliquent au présent document. Nom Définition Format d'entrée Format des fichiers en entrée du système d'archivage Format d'archivage Format retenu pour l'archivage à long terme des documents dans le système d'archivage Convertisseur Logiciel permettant de convertir soit un fichier d'un format dans un autre, soit un même format d'une version dans une autre version Testeur Logiciel permettant de vérifier si un fichier est bien conforme aux spécifications du format dans lequel il est censé être encodé Etat technique du système de conversion Etat qui est la somme des états de chaque logiciel de conversion Etat technique d'un Regroupement des éléments suivants : logiciel de test et/ou de Nom du logiciel conversion Version de ce logiciel Date d'installation de ce logiciel dans le système d'archivage S'il y a lieu, fichier de paramètres. 4/8 3. APPROCHE EN MATIERE DE GESTION DE FORMATS L'approche retenue par la Direction des Archives de France pour la gestion repose sur six règles de base : ● Nombre optimisé de formats acceptés en entrée (les formats pris en compte doivent largement couvrir les besoins de l'administration sans toutefois être trop nombreux) ; ● Nombre restreint de formats cibles (trois ou quatre formats au maximum pour chaque domaine : images, textes, plans, messagerie électronique, fichiers comprimés, etc.) ; ● Tests des formats en entrée grâce à un testeur afin de s'assurer de la conformité de ces formats à leurs spécifications ; ● Si le format en entrée n'est pas un format cible, conversion systématique dès le transfert des formats d'entrée vers les formats d'archivage grâce à un convertisseur ; ● Archivage dans un journal des opérations de test et de conversion (avec conservation de l'état technique des logiciels de test et de conversion et de l’état technique des systèmes de conversion) ; ● Durant le processus d’archivage, opérations programmées de conversions périodiques des fichiers archivés dont le format va devenir obsolète à moyen terme (veille technologique). 4. PRINCIPES DE SELECTION DES FORMATS EN ENTREE Les formats d'entrée sont forcément plus nombreux que les formats d'archivage. Cependant, il convient de limiter le nombre des formats en entrée afin de faciliter les conversions de ces formats vers les formats d'archivage. Les formats en entrée doivent posséder les caractéristiques suivantes : ● L’usage du format doit être significativement répandu dans l'administration dans un domaine fonctionnel spécifique (par exemple, pour la gestion de cartes géographiques, il doit être présent sur un nombre minimum de postes informatiques au sein de l'administration) ; ● Il ne doit pas y avoir de licence pour obtenir le contenu des spécifications ou pour écrire des logiciels qui exploitent ce format. ● Il doit exister au moins un logiciel de conversion de ce format vers un des formats retenus comme format d'archivage. 5/8 5. PRINCIPES DE SELECTION DES FORMATS CIBLES D'ARCHIVAGE Afin que le système soit administrable sur le long terme, il convient de ne retenir qu'un nombre restreint de formats cibles pour l'archivage. Les règles de sélection de ces formats cibles sont les suivantes : ● Le format doit reposer sur une norme nationale, européenne ou internationale ; ● Dans le cas où le format ne repose pas sur une norme, les spécifications de ce format doivent être publiques et facilement accessibles ; ● Le format doit être très largement répandu en termes d'usage ; ● La stabilité du format doit être "raisonnable", c'est à dire que le renouvellement des versions ne doit pas s'effectuer trop rapidement (2 à 3 ans est une périodicité acceptable) ; ● Il doit exister au moins 2 logiciels, d'éditeurs différents, disponibles sur le marché français ou européen qui exploitent ce format ou il doit exister un logiciel en "Open Source" qui gère ce format. Ces logiciels doivent a minima permettre l'affichage, et l'impression des documents ; ● Il ne doit pas y avoir de licence pour obtenir le contenu des spécifications ou pour écrire des logiciels qui exploitent ce format ; ● Le format doit être présent dans le RGI (Référentiel Général d'Interopérabilité). 6/8 6. LES FORMATS EN ENTREE Les formats suivants sont les formats acceptés en entrée. La colonne de droite du tableau indique le format cible d'archivage correspondant au format en entrée. Type de données Format accepté en entrée Version(s) supportée(s) Format cible d'archivage Images fixes PNG GIF JPEG 2000 (jp2) JPEG (jfif, jpg) TIFF BMP PCX Son et Vidéo MPEG-2 Layer III (MP3) WAV MPEG-2 MPEG-4 ISO/CEI 13818 ISO/CEI 14496 MPEG-2 Layer III (MP3) MPEG-2 Layer III (MP3) MPEG-2 MPEG-4 HTML XHTML OpenDocument MSoffice DOC Msoffice XLS Msoffice PPT Msoffice DOC Msoffice XLS Msoffice PPT PDF/A PDF RTF CSV TXT 2/3.2/4.0/4.1 1.0/1.1 ISO 26300:2006 97/2000/XP ; 95 ; 6.0 97/2000/XP ; 95 ; 5.0 97/2000/XP 97/2000/XP ; 95 ; 6.0 97/2000/XP ; 95 ; 5.0 97/2000/XP PDF 1.4 1.3 ; 1.4 ; 1.5 ; 1.6 1.5 ; 1.7 ; 1.8 N/A N/A HTML XHTML OpenDocument OpenDocument OpenDocument OpenDocument PDF/A (ISO 19005) PDF/A (ISO 19005) PDF/A (ISO 19005) PDF/A (ISO 19005) PDF/A (ISO 19005) PDF/A (ISO 19005) CSV TXT ZIP WinRAR Sit E-mail 10.X 3.X RFC 2822 + RFC 2045 Format Original Format Original Format Original E-mail + pièces jointes XML XSD XML validé par XSD SGBD 1.0 1.0 XML 1.0 N/A XML XSD XML TXT SVG DWG 1.1 SVG R2007/R2004/R2000/R14/R13/R1 SVG 2/R11/R10/R9 DXF CGM v.u.21.1.01/v.u.20.1.01/v.u19.1.01 SVG /v.u18.1.01/v.u16.1.01/v.u15.0.02/ v.u14.1.04/v.u13.1.0 ISO 8632:1992 CGM STEP ISO/10303 Documents structurées et non structurés Formats composites Documents structurés Données graphiques 7/8 1.0/1.1/1.2 GIF89a ISO/IEC 15444:2000 ISO 10918 6.X N/A N/A PNG PNG JPEG 2000 JPEG TIFF JPEG 2000 JPEG 2000 STEP 7. LES FORMATS CIBLES D'ARCHIVAGE Les formats suivants ont été retenus comme format d'archivage. Type de données Format cible d'archivage Version Images fixes PNG JPEG 2000 JPEG TIFF 1.0 ISO/IEC 15444:2000 ISO 10918 6 Images animées et sons MPEG-2 Layer III (MP3) MPEG-4 ISO/CEI 13818 ISO/CEI 14496 Documents structurées et non structurés HTML XHTML OpenDocument PDF/A CSV TXT 2/3.2/4.0/4.1 1.0/1.1 ISO 26300:2006 ISO 19005 PDF 1.4 N/A N/A Messageries E-mail + pièces jointes RFC 2822 + RFC 2045 Documents structurés XML XSD TXT 1.0 1.0 N/A Données graphiques SVG CGM STEP 1.1 ISO 8632:1992 ISO/10303 8/8