Le projet e-Helvetica de la Bibliothèque nationale suisse

Transcription

Le projet e-Helvetica de la Bibliothèque nationale suisse
Département fédéral de l'intérieur DFI
Office fédéral de la culture OFC
Bibliothèque nationale suisse BN
Le projet e-Helvetica de la Bibliothèque nationale suisse1
Elena Balzardi
Cheffe de la Section Collection et cheffe du projet e-Helvetica
Bibliothèque nationale suisse
Information électronique: archivage de longue durée
Il y a quelques années, si vous confrontiez votre interlocuteur à l’idée que les bibliothèques
patrimoniales devaient conserver à long terme des parties de l’information publiée dans
l’Internet, ce dernier, incrédule, secouait la tête ou vous adressait un sourire compatissant.
Les arguments étaient presque toujours les mêmes : un tel projet n’était pas réalisable et ne
présentait aucun intérêt pour les générations futures, le charme de l’Internet étant justement
sa nature éphémère. De plus, un tel projet était techniquement impossible.
Malgré ce scepticisme, des institutions de renom se penchent depuis quelques années sur la
conservation de l’information électronique de l’Internet, dans le cadre de projets et
d’applications réalisées dans ces projets. Dans le milieu des bibliothèques, les attentes en
matière d’information électronique se répartissent en trois catégories:
1. Disponibilité : l’accès à l’information électronique doit être garanti si possible à des prix
avantageux pour les groupes-cible et les parties prenantes (clients) de l’institution en
question.
2. Archivage : la disponibilité doit encore être garantie lorsque l’information n’est plus disponible librement ou contre paiement dans l’Internet.
3. Numérisation : l’information existant sur des supports analogiques doit être dotée de
possibilités de recherche aussi attrayantes que possible et être mise à disposition dans
une large mesure sur l’Internet.
Même si l’idée de conserver des parties de l’information publiée dans l’Internet se heurte
aujourd’hui encore à un certain scepticisme, le bien-fondé de l’archivage des publications de
l’Internet n’est plus fondamentalement mis en doute au vu de l’impressionnante propagation
de l’utilisation de l’Internet et de la meilleure sensibilisation à l’importance de la conservation
des «objets de la mémoire». A l’heure actuelle, les doutes, pas tout à fait infondés, concernent plutôt la faisabilité.
Les activités de la Bibliothèque nationale suisse
La Bibliothèque nationale suisse constitue la plus importante source écrite au monde pour la
compréhension de la Suisse et de la population suisse. Elle a pour mandat „de collectionner,
de répertorier, de conserver et de rendre accessibles les informations imprimées ou conservées sur d’autres supports que le papier, ayant un lien avec la Suisse“2. Déjà au moment de
1
Première parution dans Arbido „Publication électronique – les spécialistes en information et documentation, médiateurs entre deux mondes“, édition 4 du 14 décembre 2006
2
Loi fédérale sur la Bibliothèque nationale suisse du 18 décembre 1992
la création de la loi, le marché de l’information était en train de changer. Dans la loi de 1992,
ce n’est plus le support qui est important, mais le lien de l’information avec la Suisse. Après
la large apparition de l’Internet dès 1993, la Bibliothèque nationale suisse s’est penchée sur
la question de savoir si et comment les publications électroniques pouvaient à l’avenir être
sauvegardées à long terme et conservées pour la consultation ultérieure. Elle l’a fait d’abord
dans différents pré-projets, puis dès 2001 dans le cadre du projet e-Helvetica.
Le projet e-Helvetica3 a pour objectif de créer les bases de la collecte, de la saisie, de
l’archivage et de la mise à disposition des Helvetica électroniques offline et online. Les Helvetica offline sont des supports tels que par exemple les disquettes, CD-ROM ou DVD. Les
Helvetica online sont des publications de l’Internet. Le manuel de projet définit les principaux
objectifs et délais ainsi que la structure du projet. De même, il planifie les ressources financières pour le projet et pour l’exploitation future.
Institution de la Confédération, la Bibliothèque nationale suisse en suit les règles. Ainsi par
exemple, elle reçoit des prestations informatiques d’un prestataire de services interne à la
Confédération. Les potentiels de synergie avec d’autres institutions de la Confédération sont
exploités dans le cadre d’une réelle collaboration. En tant qu’institution publique, elle doit
suivre les règles pour les marchés publics lors de l’acquisition de biens et de prestations de
service. Bibliothèque suisse, la Bibliothèque nationale suisse recherche tout particulièrement
la collaboration avec d’autres bibliothèques suisses au niveau cantonal ou universitaire, dans
le cadre du projet e-Helvetica. En sa qualité de bibliothèque nationale, elle a des contacts
établis avec le marché suisse du livre et de l’information. Au niveau international, elle travaille avant tout avec d’autres bibliothèques nationales qui ont un mandat comparable.
Le projet e-Helvetica se divise en deux projets partiels. Le projet partiel „Organisation“
s’occupe des aspects bibliothéconomiques de la collection de e-Helvetica. Il s’agit de déterminer le contenu de la collection, de définir le catalogage et de concevoir la mise à disposition. Le projet partiel „Archivage“ s’occupe des aspects informatiques de la collection de eHelvetica. C’est ici que sont créées les bases techniques et l’application informatique pour le
traitement et le stockage de la collection. Des spécialistes en bibliothéconomie et des spécialistes en informatique collaborent au projet. Sept collaborateurs/trices se partagent 310
pourcent de postes.
Selon le plan de projet et l’état actuel du projet, le projet e-Helvetica sera terminé fin 2008; il
passera alors en exploitation. A partir de ce moment-là, l’activité de collecte sera développée.
Les contenus: projets-pilotes
Le projet partiel Organisation est responsable des travaux bibliothéconomiques. La Bibliothèque nationale suisse a décidé de mettre sur pied une collection sélective de publications
électroniques. Les documents offline tels que les disquettes, CD-ROM ou DVD sont collectés
dans leur intégralité. Les publications de l’Internet (documents online) sont collectées de
manière sélective pour former un échantillon aussi représentatif que possible. A ce jour, aucun usage uniforme ne s’est imposé dans les bibliothèques nationales pour la collecte des
biens culturels électroniques. Quelques bibliothèques nationales collectent par le webharvesting une grande partie des sites Web publiés dans leur pays. D’autres bibliothèques nationales développent une collection sélective. Pour des raisons juridiques (droits d’auteur), financières (coûts de constitution et de stockage de la collection) et pour des raisons de ressour-
3
voir : www.e-helvetica.admin.ch
2/6
ces (planification et réalisation de la conservation de longue durée), la Bibliothèque nationale
suisse a opté pour la mise sur pied d’une collection sélective.
La collection sélective est constituée sur une large base. Des publications de différents types
d’éditeurs choisis sont collectées pour servir de base à la constitution de la collection et aux
étapes de travail qui y sont liées. Dans le cadre de trois projets-pilotes (quatre à partir de
2007), les processus de travail sont conçus et mis en relation avec les travaux bibliothéconomiques pour les processus informatiques.
Le projet-pilote „POP“ (projet-pilote Prise en charge et archivage de publications commerciales online) se charge de collecter les publications commerciales des maisons d’édition traditionnelles suisses Karger (Bâle)4 et Stämpfli (Berne)5. Ce faisant, la Bibliothèque nationale
suisse poursuit la collection imprimée qui a été alimentée continuellement depuis les années
1920. La collection se compose en grande partie de titres de périodiques online qui sont
produits dans un format précis. La collection est mise sur pied en étroite collaboration et en
accord avec les maisons d’édition.
Dans le projet-pilote „e-Diss.ch“ sont collectées les thèses et habilitations électroniques des
universités suisses. La collection est développée en coordination avec la Bibliothèque nationale suisse et les bibliothèques universitaires. Cette collaboration est soutenue par la
„Conférence des bibliothèques universitaires suisses (CBU)“. En règle générale, les formats
correspondent à des standards connus. Les auteurs sont connus en tant que membres des
hautes écoles universitaires.
Le projet-pilote „Archives Web Suisse“ collecte les sites Internet patrimoniaux non commerciaux. La collection est mise sur pied en étroite collaboration avec les bibliothèques cantonales suisses qui sont responsables de la sélection des publications à collecter. Contrairement
aux projets pilotes „POP“ et „e-Diss.ch“, les producteurs de sites Web et les formats sont
hétérogènes dans le projet-pilote „Archives Web Suisse“.
Dès 2007, un nouveau projet pilote sera lancé pour la collecte de publications électroniques
officielles de la Confédération.
Tous les Helvetica électroniques en ligne collectés par la Bibliothèque nationale suisse sont
catalogués sommairement dans le catalogue en ligne Helveticat. Une fois sauvegardés et
archivés, ils font définitivement partie de la collection.
Dans tous les projets-pilotes, la collaboration avec d’autres institutions est primordiale. Les
partenaires sont des maisons d’édition et des producteurs d’information, des bibliothèques
universitaires, des bibliothèques cantonales et des administrations.
La technique : projets informatiques
Le système d’archivage est développé conformément aux directives du modèle générique
„Open Archival Information System (OAIS)“6. Ce modèle de référence, certifié ISO 14721,
décrit les archives comme une organisation dans laquelle les hommes et les systèmes oeuvrent ensemble dans le but de conserver des informations et de les mettre à disposition d’un
cercle d’utilisateurs défini. Ce modèle décrit en détail comment l’information électronique
créée par un producteur arrive dans un système d’archivage, quelles étapes de traitement
4
www.karger.com
www.staempli.ch
6
http://public.ccsds.org/publications/archive/650x0b1.pdf
5
3/6
sont à réaliser pour l’archivage à long terme et comment l’on peut accéder à l’information
stockée dans les archives.
PRESERVATION PLANNING
P
R
O
D
U
C
E
R
Descripive
Info
DATA
MANAGEMENT
Descripive
Info
queries
result sets
INGEST
ACCESS
orders
SIP
AIP
ARCHIVAL
STORAGE
AIP
DIP
C
O
N
S
U
M
E
R
ADMINISTRATION
OAIS-Referenzmodell, ISO 14721
Pour l’essentiel, le modèle réglemente comment un objet créé par un producteur (Producer)
(SIP = Submission Information Package) est intégré dans le système d’archivage (Ingest).
Une fois intégré, l’objet est transformé en un objet d’archivage (AIP = Archival Information
Package) et déposé dans le système de stockage (Archival Storage). La gestion de l’objet se
fait dans le module de gestion (Data Management). L’objet archivé (AIP = Archival Information Package) est livré à l’utilisateur en tant qu’objet d’utilisation (DIP = Dissemination Information Package) via le module Utilisation (Access), sous respect de toutes les restrictions
juridiques. L’archivage de longue durée sous la forme d’une migration et d’une émulation des
objets est prévue dans le module de conservation (Preservation Planning). La gestion de
l’ensemble du système d’archivage passe par le module d’administration (Administration).
Les processus de travail sont comparables pour l’essentiel aux processus de travail classiques d’une bibliothèque ayant des fonds imprimés. La difficulté pour la mise sur pied et la
conservation d’une collection électronique réside dans les objets à archiver. Ces derniers se
composent de plusieurs composantes directement interdépendantes qui doivent être disponibles pour pouvoir les lire (hardware, système d’exploitation, programme, publication).
La Bibliothèque nationale suisse crée son système d’archivage pour les Helvetica électroniques selon les directives du modèle OAIS. Pour le module „Archival Storage“, elle collabore
étroitement avec les Archives fédérales suisses dans le cadre de l’exploitation des synergies
au sein de l’Administration fédérale. D’autres modules, comme par exemple les modules
„Ingest“ ou „Access“, doivent être conçus selon les besoins et sur la base des objets de la
collection et des possibilités d’accès bibliothéconomiques. Le module Ingest vient d’être mis
en service. En fonction du producteur, les publications électroniques sont déposées dans
l’Archival Storage par différents chemins. Le module Access, pour la garantie de l’accès, est
prévu pour 2007-2008.
4/6
Le format de métadonnées de la Bibliothèque nationale suisse se base sur le standard
METS (Metadata Encoding & Transmission Standard, Version 1.3)7, développé par la Library
of Congress. Pour les métadonnées bibliographiques, c’est MARCxml qui est utilisé. Pour les
métadonnées techniques, l’on utilise les Preservation Metadata de la National Library of New
Zealand (version juillet 2003).
Un URN (Uniform Resource Name) est un identificateur persistant, à savoir un adressage
stable. Des identificateurs persistants peuvent remplacer les URL (Uniform Resource Locator = „lien“ dans l’Internet) dans le catalogue ou dans d’autres systèmes de recensement, ou
être utilisés comme des références stables dans les documents eux-mêmes. Ainsi les liens
deviennent stables. Le temps passé à actualiser les renvois se réduit puisque les URL sont
tenus à jour automatiquement en un seul endroit. Les liens peuvent être intégrés à plusieurs
services de recensement. Les publications numériques ont un identificateur univoque pour le
monde entier et peuvent donc être citées de façon fiable8.
L’URN garantit l’accès durable à un objet par l’archivage de longue durée ou l’archivage des
objets ainsi que par la haute disponibilité technique du service URN. Un URN renvoie au
minimum à un URL par lequel un objet est adressé. Un URN peut également gérer plusieurs
copies du même objet, donc plusieurs URL, ainsi que des formats de présentation différents
des objets.
Les projets informatiques sont également réalisés en collaboration avec d’autres institutions.
Le module „Archival Storage“ est réalisé en collaboration avec les Archives fédérales suisses
et utilisé conjointement. Les modules restants sont développés avec des entreprises externes. L’utilisation commune de standards est particulièrement développée. Par exemple, la
Deutsche Nationalbibliothek a mis son service de résolution d’URN à disposition de la Bibliothèque nationale suisse et de ses institutions partenaires. L’échange d’informations est aussi
particulièrement important avec des institutions qui travaillent dans des domaines identiques
ou semblables, ceci afin d’éviter le développement de formats ou de standards différents.
Qu’apporte l’avenir?
Les projets et les applications pour l’archivage de longue durée des sources numériques les
plus importantes sont encore en développement. Au vu des différentes approches et des
collections de contenu très divers, il est probable qu’au moins une partie des informations
importantes sera conservée et rendue accessible pour les générations futures.
Comme dans le domaine des collections imprimées, la disponibilité à long terme engendre
des coûts qui pour l’instant ne peuvent être évalués que sous forme de modèles de calculs.
Les institutions de la mémoire comme les bibliothèques nationales ou patrimoniales doivent
également s’occuper de la question des coûts, en plus du développement de la collection.
Comme pour la conservation du papier, l’on verra apparaître au fil du temps plusieurs tendances dans le domaine de la conservation des données numériques. D’où l’importance de
conserver les objets originaux autant que possible, afin que les mesures de conservation
adéquates puissent être prises en fonction des progrès de la technologie.
Une chose est importante : c’est la tâche des bibliothèques que de rendre accessible et de
conserver l’information. L’écrit est l’un des éléments de liaison et de compréhension les plus
importants à travers les siècles. L’écrit permet de comprendre le passé et il encourage
l’évolution. La forme de l’écrit, ainsi que les supports et technologies auxquels cet écrit est
7
8
http://www.loc.gov/standards/mets
www.persistent-identifier.de/?link=520
5/6
lié, sont un témoignage de la société qui fournit l’information. Elle doit rester disponible pour
les générations à venir.
Liens, informations complémentaires
Informations sur le projet e-Helvetica et sur quelques autres projets d’archivage de publications électroniques:
Projet e-Helvetica, Bibliothèque nationale suisse (Suisse)
www.e-helvetica.admin.ch
Nestor – Kompetenznetzwerk Langzeitarchivierung (Allemagne)
www.langzeitarchivierung.de
Österreichische Nationalbibliothek, Langzeitarchivierung (Autriche)
www.onb.ac.at/about/lza/
PADI – Preserving Access to Digital Information (Australie)
www.nla.gov.au/padi
Internet Archive (USA)
www.archive.org/index.php
Digital Preservation, Library of Congress (USA)
www.digitalpreservation.gov
Digital Preservation Coalition (Grande-Bretagne)
www.dpconline.org/graphics
contact: [email protected]
6/6

Documents pareils

Glossaire e

Glossaire e Stratégie en vue de conserver la disponibilité à long terme d’objets numériques. Selon cette stratégie, les conditions requises par le système pour pouvoir utiliser des objets numériques plus ancie...

Plus en détail

Archives Web Suisse : glossaire, version 1.6, 5 février 2016

Archives Web Suisse : glossaire, version 1.6, 5 février 2016 newsgroup dans lesquels les utilisateurs/trices peuvent échanger des informations – comme un avis accroché au tableau noir. L’URL (Uniform Resource Locator) est l’adresse du site web dans l’Interne...

Plus en détail