EUROPEANA la contribution française à la Bibliothèque numérique

Transcription

EUROPEANA la contribution française à la Bibliothèque numérique
Communiqué de presse
Europeana, la contribution
française à la Bibliothèque
numérique européenne
Présentation …………………………………………… 3
Les collections accessibles depuis Europeana ..……6
Les choix éditoriaux de la BnF………………………… .6
Les contributions hongroise et portugaise……………..7
Vers Gallica 2.0 ……………………………………… 8
Le programme de numérisation de la BnF……………...9
Les choix éditoriaux propres à Gallica 2.0 ……… 10
Europeana : Informations techniques………………… 13
www.europeana.eu
la contribution française à la Bibliothèque numérique européenne
EUROPEANA
Dossier de presse
Utiliser Europeana
La recherche……………………………………………14
La consultation………………………………………...17
« Ma bibliothèque »…………………………………….21
1
Communiqué de presse
La Culture peut et doit être au cœur de la dynamique européenne : pour
l’entretenir, pour la relancer, il nous appartient de concevoir et de proposer
des projets qui parlent à l’imagination des citoyens, qui les séduisent, qui
incarnent une ambition partagée à l’échelle du continent.
Mû par cette conviction, j’ai réagi à l’annonce par Google d’un plan de
numérisation des collections de plusieurs bibliothèques anglo-saxonnes.
L’Europe ne pouvait pas rester à l’écart d’un grand mouvement visant à
mettre à la disposition de tous, par l’intermédiaire de la Toile, des œuvres
indispensables à la compréhension de ce que nous sommes.
Le projet de Bibliothèque numérique que je promeus avec mes collègues
européens se situe à la rencontre de plusieurs aspirations : accélérer le
rythme de la numérisation de documents amorcée il y a plusieurs années
(notamment à la BnF avec la création de Gallica), pour atteindre une
cadence de plusieurs centaines de milliers par an à hauteur de l’Europe
entière et constituer ainsi, en peu de temps, une collection numérique riche
de cinq à six millions d’ouvrages ; organiser le savoir offert aux internautes
en leur proposant des corpus organisés et représentatifs de tous les
champs de la connaissance et leur donner des clés d’accès que seules les
bibliothèques, fortes de leur expérience et de leur compétence, peuvent
forger ; associer enfin l’ensemble des acteurs de la chaîne du livre à ce
grand dessein.
Le débat lancé de la sorte s’est amplifié. Il a mobilisé les professionnels et
les citoyens. Le but à atteindre a été affirmé par les politiques, au niveau
européen et au niveau national. La BnF s’est vu confier la responsabilité de
la contribution française au projet de Bibliothèque numérique européenne.
Le prototype que nous présentons au Salon du Livre et que nous avons
choisi d’appeler Europeana s’inscrit dans le cadre de cette grande
ambition ; il en est la première réalisation concrète. Mis en ligne, il a pour
vocation de tracer, pour tous les partenaires de cette entreprise mais aussi
pour le grand public, les contours d’une bibliothèque européenne : appuyé
sur un nombre restreint mais probant de documents provenant des
collections des bibliothèques nationales de Hongrie, du Portugal et de
France, Europeana propose des fonctionnalités modernes, adaptées aux
usages et aux aspirations des internautes.
La réflexion menée par la BnF autour de ce prototype servira un dessein
parallèle et cohérent : la modernisation de sa bibliothèque numérique,
Gallica, l’une des plus anciennes et des plus riches de la Toile, l’une des
plus fréquentées aussi. L’effort massif de numérisation engagé dès 2006
sera poursuivi en 2007 et pendant plusieurs années. Par l’exemple, la
France veut montrer la voie et appeler à la rejoindre tous ceux qui
défendent la diversité culturelle et s’attachent passionnément au
rayonnement de l’Europe tout autour du monde.
Jean-Noël Jeanneney
2
Europeana, la contribution française
à la Bibliothèque numérique européenne
Présentation
Quand Google défie l'Europe, tribune publiée en janvier 2005 dans Le
Monde par le président de la BnF, Jean-Noël Jeanneney, a largement
contribué à la prise de conscience de l'enjeu politique international que
représente la création d’une Bibliothèque numérique européenne
(BnuE).
Conçue comme un lieu d’accès unique et multilingue à un vaste
ensemble de documents numérisés et mis en ligne, représentatifs
de l’histoire et de la culture européennes, la BnuE entend apporter
une réponse européenne aux enjeux de l’accès à la connaissance sur
Internet.
A l’appel du président Jacques Chirac et de cinq autres chefs d’État ou
de gouvernement européens (Espagne, Allemagne, Italie, Hongrie,
Pologne), les institutions de l’Europe ont rejoint ce mouvement dès
le printemps 2005 avec le soutien de Jean-Claude Juncker, alors
président du Conseil européen, et de José Manuel Barroso, président de
la Commission européenne.
Ce fut aussi le cas, très vite, de vingt-trois bibliothèques nationales des
Etats de l’Union européenne, signataires d’une motion appelant, à
l’initiative de la BnF, à une numérisation large et organisée des œuvres
appartenant au patrimoine de l’Europe.
Pour sa part, la Commission européenne a publié en septembre 2005
une communication intitulée « i2010 Bibliothèques numériques » et a
lancé une vaste consultation en ligne. Sur la base des résultats de cette
consultation, la Commission a ensuite annoncé, dans un communiqué
de presse du 2 mars 2006, une intensification de ses efforts « pour
mettre en ligne la « mémoire de l’Europe » via une bibliothèque
numérique européenne ». Cette bibliothèque viendra enrichir le portail
TEL (The European Library), créé par l’organisme qui réunit les
bibliothèques nationales de tous les pays d’Europe, la Conference of
European National Librarians (CENL), dont l’objectif est de permettre
dans les cinq prochaines années l'accès aux collections des 47
bibliothèques nationales membres de la CENL.
La Commission a enfin publié, le 24 août 2006, une
recommandation sur la numérisation et l'accessibilité en ligne du
matériel culturel et la conservation numérique, qui a été approuvée
unanimement par le Conseil des ministres de la culture et de
l'audiovisuel le 13 novembre 2006.
3
En France, un comité de pilotage présidé par le ministre de la
culture et de la communication et le président de la BnF a été créé
en juillet 2005. Il a remis le 11 janvier 2006 un « livre blanc » dont
est issu un plan d’action, présenté en Conseil des ministres
le 8 février 2006.
La Bibliothèque nationale de France a reçu du gouvernement
français, le 2 mai 2006, la responsabilité officielle du pilotage
opérationnel du projet en France.
Pour remplir cette mission, la BnF s’est appuyée sur l’expérience qu’elle
avait acquise avec Gallica, l’une des premières bibliothèques
numériques au monde par son ancienneté (elle a été créée en 1996), le
nombre de documents en ligne qu’elle propose (90 000 ouvrages et
autant d’images) et l’importance de sa fréquentation (plus d’un million
de documents consultés par mois).
La mobilisation de ses équipes a permis à la Bibliothèque :
•
la réalisation d’une maquette puis d’un prototype, Europeana,
dont la version « beta » est ouverte au public à l’occasion du Salon
du livre de Paris en mars 2007, afin de tester et de proposer aux
partenaires européens de nouvelles fonctionnalités s’inscrivant dans
le cadre du projet de BnuE ;
•
la modernisation technique de sa propre bibliothèque
numérique, Gallica : passage du mode image au mode texte par
utilisation d’un procédé de reconnaissance optique de caractères
(OCR), mise en ligne de plusieurs titres de la presse quotidienne
numérisés, consultables de manière plus aisée grâce à un outil
adapté ;
•
l’intensification des programmes de numérisation d’œuvres
issues du fonds de la BnF : le rythme de numérisation passe, à
partir de 2007, de 5000 à 100 000 ouvrages par an.
Europeana, la contribution française à la Bibliothèque numérique
européenne, est un prototype de bibliothèque numérique qui donne
accès dans un premier temps à environ 12 000 documents issus
des collections de la Bibliothèque nationale de France, mais aussi
de la Bibliothèque nationale de Hongrie et de la Bibliothèque
nationale du Portugal.
Il a pour objectif de tester, sur un volume significatif de documents
numérisés, les fonctions utilisables dans une bibliothèque numérique
(recherche plein texte au sein d’un ouvrage ou d’un ensemble
d’ouvrages, annotation et étiquetage des textes dans des espaces
personnels, etc.) et met en œuvre une partie des concepts proposés
dans une maquette présentée à l’automne 2006 aux instances
politiques ainsi qu’aux professionnels des bibliothèques. Cette
maquette a également suscité des réactions recueillies auprès
d’utilisateurs dans le cadre de focus groups dont les remarques ont été
prises en compte dans l’ergonomie du prototype.
4
Les fonctionnalités développées dans Europeana se situent dans un
environnement Web 2.0. Elles permettent à tout internaute – quel que
soit son niveau de compétence dans l’utilisation des techniques
d’Internet - de découvrir facilement des collections organisées selon les
principes de classement des bibliothèques, grâce à une appropriation
intuitive des fonctionnalités de recherche.
Europeana, la contribution française au projet de BnuE, a vocation à
alimenter la réflexion des partenaires européens tout en servant de
test en grandeur réelle pour la modernisation technique de Gallica,
la Bibliothèque numérique de la BnF.
Pour mener ce projet à bonne fin, la BnF a obtenu en 2006 un budget de
3,375 M€ du ministère de la culture et de la communication, qui a
permis de financer un test de numérisation de masse, la réalisation
d’une maquette exposant les fonctionnalités attendues de la
bibliothèque numérique européenne, l’ « océrisation » des deux-tiers des
ouvrages déjà disponibles dans Gallica ainsi que la numérisation et la
conversion en mode texte de 30 000 ouvrages.
En 2007, le ministère de la culture et de la communication a affecté
10 M€ au projet de Bibliothèque numérique européenne par
l’intermédiaire de la commission « Politique numérique » du CNL (Centre
national du livre). Ce budget permettra notamment de financer la
numérisation et la conversion en mode texte de 100 000 nouveaux
documents, ainsi que l’achat de serveurs et le développement des
modules de base du « système de préservation et d’archivage réparti »
(SPAR) qui permet le stockage des données numériques, leur
préservation pérenne et leur communication au grand public, assorties
de fonctionnalités nouvelles et performantes.
En parallèle, un groupe de travail associant le Syndicat national de
l’édition et la BnF réfléchit depuis quelques mois aux conditions
économiquement équilibrées d’une mise en ligne des ouvrages encore
protégés par le droit d’auteur, en vue d’aboutir courant 2007.
5
Les collections accessibles depuis Europeana
Lancé et mis en ligne en mars 2007, le prototype donne accès à
12 000 ouvrages dont 7 000 sont issus des collections de la BnF.
Les choix éditoriaux
La sélection des documents présentés par la BnF dans Europeana
répond à l’objectif scientifique de constituer une bibliothèque
encyclopédique de textes appartenant au patrimoine culturel
francophone et européen et participant de la notion classique des
« humanités » : textes littéraires, historiques, philosophiques, politiques
ou scientifiques. Il s’agit bien de proposer un choix de textes
fondateurs de la culture européenne.
Cette
sélection
complémentaires :
s’articule
autour
de
trois
ensembles
•
Un premier ensemble gravite autour de l’idée d’œuvres phares de
la culture francophone et européenne : on y trouvera par exemple,
dans le domaine littéraire, les œuvres de Corneille, Diderot, Hugo ou
Rousseau, mises en regard des grands textes de la littérature
européenne : œuvres de Shakespeare, Dickens, Goldoni ou Dante. Dans
le domaine scientifique, on citera Kepler, Galilée ou Geoffroy-SaintHilaire.
•
Autour de ce cœur fondateur, ont été retenus des documents
souvent moins académiques, mais qui resituent dans leur contexte
historique ou social les œuvres classiques : y figurent ainsi des
œuvres de vulgarisation scientifique (ouvrages de Camille Flammarion),
des essais (textes de Claude Bernard, Auguste Blanqui ou Jules Simon),
des sources historiques (Séries des Mémoires pour servir à l’histoire de
France, Journal de Henri III et IV de Pierre de l’Estoile, correspondances
de Charles Quint, Calvin, Auguste Comte, Berlioz) ainsi qu’une sélection
de mémoires et de biographies (mémoires de Saint-Simon , Louise
Michel, ou Foch ; vies de Bonaparte, George Sand ou Victor Cousin).
•
Enfin, a été sélectionné un ensemble d’outils biographiques
(Biographie universelle des musiciens) ou bibliographiques (Manuel du
libraire de Brunet), ainsi que des encyclopédies (Encyclopédie moderne
ou Encyclopédie du XIXème siècle) et des dictionnaires (Dictionnaire des
finances ou Dictionnaire de la Bible), permettant d’offrir une description
raisonnée des états du savoir et de la langue.
6
Les contributions hongroise et portugaise
Les documents issus des bibliothèques nationales de Hongrie et du
Portugal ont été sélectionnés d'une part sur des critères techniques,
d'autre part sur des critères de contenus afin de favoriser une
convergence autour de principes simples : pluridisciplinarité, ouverture
à des problématiques souvent plus européennes que nationales.
La collection d’ouvrages hongrois (4000) comprend notamment des
études sur l'histoire, la tradition populaire et la littérature hongroises,
ainsi que des œuvres littéraires d'auteurs hongrois et des traductions en
hongrois de classiques européens. Ces documents proviennent de la
bibliothèque électronique hongroise Magyar Elektronikus Könyvtár.
La collection portugaise (1000 ouvrages) est composée principalement
de documents sur l'histoire du Portugal, notamment des récits de
voyages, ainsi que sur le droit, les arts et l'éducation. Tous proviennent
de la bibliothèque numérique du Portugal, Biblioteca Nacional Digital.
7
Vers Gallica 2.0
Gallica, bibliothèque numérique de la BnF, propose actuellement
90 000 ouvrages et plus de 80 000 images en libre accès. On la
trouve sur le site de la BnF (www.bnf.fr).
Les développements effectués dans le projet Europeana serviront à
l’élaboration d’une nouvelle version de Gallica. Son architecture
technique rénovée permettra une interopérabilité avec les bibliothèques
européennes, ainsi que la reprise des fonctionnalités élaborées pour
Europeana : nouvelles modalités de recherche et de tri des résultats par
langue et par sujet ; navigation au sein des documents par table des
matières ; grossissement des caractères ; espace de travail
personnalisé complet ; « panier » personnel, etc. Les fonctionnalités
imaginées pour Europeana mais non réalisées dans le prototype seront
développées dans cette nouvelle version de Gallica :
− Extension du moteur de recherche plein texte vers un moteur
utilisant de manière plus intelligente les métadonnées. La
sélection de ce moteur, son adaptation aux documents
numérisés s’effectueront en synergie avec des programmes
européens en cours d’approbation par la Commission et avec
l’appui de France Télécom.
− Ajout des fonctions de travail collaboratif
Courant 2007, d’autres types de documents aujourd’hui disponibles en
ligne seront progressivement ajoutés à Gallica 2.0, dont les
fonctionnalités seront étendues en conséquence pour la presse, les
cartes, les documents audiovisuels…
Gallica continue en parallèle à être alimenté de toutes les nouvelles
numérisations sans évolution technique et reste accessible aux
utilisateurs.
L’arrêt de Gallica n’interviendra que lorsque Gallica 2.0 sera pleinement
opérationnel, c'est-à-dire à l’été 2008.
8
Le programme de numérisation de la BnF
Jusqu’en 2005, Gallica s’enrichissait de 5 000 à 6 000 documents par
an, numérisés en « mode image » seul. Pour que la France puisse
apporter une contribution significative au projet de Bibliothèque
numérique européenne, un changement d’échelle radical était
nécessaire, ainsi qu’une mutation profonde des techniques d’accès.
La première évolution concerne les techniques de numérisation : la
diminution des coûts permet aujourd’hui de numériser de nouveaux
documents en mode texte, en disposant d’enveloppes financières
mesurées.
Les coûts de numérisation et de conversion par reconnaissance optique
de caractères d'un ouvrage de 300 pages s'élèvent aujourd'hui à une
vingtaine d'euros pour des documents massicotés (format qui permet
une numérisation entièrement automatisée) et à une quarantaine
d'euros pour des documents reliés. Une meilleure restitution en ligne de
certains ouvrages (dictionnaires, encyclopédies,...) ou de parties
d'ouvrages (table des matières, index) impose le recours à une
conversion par reconnaissance optique de caractères de haute qualité
(taux de reconnaissance de 99,8%) ; son coût s’élève alors au quintuple
de ceux mentionnés ci-dessus. Enfin, la seule conversion par
reconnaissance optique de caractères (à 96%) de documents déjà
numérisés représente un coût d’environ 7 à 8 € TTC pour un ouvrage de
300 pages.
60 000 documents déjà numérisés en mode image pour Gallica
seront ainsi traités à nouveau d’ici au mois de septembre 2007 afin
de leur associer le mode texte par un procédé de reconnaissance
optique de caractères (« océrisation »).
Convaincue de la nécessité d’accroître notablement son offre
numérique, la BnF a confié à IBM au printemps 2006 la réalisation d’un
test visant à définir les conditions de mise en oeuvre d’une
numérisation de masse. De nouvelles technologies ont été élaborées
ces dernières années par les industriels et permettent le changement
d’échelle radical induit par le projet de Bibliothèque numérique
européenne.
Dans le cas de la BnF, la numérisation est confiée à des prestataires
privés spécialisés, choisis sur appels d'offres. Le passage à une
numérisation de masse s’effectue en deux temps :
•
la numérisation de 30 000 documents, confiée aux sociétés
Jouve et Diadeis, sera réalisée entre décembre 2006 et septembre
2007 ;
•
la BnF a lancé le 20 février 2007 une consultation pour un nouveau
marché de « dématérialisation des collections », qui prévoit
la
numérisation de 100 000 ouvrages par an pendant trois ans.
9
Les choix éditoriaux propres à Gallica 2.0
A la sélection offerte dans Europeana s’ajoutera en 2007 la mise à
disposition, également en mode texte, de la somme des connaissances
que rassemble Gallica dans toutes les disciplines (philosophie, histoire,
littérature, religion, sciences, …).
L’accroissement du nombre de documents annuellement numérisés,
de l’ordre de 100 000 volumes par an à compter de 2007,
s’organisera autour de trois axes principaux :
•
Le patrimoine national, à partir des moments clés de l’histoire de
la France (documents fondateurs de la démocratie en France) et de ses
régions ; des grandes revues françaises scientifiques et d’érudition
(Revue française de psychanalyse, Etudes, Revue d’histoire littéraire de la
France) ; du développement de la poésie, des sciences naturelles ou des
arts décoratifs en France.
•
Les programmes à vocation internationale : certains corpus
patrimoniaux trouveront un surcroît d’intérêt dans le rapprochement
avec des ensembles documentaires portant sur le même sujet mais
issus d’autres pays, d’autres cultures nationales. Des concertations
avec de grandes bibliothèques étrangères ont permis de faire émerger
plusieurs domaines communs : la presse quotidienne nationale – pour
laquelle la Bibliothèque a lancé un vaste plan pluriannuel et qui figure
également dans plusieurs programmes nationaux, notamment en
Finlande, aux Pays-Bas, en Espagne, en Autriche, en Grande Bretagne ;
la documentation juridique (recueils de lois, archives parlementaires,
jurisprudence, grands arrêtés) ; la généalogie, et plus largement la
recherche identitaire autour des personnes ou des territoires ; les
langues : pour la France, on s’attachera d’abord à rassembler un fonds
sur l’apprentissage de la langue française et des sources pour l’histoire
de la francophonie ; les traductions des chefs-d’œuvre de différentes
littératures nationales.
•
Une bibliothèque française sur l’Europe : la Bibliothèque
nationale de France se propose de construire un corpus d’œuvres et de
documents français consacrés spécifiquement à l’Europe dans tous ses
aspects : outre la philosophie politique, les identités et mentalités
nationales, la sélection concernera l’histoire, l’économie et le
commerce (développement du système bancaire européen), le travail,
les sciences et techniques (faune et flore, développement du chemin de
fer, méthodes agricoles, médecine), la littérature et la musique, les
questions sociales - situation des femmes, des enfants, conséquences
de la révolution industrielle - l’éducation et l’enseignement, les voyages
et le tourisme, les grands événements culturels. Les relations
internationales intra-européennes mais aussi extra-européennes
(relations de l’Europe avec l’Afrique, l’Amérique, le Japon, la Russie, …)
seront également illustrées par nombre d’ouvrages. Dans ces
programmes sur l’Europe, les premières tentatives de presse
européenne occuperont une bonne place (des gazettes du XVIIIème
siècle à L’Europe artiste ou à L’économiste européen)
10
Cette politique de numérisation aura vocation à se poursuivre en
coopération avec de grandes bibliothèques françaises et étrangères
autour de programmes concertés. On citera par exemple, en France,
le programme sur les expositions universelles, conduit avec le
Conservatoire national des arts et métiers, ou le programme sur la
guerre de 1914-1918, mené actuellement avec la Bibliothèque de
documentation internationale et contemporaine (BDIC). Ce dernier
préfigure une contribution à une plus vaste réflexion au niveau européen
sur les sources de l’histoire de la première guerre mondiale. A
l’étranger, au-delà même du continent européen, on peut mentionner le
programme Sinica, compilation d’ouvrages de sinologues français puis
européens, en concertation avec la Bibliothèque nationale de Chine,
mais aussi la numérisation d’un corpus d’archives de la Révolution
française en collaboration avec l’Université de Stanford aux Etats-Unis.
Caractéristiques des collections de Gallica 2.0 à l’horizon 2008 :
Types de documents : toutes catégories de documents imprimés :
monographies, revues, journaux, thèses, brochures et plaquettes, …
Nationalités et langues : publications en français publiées en France.
Dates des documents : majoritairement XIXème siècle, corpus
significatifs du XVIIIème siècle, extension en deçà selon les capacités
offertes par la reconnaissance optique de caractères.
Ouvrages sous droits d’auteur : sauf exceptions formalisées par des
conventions avec les ayants droit et/ou dans le cadre de partenariats
avec les grandes revues françaises, tous les documents numérisés sont
pour l’instant dans le domaine public.
Toutefois, il ne serait pas concevable à terme que l’outil exceptionnel de
recherche documentaire et de découverte que constituera la
bibliothèque numérique européenne ne propose pas à l’internaute des
documents récents encore soumis au droit d’auteur, aux côtés des
documents libres de droits que la Bibliothèque nationale de France et
ses homologues européennes mettront en ligne à partir de leurs propres
collections patrimoniales.
Cependant, la mise en ligne de documents sous droits ne peut être
envisagée que dans le cadre d’un dispositif concerté assurant une juste
rémunération des ayants droit.
Un groupe de travail bipartite a été constitué à l’été 2006 entre le
Syndicat national de l’édition et la Bibliothèque nationale de France aux
fins d’examiner et de proposer aux éditeurs, ainsi qu’à toute la chaîne
de l’économie du livre, un modèle économique régissant leur
participation à la bibliothèque numérique européenne et permettant
cette juste rémunération.
11
Les membres du groupe de travail ont décidé d’avoir recours à un
expert afin de les assister dans l’élaboration dudit modèle. Les
premières orientations de l'étude d'expert ont été validées par le groupe
de travail le 20 février 2007. L’étude, conduite par la société Numilog,
sera achevée au début du mois d’avril 2007.
Dans le modèle proposé, les internautes bénéficieraient, à travers la
BnuE, de la recherche plein texte dans les documents sous droits aussi
bien que dans ceux du domaine public, le résultat de la recherche
présentant les notices descriptives des deux types d'ouvrages. Ensuite,
toute demande d’accès au texte intégral des ouvrages sous droit serait
renvoyée vers le site de diffuseurs, qui offriraient un certain nombre de
services : consultation temporaire d’un ouvrage, accès à un groupe de
documents pendant une période donnée, vente de tout ou partie de
documents numériques (avec possibilité de téléchargement), vente du
livre papier.
Ces services seraient facturés conformément aux accords conclus entre
diffuseurs et éditeurs ; leur homogénéité serait assurée par un cahier
des charges de la Bibliothèque numérique européenne, dont les
diffuseurs respecteraient les clauses.
L’offre d’ouvrages sous droits a vocation à s’inscrire en cohérence avec
la politique documentaire de Gallica 2.0. Cette complémentarité
s’entend d’abord en matière éditoriale, puisque serait proposée une
mise à jour des connaissances biographiques, bibliographiques et
critiques dans toutes les disciplines. Elle permettrait ensuite de mieux
couvrir le champ des disciplines « récentes » (psychologie,
psychanalyse, sciences de l’éducation, urbanisme…) et d’enrichir en
particulier l’histoire européenne. Enfin, certains secteurs de l’édition
(régionale, érudite…) gagneront en visibilité par une présence affirmée
en ligne.
12
Europeana :
Informations techniques
Le prototype Europeana est développé sur une plateforme indépendante de Gallica et
comporte un ensemble de 7000 monographies, toutes en mode image et en mode
texte. Le texte est issu de la conversion automatique par logiciel de reconnaissance de
caractères. Il faut noter que cette conversion est non corrigée et peut comporter par
conséquent un certain nombre d'erreurs. Le taux de reconnaissance plancher est de
96%, mais il a été décidé que 10% des documents numérisés par la Bibliothèque
nationale de France auraient un taux de 99,9%. Ce mode texte est utilisé par le moteur
de recherche pour la recherche plein texte dans l’ensemble des documents et à
l’intérieur d’un document mais est également destiné aux outils de lecture d’écrans
(de type JAWS) utilisés dans le cadre de la déficience visuelle. La volumétrie totale des
documents représente un volume de 700 Go.
Le prototype donne également accès à 4000 documents de la Bibliothèque nationale
de Hongrie et 1000 documents de la Bibliothèque nationale du Portugal, consultables
sur leur site d’origine.
Europeana utilise comme outil de recherche un logiciel libre de la fondation Apache :
Lucene.
Ce moteur dispose d’un certain nombre de fonctionnalités visibles dans Europeana : la
recherche plein texte, la recherche dans les notices, le classement des résultats. Il ne
comprend toutefois pas toutes les options envisagées dans la maquette (recherche
avancée, opérateurs booléens, outils sémantiques), qui seront explorées et mises en
œuvre dans la deuxième version de Gallica. L’algorithme de pertinence du moteur
Lucene est utilisé pour le classement des résultats de recherche. Il repose sur une
analyse des mots recherchés en fonction du nombre d’occurrences trouvées, de leur
densité et de leur emplacement dans les contenus (par exemple, un mot trouvé dans
le titre d’un ouvrage a un taux de pertinence plus élevé qu’un mot trouvé dans le corps
du texte).
L’application est déployée sur un ensemble de 26 serveurs de dernière génération (bi
processeurs dual core) hébergés par la BnF. A l’occasion de l’ouverture, un dispositif
complémentaire sera mis en œuvre par la société Atos Wordline afin d’améliorer les
conditions d’accès aux documents en cas de forte sollicitation de l’application.
13
Utiliser Europeana
L’univers graphique d’Europeana correspond aux trois étapes de progression
dans le site : bleu pour la recherche, orange pour la consultation des
documents, vert pour le travail dans l’espace personnel « Ma bibliothèque ».
Les pages d’Europeana sont construites en trois colonnes : un espace central contenant
l’information principale (les modes de recherche, les résultats de la recherche, le document, les
données personnelles enregistrées par l’utilisateur) et des espaces latéraux constitués de palettes
d’outils.
Ces palettes contiennent des liens, icônes, boutons ou formulaires offrant à l’utilisateur des
fonctions spécifiques relatives à la page qu’il consulte.
Elles s’ouvrent, se ferment et se déplacent à l’aide des boutons situés en haut à droite de chacune
d’elles, permettant ainsi à chacun de personnaliser son environnement de consultation.
La recherche
Plusieurs modes de recherche dans les collections d’Europeana sont possibles : la recherche par
mots ou expressions, dite recherche plein texte, la recherche par critères et la recherche par
thèmes.
La recherche par critères permet une découverte des collections par époque de publication, langue
des documents ou bibliothèque de provenance.
La recherche par thèmes est organisée selon la classification Dewey, conçue au XIXème siècle,
régulièrement mise à jour depuis et utilisée par un grand nombre de bibliothèques dans le monde
pour classer leurs collections. Une variété de thèmes regroupés en 10 grands ensembles permet
d’accéder à des listes de documents portant sur un même sujet.
14
Comment sont décrits les documents ?
Chaque document est signalé succinctement par son titre, son ou ses auteurs et sa date de
publication. La notice complète du document est accessible depuis l’icône d’information située à la
suite de la référence.
Dans le cas d'une recherche plein texte, le terme recherché est surligné en orange et un extrait
significatif tiré de la notice ou du contenu du document permet de vérifier la pertinence du résultat
par rapport à la recherche.
Le nombre d'occurrences indiqué correspond au nombre de fois où le ou les mots recherchés
apparaissent dans le document et/ou sa notice. Le taux de pertinence est calculé par le moteur de
recherche. Tous deux sont indiqués à la suite de l'extrait.
15
Comment affiner les résultats ?
Une fois la recherche lancée, la palette « Affiner » regroupe les résultats trouvés en sousensembles classés par grandes catégories :
« Provenance » correspond à la bibliothèque d'origine des documents, « Date » correspond à la
date de publication des documents, « Langue » correspond à la langue des documents, « Auteur »
correspond aux principaux auteurs des documents.
En cliquant sur l’un des liens proposés, l’utilisateur restreint les résultats à ce sous-ensemble. Il
peut ainsi affiner progressivement sa recherche.
Cette technique est appelée « la recherche par facettes ».
16
La consultation
Pour consulter un document, il suffit de cliquer, depuis une page de résultats, soit sur la
référence du document, soit sur l’icône symbolisant un livre ouvert, situé à droite de
celle-ci.
Seuls les documents numérisés par la Bibliothèque nationale de France sont consultables
dans l’interface d’Europeana. Les documents numérisés par la Bibliothèque nationale du
Portugal et par la Bibliothèque nationale Széchényi sont, quant à eux, consultables dans
les interfaces des bibliothèques numériques de ces deux institutions, sur des sites
distincts.
Comment naviguer dans un document ?
Pour feuilleter un document page à page, des flèches de navigation sont disponibles dans la barre
située en haut et en bas de la page en cours de consultation.
Pour accéder à une page précise, l’utilisateur peut l’appeler grâce au formulaire dédié à cet effet audessus du document, ou cliquer dans la palette « Naviguer » sur le numéro de la page souhaitée ou
la vignette correspondante.
La table des matières, lorsqu’elle existe, est également accessible dans la palette « Naviguer » et
permet un accès direct aux têtes de chapitres.
17
Peut-on agrandir l'image d'un document ?
Une fonction zoom permet d’agrandir l’image : la résolution de l'image la plus petite est de 512
pixels de largeur par 768 pixels maximum de hauteur. La résolution de l'image la plus grande est de
1024 pixels de largeur par 1536 pixels maximum de hauteur.
18
Comment s’effectue la recherche dans un document ?
Il est possible de lancer une recherche d'un ou plusieurs mots à l'intérieur d’un document grâce à la
palette « Rechercher dans ce document ».
Chaque page du document contenant l'un des termes recherchés est indiquée, ainsi que le nombre
d'occurrences trouvées dans celle-ci. Pour visualiser une page, il suffit de cliquer sur le lien vers
cette page dans la palette. Le terme recherché est surligné en jaune dans la page.
19
Peut-on sauvegarder un document ?
Pour garder une trace du document en cours de consultation, la palette « Utiliser » offre plusieurs
possibilités : imprimer le document, le télécharger (en version PDF) ou envoyer par courriel sa
référence et son adresse URL.
Il peut également être enregistré dans l’espace personnel de l’utilisateur (« Ma bibliothèque ») : voir
plus loin.
20
« Ma bibliothèque »
A quoi sert « Ma bibliothèque » ?
« Ma bibliothèque » est un espace personnel qui permet d'enregistrer des références de
documents ou d’indexer des pages afin de les retrouver sans avoir à renouveler une
recherche.
« Ma bibliothèque » est composée de trois pages différentes : « Ma page d’accueil », qui
donne une vue d'ensemble sur les données personnelles enregistrées, « Mes documents »,
dédiée aux documents enregistrés, « Mes étiquettes » qui comprend les pages indexées.
Tout internaute peut créer un compte à partir de la palette « Ma bibliothèque », à l’aide
d’un alias (nom d'utilisateur) et d’un mot de passe.
A quoi sert « Mes documents »?
La fonction « Mes documents » de « Ma bibliothèque » permet d'enregistrer dans l’espace personnel
des références de documents et de les organiser par dossiers.
L’utilisateur peut sélectionner les documents qui l’intéressent depuis une page de résultats ou
depuis l’espace de consultation en cliquant sur l’icône « Ajouter à mes documents ».
Tous les documents ajoutés apparaissent dans la page d'accueil de « Ma bibliothèque » et sur la
page « Mes documents ». Pour consulter le document, il suffit de cliquer sur la référence
enregistrée.
Depuis la page « Mes documents » de « Ma bibliothèque », l’utilisateur peut créer des dossiers et
trier, déplacer ou supprimer les références des documents à l’intérieur de ces dossiers.
21
Qu’est-ce qu’une étiquette ?
Le terme « étiquette » est la traduction française de l’anglais « tag ».
Une étiquette est un mot clé ou un ensemble de mots clés qui, tel un post-it, serait collé par
l’utilisateur sur la page d'un document.
Tout utilisateur disposant d’un espace personnel peut créer une ou plusieurs étiquettes sur
l’ensemble des pages des documents qu’il consulte.
Les étiquettes créées sur un même document en cours de consultation sont visibles depuis la
palette « Ma bibliothèque » et permettent à l’utilisateur de naviguer dans le document selon ses
propres mots clés.
Sur la page « Mes étiquettes » de son espace personnel, l’utilisateur retrouve la totalité de ses
étiquettes organisées en « nuage » (« tag cloud » en anglais).
Le nuage consiste à représenter graphiquement les étiquettes en fonction du nombre de pages
auxquelles chacune renvoie : plus le nombre de pages indexées est important, plus la taille de
l’étiquette est grande.
En cliquant sur un mot du nuage, l’utilisateur a accès aux références des pages portant cette
étiquette. Chaque référence est un lien vers la page indiquée.
22

Documents pareils