EUROPEANA la contribution française à la Bibliothèque numérique
Transcription
EUROPEANA la contribution française à la Bibliothèque numérique
Communiqué de presse Europeana, la contribution française à la Bibliothèque numérique européenne Présentation …………………………………………… 3 Les collections accessibles depuis Europeana ..……6 Les choix éditoriaux de la BnF………………………… .6 Les contributions hongroise et portugaise……………..7 Vers Gallica 2.0 ……………………………………… 8 Le programme de numérisation de la BnF……………...9 Les choix éditoriaux propres à Gallica 2.0 ……… 10 Europeana : Informations techniques………………… 13 www.europeana.eu la contribution française à la Bibliothèque numérique européenne EUROPEANA Dossier de presse Utiliser Europeana La recherche……………………………………………14 La consultation………………………………………...17 « Ma bibliothèque »…………………………………….21 1 Communiqué de presse La Culture peut et doit être au cœur de la dynamique européenne : pour l’entretenir, pour la relancer, il nous appartient de concevoir et de proposer des projets qui parlent à l’imagination des citoyens, qui les séduisent, qui incarnent une ambition partagée à l’échelle du continent. Mû par cette conviction, j’ai réagi à l’annonce par Google d’un plan de numérisation des collections de plusieurs bibliothèques anglo-saxonnes. L’Europe ne pouvait pas rester à l’écart d’un grand mouvement visant à mettre à la disposition de tous, par l’intermédiaire de la Toile, des œuvres indispensables à la compréhension de ce que nous sommes. Le projet de Bibliothèque numérique que je promeus avec mes collègues européens se situe à la rencontre de plusieurs aspirations : accélérer le rythme de la numérisation de documents amorcée il y a plusieurs années (notamment à la BnF avec la création de Gallica), pour atteindre une cadence de plusieurs centaines de milliers par an à hauteur de l’Europe entière et constituer ainsi, en peu de temps, une collection numérique riche de cinq à six millions d’ouvrages ; organiser le savoir offert aux internautes en leur proposant des corpus organisés et représentatifs de tous les champs de la connaissance et leur donner des clés d’accès que seules les bibliothèques, fortes de leur expérience et de leur compétence, peuvent forger ; associer enfin l’ensemble des acteurs de la chaîne du livre à ce grand dessein. Le débat lancé de la sorte s’est amplifié. Il a mobilisé les professionnels et les citoyens. Le but à atteindre a été affirmé par les politiques, au niveau européen et au niveau national. La BnF s’est vu confier la responsabilité de la contribution française au projet de Bibliothèque numérique européenne. Le prototype que nous présentons au Salon du Livre et que nous avons choisi d’appeler Europeana s’inscrit dans le cadre de cette grande ambition ; il en est la première réalisation concrète. Mis en ligne, il a pour vocation de tracer, pour tous les partenaires de cette entreprise mais aussi pour le grand public, les contours d’une bibliothèque européenne : appuyé sur un nombre restreint mais probant de documents provenant des collections des bibliothèques nationales de Hongrie, du Portugal et de France, Europeana propose des fonctionnalités modernes, adaptées aux usages et aux aspirations des internautes. La réflexion menée par la BnF autour de ce prototype servira un dessein parallèle et cohérent : la modernisation de sa bibliothèque numérique, Gallica, l’une des plus anciennes et des plus riches de la Toile, l’une des plus fréquentées aussi. L’effort massif de numérisation engagé dès 2006 sera poursuivi en 2007 et pendant plusieurs années. Par l’exemple, la France veut montrer la voie et appeler à la rejoindre tous ceux qui défendent la diversité culturelle et s’attachent passionnément au rayonnement de l’Europe tout autour du monde. Jean-Noël Jeanneney 2 Europeana, la contribution française à la Bibliothèque numérique européenne Présentation Quand Google défie l'Europe, tribune publiée en janvier 2005 dans Le Monde par le président de la BnF, Jean-Noël Jeanneney, a largement contribué à la prise de conscience de l'enjeu politique international que représente la création d’une Bibliothèque numérique européenne (BnuE). Conçue comme un lieu d’accès unique et multilingue à un vaste ensemble de documents numérisés et mis en ligne, représentatifs de l’histoire et de la culture européennes, la BnuE entend apporter une réponse européenne aux enjeux de l’accès à la connaissance sur Internet. A l’appel du président Jacques Chirac et de cinq autres chefs d’État ou de gouvernement européens (Espagne, Allemagne, Italie, Hongrie, Pologne), les institutions de l’Europe ont rejoint ce mouvement dès le printemps 2005 avec le soutien de Jean-Claude Juncker, alors président du Conseil européen, et de José Manuel Barroso, président de la Commission européenne. Ce fut aussi le cas, très vite, de vingt-trois bibliothèques nationales des Etats de l’Union européenne, signataires d’une motion appelant, à l’initiative de la BnF, à une numérisation large et organisée des œuvres appartenant au patrimoine de l’Europe. Pour sa part, la Commission européenne a publié en septembre 2005 une communication intitulée « i2010 Bibliothèques numériques » et a lancé une vaste consultation en ligne. Sur la base des résultats de cette consultation, la Commission a ensuite annoncé, dans un communiqué de presse du 2 mars 2006, une intensification de ses efforts « pour mettre en ligne la « mémoire de l’Europe » via une bibliothèque numérique européenne ». Cette bibliothèque viendra enrichir le portail TEL (The European Library), créé par l’organisme qui réunit les bibliothèques nationales de tous les pays d’Europe, la Conference of European National Librarians (CENL), dont l’objectif est de permettre dans les cinq prochaines années l'accès aux collections des 47 bibliothèques nationales membres de la CENL. La Commission a enfin publié, le 24 août 2006, une recommandation sur la numérisation et l'accessibilité en ligne du matériel culturel et la conservation numérique, qui a été approuvée unanimement par le Conseil des ministres de la culture et de l'audiovisuel le 13 novembre 2006. 3 En France, un comité de pilotage présidé par le ministre de la culture et de la communication et le président de la BnF a été créé en juillet 2005. Il a remis le 11 janvier 2006 un « livre blanc » dont est issu un plan d’action, présenté en Conseil des ministres le 8 février 2006. La Bibliothèque nationale de France a reçu du gouvernement français, le 2 mai 2006, la responsabilité officielle du pilotage opérationnel du projet en France. Pour remplir cette mission, la BnF s’est appuyée sur l’expérience qu’elle avait acquise avec Gallica, l’une des premières bibliothèques numériques au monde par son ancienneté (elle a été créée en 1996), le nombre de documents en ligne qu’elle propose (90 000 ouvrages et autant d’images) et l’importance de sa fréquentation (plus d’un million de documents consultés par mois). La mobilisation de ses équipes a permis à la Bibliothèque : • la réalisation d’une maquette puis d’un prototype, Europeana, dont la version « beta » est ouverte au public à l’occasion du Salon du livre de Paris en mars 2007, afin de tester et de proposer aux partenaires européens de nouvelles fonctionnalités s’inscrivant dans le cadre du projet de BnuE ; • la modernisation technique de sa propre bibliothèque numérique, Gallica : passage du mode image au mode texte par utilisation d’un procédé de reconnaissance optique de caractères (OCR), mise en ligne de plusieurs titres de la presse quotidienne numérisés, consultables de manière plus aisée grâce à un outil adapté ; • l’intensification des programmes de numérisation d’œuvres issues du fonds de la BnF : le rythme de numérisation passe, à partir de 2007, de 5000 à 100 000 ouvrages par an. Europeana, la contribution française à la Bibliothèque numérique européenne, est un prototype de bibliothèque numérique qui donne accès dans un premier temps à environ 12 000 documents issus des collections de la Bibliothèque nationale de France, mais aussi de la Bibliothèque nationale de Hongrie et de la Bibliothèque nationale du Portugal. Il a pour objectif de tester, sur un volume significatif de documents numérisés, les fonctions utilisables dans une bibliothèque numérique (recherche plein texte au sein d’un ouvrage ou d’un ensemble d’ouvrages, annotation et étiquetage des textes dans des espaces personnels, etc.) et met en œuvre une partie des concepts proposés dans une maquette présentée à l’automne 2006 aux instances politiques ainsi qu’aux professionnels des bibliothèques. Cette maquette a également suscité des réactions recueillies auprès d’utilisateurs dans le cadre de focus groups dont les remarques ont été prises en compte dans l’ergonomie du prototype. 4 Les fonctionnalités développées dans Europeana se situent dans un environnement Web 2.0. Elles permettent à tout internaute – quel que soit son niveau de compétence dans l’utilisation des techniques d’Internet - de découvrir facilement des collections organisées selon les principes de classement des bibliothèques, grâce à une appropriation intuitive des fonctionnalités de recherche. Europeana, la contribution française au projet de BnuE, a vocation à alimenter la réflexion des partenaires européens tout en servant de test en grandeur réelle pour la modernisation technique de Gallica, la Bibliothèque numérique de la BnF. Pour mener ce projet à bonne fin, la BnF a obtenu en 2006 un budget de 3,375 M€ du ministère de la culture et de la communication, qui a permis de financer un test de numérisation de masse, la réalisation d’une maquette exposant les fonctionnalités attendues de la bibliothèque numérique européenne, l’ « océrisation » des deux-tiers des ouvrages déjà disponibles dans Gallica ainsi que la numérisation et la conversion en mode texte de 30 000 ouvrages. En 2007, le ministère de la culture et de la communication a affecté 10 M€ au projet de Bibliothèque numérique européenne par l’intermédiaire de la commission « Politique numérique » du CNL (Centre national du livre). Ce budget permettra notamment de financer la numérisation et la conversion en mode texte de 100 000 nouveaux documents, ainsi que l’achat de serveurs et le développement des modules de base du « système de préservation et d’archivage réparti » (SPAR) qui permet le stockage des données numériques, leur préservation pérenne et leur communication au grand public, assorties de fonctionnalités nouvelles et performantes. En parallèle, un groupe de travail associant le Syndicat national de l’édition et la BnF réfléchit depuis quelques mois aux conditions économiquement équilibrées d’une mise en ligne des ouvrages encore protégés par le droit d’auteur, en vue d’aboutir courant 2007. 5 Les collections accessibles depuis Europeana Lancé et mis en ligne en mars 2007, le prototype donne accès à 12 000 ouvrages dont 7 000 sont issus des collections de la BnF. Les choix éditoriaux La sélection des documents présentés par la BnF dans Europeana répond à l’objectif scientifique de constituer une bibliothèque encyclopédique de textes appartenant au patrimoine culturel francophone et européen et participant de la notion classique des « humanités » : textes littéraires, historiques, philosophiques, politiques ou scientifiques. Il s’agit bien de proposer un choix de textes fondateurs de la culture européenne. Cette sélection complémentaires : s’articule autour de trois ensembles • Un premier ensemble gravite autour de l’idée d’œuvres phares de la culture francophone et européenne : on y trouvera par exemple, dans le domaine littéraire, les œuvres de Corneille, Diderot, Hugo ou Rousseau, mises en regard des grands textes de la littérature européenne : œuvres de Shakespeare, Dickens, Goldoni ou Dante. Dans le domaine scientifique, on citera Kepler, Galilée ou Geoffroy-SaintHilaire. • Autour de ce cœur fondateur, ont été retenus des documents souvent moins académiques, mais qui resituent dans leur contexte historique ou social les œuvres classiques : y figurent ainsi des œuvres de vulgarisation scientifique (ouvrages de Camille Flammarion), des essais (textes de Claude Bernard, Auguste Blanqui ou Jules Simon), des sources historiques (Séries des Mémoires pour servir à l’histoire de France, Journal de Henri III et IV de Pierre de l’Estoile, correspondances de Charles Quint, Calvin, Auguste Comte, Berlioz) ainsi qu’une sélection de mémoires et de biographies (mémoires de Saint-Simon , Louise Michel, ou Foch ; vies de Bonaparte, George Sand ou Victor Cousin). • Enfin, a été sélectionné un ensemble d’outils biographiques (Biographie universelle des musiciens) ou bibliographiques (Manuel du libraire de Brunet), ainsi que des encyclopédies (Encyclopédie moderne ou Encyclopédie du XIXème siècle) et des dictionnaires (Dictionnaire des finances ou Dictionnaire de la Bible), permettant d’offrir une description raisonnée des états du savoir et de la langue. 6 Les contributions hongroise et portugaise Les documents issus des bibliothèques nationales de Hongrie et du Portugal ont été sélectionnés d'une part sur des critères techniques, d'autre part sur des critères de contenus afin de favoriser une convergence autour de principes simples : pluridisciplinarité, ouverture à des problématiques souvent plus européennes que nationales. La collection d’ouvrages hongrois (4000) comprend notamment des études sur l'histoire, la tradition populaire et la littérature hongroises, ainsi que des œuvres littéraires d'auteurs hongrois et des traductions en hongrois de classiques européens. Ces documents proviennent de la bibliothèque électronique hongroise Magyar Elektronikus Könyvtár. La collection portugaise (1000 ouvrages) est composée principalement de documents sur l'histoire du Portugal, notamment des récits de voyages, ainsi que sur le droit, les arts et l'éducation. Tous proviennent de la bibliothèque numérique du Portugal, Biblioteca Nacional Digital. 7 Vers Gallica 2.0 Gallica, bibliothèque numérique de la BnF, propose actuellement 90 000 ouvrages et plus de 80 000 images en libre accès. On la trouve sur le site de la BnF (www.bnf.fr). Les développements effectués dans le projet Europeana serviront à l’élaboration d’une nouvelle version de Gallica. Son architecture technique rénovée permettra une interopérabilité avec les bibliothèques européennes, ainsi que la reprise des fonctionnalités élaborées pour Europeana : nouvelles modalités de recherche et de tri des résultats par langue et par sujet ; navigation au sein des documents par table des matières ; grossissement des caractères ; espace de travail personnalisé complet ; « panier » personnel, etc. Les fonctionnalités imaginées pour Europeana mais non réalisées dans le prototype seront développées dans cette nouvelle version de Gallica : − Extension du moteur de recherche plein texte vers un moteur utilisant de manière plus intelligente les métadonnées. La sélection de ce moteur, son adaptation aux documents numérisés s’effectueront en synergie avec des programmes européens en cours d’approbation par la Commission et avec l’appui de France Télécom. − Ajout des fonctions de travail collaboratif Courant 2007, d’autres types de documents aujourd’hui disponibles en ligne seront progressivement ajoutés à Gallica 2.0, dont les fonctionnalités seront étendues en conséquence pour la presse, les cartes, les documents audiovisuels… Gallica continue en parallèle à être alimenté de toutes les nouvelles numérisations sans évolution technique et reste accessible aux utilisateurs. L’arrêt de Gallica n’interviendra que lorsque Gallica 2.0 sera pleinement opérationnel, c'est-à-dire à l’été 2008. 8 Le programme de numérisation de la BnF Jusqu’en 2005, Gallica s’enrichissait de 5 000 à 6 000 documents par an, numérisés en « mode image » seul. Pour que la France puisse apporter une contribution significative au projet de Bibliothèque numérique européenne, un changement d’échelle radical était nécessaire, ainsi qu’une mutation profonde des techniques d’accès. La première évolution concerne les techniques de numérisation : la diminution des coûts permet aujourd’hui de numériser de nouveaux documents en mode texte, en disposant d’enveloppes financières mesurées. Les coûts de numérisation et de conversion par reconnaissance optique de caractères d'un ouvrage de 300 pages s'élèvent aujourd'hui à une vingtaine d'euros pour des documents massicotés (format qui permet une numérisation entièrement automatisée) et à une quarantaine d'euros pour des documents reliés. Une meilleure restitution en ligne de certains ouvrages (dictionnaires, encyclopédies,...) ou de parties d'ouvrages (table des matières, index) impose le recours à une conversion par reconnaissance optique de caractères de haute qualité (taux de reconnaissance de 99,8%) ; son coût s’élève alors au quintuple de ceux mentionnés ci-dessus. Enfin, la seule conversion par reconnaissance optique de caractères (à 96%) de documents déjà numérisés représente un coût d’environ 7 à 8 € TTC pour un ouvrage de 300 pages. 60 000 documents déjà numérisés en mode image pour Gallica seront ainsi traités à nouveau d’ici au mois de septembre 2007 afin de leur associer le mode texte par un procédé de reconnaissance optique de caractères (« océrisation »). Convaincue de la nécessité d’accroître notablement son offre numérique, la BnF a confié à IBM au printemps 2006 la réalisation d’un test visant à définir les conditions de mise en oeuvre d’une numérisation de masse. De nouvelles technologies ont été élaborées ces dernières années par les industriels et permettent le changement d’échelle radical induit par le projet de Bibliothèque numérique européenne. Dans le cas de la BnF, la numérisation est confiée à des prestataires privés spécialisés, choisis sur appels d'offres. Le passage à une numérisation de masse s’effectue en deux temps : • la numérisation de 30 000 documents, confiée aux sociétés Jouve et Diadeis, sera réalisée entre décembre 2006 et septembre 2007 ; • la BnF a lancé le 20 février 2007 une consultation pour un nouveau marché de « dématérialisation des collections », qui prévoit la numérisation de 100 000 ouvrages par an pendant trois ans. 9 Les choix éditoriaux propres à Gallica 2.0 A la sélection offerte dans Europeana s’ajoutera en 2007 la mise à disposition, également en mode texte, de la somme des connaissances que rassemble Gallica dans toutes les disciplines (philosophie, histoire, littérature, religion, sciences, …). L’accroissement du nombre de documents annuellement numérisés, de l’ordre de 100 000 volumes par an à compter de 2007, s’organisera autour de trois axes principaux : • Le patrimoine national, à partir des moments clés de l’histoire de la France (documents fondateurs de la démocratie en France) et de ses régions ; des grandes revues françaises scientifiques et d’érudition (Revue française de psychanalyse, Etudes, Revue d’histoire littéraire de la France) ; du développement de la poésie, des sciences naturelles ou des arts décoratifs en France. • Les programmes à vocation internationale : certains corpus patrimoniaux trouveront un surcroît d’intérêt dans le rapprochement avec des ensembles documentaires portant sur le même sujet mais issus d’autres pays, d’autres cultures nationales. Des concertations avec de grandes bibliothèques étrangères ont permis de faire émerger plusieurs domaines communs : la presse quotidienne nationale – pour laquelle la Bibliothèque a lancé un vaste plan pluriannuel et qui figure également dans plusieurs programmes nationaux, notamment en Finlande, aux Pays-Bas, en Espagne, en Autriche, en Grande Bretagne ; la documentation juridique (recueils de lois, archives parlementaires, jurisprudence, grands arrêtés) ; la généalogie, et plus largement la recherche identitaire autour des personnes ou des territoires ; les langues : pour la France, on s’attachera d’abord à rassembler un fonds sur l’apprentissage de la langue française et des sources pour l’histoire de la francophonie ; les traductions des chefs-d’œuvre de différentes littératures nationales. • Une bibliothèque française sur l’Europe : la Bibliothèque nationale de France se propose de construire un corpus d’œuvres et de documents français consacrés spécifiquement à l’Europe dans tous ses aspects : outre la philosophie politique, les identités et mentalités nationales, la sélection concernera l’histoire, l’économie et le commerce (développement du système bancaire européen), le travail, les sciences et techniques (faune et flore, développement du chemin de fer, méthodes agricoles, médecine), la littérature et la musique, les questions sociales - situation des femmes, des enfants, conséquences de la révolution industrielle - l’éducation et l’enseignement, les voyages et le tourisme, les grands événements culturels. Les relations internationales intra-européennes mais aussi extra-européennes (relations de l’Europe avec l’Afrique, l’Amérique, le Japon, la Russie, …) seront également illustrées par nombre d’ouvrages. Dans ces programmes sur l’Europe, les premières tentatives de presse européenne occuperont une bonne place (des gazettes du XVIIIème siècle à L’Europe artiste ou à L’économiste européen) 10 Cette politique de numérisation aura vocation à se poursuivre en coopération avec de grandes bibliothèques françaises et étrangères autour de programmes concertés. On citera par exemple, en France, le programme sur les expositions universelles, conduit avec le Conservatoire national des arts et métiers, ou le programme sur la guerre de 1914-1918, mené actuellement avec la Bibliothèque de documentation internationale et contemporaine (BDIC). Ce dernier préfigure une contribution à une plus vaste réflexion au niveau européen sur les sources de l’histoire de la première guerre mondiale. A l’étranger, au-delà même du continent européen, on peut mentionner le programme Sinica, compilation d’ouvrages de sinologues français puis européens, en concertation avec la Bibliothèque nationale de Chine, mais aussi la numérisation d’un corpus d’archives de la Révolution française en collaboration avec l’Université de Stanford aux Etats-Unis. Caractéristiques des collections de Gallica 2.0 à l’horizon 2008 : Types de documents : toutes catégories de documents imprimés : monographies, revues, journaux, thèses, brochures et plaquettes, … Nationalités et langues : publications en français publiées en France. Dates des documents : majoritairement XIXème siècle, corpus significatifs du XVIIIème siècle, extension en deçà selon les capacités offertes par la reconnaissance optique de caractères. Ouvrages sous droits d’auteur : sauf exceptions formalisées par des conventions avec les ayants droit et/ou dans le cadre de partenariats avec les grandes revues françaises, tous les documents numérisés sont pour l’instant dans le domaine public. Toutefois, il ne serait pas concevable à terme que l’outil exceptionnel de recherche documentaire et de découverte que constituera la bibliothèque numérique européenne ne propose pas à l’internaute des documents récents encore soumis au droit d’auteur, aux côtés des documents libres de droits que la Bibliothèque nationale de France et ses homologues européennes mettront en ligne à partir de leurs propres collections patrimoniales. Cependant, la mise en ligne de documents sous droits ne peut être envisagée que dans le cadre d’un dispositif concerté assurant une juste rémunération des ayants droit. Un groupe de travail bipartite a été constitué à l’été 2006 entre le Syndicat national de l’édition et la Bibliothèque nationale de France aux fins d’examiner et de proposer aux éditeurs, ainsi qu’à toute la chaîne de l’économie du livre, un modèle économique régissant leur participation à la bibliothèque numérique européenne et permettant cette juste rémunération. 11 Les membres du groupe de travail ont décidé d’avoir recours à un expert afin de les assister dans l’élaboration dudit modèle. Les premières orientations de l'étude d'expert ont été validées par le groupe de travail le 20 février 2007. L’étude, conduite par la société Numilog, sera achevée au début du mois d’avril 2007. Dans le modèle proposé, les internautes bénéficieraient, à travers la BnuE, de la recherche plein texte dans les documents sous droits aussi bien que dans ceux du domaine public, le résultat de la recherche présentant les notices descriptives des deux types d'ouvrages. Ensuite, toute demande d’accès au texte intégral des ouvrages sous droit serait renvoyée vers le site de diffuseurs, qui offriraient un certain nombre de services : consultation temporaire d’un ouvrage, accès à un groupe de documents pendant une période donnée, vente de tout ou partie de documents numériques (avec possibilité de téléchargement), vente du livre papier. Ces services seraient facturés conformément aux accords conclus entre diffuseurs et éditeurs ; leur homogénéité serait assurée par un cahier des charges de la Bibliothèque numérique européenne, dont les diffuseurs respecteraient les clauses. L’offre d’ouvrages sous droits a vocation à s’inscrire en cohérence avec la politique documentaire de Gallica 2.0. Cette complémentarité s’entend d’abord en matière éditoriale, puisque serait proposée une mise à jour des connaissances biographiques, bibliographiques et critiques dans toutes les disciplines. Elle permettrait ensuite de mieux couvrir le champ des disciplines « récentes » (psychologie, psychanalyse, sciences de l’éducation, urbanisme…) et d’enrichir en particulier l’histoire européenne. Enfin, certains secteurs de l’édition (régionale, érudite…) gagneront en visibilité par une présence affirmée en ligne. 12 Europeana : Informations techniques Le prototype Europeana est développé sur une plateforme indépendante de Gallica et comporte un ensemble de 7000 monographies, toutes en mode image et en mode texte. Le texte est issu de la conversion automatique par logiciel de reconnaissance de caractères. Il faut noter que cette conversion est non corrigée et peut comporter par conséquent un certain nombre d'erreurs. Le taux de reconnaissance plancher est de 96%, mais il a été décidé que 10% des documents numérisés par la Bibliothèque nationale de France auraient un taux de 99,9%. Ce mode texte est utilisé par le moteur de recherche pour la recherche plein texte dans l’ensemble des documents et à l’intérieur d’un document mais est également destiné aux outils de lecture d’écrans (de type JAWS) utilisés dans le cadre de la déficience visuelle. La volumétrie totale des documents représente un volume de 700 Go. Le prototype donne également accès à 4000 documents de la Bibliothèque nationale de Hongrie et 1000 documents de la Bibliothèque nationale du Portugal, consultables sur leur site d’origine. Europeana utilise comme outil de recherche un logiciel libre de la fondation Apache : Lucene. Ce moteur dispose d’un certain nombre de fonctionnalités visibles dans Europeana : la recherche plein texte, la recherche dans les notices, le classement des résultats. Il ne comprend toutefois pas toutes les options envisagées dans la maquette (recherche avancée, opérateurs booléens, outils sémantiques), qui seront explorées et mises en œuvre dans la deuxième version de Gallica. L’algorithme de pertinence du moteur Lucene est utilisé pour le classement des résultats de recherche. Il repose sur une analyse des mots recherchés en fonction du nombre d’occurrences trouvées, de leur densité et de leur emplacement dans les contenus (par exemple, un mot trouvé dans le titre d’un ouvrage a un taux de pertinence plus élevé qu’un mot trouvé dans le corps du texte). L’application est déployée sur un ensemble de 26 serveurs de dernière génération (bi processeurs dual core) hébergés par la BnF. A l’occasion de l’ouverture, un dispositif complémentaire sera mis en œuvre par la société Atos Wordline afin d’améliorer les conditions d’accès aux documents en cas de forte sollicitation de l’application. 13 Utiliser Europeana L’univers graphique d’Europeana correspond aux trois étapes de progression dans le site : bleu pour la recherche, orange pour la consultation des documents, vert pour le travail dans l’espace personnel « Ma bibliothèque ». Les pages d’Europeana sont construites en trois colonnes : un espace central contenant l’information principale (les modes de recherche, les résultats de la recherche, le document, les données personnelles enregistrées par l’utilisateur) et des espaces latéraux constitués de palettes d’outils. Ces palettes contiennent des liens, icônes, boutons ou formulaires offrant à l’utilisateur des fonctions spécifiques relatives à la page qu’il consulte. Elles s’ouvrent, se ferment et se déplacent à l’aide des boutons situés en haut à droite de chacune d’elles, permettant ainsi à chacun de personnaliser son environnement de consultation. La recherche Plusieurs modes de recherche dans les collections d’Europeana sont possibles : la recherche par mots ou expressions, dite recherche plein texte, la recherche par critères et la recherche par thèmes. La recherche par critères permet une découverte des collections par époque de publication, langue des documents ou bibliothèque de provenance. La recherche par thèmes est organisée selon la classification Dewey, conçue au XIXème siècle, régulièrement mise à jour depuis et utilisée par un grand nombre de bibliothèques dans le monde pour classer leurs collections. Une variété de thèmes regroupés en 10 grands ensembles permet d’accéder à des listes de documents portant sur un même sujet. 14 Comment sont décrits les documents ? Chaque document est signalé succinctement par son titre, son ou ses auteurs et sa date de publication. La notice complète du document est accessible depuis l’icône d’information située à la suite de la référence. Dans le cas d'une recherche plein texte, le terme recherché est surligné en orange et un extrait significatif tiré de la notice ou du contenu du document permet de vérifier la pertinence du résultat par rapport à la recherche. Le nombre d'occurrences indiqué correspond au nombre de fois où le ou les mots recherchés apparaissent dans le document et/ou sa notice. Le taux de pertinence est calculé par le moteur de recherche. Tous deux sont indiqués à la suite de l'extrait. 15 Comment affiner les résultats ? Une fois la recherche lancée, la palette « Affiner » regroupe les résultats trouvés en sousensembles classés par grandes catégories : « Provenance » correspond à la bibliothèque d'origine des documents, « Date » correspond à la date de publication des documents, « Langue » correspond à la langue des documents, « Auteur » correspond aux principaux auteurs des documents. En cliquant sur l’un des liens proposés, l’utilisateur restreint les résultats à ce sous-ensemble. Il peut ainsi affiner progressivement sa recherche. Cette technique est appelée « la recherche par facettes ». 16 La consultation Pour consulter un document, il suffit de cliquer, depuis une page de résultats, soit sur la référence du document, soit sur l’icône symbolisant un livre ouvert, situé à droite de celle-ci. Seuls les documents numérisés par la Bibliothèque nationale de France sont consultables dans l’interface d’Europeana. Les documents numérisés par la Bibliothèque nationale du Portugal et par la Bibliothèque nationale Széchényi sont, quant à eux, consultables dans les interfaces des bibliothèques numériques de ces deux institutions, sur des sites distincts. Comment naviguer dans un document ? Pour feuilleter un document page à page, des flèches de navigation sont disponibles dans la barre située en haut et en bas de la page en cours de consultation. Pour accéder à une page précise, l’utilisateur peut l’appeler grâce au formulaire dédié à cet effet audessus du document, ou cliquer dans la palette « Naviguer » sur le numéro de la page souhaitée ou la vignette correspondante. La table des matières, lorsqu’elle existe, est également accessible dans la palette « Naviguer » et permet un accès direct aux têtes de chapitres. 17 Peut-on agrandir l'image d'un document ? Une fonction zoom permet d’agrandir l’image : la résolution de l'image la plus petite est de 512 pixels de largeur par 768 pixels maximum de hauteur. La résolution de l'image la plus grande est de 1024 pixels de largeur par 1536 pixels maximum de hauteur. 18 Comment s’effectue la recherche dans un document ? Il est possible de lancer une recherche d'un ou plusieurs mots à l'intérieur d’un document grâce à la palette « Rechercher dans ce document ». Chaque page du document contenant l'un des termes recherchés est indiquée, ainsi que le nombre d'occurrences trouvées dans celle-ci. Pour visualiser une page, il suffit de cliquer sur le lien vers cette page dans la palette. Le terme recherché est surligné en jaune dans la page. 19 Peut-on sauvegarder un document ? Pour garder une trace du document en cours de consultation, la palette « Utiliser » offre plusieurs possibilités : imprimer le document, le télécharger (en version PDF) ou envoyer par courriel sa référence et son adresse URL. Il peut également être enregistré dans l’espace personnel de l’utilisateur (« Ma bibliothèque ») : voir plus loin. 20 « Ma bibliothèque » A quoi sert « Ma bibliothèque » ? « Ma bibliothèque » est un espace personnel qui permet d'enregistrer des références de documents ou d’indexer des pages afin de les retrouver sans avoir à renouveler une recherche. « Ma bibliothèque » est composée de trois pages différentes : « Ma page d’accueil », qui donne une vue d'ensemble sur les données personnelles enregistrées, « Mes documents », dédiée aux documents enregistrés, « Mes étiquettes » qui comprend les pages indexées. Tout internaute peut créer un compte à partir de la palette « Ma bibliothèque », à l’aide d’un alias (nom d'utilisateur) et d’un mot de passe. A quoi sert « Mes documents »? La fonction « Mes documents » de « Ma bibliothèque » permet d'enregistrer dans l’espace personnel des références de documents et de les organiser par dossiers. L’utilisateur peut sélectionner les documents qui l’intéressent depuis une page de résultats ou depuis l’espace de consultation en cliquant sur l’icône « Ajouter à mes documents ». Tous les documents ajoutés apparaissent dans la page d'accueil de « Ma bibliothèque » et sur la page « Mes documents ». Pour consulter le document, il suffit de cliquer sur la référence enregistrée. Depuis la page « Mes documents » de « Ma bibliothèque », l’utilisateur peut créer des dossiers et trier, déplacer ou supprimer les références des documents à l’intérieur de ces dossiers. 21 Qu’est-ce qu’une étiquette ? Le terme « étiquette » est la traduction française de l’anglais « tag ». Une étiquette est un mot clé ou un ensemble de mots clés qui, tel un post-it, serait collé par l’utilisateur sur la page d'un document. Tout utilisateur disposant d’un espace personnel peut créer une ou plusieurs étiquettes sur l’ensemble des pages des documents qu’il consulte. Les étiquettes créées sur un même document en cours de consultation sont visibles depuis la palette « Ma bibliothèque » et permettent à l’utilisateur de naviguer dans le document selon ses propres mots clés. Sur la page « Mes étiquettes » de son espace personnel, l’utilisateur retrouve la totalité de ses étiquettes organisées en « nuage » (« tag cloud » en anglais). Le nuage consiste à représenter graphiquement les étiquettes en fonction du nombre de pages auxquelles chacune renvoie : plus le nombre de pages indexées est important, plus la taille de l’étiquette est grande. En cliquant sur un mot du nuage, l’utilisateur a accès aux références des pages portant cette étiquette. Chaque référence est un lien vers la page indiquée. 22