Diapos Cours 09 (fichier PDF).
Transcription
Diapos Cours 09 (fichier PDF).
Annonces Faculté des arts et des sciences École de bibliothéconomie et des sciences de l’information Suite à notre discussion sur la reconnaissance de visages, un article intéressant sur l’utilisation du nez comme élément biométrique : <http://www.bath.ac.uk/news/2010/03/02/nose-recognition/> Cours 9 : Normalisation. Métadonnées. Diffusion et consultation. SCI6308 Documents visuels et sonores 1 2 Au programme aujourd’hui La normalisation La normalisation Présentation Les métadonnées Quelques joueurs Diffusion et consultation ISAN UPF Un format physique permanent ? 3 La normalisation 4 La normalisation Présentation Quelques joueurs À l’âge de 100+ ans, les documents audiovisuels sont mûrs pour être organisés de façon convenable AMIA, l’Association of Moving Image Archivists BAC, Bibliothèque et Archives Canada Il s’agit de méthodes de travail, catalogage, indexation, gestion de droits, préservation BAnQ, Bibliothèque et Archives nationales du Québec CBC, the Canadian Broadcasting Corporation Le tout s’insère dans le portrait plus global de l’organisation de tout en environnement réseauté SRC, la Société Radio-Canada CQ, la Cinémathèque québécoise Il y a plusieurs joueurs et il convient de coordonner les travaux CIA, le Conseil international des archives 5 6 La normalisation & Quelques joueurs La normalisation & Quelques joueurs D’autres joueurs Encore d’autres IEEE (I triple E), anciennement l’Institute of Electrical and Electronics Engineers FIAF, la Fédération internationale des archives de film SMPTE, the Society of Motion Picture and Television Engineers FIAT, la Fédération internationale des archives de télévision IASA, l’International Association of Sound and Audiovisual Archives W3C, the World Wide Web Consortium LC, the Library of Congress IFLA, l’International Federation of Library Associations and Institutions CCAAA, le Coordinating Council of Audiovisual Archives Associations INA, l’Institut national de l’audiovisuel (France) ONF, l’Office national du film du Canada 7 La normalisation & Quelques joueurs 8 La normalisation L’affaire de tout le monde L’ISAN Avec tous ces joueurs (il y en a d’autres encore), la gestion de l’audiovisuel est devenue l’affaire de tout le monde http://www.isan.org/ Norme publiée en 2002 Ça reflète la réalité du multimédia, jadis une catégorie spéciale de documentation mais maintenant intégré Un réseau d’agences pour administrer le système 9 La normalisation & L’ISAN 10 La normalisation & L’ISAN Qu’est-ce que l’ISAN ? Format ISAN = International Standard Audiovisual Number = Numéro international normalisé pour oeuvres audiovisue!es 96 bits en 3 segments : racine Système de numérotation volontaire aux fins d’identification d’oeuvres audiovisuelles épisode version Numéro de référence unique, permanent et reconnu à l’échelle internationale Lorsqu’il n’y a pas d’épisodes ni versions, des zéros Commence toujours avec le sigle ISAN Exemple: ISAN 0000-0001-8947-0000-8-0000-0000-D Autre encodage : code à barres 2-dimensions, 96 pixels Chiffre de contrôle (check digit) à la fin 11 12 La normalisation & L’ISAN La normalisation & L’ISAN Un numéro « muet » L’oeuvre, pas la publication pas un descripteur de contenu L’ISAN demeure le même, peu importe le format de diffusion (film, CD, VHS, DVD) aucun code significatif un identificateur unique seulement L’ISAN identifie l’oeuvre, et non ses manifestations 13 La normalisation & L’ISAN 14 La normalisation & L’ISAN Quelques exemples Exclus Films (longs et courts métrages) Trame sonore Bandes annonces de films Scénario Productions pour la télévision, épisodes de séries Images fixes tirées du film Publicités Enregistrements en direct d’événements (activités sportives, bulletins de nouvelles) Œuvres composites avec composante audiovisuelle 15 La normalisation & L’ISAN 16 La normalisation & L’ISAN Première agence Autres agences Agence française ISAN, composé de ISAN Canada Société des producteurs de cinéma et télévision ISAN Berne Association nationale de gestion des oeuvres audiovisuelles ISAN Deutschland Société des auteurs réalisateurs producteurs ISAN Australia Société des auteurs compositeurs d’oeuvres dramatiques É-U, Espagne, Pays-Bas, Royaume-Uni, Suède, Pologne, Brasil, Italie, Serbie, Autriche, Amérique latine... Société civile des auteurs multimédia Plus : une agence pour d’autres pays qui n’ont pas leur propre agence ...ce qui couvre à peu près tout le marché français 17 18 La normalisation La normalisation & UPF Autre initiative : l’UPF Le nom est trompeur UPF = Universal Preservation Format = Format universel de préservation Le nom UPF signifie une enveloppe de métadonnées et non pas un support physique <http://info.wgbh.org/upf/> On a affaire plutôt à un conteneur normalisé de métadonnées Une initiative de la WGBH Educational Foundation Une recommandation pour l’archivage de médias 19 La normalisation & UPF 20 La normalisation & UPF La migration Documents numériques Il s’agit donc d’une initiative pour la migration de données L’UPF ne s’applique qu’aux documents en format numérique Certains croient qu’il serait mieux de l’appeler Universal Migration Format Le but est de rejoindre les métadonnées aux données (l’« essence ») pour faciliter la migration d’un support à un autre Faute de fonds pour donner suite, l’initiative est sur les tablettes depuis plusieurs années maintenant Mais, WGBH implante actuellement un DAM (Digital Asset Management System) et dans ce contexte, on verra... 21 La normalisation 22 La normalisation & Un format physique permanent ? Un format physique permanent ? La SMPTE Depuis des années, les archivistes réclament un format physique qui est stable Selon un groupe de travail de la SMPTE, on peut oublier l’idée d’un format normalisé d’enregistrement Le problème est reconnu depuis la découverte du problème d’acidité dans le papier (années 1950) Entre autres, le développement technologique fait qu’on ne peut guère penser à s’arrêter sur un format précis On rêve d’un format physique qui serait stable chimiquement pendant longtemps Remarque : dans la littérature de la préservation numérique, on préconise la variété pour sa robustesse 23 24 La normalisation & Un format physique permanent ? La normalisation & Un format physique permanent ? Par contre Autres aspects Certains membres du study group favoriseraient un nouveau format d’enregistrement optimisé pour l’archivage Les archivistes ne constituent pas un marché assez important Il faudrait que les studios américains réclament un tel format Ceci serait accompagné d’un ruban magnétique spécialisé Rêve ou réalité ? Espoirs quelque part ? 25 26 La normalisation & Un format physique permanent ? Les fabricants Métadonnées Présentation Chez les fabricants, compétitivité plutôt que collaboration Classification Tout est top-secret Normalisation Aussi, développements dans les techniques d’encodage EBU/SMPTE Dans la technologie, rien n’est très stable MPEG 7, MPEG2 SESAME DELPHES SMIL MXF / JPEG2000 Vocabulaires du Getty 27 Métadonnées 28 Métadonnées Présentation Classification En sciences de l’information, les métadonnées sont notre matière première, en quelque sorte Boll, Klas & Sheth Besser L’objet de tous nous travaux, plus ou moins Turner & Moal Plusieurs définitions et maintenant, prolifération C’est surprenant combien la quantité de travaux sur cette question est petite D’où le besoin de les classifier maintenant 29 30 Métadonnées & Classification Métadonnées & Classification Boll, Klas & Sheth Une autre perspective Boll, Susanne, Wolfgang Klas, and Amit Sheth. 1998. Overview on using metadata to manage multimedia data. In Multimedia data management : using metadata to integrate and apply digital media, ed. Amit Sheth and Wolfgang Klas. New York: McGraw-Hill, 15–17. Digital image access & retrieval, ed. P. Bryan Heidorn and Beth Sandore. 1997. UrbanaChampaign, IL: Graduate School of Library and Information Science, University of Illinois. Métadonnées indépendantes du contenu (par ex. adresse physique, type de ruban, de caméra) Besser y identifie quelques couches de métadonnées pour la gestion d’images fixes Métadonnées dépendantes du contenu (format du fichier, taille du fichier, résolution, encodage Métadonnées pour décrire le contenu (texte créé par des humains) 31 Métadonnées & Classification 32 Métadonnées & Classification Selon Besser Quelques conclusions Format du fichier L’identification des types de métadonnées ne suffit pas Équipement de numérisation Il faut normaliser, uniformiser, pour assurer la découverte et la communication Qui a numérisé Catalogage Indexation Droit d’utilisation, qui détient les droits 33 Métadonnées & Classification 34 Métadonnées Turner & Moal Normalisation Le MétroMéta, un outil pour les métadonnées en sciences de l’information Les noyaux sur lesquels on travaille (par ex. Dublin Core, VRA Core, CDWA (Getty) ) sont des exemples de ce qu’il faut Objectif : produire un graphique pour décrire et pointer Mais : les noyaux ne sont que des noyaux, chaque institution doit ajouter bien d’autres métadonnées Chaque ligne du métro un thème Noeuds avec ensembles de métadonnées communs Besoin de mise à jour 35 36 Métadonnées & Normalisation Métadonnées & Normalisation Auffret & Prié Comparer Auffret & Prié sur la normalisation (Computers & the Humanities 33:4, déc 1999, 319-344) : Ceci rejoint le modèle de MPEG7 : Certaines données sont inscrites lors de la création Le lien avec la rentabilité économique Les données font partie integrante du fichier numérique du document Assurer l’accès, l’échange, les manipulations désirées de l’information Faire le plus possible au niveau de la création Ainsi on évite le travail après coup 37 Métadonnées & Normalisation 38 Métadonnées & Normalisation Comparer avec le modèle textuel Autre initiative du monde textuel Le même raisonnement a mené à SGML (ISO 8879:1986) pour le marquage de texte TEI : le Text Encoding Initiative Un projet de développement de lignes directrices pour la préparation et l’échange de textes électroniques Ensuite, XML et ses dérivés (DTDs, schémas) Enfants de SGML: XML, HTML, puis XHTML pour la recherche XML maintenant la lingua $anca pour les industries de la langue Fournit une gamme très large de descripteurs (balises) en forme d’une DTD de SGML (maintenant XML) 39 Métadonnées & Normalisation 40 Métadonnées Documents audiovisuels EBU/SMPTE Voici quelques initiatives qui cherchent à contribuer à une norme pour la gestion de documents audiovisuels EBU= European Broadcasting Union SMPTE = Society of Motion Picture and Television Engineers Les métadonnées telles que définies par le Joint EBU/SMPTE Task Force (TFHS) sont reliées au matériel des émissions mais pas directement au contenu Une initiative pour développer des normes pour l’échange d’émissions de télévision par flux de bits (bit streams) Son ontologie pour contenu audiovisuel 41 42 Métadonnées & EBU/SMPTE Métadonnées & EBU/SMPTE On traite Catégories Code temporel Format (de fichier, infos nécessaire pour décoder et afficher) Informations sur les conditions techniques lors de la création du matériel Description (catalogage, indexation, administration) Association (assemblage, synchronisation des éléments) Scénarios Composition (former séquences, ordonner structures plus grandes) Descriptions de lieux de tournage Matériel de publicité Autre (informations utiles mais qui ne tombent pas dans les autres catégories) Métadonnées descriptives normalisées pour la recherche dans les bases de données 43 Métadonnées 44 Métadonnées & MPEG7 MPEG7 La mayonnaise n’a pas pris Norme ISO Des organismes comme l’ONF, le CRIM, MIC ont travaillé à l’implantation Une norme pour la représentation du contenu de documents audiovisuels Mais maintenant la combinaison MXF/JPEG2000 prend le dessus Les métadonnées font partie des fichiers numériques de documents À toute fin pratique, MPEG7 est mort maintenant Beaucoup de travail pour développer un dictionnaire normalisé et complet de métadonnées 45 Métadonnées 46 Métadonnées & MPEG2 MPEG2 Tests de compatibilité C’est une norme de compression pour l’image en mouvement Ceci exige des tests pour la compatibilité entre niveaux Livingston & Safar notent qu’il n’y a pas une norme unique MPEG2 Par exemple, on ne peut pas convertir des données du profile MPEG 4:2:2 à un autre profil de données MPEG sans d’abord revenir au vidéo non compressé Il s’agit de toute une famille de profils Dans le cas de MPEG2, il y a des pertes importantes d’informations lors de la compression Il y a des différents niveaux 47 48 Métadonnées & MPEG2 Métadonnées La compression SESAME On perd de l’intégrité et de la qualité Système d’exploration de séquences audiovisuelles et multimédias enrichi par l’expérience Pour des fins d’archivage, on voudrait absolument éviter la compression Projet qui date de 1999 Il faut considérer MPEG2 comme un format de distribution, pas un format de préservation 49 Métadonnées & SESAME 50 Métadonnées & SESAME Une approche globale Détection automatique http://rfv.insa-lyon.fr/~jolion/SESAME/final/modele6.html Les travaux visent la détection automatique et analyse de Un projet France Télécom via CNET/CCETT (Centre national d’études des télécommunications / Centre commun d’etudes de telediffusion et de telecommunications) plans mouvements de caméra objets en mouvement Vise une approche globale à l’exploitation de dépôts potentiellement énormes de documents audiovisuels suivi d’objets 51 Métadonnées 52 Métadonnées DELPHES SMIL Dispositif Electronique d’étude et de Lecture pour la Pédagogie de l’ Histoire dans l’Enseignement Secondaire Synchronised Multimedia Integration Language (= Langage d’intégration de multimédia synchronisé) Projet européen développé à l’INA (1998-2001) pour la création de cours d’histoire hypermédia Norme pour le multimédia Syntaxe XML Permet aux enseignants et aux étudiants de manipuler, annoter, et composer des données audiovisuelles Infos au World Wide Web Consortium (www.w3c.org) Ceci via l’indexation complète fournie par l’INA 53 54 Métadonnées Métadonnées & MXF/JPEG2000 MXF/JPEG2000 MXF La combinaison gagnante, on dirait, qui prend le dessus sur la combinaison MPEG7/MPEG2 Parrainé par SMPTE, toute une série de standards Un conteneur pour données audiovisuelles numériques (vidéo et audio) MXF conçu pour utilisation dans la production numérique (envoyer des fichiers à travers la planète) Permet une variété de codecs Mais puisque la préservation numérique passe par les métadonnées, le potentiel pour ça aussi « Essence » et métadonnées dans le même fichier Non lié à un seul environnement informatique Surtout combiné avec JPEG2000 (BAC a adopté cette combinaison, l’INA aussi) Toutefois, il n’y a pas compatibilité/interopérabilité universelle et le tout est en train de s’implanter ; on verra pour la suite Si on ajoute le OAIS (ISO 14721:2003), on peut construire une archive 55 Métadonnées & MXF/JPEG2000 56 Métadonnées JPEG2000 Vocabulaires du Getty Une amélioration de l’algorithm JPEG qu’on connaît Art & Architecture Thesaurus Pas très bien implanté, on ne le voit pas beaucoup sur le web Union List of Artist Names (ULAN) Toutefois, un avantage important : il a la possibilité d’exécuter la compression sans perte, ce qui est d’un grand intérêt pour l’archivage Getty Thesaurus of Geographic Names (TGN) La clé : la transformation en ondelettes, mathématiquement réversible Cela rejoint la notion déontologique en restauration d’objets d’archives, de musées, selon laquelle les interventions doivent être réversibles 57 58 Diffusion et consultation Diffusion et consultation Présentation Présentation Unesco : Un principe général de l’archivage de matériel audiovisuel Accessibilité Bien sûr, une étape de la chaîne documentaire Utilisateurs La combinaison Préservation et accès Collections Nouveaux modèles 59 60 Diffusion et consultation Diffusion et consultation & Accessibilité Accessibilité Quelques moyens Le travail des relations publiques d’une archive audiovisuelle est relié à son accessibilité par les usagers externes Campagnes de publicité Conférences de presse Le personnel des archives a/v peut attirer l’attention du public aux objectifs de l’archive Visionnement/visionnage de nouvelles découvertes Visionnement de nouvelles restaurations Expositions Soumission de mémoires aux comités parlementaires 61 Diffusion et consultation & Accessibilité 62 Diffusion et consultation & Accessibilité Activités culturelles Événements entourant l’actualité Collaboration avec organismes culturelles Le 30e anniversaire de la Crise d’octobre Participation aux événements a/v : Le 25e anniversaire du decès de Claude Jutra la Cinémathèque québécoise Le 400e anniversaire de la fondation de Québec Goethe Institut Le Moulin à images de Robert Lepage Cinéma du Parc, Ex Centris pour le Festival du nouveau média, Festival des films sur l’art, etc.) Le 75e anniversaire de Radio-Canada Outfest (www.outfest.org/), Image+Nation (www.imagenation.org) chez les gais et lesbiennes Orphan Film Symposium (www.nyu.edu/orphanfilm/) Home Movie Day (www.homemovieday.com/) (en 2009 : 17 oct) 63 Diffusion et consultation 64 Diffusion et consultation & Utilisateurs Utilisateurs Grands utilisateurs Dans les archives de production de diffuseurs radio et télévision, l’utilisation interne a priorité (Unesco) Producteurs à but lucratif Journalistes Par contre, des cinémathèques et archives de film historique s’orientent plutôt vers des usagers externes Éditeurs Maisons de production film et de télévision 65 66 Diffusion et consultation & Utilisateurs Diffusion et consultation & Utilisateurs Dans une archive de production Autre réalité On vise à répondre à 90% des demandes en dedans de 24 h Des archives d’images historiques ont souvent besoin de beaucoup plus de temps pour répondre (des jours, même des semaines) En pratique, il s’agit souvent d’une question de minutes Pour être réaliste, on doit normalement faire payer par le client le temps de recherche 67 Diffusion et consultation & Utilisateurs 68 Diffusion et consultation Nouvelle réalité Collections Avec l’arrivée des archives numériques, c’est l’usager qui fait la recherche Déjà, beaucoup de collections d’images en ligne : Archives nationales des E-U Ça peut marcher à condition que les systèmes soient capables de répondre BAC BAnQ Un défi intéressant en SI Archives nationales de la France De plus en plus, la recherche de matériel se fait sur le web INA ONF etc. 69 Diffusion et consultation & Collections 70 Diffusion et consultation & Collections Métadonnées, normalisation Automatisation de tout cela Cette réalité souligne l’importance de Matériel afférent (péritexte) relié au processus de production, de distribution la normalisation des métadonnées Recherches en SI : recyclage d’une partie de ce matériel pour la génération d’indexes l’indexation de bonne qualité l’uniformisation des méthodes Important par rapport à la gestion interne et l’interopérabilité avec d’autres systèmes 71 72 Diffusion et consultation & Collections Diffusion et consultation & Collections Les collections Formats de rubans magnétiques Plans d’archives (stockshots) Sondage de la revue Televison Broadcast : environ 200 collections à travers le monde en ligne chez www.footage.net 1000 questionnaires envoyés 231 réponses (=23%) des millions de plans disponibles des milliers de chercheurs par jour Un site important pour recherchistes, archivistes, universitaires, producteurs de documentaires 73 Diffusion et consultation & Collections 74 Diffusion et consultation & Collections Dans ces 231 institutions Betacam-SP S-VHS VHS U-Matic 3/4" 1" Type C SP Betacam Hi-8 D-2 Formats de choix Betacam-SP 0,3 0,63 0,62 0,62 0,62 0,57 0,52 0,33 0,26 0,17 DVCPRO 0,23 S-VHS 0,22 Digital Betacam 0,17 Betacam SX 0,16 Digital-S 0,09 DVCam 0,07 U-Matic-SP 0,06 D-3 0,03 DV 0,03 M-II 0,03 75 Diffusion et consultation & Collections 76 Diffusion et consultation Toutefois Nouveaux modèles Le format recommandé maintenant : LTO (linear tape open) Il y a beaucoup de nouveaux modèles de diffusion, et ils sont en évolution constante LTO 4 utilisé : 0,8 To, 1,6 To compressé VHS > DVD > iTunes Store LTO 5 actuellement : 1,6 To, 3,2 To compressé Cinéma > télévision > chaînes spécialisées > sur demande > iPod > web LTO 6 en chantier Congrès de l’AMIA : actuellement, plus de 80% du matériel dans les collections est toujours sur 3/4” U-matic, ce qui donne une idée de l’écart Netflix, Hulu Faire sa propre télé : YouTube, Daily Motion, Tou.tv, ONF... Cela indique la quantité de travail de numérisation à faire Le modèle habituel (d’abord au cinéma, plus tard sur DVD) s’effrite 77 78 Diffusion et consultation & Nouveaux modèles Diffusion et consultation & Nouveaux modèles Les modèles changent Autres tendances Tendance : collections numériques disponibles en ligne (par ex. INA, la collection la plus importante) Regarder un film, télévision sur téléphone portable Des sites web comme la Zone audio-vidéo de la SRC Sorties simultanément de films au cinéma, sur DVD et sur le web Beaucoup de chaînes de télévision offrent des clips Diffusion en HD, 3D dans des salles Beaucoup d’émissions de télévision disponibles sur le web, à des sites spécialisés, plus ou moins légaux, ou achat légal Petits appareils-photo numériques tournent en vidéo HD Smart phones tournent en vidéo, vidéo HD YouTube, Daily Motion, etc. constituent des archives importantes, en quelque sorte Bref, en 5 ans on peut s’attendre à un environnement passablement différent de celui d’aujourd’hui La diffusion de la télé numérique via internet s’en vient 79 80