Diapos Cours 09 (fichier PDF).

Transcription

Diapos Cours 09 (fichier PDF).
Annonces
Faculté des arts et des sciences
École de bibliothéconomie
et des sciences de l’information
Suite à notre discussion sur la reconnaissance de visages, un
article intéressant sur l’utilisation du nez comme élément
biométrique :
<http://www.bath.ac.uk/news/2010/03/02/nose-recognition/>
Cours 9 :
Normalisation.
Métadonnées.
Diffusion et consultation.
SCI6308 Documents visuels et sonores
1
2
Au programme aujourd’hui
La normalisation
La normalisation
Présentation
Les métadonnées
Quelques joueurs
Diffusion et consultation
ISAN
UPF
Un format physique permanent ?
3
La normalisation
4
La normalisation
Présentation
Quelques joueurs
À l’âge de 100+ ans, les documents audiovisuels sont mûrs pour
être organisés de façon convenable
AMIA, l’Association of Moving Image Archivists
BAC, Bibliothèque et Archives Canada
Il s’agit de méthodes de travail, catalogage, indexation, gestion
de droits, préservation
BAnQ, Bibliothèque et Archives nationales du Québec
CBC, the Canadian Broadcasting Corporation
Le tout s’insère dans le portrait plus global de l’organisation de
tout en environnement réseauté
SRC, la Société Radio-Canada
CQ, la Cinémathèque québécoise
Il y a plusieurs joueurs et il convient de coordonner les travaux
CIA, le Conseil international des archives
5
6
La normalisation
& Quelques joueurs
La normalisation
& Quelques joueurs
D’autres joueurs
Encore d’autres
IEEE (I triple E), anciennement l’Institute of Electrical and
Electronics Engineers
FIAF, la Fédération internationale des archives de film
SMPTE, the Society of Motion Picture and Television
Engineers
FIAT, la Fédération internationale des archives de télévision
IASA, l’International Association of Sound and Audiovisual
Archives
W3C, the World Wide Web Consortium
LC, the Library of Congress
IFLA, l’International Federation of Library Associations and
Institutions
CCAAA, le Coordinating Council of Audiovisual Archives
Associations
INA, l’Institut national de l’audiovisuel (France)
ONF, l’Office national du film du Canada
7
La normalisation
& Quelques joueurs
8
La normalisation
L’affaire de tout le monde
L’ISAN
Avec tous ces joueurs (il y en a d’autres encore), la gestion de
l’audiovisuel est devenue l’affaire de tout le monde
http://www.isan.org/
Norme publiée en 2002
Ça reflète la réalité du multimédia, jadis une catégorie spéciale
de documentation mais maintenant intégré
Un réseau d’agences pour administrer le système
9
La normalisation
& L’ISAN
10
La normalisation
& L’ISAN
Qu’est-ce que l’ISAN ?
Format
ISAN = International Standard Audiovisual Number = Numéro
international normalisé pour oeuvres audiovisue!es
96 bits en 3 segments :
racine
Système de numérotation volontaire aux fins d’identification
d’oeuvres audiovisuelles
épisode
version
Numéro de référence unique, permanent et reconnu à l’échelle
internationale
Lorsqu’il n’y a pas d’épisodes ni versions, des zéros
Commence toujours avec le sigle ISAN
Exemple: ISAN 0000-0001-8947-0000-8-0000-0000-D
Autre encodage : code à barres 2-dimensions, 96 pixels
Chiffre de contrôle (check digit) à la fin
11
12
La normalisation
& L’ISAN
La normalisation
& L’ISAN
Un numéro « muet »
L’oeuvre, pas la publication
pas un descripteur de contenu
L’ISAN demeure le même, peu importe le format de diffusion
(film, CD, VHS, DVD)
aucun code significatif
un identificateur unique seulement
L’ISAN identifie l’oeuvre, et non ses manifestations
13
La normalisation
& L’ISAN
14
La normalisation
& L’ISAN
Quelques exemples
Exclus
Films (longs et courts métrages)
Trame sonore
Bandes annonces de films
Scénario
Productions pour la télévision, épisodes de séries
Images fixes tirées du film
Publicités
Enregistrements en direct d’événements (activités sportives,
bulletins de nouvelles)
Œuvres composites avec composante audiovisuelle
15
La normalisation
& L’ISAN
16
La normalisation
& L’ISAN
Première agence
Autres agences
Agence française ISAN, composé de
ISAN Canada
Société des producteurs de cinéma et télévision
ISAN Berne
Association nationale de gestion des oeuvres audiovisuelles
ISAN Deutschland
Société des auteurs réalisateurs producteurs
ISAN Australia
Société des auteurs compositeurs d’oeuvres dramatiques
É-U, Espagne, Pays-Bas, Royaume-Uni, Suède, Pologne, Brasil,
Italie, Serbie, Autriche, Amérique latine...
Société civile des auteurs multimédia
Plus : une agence pour d’autres pays qui n’ont pas leur propre
agence
...ce qui couvre à peu près tout le marché français
17
18
La normalisation
La normalisation
& UPF
Autre initiative : l’UPF
Le nom est trompeur
UPF = Universal Preservation Format = Format universel de
préservation
Le nom UPF signifie une enveloppe de métadonnées et non pas
un support physique
<http://info.wgbh.org/upf/>
On a affaire plutôt à un conteneur normalisé de métadonnées
Une initiative de la WGBH Educational Foundation
Une recommandation pour l’archivage de médias
19
La normalisation
& UPF
20
La normalisation
& UPF
La migration
Documents numériques
Il s’agit donc d’une initiative pour la migration de données
L’UPF ne s’applique qu’aux documents en format numérique
Certains croient qu’il serait mieux de l’appeler Universal
Migration Format
Le but est de rejoindre les métadonnées aux données
(l’« essence ») pour faciliter la migration d’un support à un autre
Faute de fonds pour donner suite, l’initiative est sur les tablettes
depuis plusieurs années maintenant
Mais, WGBH implante actuellement un DAM (Digital Asset
Management System) et dans ce contexte, on verra...
21
La normalisation
22
La normalisation
& Un format physique permanent ?
Un format physique permanent ?
La SMPTE
Depuis des années, les archivistes réclament un format physique
qui est stable
Selon un groupe de travail de la SMPTE, on peut oublier l’idée
d’un format normalisé d’enregistrement
Le problème est reconnu depuis la découverte du problème
d’acidité dans le papier (années 1950)
Entre autres, le développement technologique fait qu’on ne
peut guère penser à s’arrêter sur un format précis
On rêve d’un format physique qui serait stable chimiquement
pendant longtemps
Remarque : dans la littérature de la préservation numérique, on
préconise la variété pour sa robustesse
23
24
La normalisation
& Un format physique permanent ?
La normalisation
& Un format physique permanent ?
Par contre
Autres aspects
Certains membres du study group favoriseraient un nouveau
format d’enregistrement optimisé pour l’archivage
Les archivistes ne constituent pas un marché assez important
Il faudrait que les studios américains réclament un tel format
Ceci serait accompagné d’un ruban magnétique spécialisé
Rêve ou réalité ? Espoirs quelque part ?
25
26
La normalisation
& Un format physique permanent ?
Les fabricants
Métadonnées
Présentation
Chez les fabricants, compétitivité plutôt que collaboration
Classification
Tout est top-secret
Normalisation
Aussi, développements dans les techniques d’encodage
EBU/SMPTE
Dans la technologie, rien n’est très stable
MPEG 7, MPEG2
SESAME
DELPHES
SMIL
MXF / JPEG2000
Vocabulaires du Getty
27
Métadonnées
28
Métadonnées
Présentation
Classification
En sciences de l’information, les métadonnées sont notre
matière première, en quelque sorte
Boll, Klas & Sheth
Besser
L’objet de tous nous travaux, plus ou moins
Turner & Moal
Plusieurs définitions et maintenant, prolifération
C’est surprenant combien la quantité de travaux sur cette
question est petite
D’où le besoin de les classifier maintenant
29
30
Métadonnées
& Classification
Métadonnées
& Classification
Boll, Klas & Sheth
Une autre perspective
Boll, Susanne, Wolfgang Klas, and Amit Sheth. 1998. Overview on using metadata to
manage multimedia data. In Multimedia data management : using metadata to integrate and
apply digital media, ed. Amit Sheth and Wolfgang Klas. New York: McGraw-Hill, 15–17.
Digital image access & retrieval, ed. P. Bryan Heidorn and Beth Sandore. 1997. UrbanaChampaign, IL: Graduate School of Library and Information Science, University of
Illinois.
Métadonnées indépendantes du contenu (par ex. adresse
physique, type de ruban, de caméra)
Besser y identifie quelques couches de métadonnées pour la
gestion d’images fixes
Métadonnées dépendantes du contenu (format du fichier, taille
du fichier, résolution, encodage
Métadonnées pour décrire le contenu (texte créé par des
humains)
31
Métadonnées
& Classification
32
Métadonnées
& Classification
Selon Besser
Quelques conclusions
Format du fichier
L’identification des types de métadonnées ne suffit pas
Équipement de numérisation
Il faut normaliser, uniformiser, pour assurer la découverte et la
communication
Qui a numérisé
Catalogage
Indexation
Droit d’utilisation, qui détient les droits
33
Métadonnées
& Classification
34
Métadonnées
Turner & Moal
Normalisation
Le MétroMéta, un outil pour les métadonnées en sciences de
l’information
Les noyaux sur lesquels on travaille (par ex. Dublin Core, VRA
Core, CDWA (Getty) ) sont des exemples de ce qu’il faut
Objectif : produire un graphique pour décrire et pointer
Mais : les noyaux ne sont que des noyaux, chaque institution
doit ajouter bien d’autres métadonnées
Chaque ligne du métro un thème
Noeuds avec ensembles de métadonnées communs
Besoin de mise à jour
35
36
Métadonnées
& Normalisation
Métadonnées
& Normalisation
Auffret & Prié
Comparer
Auffret & Prié sur la normalisation (Computers & the Humanities
33:4, déc 1999, 319-344) :
Ceci rejoint le modèle de MPEG7 :
Certaines données sont inscrites lors de la création
Le lien avec la rentabilité économique
Les données font partie integrante du fichier numérique du
document
Assurer l’accès, l’échange, les manipulations désirées de
l’information
Faire le plus possible au niveau de la création
Ainsi on évite le travail après coup
37
Métadonnées
& Normalisation
38
Métadonnées
& Normalisation
Comparer avec le modèle textuel
Autre initiative du monde textuel
Le même raisonnement a mené à SGML (ISO 8879:1986) pour
le marquage de texte
TEI : le Text Encoding Initiative
Un projet de développement de lignes directrices pour la
préparation et l’échange de textes électroniques
Ensuite, XML et ses dérivés (DTDs, schémas)
Enfants de SGML: XML, HTML, puis XHTML
pour la recherche
XML maintenant la lingua $anca
pour les industries de la langue
Fournit une gamme très large de descripteurs (balises) en forme
d’une DTD de SGML (maintenant XML)
39
Métadonnées
& Normalisation
40
Métadonnées
Documents audiovisuels
EBU/SMPTE
Voici quelques initiatives qui cherchent à contribuer à une
norme pour la gestion de documents audiovisuels
EBU= European Broadcasting Union
SMPTE = Society of Motion Picture and Television Engineers
Les métadonnées telles que définies par le Joint EBU/SMPTE
Task Force (TFHS) sont reliées au matériel des émissions mais
pas directement au contenu
Une initiative pour développer des normes pour l’échange
d’émissions de télévision par flux de bits (bit streams)
Son ontologie pour contenu audiovisuel
41
42
Métadonnées
& EBU/SMPTE
Métadonnées
& EBU/SMPTE
On traite
Catégories
Code temporel
Format (de fichier, infos nécessaire pour décoder et afficher)
Informations sur les conditions techniques lors de la création du
matériel
Description (catalogage, indexation, administration)
Association (assemblage, synchronisation des éléments)
Scénarios
Composition (former séquences, ordonner structures plus
grandes)
Descriptions de lieux de tournage
Matériel de publicité
Autre (informations utiles mais qui ne tombent pas dans les
autres catégories)
Métadonnées descriptives normalisées pour la recherche dans
les bases de données
43
Métadonnées
44
Métadonnées
& MPEG7
MPEG7
La mayonnaise n’a pas pris
Norme ISO
Des organismes comme l’ONF, le CRIM, MIC ont travaillé à
l’implantation
Une norme pour la représentation du contenu de documents
audiovisuels
Mais maintenant la combinaison MXF/JPEG2000 prend le
dessus
Les métadonnées font partie des fichiers numériques de
documents
À toute fin pratique, MPEG7 est mort maintenant
Beaucoup de travail pour développer un dictionnaire normalisé
et complet de métadonnées
45
Métadonnées
46
Métadonnées
& MPEG2
MPEG2
Tests de compatibilité
C’est une norme de compression pour l’image en mouvement
Ceci exige des tests pour la compatibilité entre niveaux
Livingston & Safar notent qu’il n’y a pas une norme unique
MPEG2
Par exemple, on ne peut pas convertir des données du profile
MPEG 4:2:2 à un autre profil de données MPEG sans d’abord
revenir au vidéo non compressé
Il s’agit de toute une famille de profils
Dans le cas de MPEG2, il y a des pertes importantes
d’informations lors de la compression
Il y a des différents niveaux
47
48
Métadonnées
& MPEG2
Métadonnées
La compression
SESAME
On perd de l’intégrité et de la qualité
Système d’exploration de séquences audiovisuelles et
multimédias enrichi par l’expérience
Pour des fins d’archivage, on voudrait absolument éviter la
compression
Projet qui date de 1999
Il faut considérer MPEG2 comme un format de distribution,
pas un format de préservation
49
Métadonnées
& SESAME
50
Métadonnées
& SESAME
Une approche globale
Détection automatique
http://rfv.insa-lyon.fr/~jolion/SESAME/final/modele6.html
Les travaux visent la détection automatique et analyse de
Un projet France Télécom via CNET/CCETT (Centre national
d’études des télécommunications / Centre commun d’etudes de
telediffusion et de telecommunications)
plans
mouvements de caméra
objets en mouvement
Vise une approche globale à l’exploitation de dépôts
potentiellement énormes de documents audiovisuels
suivi d’objets
51
Métadonnées
52
Métadonnées
DELPHES
SMIL
Dispositif Electronique d’étude et de Lecture pour la Pédagogie
de l’ Histoire dans l’Enseignement Secondaire
Synchronised Multimedia Integration Language (= Langage
d’intégration de multimédia synchronisé)
Projet européen développé à l’INA (1998-2001) pour la création
de cours d’histoire hypermédia
Norme pour le multimédia
Syntaxe XML
Permet aux enseignants et aux étudiants de manipuler, annoter,
et composer des données audiovisuelles
Infos au World Wide Web Consortium (www.w3c.org)
Ceci via l’indexation complète fournie par l’INA
53
54
Métadonnées
Métadonnées
& MXF/JPEG2000
MXF/JPEG2000
MXF
La combinaison gagnante, on dirait, qui prend le dessus sur la
combinaison MPEG7/MPEG2
Parrainé par SMPTE, toute une série de standards
Un conteneur pour données audiovisuelles numériques (vidéo et
audio)
MXF conçu pour utilisation dans la production numérique
(envoyer des fichiers à travers la planète)
Permet une variété de codecs
Mais puisque la préservation numérique passe par les
métadonnées, le potentiel pour ça aussi
« Essence » et métadonnées dans le même fichier
Non lié à un seul environnement informatique
Surtout combiné avec JPEG2000 (BAC a adopté cette
combinaison, l’INA aussi)
Toutefois, il n’y a pas compatibilité/interopérabilité universelle
et le tout est en train de s’implanter ; on verra pour la suite
Si on ajoute le OAIS (ISO 14721:2003), on peut construire une
archive
55
Métadonnées
& MXF/JPEG2000
56
Métadonnées
JPEG2000
Vocabulaires du Getty
Une amélioration de l’algorithm JPEG qu’on connaît
Art & Architecture Thesaurus
Pas très bien implanté, on ne le voit pas beaucoup sur le web
Union List of Artist Names (ULAN)
Toutefois, un avantage important : il a la possibilité d’exécuter
la compression sans perte, ce qui est d’un grand intérêt pour
l’archivage
Getty Thesaurus of Geographic Names (TGN)
La clé : la transformation en ondelettes, mathématiquement
réversible
Cela rejoint la notion déontologique en restauration d’objets
d’archives, de musées, selon laquelle les interventions doivent
être réversibles
57
58
Diffusion et consultation
Diffusion et consultation
Présentation
Présentation
Unesco : Un principe général de l’archivage de matériel
audiovisuel
Accessibilité
Bien sûr, une étape de la chaîne documentaire
Utilisateurs
La combinaison Préservation et accès
Collections
Nouveaux modèles
59
60
Diffusion et consultation
Diffusion et consultation
& Accessibilité
Accessibilité
Quelques moyens
Le travail des relations publiques d’une archive audiovisuelle est
relié à son accessibilité par les usagers externes
Campagnes de publicité
Conférences de presse
Le personnel des archives a/v peut attirer l’attention du public
aux objectifs de l’archive
Visionnement/visionnage de nouvelles découvertes
Visionnement de nouvelles restaurations
Expositions
Soumission de mémoires aux comités parlementaires
61
Diffusion et consultation
& Accessibilité
62
Diffusion et consultation
& Accessibilité
Activités culturelles
Événements entourant l’actualité
Collaboration avec organismes culturelles
Le 30e anniversaire de la Crise d’octobre
Participation aux événements a/v :
Le 25e anniversaire du decès de Claude Jutra
la Cinémathèque québécoise
Le 400e anniversaire de la fondation de Québec
Goethe Institut
Le Moulin à images de Robert Lepage
Cinéma du Parc, Ex Centris pour le Festival du nouveau
média, Festival des films sur l’art, etc.)
Le 75e anniversaire de Radio-Canada
Outfest (www.outfest.org/), Image+Nation (www.imagenation.org) chez les gais et lesbiennes
Orphan Film Symposium (www.nyu.edu/orphanfilm/)
Home Movie Day (www.homemovieday.com/) (en 2009 : 17 oct)
63
Diffusion et consultation
64
Diffusion et consultation
& Utilisateurs
Utilisateurs
Grands utilisateurs
Dans les archives de production de diffuseurs radio et télévision,
l’utilisation interne a priorité (Unesco)
Producteurs à but lucratif
Journalistes
Par contre, des cinémathèques et archives de film historique
s’orientent plutôt vers des usagers externes
Éditeurs
Maisons de production film et de télévision
65
66
Diffusion et consultation
& Utilisateurs
Diffusion et consultation
& Utilisateurs
Dans une archive de production
Autre réalité
On vise à répondre à 90% des demandes en dedans de 24 h
Des archives d’images historiques ont souvent besoin de
beaucoup plus de temps pour répondre (des jours, même des
semaines)
En pratique, il s’agit souvent d’une question de minutes
Pour être réaliste, on doit normalement faire payer par le client
le temps de recherche
67
Diffusion et consultation
& Utilisateurs
68
Diffusion et consultation
Nouvelle réalité
Collections
Avec l’arrivée des archives numériques, c’est l’usager qui fait la
recherche
Déjà, beaucoup de collections d’images en ligne :
Archives nationales des E-U
Ça peut marcher à condition que les systèmes soient capables
de répondre
BAC
BAnQ
Un défi intéressant en SI
Archives nationales de la France
De plus en plus, la recherche de matériel se fait sur le web
INA
ONF
etc.
69
Diffusion et consultation
& Collections
70
Diffusion et consultation
& Collections
Métadonnées, normalisation
Automatisation de tout cela
Cette réalité souligne l’importance de
Matériel afférent (péritexte) relié au processus de production, de
distribution
la normalisation des métadonnées
Recherches en SI : recyclage d’une partie de ce matériel pour la
génération d’indexes
l’indexation de bonne qualité
l’uniformisation des méthodes
Important par rapport à la gestion interne et l’interopérabilité
avec d’autres systèmes
71
72
Diffusion et consultation
& Collections
Diffusion et consultation
& Collections
Les collections
Formats de rubans magnétiques
Plans d’archives (stockshots)
Sondage de la revue Televison Broadcast :
environ 200 collections à travers le monde en ligne chez
www.footage.net
1000 questionnaires envoyés
231 réponses (=23%)
des millions de plans disponibles
des milliers de chercheurs par jour
Un site important pour recherchistes, archivistes, universitaires,
producteurs de documentaires
73
Diffusion et consultation
& Collections
74
Diffusion et consultation
& Collections
Dans ces 231 institutions
Betacam-SP
S-VHS
VHS
U-Matic 3/4"
1" Type C
SP
Betacam
Hi-8
D-2
Formats de choix
Betacam-SP 0,3
0,63
0,62
0,62
0,62
0,57
0,52
0,33
0,26
0,17
DVCPRO 0,23
S-VHS 0,22
Digital Betacam 0,17
Betacam SX 0,16
Digital-S 0,09
DVCam 0,07
U-Matic-SP 0,06
D-3 0,03
DV 0,03
M-II 0,03
75
Diffusion et consultation
& Collections
76
Diffusion et consultation
Toutefois
Nouveaux modèles
Le format recommandé maintenant : LTO (linear tape open)
Il y a beaucoup de nouveaux modèles de diffusion, et ils sont en
évolution constante
LTO 4 utilisé : 0,8 To, 1,6 To compressé
VHS > DVD > iTunes Store
LTO 5 actuellement : 1,6 To, 3,2 To compressé
Cinéma > télévision > chaînes spécialisées > sur demande > iPod
> web
LTO 6 en chantier
Congrès de l’AMIA : actuellement, plus de 80% du matériel
dans les collections est toujours sur 3/4” U-matic, ce qui donne
une idée de l’écart
Netflix, Hulu
Faire sa propre télé : YouTube, Daily Motion, Tou.tv, ONF...
Cela indique la quantité de travail de numérisation à faire
Le modèle habituel (d’abord au cinéma, plus tard sur DVD)
s’effrite
77
78
Diffusion et consultation
& Nouveaux modèles
Diffusion et consultation
& Nouveaux modèles
Les modèles changent
Autres tendances
Tendance : collections numériques disponibles en ligne (par ex.
INA, la collection la plus importante)
Regarder un film, télévision sur téléphone portable
Des sites web comme la Zone audio-vidéo de la SRC
Sorties simultanément de films au cinéma, sur DVD et sur le
web
Beaucoup de chaînes de télévision offrent des clips
Diffusion en HD, 3D dans des salles
Beaucoup d’émissions de télévision disponibles sur le web, à des
sites spécialisés, plus ou moins légaux, ou achat légal
Petits appareils-photo numériques tournent en vidéo HD
Smart phones tournent en vidéo, vidéo HD
YouTube, Daily Motion, etc. constituent des archives
importantes, en quelque sorte
Bref, en 5 ans on peut s’attendre à un environnement
passablement différent de celui d’aujourd’hui
La diffusion de la télé numérique via internet s’en vient
79
80

Documents pareils