Glossaire e

Transcription

Glossaire e
Département fédéral de l'intérieur DFI
Office fédéral de la culture OFC
Bibliothèque nationale suisse BN
Glossaire e-Helvetica
Version:
Version 1.3
Date:
05.02.2016
Table des matières
Access
Administration
Archivage à long terme
Archival Storage
Backup incrémentiel
Bases de données
Cache
Data Management
Disponibilité à long terme
DOI (Digital Object Identifier)
Domain
e-Helvetica
e-Helvetica Access
e-Helvetica Deposit
E-mail
Emulation
Format de fichier
Format propriétaire
FTP (File Transfer Protocol)
Harvesting
Helvetica
Helveticat
Homepage
HTTP (Hypertext Transfer Protocol)
Hyperlien
Ingest
Internet
Intranet
JDBC (Java Database Connectivity)
MARC
Métadonnées
METS (Metadata Encoding & Transmission Standard)
Migration
MODS (Metadata Object Description Schema)
NAS (Network Attached Storage)
NFS (Network File System)
Ninive
Numérisation
OAI (Open Archives Initiative)
OAI-PMH (Open Archives Initiative – Protocol for Metadata Harvesting)
OAIS (Open Archival Information System)
Page web
PDF
Persistent identifier
Preservation planning
Publications électroniques
Publications en ligne
Publications numériques (born-digital)
Publications numérisées (digitized)
Publications officielles
Publications universitaires
robots.txt
Serveur d’archive
Serveur de documents
SFTP (Secure File Transfer Protocol)
Site web (site)
Sites web dynamiques
Sites web statiques
Support de données
Tableaux
Tarball
URN (Uniform Resource Name)
Usenet (Newsgroup)
Web Harvesting
WebDAV
Weblogs (Blogs)
wget
World Wide Web (WWW)
XML (Extensible Markup Language)
2
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
4
5
5
5
5
5
5
5
5
5
5
6
6
6
6
6
6
6
6
7
7
7
7
7
7
7
7
8
8
8
8
8
8
8
8
8
8
9
9
9
9
9
9
9
9
9
10
10
10
10
10
10
10
Access
Processus dans le modèle OAIS: mise à disposition des données d’archives pour l’utilisation.
Administration
Processus dans le modèle OAIS: surveillance des processus de travail dans le système d’archivage.
Archivage à long terme
Par archivage à long terme, on entend la saisie et la conservation à long terme d’informations. C’est
surtout l’archivage à long terme d’informations existant sous forme numérique (digital preservation) qui
pose de nouveaux problèmes.
Archival Storage
Processus dans le modèle OAIS: stockage des objets numériques dans le système d’archivage.
Backup incrémentiel
Un backup incrémentiel est basé sur le backup complet d’un système source. Il ne sauvegarde momentanément que les nouvelles données ajoutées. Pour restaurer des données avec succès, il faut utiliser
le premier backup complet. Sur cette base, les backups incrémentiels sont ensuite remis dans le système par ordre chronologique ascendant.
Bases de données
Les bases de données sont des systèmes permettant de stocker et de gérer de grandes quantités de
données. Une base de données contient des données déposées selon une structure définie et des
programmes de gestion qui stockent les données, les recherchent ou exécutent d’autres opérations sur
les données. Généralement on appelle aussi base de données un programme d’application pour l’organisation et la gestion structurées de données. Les contenus des bases de données sont répertoriés par
des interfaces d’utilisation interactives (principalement propriétaires). Les utilisatrices/utilisateurs transmettent des demandes de recherche individuelles pour lesquelles sont préparés des résultats individuels.
Cache
Le cache est une mémoire tampon rapide, c’est-à-dire une mémoire dont l’accès aux contenus est
spécialement rapide et dans laquelle les données utilisées à plusieurs reprises sont déposées temporairement.
Data Management
Processus dans le modèle OAIS: gestion et maintien des données d’archives par des métadonnées
bibliographiques, techniques et administratives.
Disponibilité à long terme
Le maintien de la disponibilité à long terme d’objets numériques comprend toutes les mesures servant
à faire en sorte que les objets numériques puissent encore être utilisés par les générations futures. Par
générations futures, on entend une période illimitée dans le futur et pour laquelle il faut s’attendre
- à de profonds changements technologiques dans le domaine du stockage et de l’accès aux objets
numériques
- au développement de nouveaux formats et supports de données et à l’élimination des anciens sur
le marché
- ainsi qu’à des changements décisifs dans le comportement des utilisateurs et l’apparition de nouveaux genres de contenus d’information.
L’on distingue deux sortes de mesures de conservation de la disponibilité à long terme:
- des mesures pour la conservation de la substance du flux de données des objets numériques (p.ex.
par refreshing)
- des mesures pour la conservation de l’utilisabilité (p.ex. par émulation ou migration).
3
DOI (Digital Object Identifier)
Le digital object identifier (DOI) permet une identification univoque et permanente d’objets numériques.
Le système du DOI est comparable à ceux de l’ISBN et de l’ISSN, mais va plus loin par sa fonction
intégrée de localisation.
Domain
Un domain est un domaine défini par des caractéristiques communes; on entend généralement par là
un groupe d’ordinateurs ayant des éléments de nom communs (host name). Le plus petit élément commun du nom se nomme top-level-domain, p.ex. l’abréviation du pays ".ch" ou l’abréviation ".com". Les
domaines peuvent être divisés en sous-domaines qu’on appelle second-level-domain, third-level-domain etc.
e-Helvetica
Le terme e-Helvetica est composé de "e" pour électronique et de "Helvetica" pour désigner des publications en lien avec la Suisse.
Le terme e-Helvetica désigne également le service de la BN qui a pour tâche la constitution, le catalogage, l'archivage à long terme et la mise à disposition de la collection numérique.
e-Helvetica Access
e-Helvetica Access est l'interface de consultation des collections numériques de la Bibliothèque nationale suisse (BN). Cette interface permet la recherche plein texte dans le contenu des publications numériques.
Vous trouvez dans e-Helvetica Access les publications numériques qui sont dans les fonds de la BN.
Actuellement sont répertoriées dans e-Helvetica Access les publications numériques originales tels que
livres, périodiques, thèses et publications officielles ainsi que des sites web ayant un lien avec la Suisse.
La collection est en cours de constitution. Outre la BN, des institutions partenaires y participent.
Dans e-Helvetica Access vous trouvez aussi des publications qui ont été numérisées par la BN.
e-Helvetica Deposit
e-Helvetica Deposit est une plateforme permettant aux éditeurs de déposer des livres électroniques
individuels.
E-mail
Un e-mail est un message (texte, fichiers) qui est transféré dans un réseau entre expéditeurs/trices et
récepteurs/trices, par le service "Simple Mail Transfer Protocol" (SMTP).
Emulation
Stratégie en vue de conserver la disponibilité à long terme d’objets numériques. Selon cette stratégie,
les conditions requises par le système pour pouvoir utiliser des objets numériques plus anciens peuvent
être reproduites (émulées) par des logiciels spécialisés sur des systèmes actuels disponibles sur le
marché. Les objets numériques eux-mêmes sont conservés si possible sans être modifiés. Diverses
stratégies d’émulation en partie concurrentes (émulation du matériel contre émulation du logiciel) font
l’objet de discussions.
Format de fichier
Pour réunir des données dans un fichier, il faut des règles définies. Un groupe de ces règles constitue
un format de fichier. Les formats de fichier peuvent être très simples s’ils ne prescrivent par exemple
que la simple succession des données. Mais ils peuvent aussi requérir le stockage d’informations complémentaires précises à des endroits définis dans le fichier. Ils peuvent également demander une codification précise des données et des informations stockées en plus. Jusqu’à la création d’un format d’archive approprié, le choix du format de fichier est crucial pour l’archivage à long terme de données numériques. Il est judicieux de choisir des formats de fichier largement répandus et utilisés par de nombreux programmes (p.ex. TIF pour les fichiers d’images); en effet, il est très probable que dans un futur
assez proche il existe également des programmes permettant de récupérer les informations tirées des
fichiers. Le choix de formats de fichier simples a une influence positive sur l’archivage à long terme
(p.ex. TXT pour les fichiers texte) ; au besoin, ces formats faciliteraient une éventuelle reconstruction
4
ultérieure des règles ayant régi le regroupement des données. Par contre, les formats de fichier appartenant à un seul producteur (p.ex. DOC pour les fichiers texte) sont inappropriés car ce dernier peut les
modifier ou en limiter l’utilisation à sa guise. Souvent, la terminaison du fichier permet de déduire le
format de fichier.
Format propriétaire
Un format propriétaire est un format (structure de données, format de fichier ou de données) dont les
spécifications ne sont pas disponibles ou accessibles ouvertement. Exemple : ‘.wma’ ou ‘.doc’.
FTP (File Transfer Protocol)
FTP est un protocole de transfert de fichiers dans l’Internet. FTP désigne également le service Internet
sur lequel ce protocole est basé.
Harvesting
Le harvesting, aussi appelé webharvesting, est un système de collecte automatique de pages web au
moyen d’un harvester (robot).
Helvetica
Les Helvetica sont des publications qui paraissent en Suisse, qui se rapportent à la Suisse ou à des
personnes de nationalité suisse ou domiciliées en Suisse ou qui ont été créées par ou avec le concours
d’auteurs ayant un lien avec la Suisse. Les Helvetica correspondent au domaine de collecte de la Bibliothèque nationale suisse.
Helveticat
Catalogue de la Bibliothèque nationale suisse.
Homepage
La homepage ou page d’accueil est la page d’entrée d’un fournisseur de pages web dans le World Wide
Web. On désigne également sous ce nom le site web d’un particulier. Aujourd'hui, le mot ne désigne
donc plus uniquement comme à l’origine la page d’entrée d’un site, mais l’ensemble de l’information
proposée sur le site.
HTTP (Hypertext Transfer Protocol)
HTTP est un protocole de transfert pour le transfert de données dans le WWW ; il se base sur le protocole de transport TCP/IP.
Hyperlien
L’hyperlien, ou simplement lien, est le lien entre un élément dans un hypertexte ou sur une page Internet
avec un autre élément sur la même page ou avec une autre page. Le terme dont part le lien est souligné
et mis en évidence en couleur ; le lien est parfois aussi représenté par un graphique (un symbole).
Ingest
Processus dans le modèle OAIS: prise en charge des données du producteur, préparation pour l’archivage et intégration dans le système de stockage pour l’archivage à long terme.
Internet
L’Internet est le plus grand réseau d’ordinateurs du monde, il se compose de nombreux réseaux reliés
entre eux et met à disposition une infrastructure de communication variée. Les prestations de l’Internet
– on parle aussi de services – sont entre autres: l’ e-mail, le courrier électronique; World Wide Web
(WWW), un système de documents basé sur l’hypertexte; Usenet, un forum de discussion; FTP, un
système de transfert de toutes sortes de fichiers; IRC, le chat; Gopher, Telnet, Wais, Archie, et quelques
anciens services dont l’importance décroît. Pour beaucoup d’utilisateurs privés, le WWW est la contribution la plus importante, c’est pourquoi cet élément est souvent considéré comme égal à l’Internet.
5
Intranet
L’Intranet est un réseau privé (propre à une entreprise) qui travaille avec la technologie de l’Internet.
Contrairement à l’Internet, l’Intranet n’est accessible qu’à un cercle restreint et local d’utilisateurs.
JDBC (Java Database Connectivity)
Java Database Connectivity (JDBC) est une interface de base de données de la plateforme Java qui
offre une interface homogène entre des bases de données de différents producteurs et qui est spécialement adaptée aux bases de données relationnelles. Interface universelle entre bases de données,
JDBC est comparable p.ex. à ODBC sous Windows ou DBI sous Perl. Etablir et gérer les connexions
aux bases de données, transférer les requêtes SQL à la base de données, transformer les résultats en
une forme utilisable par Java et les mettre à disposition du programme sont quelques-unes des tâches
de JDBC.
MARC
MARC (Machine Readable Cataloging) est une norme largement utilisée pour la représentation et
l’échange de données bibliographiques, d’autorité, de fonds, de classification et de données de renseignements communautaires lisibles par machine.
Métadonnées
Les métadonnées sont des données sur des données. Autrement dit, les métadonnées désignent des
données qui décrivent d’autres données ou objets. Il s’agit donc d'informations sur des données qui
facilitent au maximum l’accès aux données souhaitées ainsi que l’échange et la gestion de ces données.
Ces informations de base contiennent p.ex. des indications sur l’auteur du document, la date de publication, des renvois à des documents sur le même sujet, etc. Les notices bibliographiques de publications sont donc des métadonnées. Dans le domaine électronique, les métadonnées n’incluent pas seulement des mentions bibliographiques, mais aussi des informations techniques et administratives (format et grandeur du fichier, date de reprise des données etc.).
METS (Metadata Encoding & Transmission Standard)
METS est un format XML défini au moyen d’un schéma XML, utilisé pour la description de collections
numériques d’objets avec des métadonnées. Le format des métadonnées (MAB, MARC, Dublin Core
etc.) peut varier et n’est pas défini par METS. En revanche, METS contient des éléments pour le groupement d’objets et leur mise en relation avec des métadonnées descriptives et administratives. METS
permet par exemple de codifier des œuvres structurées de façon hiérarchique ou autre; une œuvre peut
être une collection de livres, un livre structuré en chapitres et en pages, ou un film composé de plusieurs
scènes. C’est un sous-ensemble du schéma XLink qui est utilisé pour relier les fichiers METS et les
objets numériques dont il faut tirer des informations.
Migration
Stratégie de conservation de la disponibilité à long terme. Pour faire suite aux changements techniques
que subit l’environnement, les objets numériques à conserver sont soumis à des procédures censées
garantir leur utilisabilité dans les nouvelles conditions.
MODS (Metadata Object Description Schema)
MODS (Metadata Object Description Schema) est un standard de métadonnées de la Library of Congress. MODS est basé sur un schéma XML qui sert à décrire des données bibliographiques.
NAS (Network Attached Storage)
Network Attached Storage (NAS) désigne des serveurs de fichiers faciles à gérer. NAS est utilisé pour
mettre à disposition sans grand investissement une capacité de stockage indépendante dans un réseau
d’ordinateurs. A la différence d’un Direct Attached Storage, un NAS est est un hôte autonome ayant son
propre système d’exploitation. Comme les fonctions sont adaptées très spécifiquement à leur utilisation,
des erreurs qui seraient dues à des possibilités de configuration étendues et superflues pour leur utilisation spécifique peuvent être évitées dès le départ. Les services basés sur les fichiers comme NFS ou
SMB/CIFS sont la fonction principale. Pour cette raison, les systèmes NAS sont souvent appelés filers.
6
Un disque dur courant qui se trouve dans un boîtier externe équipé d’une prise réseau RJ-45, du
firmware correspondant et, en option, d’autres possibilités de connexion, correspond déjà à un NAS.
NFS (Network File System)
Le Network File System – en abrégé NFS (aussi appelé Network File Service) – est un protocole développé par Sun Microsystems qui permet d’accéder à des fichiers via un réseau. Les fichiers ne sont pas
transmis comme p.ex. avec FTP, mais les utilisateurs peuvent accéder aux fichiers qui se trouvent sur
un ordinateur distant comme s’ils étaient stockés sur leur disque dur local.
Ninive
Ninive est le système de stockage de la Bibliothèque nationale suisse pour l’archivage à long terme.
Numérisation
La numérisation d’objets analogiques recourt à des interventions dans des domaines divers. L’objectif
prioritaire est de faciliter l’accès des utilisateurs aux contenus et de conserver le contenu des objets
menacés de dégradation. Des mesures pour l’archivage à long terme des objets numériques sont nécessaires pour garantir le futur des interventions réalisées.
OAI (Open Archives Initiative)
Interface standardisée pour l’échange de métadonnées sur la base de 'Open Archive Initiative Protocol
for Metadata Harvesting', qui permet de faire des recherches à l’aide de métadonnées dans les fonds
d’archives documentaires scientifiques de renommée.
OAI-PMH (Open Archives Initiative – Protocol for Metadata Harvesting)
OAI-PMH est un protocole d'échange de métadonnées. Il permet à un serveur de documents de récolter
et d’indexer des métadonnées appartenant à d'autres serveurs de documents compatibles OAI-PMH,
de façon à ce que les recherches lancées dans son propre moteur de recherche puissent englober les
documents hébergés par ces autres serveurs. Un serveur compatible OAI-PMH peut être à la fois fournisseur et moissonneur de métadonnées.
OAIS (Open Archival Information System)
Ce modèle de référence certifié ISO 14721 décrit une archive comme une organisation dans laquelle
des hommes et des systèmes œuvrent ensemble dans le but de conserver des informations et de les
mettre à disposition d’un cercle d’utilisateurs défini. Etre conforme à OAIS suppose un engagement à
respecter les conditions-cadre définies dans le modèle de référence. Le modèle de référence ne spécifie
ni le design, ni l’implémentation d’une archive conforme à OAIS.
Page web
Une page web est une page d’un fournisseur d'information sur la Toile (ou World Wide Web). La page
web est à distinguer du site web. Un site web se compose habituellement d’un groupe de pages web
ordonnées hiérarchiquement et dont la page principale est appelée homepage ou page d’accueil.
PDF
Format de fichier basé sur Postscript et créé par l’entreprise Adobe pour la représentation de documents
dans leur mise en page d’origine (p.ex. sauts de page fixes, placement d’illustrations). PDF n’est donc
pas seulement intéressant pour les publications commerciales, mais aussi pour les publications scientifiques, surtout dans l’optique du problème de la citation dans les documents électroniques. L’aptitude
de PDF comme format d’archivage à long terme est contestée car bien qu’il soit ouvert, il s’agit d’un
format propriétaire. Pour un sous-ensemble du format (PDF/A = Archive), un processus de standardisation (ISO 19005-1. Document management - Electronic document file format for long-term preservation - Part 1: Use of PDF (PDF/A)) a été introduit pour favoriser une plus grande acceptation du format
à des fins d’archivage à long terme.
7
Persistent identifier
Les persistent identifiers sont des identificateurs uniques d’objets numériques, indépendants de l’emplacement, qui garantissent en même temps l’accès durable à des ressources électroniques. La Bibliothèque nationale suisse attribue de tels identificateurs sur la base du National Bibliography Number
(NBN).
Preservation planning
Processus dans le modèle OAIS: planification et mise en oeuvre des mesures de conservation à long
terme sur les objets numériques dans le système d’archivage.
Publications électroniques
Par publications électroniques, on entend aussi bien les publications online que les publications offline.
On utilise aussi l’expression publications numériques.
Publications en ligne
Les publications en ligne (ou online) sont un sous-ensemble des publications électroniques. Les publications en ligne sont publiées et diffusées sur Internet sans support physique. Elles apparaissent sous
toutes sortes de formats de données et de formes de présentation. Exemples: revue électronique, base
de données, newsletter par e-mail, etc. Autres expressions utilisées: publications en réseau, publications électroniques non physiques, publications non physiques.
Publications numériques (born-digital)
Les publications numériques sont des publications numériques originales. Fabriquées sur support numérique, elles n’existent que sous cette forme.
Publications numérisées (digitized)
Les publications numérisées sont des publications converties de l’analogique (papier p. ex.) au numérique.
Publications officielles
Les publications officielles sont des informations imprimées ou conservées sur d’autres supports que le
papier et qui sont publiées par une unité de l’Administration fédérale centrale.
Publications universitaires
Par publications universitaires, on entend les thèses et les thèses d’habilitation qui sont publiées dans
une université.
robots.txt
Après convention du protocole d’exclusion des robots, lorsqu’un webcrawler (robot) trouve une page
web, il lit d’abord le fichier robots.txt (écrit en minuscules) dans le répertoire racine (root) d’un domaine.
Dans ce fichier, on peut spécifier si la page web peut être visitée par un webcrawler, et de quelle manière. Les exploitants de sites web ont donc la possibilité de bloquer des domaines choisis de leur
présence web pour certains moteurs de recherche. Le protocole est purement indicatif et dépend de la
collaboration du webcrawler. On parle de webcrawlers «aimables». L’exclusion de certaines parties
d’une présence web par le protocole n’en garantit pas la dissimulation ; à cet effet, un fichier .htaccess
permet de protéger des pages ou des sous-répertoires d’un serveur. Certains moteurs de recherche
affichent quand même dans leurs pages de résultats les URL trouvées par un webcrawler, mais sans
la description des pages.
Serveur d’archive
Le serveur d’archive désigne une infrastructure technique et organisationnelle dont la tâche prioritaire
est le stockage, la gestion et l’archivage à long terme d’objets numériques. Dans le contexte de l’archivage à long terme, on sépare les systèmes du type serveur d’archive des systèmes du type serveur de
documents, ceci dans le but de distinguer chacun des axes essentiels de la fonctionnalité.
8
Serveur de documents
Un serveur de documents désigne un système technique et organisationnel dont l’axe principal est la
mise à disposition de documents numériques (ou d’objets similaires à des documents) à l’utilisateur
final. Un serveur de documents coopère avec un serveur d’archive ou un système de dépôt afin de
garantir la disponibilité à long terme des objets à mettre à disposition.
SFTP (Secure File Transfer Protocol)
SFTP, aussi appelé Secure FTP (protocole sécurisé de transfert de fichiers) est une variante du protocole FTP qui tunnelise la session à travers une connexion secure shell pour la sécuriser.
Site web (site)
Un site web se compose généralement de plusieurs pages web ordonnées hiérarchiquement.
Sites web dynamiques
Dans le contexte bibliothéconomique, les sites web dynamiques sont des publications qui ne sont pas
achevées au moment de leur première publication. Elles peuvent être modifiées et augmentées dans
des mesures et à des fréquences variables (ressources intégratrices).
Sites web statiques
Dans le contexte bibliothéconomique, les sites web statiques sont des publications achevées au moment de leur première parution et qui ne subiront donc plus aucune modification a posteriori (ressource
monographique). Les "versions" de sites web statiques modifiées sur le fond sont considérées comme
de nouvelles publications en ligne.
Support de données
Média de stockage pouvant être traité de façon mécanique ou électronique, et sur lequel sont stockées
durablement des données numériques qui peuvent en être à nouveau extraites. A titre d’exemples, on
peut citer les supports de données magnétiques (disquettes, bandes magnétiques) et optiques (CDROM, DVD).
Tableaux
Les tableaux sont des pages définies dans un mailbox (Bulletin Board System) ou un newsgroup dans
lesquels les utilisateurs/trices peuvent échanger des informations – comme un avis accroché au panneau d’affichage.
Tarball
Tar est le nom d’un logiciel d'archivage de fichiers standard d'Unix; il désigne également le fichier d'archive créé par ce programme et dont l’extension est .tar. Le nom «tar» vient de l’anglais tape archiver
(littéralement «archiveur pour bande»). Tar offre la possibilité de concaténer un grand nombre de fichiers en un seul et de recréer les fichiers à partir de ce dernier. On appelle parfois le fichier d'archivage créé un tarball. Le type MIME pour le fichier .tar est application/x-tar.
URN (Uniform Resource Name)
Un URN (Uniform Resource Name) est un Persistent Identifier. Les Persistent identifiers peuvent remplacer les URL (Uniform Resource Locator; „lien“ dans l’Internet) dans le catalogue ou dans d’autres
systèmes de recensement, ou être utilisés comme références stables dans les documents eux-mêmes,
ce qui permet d’avoir des liens stables. La mise à jour des références prend moins de temps puisque
les URL sont mis à jour de façon automatisée en un seul endroit. Les liens peuvent être intégrés à
plusieurs services de recensement. Les publications numériques ont un identificateur unique au monde
et peuvent donc être citées de manière fiable. L’URN garantit un accès durable à un objet. L’accès
durable est garanti par l’archivage à long terme ou l’archivage des objets ainsi que par la haute disponibilité technique du service URN. Un URN renvoie au moins à un URL par lequel un objet est adressé.
Un URN peut également gérer plusieurs copies du même objet, donc plusieurs URL, ainsi que différents
formats de présentation des objets.
9
Usenet (Newsgroup)
Usenet est un réseau de forums ou groupes de discussion qui est en principe indépendant de l’Internet.
Une autre désignation pour Usenet est Newsgroup, ce qui peut toutefois créer des malentendus. Un
newsgroup n’est en réalité qu’une partie – peut-être très petite – de Usenet qui traite un thème précis.
Mais il existe aussi des newsgroups en dehors de Usenet à proprement parler, par exemple dans les
intranets d’entreprises ou dans des écoles ou universités.
Web Harvesting
Voir Harvesting.
WebDAV
WebDAV (Web-based Distributed Authoring and Versioning) est un standard ouvert permettant de
mettre à disposition des fichiers dans l’Internet. Les utilisateurs peuvent accéder à leurs données
comme sur un disque dur en ligne. Des exemples connus sont l’iDisk, le disque dur virtuel sur Internet
d’Apple, le GMX MediaCenter ou le disque dur en ligne aon (aon-Online-Festplatte) de Telekom Austria. D’un point de vue technique, WebDAV est une extension du protocole HTTP/1.1 qui lève certaines restrictions de HTTP. Jusqu’ici, les formulaires en ligne ne permettaient la plupart du temps que
l’upload de fichiers individuels (HTTP-POST). Avec WebDAV, il est possible de transmettre des répertoires entiers. De plus, le contrôle des versions est spécifié.
Weblogs (Blogs)
Un weblog, en général simplement appelé blog, est un site web qui contient périodiquement de nouvelles entrées. Un weblog est une sorte de journal intime virtuel dans lequel l’auteur (blogger) note des
pensées personnelles et des liens commentés vers des sources Internet qu’il/elle a visitées.
wget
GNU Wget est un logiciel libre en ligne de commande qui sert à télécharger des ressources (fichiers,
pages web etc.) via un réseau. ftp, http et https sont quelques-uns des protocoles supportés. La première version, écrite par Hrvoje Niksic, date de 1995. Ce programme existe pour UNIX et GNU/Linux
ainsi que pour OS/2, Windows et SkyOS. Il est sous la GNU General Public License et fait partie du
projet GNU. Le protocole a été développé en 1994 par un groupe indépendant, mais entre-temps il est
unanimement reconnu et peut être considéré comme un quasi-standard. ACAP 1.0 (Automated Content
Access Protocol), publié le 30.11.2007, est une extension possible du protocole d’exclusion des robots.
Au début juin 2008, Google, Microsoft et Yahoo ont reconnu quelques points communs.
World Wide Web (WWW)
Le World Wide Web est un système hypermédia pour l’Internet développé en 1989 au Centre européen
de recherche nucléaire CERN. Le WWW permet d’accéder à toutes sortes de documents stockés sous
forme numérique sur un ordinateur qui se trouve quelque part dans le monde et qui est relié avec le
WWW. Les documents sont des textes normaux, des hypertextes, mais aussi des fichiers de musique
et d’images ainsi que des films. Le World Wide Web et l’Internet ne sont pas identiques, mais le World
Wide Web se base sur l’Internet. Toutefois, la plupart des surfeurs et surfeuses sur Internet utilisent
exclusivement le World Wide Web pour leurs activités. Le World Wide Web utilise le protocole de transmission HTTP; il existe encore d’autres protocoles dans l’Internet, p.ex. FTP. La majorité des documents
texte dans le WWW est aujourd’hui créée dans la langue de description de pages HTML, dont les hyperliens sont la caractéristique principale. Ces derniers permettent d’appeler à partir d’un document
n’importe quel autre document qui est accessible dans le WWW à l’aide d’une procédure d’adressage
standardisée et en utilisant le protocole HTTP. A côté de HTML, il existe encore une multitude d’autres
formats de données pour les textes et autres types de documents.
XML (Extensible Markup Language)
L’Extensible Markup Language, abrégé XML, est un standard pour la création de documents lisibles par
les machines et par les hommes. XML définit les règles pour la création de ces documents. Pour chaque
cas concret d’application (application XML), il s’agit de spécifier les détails des documents en question.
XML est donc un standard pour le définition de n’importe quel langage de composition; ces langages
étant toutefois fortement apparentés de par leur structure de base. Les structures XML ont de bonnes
10
propriétés pour la disponibilité à long terme car il s’agit d’un standard ouvert offrant de nombreuses
possibilités de structuration pour les types d’objets les plus divers. Les structures XML sont interprétables par machine car elles suivent des règles formelles.
11

Documents pareils

Archives Web Suisse : glossaire, version 1.6, 5 février 2016

Archives Web Suisse : glossaire, version 1.6, 5 février 2016 L’Internet est le plus grand réseau d’ordinateurs du monde, il se compose de nombreux réseaux reliés entre eux et met à disposition une infrastructure de communi-cation variée. Les prestations de l...

Plus en détail

Le projet e-Helvetica de la Bibliothèque nationale suisse

Le projet e-Helvetica de la Bibliothèque nationale suisse possibilités de recherche aussi attrayantes que possible et être mise à disposition dans une large mesure sur l’Internet. Même si l’idée de conserver des parties de l’information publiée dans l’Int...

Plus en détail