version PDF - Flash informatique

Transcription

version PDF - Flash informatique
Échange, élaboration collective
et conservation de documents
État des lieux et
recommandations
Anne.Possoz@epfl.ch, Domaine IT,
Jean-Daniel.Bonjour@epfl.ch, ENAC
& Jean-Claude.Berney@epfl.ch, Domaine IT
Tu
m’as envoyé une lettre que je
ne peux pas lire ! C’est quoi
ce .docx ? J’ai un problème pour lire ton
annonce de conférence ! C’est quoi ce
.odt ? Ton document ne s’imprime pas
correctement ! Je n’arrive plus à ouvrir
mes anciens documents !
Les enjeux de disposer de formats
de documents ouverts pour la bureautique sont aujourd’hui une préoccupation majeure. Les administrations
devant communiquer entre elles, mais
aussi avec la population, décident
de plus en plus de s’appuyer sur des
normes officiellement reconnues. Par
ailleurs, dans cette nouvelle ère numérique, la question de la pérennité
des données devient cruciale. C’est
ainsi que l’ISO1 se voit sollicitée ces
dernières années dans le domaine des
formats de documents.
Le format le plus approprié pour un
document donné dépend souvent du
contexte (outil utilisé, fonctionnalités
attendues …). Après avoir passé en
revue les différents aspects à prendre en
compte, nous ferons quelques recom1
Organisation internationale de standardisation – www.iso.org/
mandations pragmatiques applicables
à la situation cet été 2008. Selon l’évolution future de l’interopérabilité des
outils et des formats, ces recommandations pourraient se simplifier.
Contexte
Quels documents ?
Il s’agira dans cet article de documents tels une lettre, un article, une
feuille de calcul, une présentation pour
une conférence, peut-être même une
thèse. Ces documents font partie de
ce que l’on appelle aujourd’hui la bureautique. Le son et la vidéo sortent du
champ de réflexion du présent article.
Quel usage ?
Se poser la question des auteurs du
document, de ses destinataires et de son
utilisation à long terme est important
pour le choix de l’outil de production
et du format d’enregistrement. Les
conditions sont différentes pour
z un document personnel ou à divulguer;
suite en page
8
Sommaire
FI 6/2008
1 Formats de documents
Anne Possoz, Jean-Daniel Bonjour & Jean-Claude Berney
2 Au revoir, Michèle !
Krassimir Todorov
3 Server Load Balancing
Georges Aubry &
Daniel Grandjean
11 La navigation Internet sans voir
Cédric Fardel
12 Un local serveurs à la FSB
Vittoria Rezzonico
14 Installation de VMware Server
Jean-Claude De Giorgi
18 ForumIT de printemps
Jacqueline Dousson
19 Workshop Speedup
20 WebDAV
Predrag.Viceic
26 Programme des cours
29 OneNote
Jacqueline Frey
31 Arrivée de Callisto au DIT
Jacques Menu
32 Chroniques nomades
Daniel Grandjean
Prochaines parutions
no
SP
7
8
9
10
délai
parution
rédaction
26.06.08
28.08.08
25.09.08
30.10.08
27.11.08
26.08.08
16.09.08
14.10.08
18.11.08
16.12.08
FI 6 – 24 juin 2008 – page 1
Échange, élaboration collective et conservation de documents – État des lieux et recommandations
z
z
commandes de mise en forme et de structuration (titre,
légendes, index, bibliographie, etc.), puis celles-ci sont
interprétées par le moteur TeX qui crée un document au
format DVI (device independent, .dvi) pouvant être à son
tour visualisé ou imprimé à l’aide de divers outils libres;
les fichiers .tex étant du texte ils peuvent être lus par
d’autres outils et aisément convertis vers d’autres formes
de documents (PDF, HTML, diapositives de présenta-
Quel outil ?
ODF, Open Document Format
suite de la première page
un auteur unique ou un groupe d’auteurs;
un document à imprimer (comme s’il était écrit à la main)
ou à distribuer sous forme informatique;
z un document statique ou évolutif dans le temps ou qui
servira de modèle;
z un document à archiver ou non.
Les outils de bureautique utilisés aujourd’hui à l’EPFL
sont principalement:
z les suites Microsoft Office (2003 et 2007, parfois encore
97, sous Microsoft Windows; et 2004 et 2008, sous Mac
OSX 2);
z OpenOffice.org (OOo), logiciel libre sous licence LGPL,
disponible pour les trois OS Windows, Mac et Linux; il
donne lieu à des versions dérivées: NeoOffice 3 sous Mac
OSX (qui va tout bientôt perdre sa raison d’être, l’intégration Aqua étant disponible dès OOo v3, en version bêta
au moment d’écrire cet article) et StarOffice 4, la version
SUN; les formats de documents de OOo et de ces deux
dérivées sont strictement identiques;
z LaTeX, le plus ancien des trois, préféré par les mathématiciens et les physiciens pour ses qualités typographiques et
la possibilité de composition de formules mathématiques
complexes, sous licence libre LPPL 5; LaTeX existe pour
les trois OS Windows, Mac et Linux.
Quel format ?
Le format d’un document, c’est la manière de représenter
les données de ce document pour les stocker dans un fichier
informatique. Il s’agit de stocker le fond (le contenu) et la
forme (la mise en page).
On peut distinguer deux grandes classes de formats pour
ces fichiers:
z ceux qui favorisent l’interopérabilité, stockant les données
sous forme lisible par un œil humain: des balises précisent
la structure et la forme (un peu comme pour le html);
pour les documents, c’est principalement le XML 6 qui
est utilisé; le format TeX utilise un principe similaire aux
balises;
z ceux qui accordent la priorité aux performances, sans
soucis d’interopérabilité, stockant les données sous
forme binaire; le contenu n’est alors pas lisible par un
œil humain mais uniquement à l’aide d’un programme
adapté; tributaires de l’évolution de ces programmes
et des sociétés qui les développent, ces formats posent
beaucoup de problèmes à long terme.
Considérons ici les principaux formats liés aux outils
mentionnés.
z TeX: les données de LaTeX au format TeX (.tex) sont
éditées comme du simple texte par l’auteur, qui inclut les
2
3
4
5
6
L’histoire du format ODF remonte à StarOffice
de Sun et OpenOffice.org, la version libre du même
logiciel. Dès 2001, OpenOffice.org a commencé à utiliser XML pour les formats de ses documents. Quand
les développeurs de KOffice, la suite office de KDE
(environnement graphique libre) ont aussi voulu faire
du XML, ils ont proposé de collaborer sur la définition
d’une norme.
C’est ainsi qu’un groupe de travail technique de
l’OASIS (Organization for the Advancement of Structured
Information Standards) s’est créé spécifiquement pour les
formats de document. L’OASIS regroupe de nombreux
membres dont les plus connus sont Sun, IBM, Oracle,
HP, Corel, Microsoft et Intel. A noter que Microsoft
n’a pas souhaité participer au groupe de travail susmentionné. Lors de ses premiers pas, ODF suivait aussi
l’évolution du tout jeune XML. Des versions préliminaires de ODF sont approuvées par l’OASIS en 2004, puis
2005. En mai 2005, ODF (v1.0) est approuvé comme
norme OASIS.
En septembre 2005, l’OASIS soumet alors à l’ISO
ODF v1.0 pour approbation (par la procédure fast-track).
En mai 2006, ODF v1.0 est approuvé comme norme
ISO/IEC 26300. Cette approbation par l’ISO a un impact car de plus en plus d’administrations, conscientes de
l’importance de l’accès à long terme et pour tous, souhaitent n’utiliser que des standards ouverts, la reconnaissance
d’une norme par l’ISO devant être une garantie.
L’interopérabilité devenue possible suite à la publication de cette norme, divers outils utilisent aujourd’hui
ODF, soit comme format de base (OpenOffice.org,
KOffice), soit comme format supporté (Google docs,
IBM Lotus Symphony, Corel WordPerfect). Et tout récemment, fin mai 2007, Microsoft a annoncé que lors de
la prochaine mise à jour de MS Office 2007, ODF v1.1
et PDF v1.5 seront supportés. Ce Service Pack 2 (SP2)
est attendu d’ici mi-2009. Lors de cette même annonce,
Microsoft a manifesté son intention de participer au
développement des nouvelles versions de ODF. L’avenir
nous dira si nous avançons ainsi vers l’interopérabilité
ou si les rêves ne se réalisent pas toujours.
La version 2004 de Mac OSX est le pendant de 2003 Windows et la version 2008 de Mac OSX celle de 2007.
NeoOffice était une version de OOo v2 adaptée à l’environnement graphique natif de Mac OSX, Aqua, la version OOo v2 imposant
l’utilisation de X11.
StarOffice de SUN ajoute des compléments à OOo pour utilisation en entreprise.
TeX a été créé en 1977 par le mathématicien et informaticien Donald Knuth qui voulait une bien meilleure qualité typographique que
ce qui existait.
XML: eXtensible Markup Language, est un langage de balise extensible – fr.wikipedia.org/wiki/Xml
FI 6 – 24 juin 2008 – page 8
Échange, élaboration collective et conservation de documents – État des lieux et recommandations
z
z
z
z
z
tions …). Diverses revues scientifiques, de mathématiques, physique ou biologie, préfèrent ce format 7.
MS Office, jusqu’à Office 2003 inclus (.doc, .xls, .ppt):
ces formats sont de type binaire (données brutes, avec la
mise en forme dans une zone particulière du document et
qui fonctionne par pointeurs). Ce n’est que tout récemment (sous la pression de la concurrence et du public)
que Microsoft a mis à disposition la documentation de ces
formats8. Si des applications sont parvenues à importer ce
type de format, c’est par méthode de reverse engineering
(autorisé par la loi s’il s’agit d’interopérabilité ) mais qui
ne peut pas garantir une fiabilité à 100%.
Les versions de MS Office pour Mac jusque Office 2004
utilisent ce même format.
ODF ou Open Document Format (.ods, .odt, .odp): est
le format de document natif de OpenOffice.org et de
KOffice, structuré en XML et enregistré sous forme
compressée (zip).
MS OOXML ou Microsoft Office Open XML (.docx,
.xlsx, .pptx): depuis la suite MS Office 2007, Microsoft
utilise un format structuré en XML pour encoder les
données. Ce format est aussi celui de la suite Office
2008 pour Mac OSX (voir encadré pour les appellations
OOXML).
PDF, format de visualisation et d’impression: est
aujourd’hui largement répandu ainsi que normalisé (ISO
PDF/A). Sa spécificité est de préserver la mise en forme
jusque dans les moindres détails et indépendamment de la
plate-forme de lecture (en embarquant notamment dans
le fichier les polices utilisées). Conserver un fichier .pdf
revient à conserver une copie papier. Même si certaines
applications (telles Illustrator ou Inkscape) permettent
d’y apporter des modifications, ce n’est que de façon extrêmement limitée. Les outils de lecture du format PDF
existent sur tous les systèmes. OpenOffice.org permet
d’enregistrer directement ses documents au format PDF.
Pour la suite Microsoft Office, il est possible d’installer
un plugin qui permet la sauvegarde au format PDF.
Interopérabilité et pérennité
Pour travailler en collaboration, l’idéal serait que tous ces
formats de document reposent sur une convention unique de
ce que peut contenir un document. Ainsi, passer d’un format
à un autre serait garanti. Ce n’est pas le cas aujourd’hui et si
des outils tels que OpenOffice.org permettent d’importer et
exporter des documents au format Microsoft Office binaire
(.doc, etc.), l’utilisation dans des outils différents ne donnera
pas exactement la même mise en page, et la structure en
sera parfois même affectée (OpenOffice.org implémentant
notamment des types de styles que MS Office ne connaît
pas: styles de page, de cadre, de listes, etc.). La situation est
encore plus complexe pour les feuilles de calcul. L’échange
d’un document au format MS Office entre une version de
MS Office Windows et Mac OSX pose aussi parfois quelques
problèmes, et même entre différentes versions de MS Office
sur la même plate-forme !
7
8
Un autre point important, concernant la mise en page,
est de s’assurer d’avoir à disposition les mêmes polices de
caractères pour tous les environnements.
À ce jour, il n’y a pas encore de bonnes solutions de
conversion entre MS OOXML et ODF. Des plugins permettant de lire OOXML dans OpenOffice.org sont en chantier.
Et Microsoft vient d’annoncer qu’ils supporteront le format
OOXML, Office Open XML
OOXML a été créé par Microsoft pour répondre
à la forte pression de la concurrence (OpenOffice.org
notamment), à l’intérêt pour le format ODF (normalisé)
et aux demandes de plus en plus pressantes en matière
d’interopérabilité des formats de documents.
Pour sa suite bureautique, Microsoft utilisait un
format binaire, propriétaire et dont la documentation
n’est disponible que depuis le 15 février 2008. Il s’agit
du format des fichiers.doc,.xls et.ppt. Ce format était le
standard de facto jusqu’à l’apparition du format ODF,
reconnu comme norme ISO en 2006.
La demande d’interopérabilité a conduit Microsoft a
produire un format basé sur XML, qu’il a nommé Office
Open XML ou OOXML. Il a alors soumis ce format à
l’Ecma qui l’a reconnu comme norme ECMA 376 le 7
décembre 2006. L’Ecma l’a alors soumis pour normalisation à l’ISO, fin 2006, par la voie fast-track, sous le label
DIS 29500. Lors d’un premier vote, en septembre 2007,
les membres ISO (il s’agit des National Body, NB) n’ont
pas approuvé ce format sans qu’il soit revu et corrigé, vu
ses nombreuses faiblesses et absence de cohérence avec
d’autres normes ISO. L’Ecma, mandatée par l’ISO, a
alors modifié le format pour une nouvelle consultation.
C’est ainsi qu’en février 2008 a eu lieu à Genève un Ballot
resolution meeting (BRM), réunion où se sont retrouvés les
experts techniques afin de résoudre plus d’un millier de
commentaires émis par les NB. Une semaine ne pouvant
suffire pour cette consultation, un vote en bloc a eu lieu
sur la majorité des commentaires. Un nouveau vote des
membres de l’ISO a eu lieu fin mars et le 2 avril 2008,
l’ISO a annoncé la norme officielle ISO/IEC 29500.
Quatre pays ayant récemment déposé un recours contre
les vices de forme de cette procédure, l’affaire n’est pas
encore terminée.
Cette trajectoire tumultueuse risque de mener à
confusion. Par OOXML, entend-on MS-OOXML,
le format de MS Office 2007 ou Ecma-OOXML, la
norme ECMA 376 ou ISO-OOXML, la norme ISO/
IEC 29500 ? Dans cet article pragmatique, c’est le seul
standard de facto de la suite MS Office 2007 qui est pris
en compte.
Le 21 mai 2008, Microsoft a annoncé que ISOOOXML ne serait pas implémenté avant la prochaine
version de MS Office, sans donner de date. Il est piquant
de voir que ODF (défini sans que Microsoft souhaite
participer à son élaboration, mais cela pourrait changer)
devrait donc être fonctionnel sous MS Office avant ISOOOXML (issu de Microsoft) !
Pour un tour d’horizon de revues biologiques – www.ccrnp.ncifcrf.gov/~toms/latex.html
Microsoft a finalement publié ses formats binaires le 15 février 2008 – www.microsoft.com/interop/docs/OfficeBinaryFormats.mspx
FI 6 – 24 juin 2008 – page 9
Échange, élaboration collective et conservation de documents – État des lieux et recommandations
ODF 1.1 dans la prochaine version de MS Office 2007 (SP2)
qui devrait être disponible mi-2009.
Notons toutefois que pour des textes simples et avant la
mise en forme finale, il est envisageable de travailler sur un
document au format .doc, l’une utilisant OpenOffice.org et
l’autre MS Office.
On se rend aussi compte que, pour pouvoir continuer à
lire ses documents dans quelques années, il faut être prudent.
Une sauvegarde au format PDF est sans doute la stratégie la
plus fiable. Mais s’il s’agit de documents que l’on veut pouvoir
continuer à modifier, il sera alors nécessaire de les rouvrir et
de les réarchiver avec chaque nouvelle version d’outil logiciel.
En principe deux versions consécutives permettent d’ouvrir
un document de la version antérieure.
De son côté, si TeX n’est pas directement interopérable avec les autres formats de documents, il est par contre
champion dans le domaine de la pérennité. Ce fait n’est
pas le fruit du hasard puisque son créateur, Don Knuth, a
délibérément figé TeX en 1989 et arrêté son développement
futur précisément à cette fin.
tionnement parfait est de s’accorder dans le groupe à utiliser
le même outil, et d’avoir à disposition les mêmes polices de
caractères. Il est aussi important de sauvegarder le document
dans le format natif de la suite bureautique choisie.
S’il s’agit d’un document simple et dont le contenu
seul est écrit par plusieurs personnes, diverses solutions
sont possibles. On peut utiliser un wiki ou s’échanger le
document au format .doc de MS Office. L’enregistrement
des modifications et leur acceptation fonctionnent bien entre
MS Office et OpenOffice.org. Il est judicieux d’utiliser des
polices de caractères courantes.
Archives
L’archivage de documents figés se fait en PDF. L’archivage
de documents qui doivent pouvoir être réutilisés ultérieurement se fait de préférence dans le format natif de l’outil
bureautique utilisé. Lors de la sortie d’une nouvelle version
de l’outil concerné, il est largement conseillé de reprendre
le document et de le sauvegarder à nouveau.
Documents personnels
Il est possible d’utiliser son outil préféré tout en ayant à
l’esprit les exigences liées à la pérennité et à l’archivage.
Recommandations
Comme il s’agit d’un problème à multiples facettes, voici
quelques grandes lignes à respecter. Commençons par ce qui
est le plus simple et clair.
Documents statiques
Pour transmettre tout document qui ne doit pas être
modifié par le destinataire, utiliser uniquement le format
PDF (ou HTML). C’est en particulier vrai pour les documents mis à disposition sur le Web. Un archivage figé est
aussi le mieux conservé au format PDF.
Rédaction en groupe
Feuilles de calculs
La compatibilité de feuilles de calcul est toujours plus
risquée, même si OpenOffice.org reprend aujourd’hui la très
grande majorité des documents MS Office (.xls).
Les macros sont toujours un moyen fragile de travailler
à long terme, et ceci même avec une suite de bureautique
unique (cf. problèmes de migration de macros d’une version
MS Office à l’autre). Les éditeurs de logiciels peuvent décider d’apporter des changements importants au langage des
macros. Le passage de macros d’un outil à l’autre est plus
délicat encore.
Si plusieurs personnes participent à la rédaction d’un
même document un peu complexe, la seule garantie de foncFormat / Outil bureautique
LaTeX
Microsoft
TeX
MS
binaire
ODF
MSOOXML
V
PDF
Système
V
Windows, Mac, Linux
MS Office 2003
V
Windows
MS Office 2004
V
Mac OSX
MS Office 2007
O
MS Office 2008
O
OpenOffice.org OpenOffice.org 2 import via
addon
annoncé
V
via plugin
Windows
V
via plugin
Mac OSX
O
V
V
Windows, Mac, Linux
StarOffice
O
V
V
Windows, Linux
NeoOffice 2
O
V
OpenOffice.org 3
O
V
annoncé
V
Mac OSX
V
Windows, Mac, Linux
Table 1 – Support de formats courants par des outils de bureautique
Convention: V: totalement supporté
O: partiellement supporté (risques de pertes)
FI 6 – 24 juin 2008 – page 10
Échange, élaboration collective et conservation de documents – État des lieux et recommandations
Illustrations
Rares sont les documents scientifiques qui ne contiennent
pas des images, des figures, des équations, etc. (on parle de
documents composites). La présence d’illustrations matricielles (bitmap ou raster, c’est-à-dire sous forme de points,
comme des photos) ne pose désormais plus de problème
lors de l’échange de documents entre plates-formes ou suites bureautiques différentes. Par contre, la modification des
illustrations vectorisées (comme des figures et des équations)
n’est aujourd’hui possible que si les auteurs, travaillant en
collaboration sur un même document, s’accordent sur le
choix des logiciels de dessins et d’élaboration d’équations.
Les modules logiciels, intégrés dans les suites bureautiques
MS Office et OpenOffice.org, ont acquis une grande maturité (nécessitant de moins en moins le recours à des logiciels
externes), mais ne sont pas compatibles ! Retravailler des
figures ou équations n’est donc aujourd’hui possible que si
l’on utilise la même suite bureautique, d’où l’importance
pour le groupe de se mettre d’accord sur les outils !
Dans le cas où l’on utilise des logiciels de dessin/équation
spécifiques (externes à la suite bureautique), on rappelle à
l’utilisateur l’importance de sauvegarder également ces objets
au format natif, indépendamment du document dans lequel
ils sont insérés.
9
10
Et demain ?
Dans ce domaine en constante évolution, nous voyons
certains aspects converger. La version de OpenOffice v3 pour
Mac OSX, déjà en version beta, est maintenant basée Aqua.
Ainsi, NeoOffice n’aura plus de raison d’être.
OpenOffice.org v3 devrait aussi permettre l’importation
et l’édition de documents PDF/A; cette fonctionnalité devrait
être incluse dans la version finale annoncé pour septembre
2008 9.
L’annonce de Microsoft 10 d’inclure ODF dans MS
Office 2007 (SP2, annoncé pour le premier semestre 2009)
de même que l’exportation en PDF/A méritera toute notre
attention.
Si, du point de vue commercial des vendeurs de logiciels,
les formats multiples sont un avantage, il est évident que du
point de vue des utilisateurs un format unique est de loin
préférable, tant pour l’interopérabilité que pour l’utilisation
à long terme.
Voudrez-vous encore relire des documents dans 10 ans ?
Pensez-vous encore pouvoir relire vos documents dans 10 ans ?
n
Pour l’ensemble des nouveautés de OOo v3, voir www.01net.com/editorial/379569/openoffice-3.0-beta-1-les-nouveautes-en-images/
www.microsoft.com/france/CP/2008/5/2008052201_a209.mspx
La navigation Internet sans voir
La navigation Internet sans voir
Cédric Fardel, [email protected]
NdR: Lors d’une récente séance de webmasters à l’EPFL, Cédric
Fardel est venu accompagné de son chien Neptune. C’est un
utilisateur quotidien d’Internet. Il a surfé devant nous sur les
sites de l’EPFL, grâce à son logiciel de synthèse vocale et nous
étions très impressionnés par sa virtuosité à repérer dans une page
les liens susceptibles de l’intéresser. Nous ne voyions pas les sites
visités et le jeu consistait à deviner de quelle page il s’agissait,
cela nous a permis de nous rendre compte qu’avec quelques petits
efforts dans la création des pages, on aurait pu rendre la vie plus
facile à ces internautes mal ou non-voyants. Et puis, ces efforts
peuvent s’avérer utiles pour un meilleur référencement par les
moteurs de recherche puisque ces moteurs apprécient aussi une
page bien structurée !
L’Internet représente un moyen de communication
aux avantages nombreux et c’est encore plus vrai pour une
personne aveugle ou simplement déficiente visuelle. Pour
qu’elle puisse en bénéficier, cependant, encore faut-il que
l’accessibilité des sites soit assurée. Grâce à l’informatique et
l’Internet, les déficients visuels ont gagné en autonomie et
ils peuvent de nos jours se cultiver, se documenter, faire des
achats, se distraire, communiquer, nouer et entretenir des
relations comme jamais ils n’ont pu le faire auparavant.
Même si certains mal- et non-voyants utilisent un
terminal Braille (système tactile qui renseigne l’utilisateur
de ce qui paraît à l’écran), il leur est devenu possible d’ac-
céder à Internet avec un ordinateur tout à fait ordinaire qui
comprend simplement en plus un logiciel qui pilote une
synthèse vocale.
Et puisque la technologie moderne permet de telles
avancées, il est souhaitable de faire en sorte, aussi souvent
que possible (pour les services administratifs et autres), que la
navigation soit prévue dans le respect des règles d’accessibilité
telles que les présentent les sites énumérés ci-dessous:
références
z www.w3.org: le W3C, World Wide Web Consortium, organisme international qui développe des standards pour
le Web
z www.alsacreations.com/: pour apprendre XHTML, les
CSS et les standards W3C de la conception Web
z www.la-grange.net/w3c/WAI-WEBCONTENTTECHS/: les techniques pour les règles d’accessibilité du
contenu Web 1.0
z www.ech.ch: eCH développe et adopte des normes.
z www.access-for-all.ch/fr/index.html: la fondation Accès
pour tous, organe de labellisation indépendant pour les
sites Web sans barrières en Suisse.
z www.vd.ch/accessibilite: le dossier accessibilité du canton
de Vaud
z www.cedricfardel.ch: le site de Cédric Fardel n
FI 6 – 24 juin 2008 – page 11