How XML Author Enhances Microsoft Word

Transcription

How XML Author Enhances Microsoft Word
Comment Quark XML Author améliore
Microsoft Word
Présentation
Microsoft® a introduit des fonctionnalités XML dans Office 2003 qu’il a ensuite améliorées dans
Office 2007 et a maintenu ces capacités dans Office 2010, ce qui a contribué à faire connaître la
valeur du format XML aux utilisateurs. L’éditeur s’est attaché à utiliser XML pour permettre aux
développeurs de logiciels tiers d’intégrer des données dans les documents, des documents
dans les processus aval et d’améliorer la productivité des utilisateurs individuels.
Mais Microsoft a choisi de ne pas permettre l’édition de fichiers XML dans Word. Quant aux
clients désireux d’utiliser Word pour créer des documents XML, Microsoft leur recommande
des produits partenaires, comme notamment Quark® XML Author.
Si les développeurs peuvent tirer parti des capacités XML intégrées dans Word pour conférer
des fonctions d’édition XML dans des cas simples, les besoins d’une application de publication
dynamique nécessitent la mise en œuvre de fonctionnalités complètes d’édition de documents
XML dont seul Quark XML Author for Microsoft Word dispose. Quark XML Author s’appuie
sur les fonctions XML de Word pour permettre aux rédacteurs de créer et de modifier des
documents XML sans renoncer pour autant à l’utilisation simple et intuitive de Microsoft Word.
2
Quark XML Author
s’appuie sur les fonctions
XML de Word pour
permettre aux rédacteurs
de créer et de modifier
des documents XML
sans renoncer pour
autant à l’utilisation
simple et intuitive
de Microsoft Word.
©2012 Quark Software Inc. All rights reserved
Prise en charge du format XML par Microsoft
Cette partie fournit des détails sur les fonctionnalités XML de Microsoft, afin de vous aider à
comprendre leur intérêt pour de nombreux types d’applications et prendre conscience de
leurs limites en tant qu’éditeur XML. La prise en charge du XML dans Microsoft Word porte
sur deux aspects : le format des fichiers et l’intégration des données. Cette partie décrit en
détail chacun de ces aspects.
Format des fichiers
Supposons que votre entreprise a généré des milliers de documents Word avec le logo
de la société et que, celui-ci ayant changé, vous devez maintenant mettre à jour tous ces
documents. (Nous avons emprunté ce scénario à un article de Microsoft disponible à l’adresse
http://msdn2.microsoft.com/en-us/library/aa338205.aspx, qui explore plus en détail que
nous ne le faisons ici le format des fichiers Microsoft.)
L’une des méthodes pour remplacer le logo consiste à ouvrir chaque document, trouver le
logo, remplacer celui-ci par le nouveau logo, et enregistrer le document. Cela peut suffire si
l’on n’a que quelques documents. Mais dans le cas de centaines ou de milliers de fichiers,
cette tâche prendrait trop de temps et mobiliserait trop de personnel, sans compter qu’elle
serait susceptible d’entraîner des erreurs.
L’autre solution consisterait à créer un logiciel qui automatise tout le processus d’ouverture
des documents, de recherche et de remplacement de l’ancien logo, puis d’enregistrement
des documents mis à jour. Mais jusqu’à la sortie d’Office 2007, les fichiers Microsoft Word
étaient au format «.doc », un format binaire propriétaire. Pour automatiser le remplacement
du logo, il fallait d’abord apprendre le format de fichier (étape diificile), puis créer et tester
un logiciel permettant de parcourir les fichiers, lire les données cibles et les remplacer.
Pour simplifier ce scénario, ainsi que permettre l’accès à de nombreuses autres fonctions (décrites
dans l’article à l’adresse indiquée ci-dessus), Microsoft a décidé d’ouvrir le format « .doc » dans
Office 2007 afin d’en simplifier l’accès. Et plutôt que se limiter à la seule publication des spécifications pour le format .doc existant, Microsoft est allé encore plus loin et a remplacé le format
par défaut par une version XML de .doc baptisée « OpenXML », qui utilise l’extension .docx.
Le principal avantage à baser ce nouveau format de fichier sur XML est qu’il existe déjà de
nombreux logiciels pour traiter le format XML. Cela signifie qu’il est plus simple et moins
onéreux de développer des logiciels permettant de traiter OpenXML que d’écrire des logiciels
pour traiter des fichiers .doc.
(Microsoft avait déjà introduit un format de fichier XML dans Office 2003, qu’il avait appelé
« Word ML ». Dans Office 2007 et 2010, Microsoft a apporté plusieurs améliorations au format,
publié la documentation le concernant, et en a fait le format de fichier par défaut pour Office.
Bien que Word 2007 puisse ouvrir les fichiers .doc, il utilise le format OpenXML par défaut.)
Intégration des données
De nombreux documents Word contiennent des données provenant de différents systèmes
métiers. Par exemple, les documents Word peuvent être des catalogues contenant des
références de pièces détachées, des descriptions et des prix extraits d’une base de données.
Il peut aussi s’agir de rapports de recherche contenant des cours de titres et autres données
financières pour les sociétés cotées en bourse. Dans la plupart des cas, l’insertion de ces
informations dans des documents Word implique leur saisie manuelle.
Mais que faites-vous lorsque les données changent ? Avant que Microsoft ne commercialise
Office 2007, il fallait exécuter une procédure similaire à celle de l’exemple du logo cité plus
haut : ouvrir les anciens documents, trouver les données obsolètes et les mettre à jour par les
données les plus récentes, puis enregistrer les documents. Combien de rapports hebdomadaires
ou mensuels sont créés précisément selon cette approche ? Et combien de temps et d’efforts
y consacre-t-on ?
©2012 Quark Software Inc. All rights reserved
3
Pour éliminer ce travail laborieux et souvent propice aux erreurs, Microsoft a introduit des
capacités d’intégration de données de type XML dans Office 2003. Les développeurs peuvent
ainsi configurer, à l’intérieur d’un document, des champs qui se connectent à des bases de
données et autres flux de données afin que les mises à jour interviennent automatiquement
ou d’un simple clic de souris. De nos jours, des flux de données XML sont disponibles auprès
de tous les principaux systèmes informatiques et bases de données.
Bien que Word fournisse
Pour mettre en œuvre cette fonctionnalité, Microsoft a introduit dans Office 2007 (qui sont
toujours disponibles dans Office 2010) des « commandes de contenu » grâce auxquelles un
programmeur peut intégrer des données XML dans un document Word. Extrait de l’article
Microsoft figurant à l’adresse http://msdn2.microsoft.com/en-us/library/bb266218.aspx, la
capture d’écran suivante montre l’utilisation d’une commande de contenu pour intégrer des
cours de titres dans un document :
prétend pas pour autant
quelques excellentes
fonctionnalités tirant parti
de XML, Microsoft ne
que Word soit un « éditeur
XML ». De fait, Microsoft
recommande aux clients
qui veulent un éditeur
XML de se tourner vers
Un programmeur peut configurer la commande de contenu de telle sorte que, lorsque l’utilisateur
ouvre le document, Word récupère automatiquement le cours le plus récent et actualise ce
tableau. Office 2007 et Office 2010 permettent en outre au programmeur de verrouiller les
commandes de contenu pour empêcher les utilisateurs de modifier leur fonction ou de les
supprimer. Le verrouillage de parties du document permet aux processus en aval de veiller
à ce que les documents contiennent en permanence les informations prévues, ce qui simplifie
l’écriture et le test de ces processus.
les produits de ses
partenaires, tels que
Quark XML Author.
Comment Quark XML Author améliore la
prise en charge de XML dans Microsoft Word
Bien que Word fournisse quelques excellentes fonctionnalités tirant parti du XML, Microsoft ne
prétend pas pour autant que Word soit un « éditeur XML ». De fait, Microsoft recommande aux
clients qui veulent un éditeur XML de se tourner vers les produits de ses partenaires, tels que
Quark XML Author.
Avant d’examiner comment Quark XML Author améliore Word, vous devez d’abord comprendre
la différence essentielle qu’il y a entre un éditeur XML et Word : un éditeur XML vous permet
d’utiliser vos propres balises dans tout le document. Cet aspect est essentiel pour les applications
de publication dynamique, dans le cadre desquelles vous voulez publier les mêmes informations
avec différents types de formatage pour différents types de documents et de supports.
En revanche, Microsoft a choisi que les balises pour son format de fichier XML Word 2007/2010
contrôlent l’aspect du contenu dans un fichier Word. Ceci est parfaitement logique pour Word, mais
c’est exactement le contraire de la dissociation du contenu et de son formatage, dont la publication
dynamique a besoin. En publication dynamique, on veut que la balise indique la signification du
contenu (par exemple, intitulé, référence de pièce ou liste) plutôt que son aspect ; un processus
de publication automatisé détermine la mise en forme en fonction de la signification, ce qui
permet à du texte avec la même signification d’être formaté différemment à des fins diverses.
Pour prendre en charge les fonctionnalités d’intégration de données de Word, les commandes
de contenu dans Office 2007/2010 vous permettent d’affecter vos propres balises XML à des
parties spécifiques du document. Vous pourriez être tenté d’en conclure que, en utilisant des
commandes de contenu pour chaque partie de votre document, vous seriez à même de construire
votre propre éditeur XML. Et vous auriez raison.
Toutefois, pour remplacer toutes les fonctions normales d’édition de texte par des commandes
de contenu, il vous faudrait décider quels efforts vous seriez prêt à consentir pour préserver
l’utilisation habituelle de Word. Si vous êtes disposé à modifier considérablement l’utilisation
normale de Word en créant ce qui en constituerait une forme très fonctionnelle et très intelligente,
le développement pourrait vous prendre plusieurs semaines. Mais si vous voulez perturber au
minimum les utilisateurs en conservant autant que possible l’utilisation habituelle de Word, le
développement prendra probablement plusieurs années.
4
©2012 Quark Software Inc. All rights reserved
C’est là qu’intervient Quark XML Author : ce module crée un véritable environnement d’édition
XML au sein même de Word. Afin d’y parvenir, les développeurs ont dû étudier chaque fonction
de Word, qu’elle soit accessible à partir du clavier, des menus, des barres d’outils ou du système
d’exploitation Windows, et analyser :
■
Son potentiel de corruption du document ;
■
L’expérience utilisateur pour le fonctionnement usuel de Word ;
■
La mise en œuvre appropriée pour la création de fichiers XML.
Quark XML Author for Word fonctionne en arrière-plan et modifie à peine le fonctionnement de Word pour
permettre aux utilisateurs de créer des documents XML. Dans cette illustration, Quark XML Author utilise la
liste déroulante des styles de Word pour montrer tous les types de contenus valides que l’auteur peut insérer
au niveau du curseur.
Les styles de Word sont un exemple des fonctions que Quark XML Author modifie. Quark XML
Author établit une relation entre les styles et les éléments XML, qu’il appelle « Smart Styles »,
car les seuls styles qui apparaissent dans la liste déroulante sont ceux qui sont valides pour
insertion au niveau du curseur. Quark XML Author intercepte des centaines de fonctions telles
que la fonction Styles, et doit traiter des milliers de permutations. Pour créer votre propre éditeur
XML dans Word, il vous faudrait dupliquer toutes ces fonctionnalités, ce qui se révélerait
extrêmement onéreux.
Quark XML Author cherche à préserver autant que possible l’expérience d’utilisation de Word.
Il utilise des boîtes de dialogue et d’autres types de commandes seulement s’ils améliorent
l’expérience de l’utilisateur par rapport à l’interface native de Word.
Pour garantir la conformité au format XML, Quark XML Author prend les mesures suivantes :
1. Il supprime toutes les fonctions superflues dans les menus et les barres d’outils ;
2. Il intercepte les fonctions non valides, telles qu’une tentative de glisser-déposer
une image dans une partie du document où elle n’est pas autorisée, et affiche à
la place un message d’erreur.
©2012 Quark Software Inc. All rights reserved
5
La combinaison de
Conclusion
Microsoft Word et
Bien que des versions récentes de Microsoft Word marquent des progrès significatifs dans leur
utilisation du format XML, elles n’offrent pas de fonctionnalités d’édition XML. Mais comme
Word possède un riche environnement de développement, il est possible, au prix de nombreux
efforts de développement, de créer à partir de Word un éditeur XML doté de nombreuses
fonctionnalités tout en restant simple à utiliser. Quark XML Author for Microsoft Word offre
précisément cette expérience grâce à huit ans de travail et plus de 100 000 heures de
développement. La combinaison de Microsoft Word et de Quark XML Author associe les
avantages de XML aux traditionnelles qualités de confort et de convivialité de Word.
de Quark XML Author
associe les avantages de
XML aux traditionnelles
qualités de confort et
de convivialité de Word.
À propos
de Quark
Fondée à Denver en 1981, Quark avait déjà pour vision de
créer des logiciels qui établiraient les bases de la publication
moderne. Et depuis 30 ans, Quark tient cette promesse.
Les solutions de publication dynamique de Quark établissent
de nouveaux standards dans le secteur de la publication
multicanal automatisée en alliant la puissance du format
For more information
visit www.quark.com.
North America
Quark Software Inc.
1225 17th Street
Suite 1200
Denver, CO 80202
[email protected]
+1.800.676.4575
+1.303.894.8888
XML à des capacités de mise en page et de conception
graphique flexibles pour automatiser la production de
communications personnalisées et intelligentes à la fois pour
les supports imprimés, le Web et les médias numériques.
Europe
Quark Software Inc.
16 avenue Hoche
75008 Paris
France
[email protected]
+33 (0)1 56 43 44 90
Asia
Quark Software Inc.
A 45 Industrial Area
Phase VIII B Mohali
160059
Punjab, India
[email protected]
+91.172.2299.131
Japan
Quark Software Inc.
Wind Ebisu bldg.
2-4-8 Ebisu-nishi
Shibuya-ku, Tokyo
150-0021 Japan
[email protected]
+81.3.3476.9440
©2012 Quark Software Inc. Tous droits réservés. Quark, le logo Quark, Quark XML Author et Quark Publishing System sont des marques ou des marques
déposées de Quark Software Inc. et de ses filiales aux États-Unis et/ou dans d’autres pays. Toutes les autres marques sont la propriété de leurs détenteurs
respectifs. 16607WP_FR
6
©2012 Quark Software Inc. All rights reserved