Ebauche de feuille de route statistico-conomtrique

Transcription

Ebauche de feuille de route statistico-conomtrique
« Logiciels et formats de données »
Jean-Claude Caty, 6 décembre 2004
http://yonne.lautre.net/article.php3?id_article=980
Les consommateurs n'ont pas toujours conscience de leurs choix en matière de logiciels. Pourtant de
nombreux dangers existent ...
Préambule
La problématique des formats de données en informatique n'est pas uniquement un aspect technique.
Elle relève même avant tout d'aspects politiques d'autant plus importants que les données manipulées et
stockéees par un ordinateur sont des données publiques (à ne pas confondre avec les données accessibles
au public). Cette importance est du reste très bien démontrée sur le site de Thierry Stoehr [1]. D'ailleurs,
les éléments principaux de cet article sont fortement inspirés de ce site. Merci à Thierry pour son travail
remarquable.
Logiciels et formats de données
Ce n'est pas nouveau, l'informatique produit des données. Citons comme exemple de données un texte
produit par un traitement de texte, une feuille de calcul issue d'un tableur, ... Ce processus -- banal en
apparence -- mérite que l'on s'y attarde. Le plus souvent, ces données sont enregistrées dans un fichier, le
processus d'enregistrement est réalisé par un logiciel. Les données du fichier sont inscrites dans un
format.
Pour illustrer ce concept de format, imaginons qu'une partie d'un texte doive être soulignée. On peut
alors imaginer que le logiciel que l'on utilise décide d'encadrer de codes spéciaux le texte à souligner. Le
logiciel connaît ces codes et est donc ensuite capable de décoder et de souligner le texte correspondant.
On voit dans cet exemple que le logiciel et le format sont intimement liés et dépendent étroitement l'un
de l'autre. Beaucoup considèrent que cet aspect relève de la cuisine interne du logiciel, de l'éditeur du
logiciel et qu'ils n'ont pas la nécessité de s'en mêler, mais n'y a t-il pas danger à réagir ainsi. Peut-on
confier ses données à des logiciels, à des formats sans réfléchir ?
Les données que l'on manipule peuvent par ailleurs avoir un caractère public très important comme des
données d'état civil gérées par une mairie, les informations d'un acte notarié, ... Comment doivent réagir
les mairies, les collectivités et administrations publiques, les notaires ? Notons à ce niveau que les actes
notariés sont actuellement conservés sous forme papier. Pour mieux appréhender ces éléments, il
importe de réfléchir sur les caractéristiques des logiciels et des formats de données. Si vous n'êtes pas
familiarisé avec ces notions de logiciel et format, n'hésitez pas à consulter l'analogie très intéressante «
machine à café » -- « format de capsule [2] » sur le site de formats-ouverts
Les logiciels
Dans la jungle des logiciels, il en existe différentes catégories et l'utilisateur lambda a souvent tendance à
les confondre. Distinguons ici d'une part les logiciels gratuits des logiciels payants, d'autre part les
logiciels libres des logiciels propriétaires.
Logiciels gratuits et logiciels payants
Après écriture par un programmeur, les logiciels sont livrés soit gratuitement, soit contre rémunération.
Certains logiciels -- les sharewares -- sont proposés gratuitement le temps d'être testés par l'utilisateur. A
l'issue de la période de test, la licence autorise 2 choix : rémunèrer l'auteur, ou supprimer purement et
simplement le logiciel. Ces logiciels ne sont donc pas gratuits.
Logiciels libres et logiciels propriétaires
Autre classification totalement indépendante de la précédente : les logiciels libres et les logiciels
propriétaires. Les logiciels libres étant définis de manière très précise par 4 critères, tout logiciel n'y
satisfaisant pas est un logiciel propriétaire.
Les 4 critères de définition d'un logiciel libre sont :
¾ La liberté d'utilisation : Un logiciel libre est utilisé par tous sans restriction d'usage.
¾ La liberté de modification : Un logiciel libre peut être modifié pour être adapté à son propre usage.
Cette condition implique que le code source du logiciel soit disponible.
¾ La liberté de copie et diffusion : Un logiciel est librement copiable pour être partagé avec ses voisins,
ses amis,... à noter que le logiciel peut être copié sur les multiples ordinateurs d'une même structure.
¾ La liberté d'amélioration : Les améliorations apportées à un logiciel par toute personne ou structure grâce à la disposition du code source - doivent être diffusées selon les mêmes libertés. Cela interdit toute
appropriation ultérieure.
4 catégories de logiciels
Ces 2 classifications indépendantes permettent de définir 4 catégories résumées dans le tableau suivant :
Logiciel
gratuit
payant
Libre
Ex :Linux debian
Ex : SuSE Linux
Propriétaire
freeware
Commerciaux, shareware
Quelques confusions souvent remarquées :
Un logiciel libre n'est pas forcément gratuit. Certaines distributions GNU/Linux sont par exemple
payantes. Certes le prix est modique au regard de nombreux logiciels propriétaires.
Un logiciel gratuit n'est pas nécessairement un logiciel libre. Ainsi en est-il des freewares qui ne publient
pas leur code source.
Les licences des logiciels propriétaires sont bien plus restrictives que ne l'imaginent beaucoup
d'utilisateurs. Tout d'abord, la licence ne donne à l'éditeur qu'une obligation de moyens, pas d'obligation
de résultats. Aussi, la société ne mettra t-elle à votre disposition que des moyens pour corriger une
éventuelle anomalie. Si la recherche de l'anomalie échoue, vous ne pourrez vous retourner contre
l'éditeur compte tenu de l'absence d'obligation de résultats.
De surcroît, ne disposant pas des sources des logiciels, vous ne pourrez faire appel à aucune autre société
disposant peut-être de meilleures compétences. De toute façon, même en disposant des sources, cette
possibilité vous serait interdite dans la mesure où vous n'avez acheté qu'une licence d'utilisation et non le
logiciel lui-même. Vous êtes dans le même cas qu'une personne ayant loué une voiture. Vous pouvez
disposer de la voiture selon certaines conditions mais elle ne vous appartient pas.
Dangers relatifs aux logiciels propriétaires
Quelles données dans un format fermé ?
Un logiciel propriétaire ne dit pas ce qu'il enregistre. En effet, le logiciel propriétaire est diffusé en code
binaire. Aussi, à moins de parler couramment ce langage, il est extrêmement difficile de savoir ce que fait
exactement le logiciel. Un logiciel libre possède l'avantage de publier son code source (langage proche de
l'anglais) et il est déjà beaucoup plus facile de comprendre et connaître ses fonctionnalités exactes.
Par ailleurs, le logiciel enregistre les informations manipulées dans un format pouvant être fermé.
Quelles données votre logiciel propriétaire enregistre t-il dans un format fermé ? La réponse à cette
question est quelquefois difficile. Pour comprendre cette difficulté, l'auteur de cet article vous invite à
ouvrir un document issu de Word et au format « .doc » avec un simple éditeur de texte [3] (comme gedit
sous GNU/Linux ou notepad sous Windows). Vous comprendrez la difficulté de savoir ce que le logiciel a
enregistré.
Particulièrement, pouvez-vous certifier que des données que vous ne voulez pas divulguer sont absentes
dans le document généré ? Vous ne le pouvez pas car -- reprenons l'exemple précédent -- , Word
enregistre des informations supplémentaires dans le document. Ainsi, vous pouvez retrouver du texte
effacé dans votre document ! Ce texte est présent et marqué comme effacé. Le logiciel de traitement de
texte ne l'affichera pas. Cependant, en ouvrant le document avec un éditeur de texte, il sera visible !
Souhaitez-vous un tel comportement ? N'avez-vous pas supprimé ces informations eu égard à leur
caractère personnel ? Ce texte est-il publié sur internet à la disposition de tous ? Des moteurs de
recherche ont-ils enregistré et indexé ces informations ?
Les services administratifs utilisent de plus en plus de logiciels commerciaux. De nombreuses
informations nominatives doivent rester confidentielles. L'utilisation de logiciels propriétaires ne garantit
pas cette confidentialité que tout citoyen est en droit d'attendre de la part des services administratifs de
son pays.
La suite bureautique openOffice.org, logiciel libre, enregistre nativement les données dans plusieurs
fichiers au format XML [4]. L'ensemble de ces fichiers est ensuite compressé dans un conteneur unique
au format openOffice.org (format « sxw » pour le traitement de texte, format « sxc » pour le tableur, ...).
Il suffit d'ouvrir ce conteneur avec un utilitaire comme file-roller, ark, winzip, ... pour s'en convaincre.
Terminons ce danger par le coup de l'arroseur arrosé. Une collusion entre la commission européenne et le
BSA [5] (dont Microsoft est membre) a été découverte par le biais d'un document Word [6]. Une directive
de l'Union Européenne fut rédigée par les lobby du logiciel. L'auteur du document s'avère être membre de
BSA. Une cinglante démonstration des propos de Raoul-Marc Jennar dans un article relatif aux lobby à
l'oeuvre dans la commission européenne [7].
Le logiciel réalise t-il uniquement ce qui lui est demandé ?
Un logiciel est développé pour réaliser une fonction. Ca, c'est ce qui est annoncé. Mais en êtes-vous bien
certain ? Avez-vous les moyens de le vérifier ? Vous commencez à connaître la chanson. Si l'on dispose du
code source du logiciel, n'importe qui, pourvu qu'il dispose de connaissances informatiques suffisantes,
peut répondre à cette question. Mieux : si le code source d'un logiciel est disponible, vous êtes quasi
certain qu'un informaticien ira regarder le logiciel pour voir comment il fonctionne -- par curiosité, pour
l'améliorer, ... -- et s'il s'y trouve du code qui fait autre chose, il y a des chances pour que l'information
remonte. La publication du code source d'un logiciel est donc la meilleure garantie dans ce domaine.
A la lecture de ce texte, j'entends déja des voix : « quelle paranoïa ! ». Aussi conseillerai-je d'utiliser «
Windows Media Player », logiciel espion qui enregistre chez Microsoft vos préférences en matière de
musique et cinéma [8].
Ce logiciel est réalisé pour lire musique ou vidéo. De quel droit transmet-il vos goûts chez Microsoft ?
Cette fonction est-elle documentée ? Car enfin, cette fonction a bien été développée par un programmeur
chez Microsoft. Un serveur a bien été mis en place pour recevoir cette information. Quelle est la raison
cachée de tout cela ?
Mais, me direz-vous, « Windows media player » est un logiciel propriétaire et il fut bien possible de
découvrir cette fonctionnalité sans disposer cependant du code source. Effectivement, une personne plus
curieuse que les autres, en analysant le trafic réseau de son ordinateur, a mis en évidence la transmission
d'informations suspectes par « Windows media player » . Combien d'autres logiciels propriétaires
transmettent ainsi « à l'insu de notre plein gré » des informations personnelles sur nos goûts, notre
identité, ...
Et ce n'est pas tout [9] Je laisse à tout individu à la paranoïa plus exacerbée que la mienne une recherche
plus approfondie. Compte tenu de ces faits, il devient même important que les citoyens, gérés
informatiquement par les services administratifs de nombreuses collectivités (mairies, impots, ...) exigent
la sécurité dans ce domaine. L'adoption des logiciels libres par les services administratifs devient donc
une nécessité.
Les formats
Dans la mesure où les logiciels enregistrent et lisent correctement les informations que les utilisateurs
leur confient, peu se préoccupent de leur pérennité. Certaines de ces informations, que l'on a tendance à
oublier dans le coin d'un disque dur, resteront-elles lisibles plus tard ? Cette question est intimement liée
à la nature des formats utilisés pour conserver ces données.
Formats ouverts et formats fermés
La très controversée LEN (« Loi sur l'économie numérique » ) donne une définition des formats ouverts.
Le site « formats-ouverts.org » précise cette définition [10].
- des protocoles et des formats de données indépendants d'un logiciel particulier, d'un système
d'exploitation ou d'une société.
- des spécifications techniques documentées, publiées, non payantes, sans brevet dessus, sans royalties
dessus.
Il faudra probablement que la jurisprudence fasse son oeuvre pour affiner et confirmer ou non l'analyse
ci-dessus.
Comme nous l'avons vu précédemment, données et logiciels sont indissociables. Cependant, lorsque le
format des données est connu, publié, il devient possible d'écrire plus d'un logiciel pour manipuler,
visualiser ces données. Ainsi, le format pdf -- format libre -- peut-il être affiché par plusieurs logiciels :
acrobat reader sous windows et sous Linux, xpdf sous Linux. un document pdf peut également être
fabriqué par de nombreux autres logiciels : Acrobat writer, LaTeX, openOffice.org et bien d'autres. Cela
est rendu possible car la société Adobe, créatrice du format pdf en a publié les spécifications.
A contrario, le format Word, format fermé par excellence ne peut complètement être affiché ou écrit par
des logiciels concurrents. Certains, comme OpenOffice.org semblent capables de le faire. Cependant, ces
capacités sont le fruit du travail considérable de personnes qui ont tenté de comprendre les coulisses du
format. Elles n'y sont cependant parvenues qu'à concurrence de 90% environ et il reste toujours
l'incertitude de ne pouvoir complètement afficher ou fabriquer du format Word, les spécifications restant
un secret de Microsoft.
Dangers relatifs aux formats propriétaires.
Vous ne possédez pas le logiciel permettant la gestion des données transmises [11]
Vous venez de recevoir par courriel des informations demandées auprès d'un service public. Puis, en
cherchant à l'afficher sur l'écran de votre ordinateur, pas moyen de l'ouvrir. Quel est le problème ?
Tout d'abord, les informations transmises furent élaborées par un logiciel fonctionnant sous un système
d'exploitation. Par malchance, votre ordinateur est équipé d'un autre système d'exploitation pour lequel
le logiciel n'existe pas. Pire, votre machine n'accepte pas le système d'exploitation requis. Faut-il se
résoudre à acheter un autre ordinateur, le système d'exploitation et le logiciel simplement pour pouvoir
exploiter ces informations ?
Pour un utilisateur placé dans ce contexte, l'agression est manifeste. Aussi, dans la foulée de Richard
Stallman, nous devons refuser les documents qui nous sont envoyés dans des formats fermés [12] et
exiger des formats ouverts lisibles sur toute plate-forme. En échange, transmettez vos propres documents
dans des formats ouverts. N'hésitez pas à utiliser ce texte pour justifier de votre position.
L'une des applications les plus répandue est le traitement de texte. Il existe une suite bureautique libre
maintes fois évoquée ici -- openOffice.org -- disponible sous de nombreux systèmes d'exploitation :
Windows, Linux, MacOS X, ... N'hésitez donc pas à télécharger [13], à la récupérer dans une revue vendue
avec CD, voire à demander à un ami cette suite bureautique. La licence de cette suite bureautique le
permet et il ne s'agit pas de piratage !
Vous disposez d'un logiciel plus ancien que la version des données.
Autre problème plus pernicieux : vous recevez un document, vous disposez du logiciel permettant de
l'ouvrir et ... rien à faire, le logiciel refuse. Motif : le document reçu a été élaboré avec la toute dernière
version de votre logiciel fétiche mais propriétaire. Malheureusement, vous ne disposez pas de cette toute
dernière version et son achat représente une somme conséquente inacceptable pour votre bourse. La
course à la dernière version est réservée à une classe sociale dont vous ne faites pas partie. Tant pis pour
vous !
Une version d'un logiciel est abandonnée.
Vous l'avez remarqué, vos logiciels évoluent et vous êtes régulièrement sollicité pour passer à la version
suivante. Très rapidement, les versions qui commencent à dater ne sont plus supportées. Des anomalies
logicielles peuvent subsister et ne seront jamais corrigées. Comme les sources de ces logiciels ne sont pas
disponibles, vous ne pouvez faire corriger ces anomalies, ni par une autre société, ni par un informaticien
que vous auriez embauché. Comme cela fut précisé plus haut, cette possibilité est de toute façon interdite
par la licence d'utilisation.
Un format est purement et simplement abandonné.
Ces versions successives des logiciels que vous utilisez prennent en compte de nouvelles fonctionnalités,
lesquelles se traduisent par une évolution du format. Très rapidement, de la même manière que les
anciennes versions logicielles sont abandonnées, les anciens formats subissent le même sort. Si vous
n'avez pas évolué parallèllement aux différentes versions logicielles, vous risquez de ne plus pouvoir les
actualiser. Les informations sont les éléments les plus précieux d'un particulier, d'une entreprise, d'une
administration. Les coûts de mise à jour peuvent devenir prohibitifs si ces informations sont enregistrées
dans un format fermé. La garantie d'un format ouvert est celle de pouvoir relire ces données, au besoin en
développant un nouveau logiciel de mise à niveau. Cette garantie est refusée lorsque ces informations
sont dépendantes d'un format fermé.
Ces problèmes peuvent être particulièrement cruciaux pour les services publics gérant des informations
importantes. Ironisons un peu : cela n'est jamais arrivé [14].
Le logiciel est abandonné.
Les « contraintes » économiques du moment sont telles que le particulier, la petite entreprise et même
l'administration pèsent peu face aux volontés du marché. Aussi, lorsqu'un logiciel n'est par exemple plus
rentable, l'éditeur peut décider unilatéralement d'arrêter ce produit. Les fichiers dans un format fermé
gérés par ce produit se retrouvent orphelins.
L'éditeur du logiciel et du format disparaît.
Plus grave, le logiciel n'est pas seul succeptible de disparition. A l'heure où des multinationales comme
Enron, Worldcom, Parmalat ne sont pas à l'abri de faillites, rien n'indique que l'éditeur du logiciel ne
disparaîtra pas lui aussi. Même Microsoft n'est pas à l'abri [15]. Si l'éditeur disparaît, qu'adviendra t-il de
vos données ? Les spécifications du format fermé de vos documents disparaissent dans le même élan.
Que chacun se débrouille ensuite pour récupérer ce qu'il peut.
Exemples, conseils, idées recues.
Le but de ce document n'est pas de fournir un catalogue de référence. Bien des sites, à commencer par
formats-ouverts.org suivent l'actualité bien mieux que ne peut le faire ce document. Citons toutefois
quelques exemples.
Exemples de formats ouverts, formats fermés.
Le format flash, souvent utilisé n'est pas complètement libre. Des spécifications existent mais sont
incomplètes. On peut préférer SVG, format ouvert basé sur XML.
Le trop fameux format mp3 n'est pas ouvert à cause de brevets logiciels déposés. Là aussi, l'alternative
existe et est meilleure. Préférez lui le format « ogg vorbis » [16]. Il offre une meilleure compression pour
un meilleur rendu sonore. Par ailleurs, des baladeurs ogg vorbis existent [17].
La musique est d'ailleurs le théatre de batailles rangées pour imposer des formats fermés. Les enjeux sont
considérables dans la mesure où l'objectif inavoué est tout simplement la privatisation des services
publics dont la culture au travers des accords de l'OMC [18] (notamment l'AGCS [19]) Quelques liens
pour mieux comprendre les enjeux [20] [21]
Le téléphone portable est également concerné [22]
Terminons ce panorama décousu en évoquant le cas d'internet explorer. Combien de fois ai-je entendu
dire que les logiciels libres n'étaient pas à la hauteur d'internet explorer. Tordons tout de suite le cou à
cette opinion. IE ne respecte pas intégralement les normes du W3C [23], contrairement aux logiciels
libres comme mozilla ou firefox. Parallèlement, Microsoft fournit des outils pour publier sur internet,
outils favorisant les extensions hors norme d'IE. La faute est ensuite rejetée sur les navigateurs libres
incapables d'afficher correctement ... des formats fermés.
Dorénavant, faites vous plaisir. Lorsque vous rencontrez un site « optimisé pour internet explorer »,
sachez qu'il revendique -- sans forcément s'en rendre compte -- le non respect des normes ouvertes au
profit d'un monde fermé. N'hésitez pas à provoquer son webmaster.
Prolongements
Utiliser des logiciels et formats libres est l'affaire de tous.
L'administration et l'europe ont des discours contradictoires. Un temps poussées par les lobbys, elles
seront pour les brevets logiciels générateurs « d'enfermements ». Dans d'autres décisions, elles
demanderont des formats ouverts [24]
L'information et la conduite de chacun d'entre nous sont probablement l'un des meilleurs gages
d'évolution vers un monde plus ouvert. En son temps, Pythagore a souhaité un monde fermé en
demandant à ses étudiants de ne pas divulguer son théorème. Fort heureusement, les mathématiques
sont restées libres.
Les logiciels libres et leurs formats ouverts peuvent nous montrer la voie vers un autre monde possible,
[25], monde basé sur la coopération et l'intégration de chacun et non sur la compétition et le rejet de tous
ceux qui n'ont pas les capacités de s'aligner sur le meilleur.
[1] formats-ouverts.org
[2] Prisonnier d'une capsule
[3] Informations invisibles
[4] XML
[5] BSA : Business Software Alliance
[6] Collusion
[7] Lobby
[8] Player espion
[9] Autre espion
[10] Définition
[11] RMLL
[12] Refusons Word
[13] openOffice
[14] Abandon
[15] CrimeAuSoft
[16] Musique libre
[17] Baladeur Ogg
[18] OMC : Organisation Mondiale du Commerce
[19] AGCS
[20] Enjeu1
[21] Enjeu2
[22] Telephone
[23] W3C : World Wide Web Consortium
[24] Voeu1 ; Voeu2
[25] Possible

Documents pareils