Bernard Andruccioli 2005-2006 IUT Bordeaux

Transcription

Bernard Andruccioli 2005-2006 IUT Bordeaux
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 1/23/
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 2/23/
La compression des données.
Bernard Andruccioli
2005-2006
IUT Bordeaux-Montesquieu
Département Tech de Co
Université Montesquieu-Bordeaux 4
Beaucoup d’entre vous l’ont sans doute constaté : la taille des fichiers créés avec les
logiciels actuels grossit et bien souvent ces documents que l’on souhaite emporter ne
tiennent pas sur une simple disquette qui est pourtant ce qui est le plus pratique à
transporter.
Ainsi la taille du fichier relatif au premier poly sur Excel que je vous ai distribué est de
plus de 2 MO alors qu’une simple disquette ne contient pas plus de 1,44MO…Pourtant sur
cette disquette j’ai pu insérer ce documents accompagné de quelques autres aussi
volumineux. La solution adoptée ? La compression de données.
La preuve :
La compression des données.
Ce fichier de plus de 2Mo n’est plus que de 210 à 365 KO selon les cas. Cette diminution
considérable de la taille se fait sans perte de données, et permet donc une restitution
intégrale.
1°) Quel standard de compression utiliser ?
4
2°) Quels logiciels utiliser ?
4
3°) Manipulation de ZIP Central
5
Création d’une archive : 7
Extraction des fichiers contenus dans une archive. 10
Création d’une archive auto-extractible. 11
4°) Power Archiver 2000
12
5°) Deux mots sur WINZIP
14
6°) L’explorateur et le clic droit de la souris
15
7°) Utilisation de Windows Commander.
16
8°) Le format RAR
17
9°) Les formats de compression présents sur les autres plates-formes
18
LINUX 19
Le MAC et le format HQX. 20
AMIGA : 21
10°) Compression et cryptage…
22
11°) Quelles sont les données qui se compactent le mieux ?
23
12°) Quelles sont les performances respectives des compacteurs ?
23
La compression (ou compactage ou archivage) est une technique déjà ancienne dans
l’informatique, présente sur toutes les plates-formes, et qui est couramment utilisée
(Documents joints en Email, téléchargement de fichier, …) Le gain de place, et le gain de
temps ont motivé les développeurs qui proposent des algorithmes de plus en plus
performants et des logiciels de plus en plus et conviviaux.
En se limitant aux algorithmes les plus connus, et les plus utilisés sous Windows,
quelques programmes sont à connaître :
Du temps du DOS ces programmes étaient bien sûr présents mais nécessitaient
l’utilisation de la ligne de commande. Ces programmes (PKZIP, ARJ, et LHA pour ne citer
que les plus répandus) adoptaient une syntaxe commune (toujours actuelle) et
proposaient une aide « en ligne » par le simple fait de saisir leur nom ; ainsi pour LHA :
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 3/23/
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 4/23/
ATTENTION tout de même : cela nécessite une certaine habitude, et il serait
bien hasardeux de se lancer dans une telle sauvegarde pour un document
important (le mémoire par exemple) sans une pratique minimum…De toute
façon cela ne dispense pas, au début en tous cas, d’une sauvegarde classique
d’un gros fichier sur plusieurs disquettes…
1°) Quel standard de compression utiliser ?
De très nombreux formats de compression existent, mais il est prudent de se limiter aux
formats les plus courants pour les raisons suivantes :
Programmes suivis depuis longtemps, sans bogues, sûrs d’utilisation.
Très répandus, donc communication avec d’autres personnes aisée
Présence sur d’autres plates-formes (nous y reviendrons plus loin)
Ces programmes sont les suivants et proposent les formats de sauvegarde suivants :
Programmes/Algorithmes
Pkzip - Pkunzip
LHA ou LHARC
ARJ
RAR et WINRAR
Ce qui, pour compacter un fichier nommé TOTO.DOC présent dans le répertoire /monrep,
dans un fichier nommé COUCOU.LZH dans un répertoire /dossier, donne :
Lha –a c:/dossier/coucou.lzh
c:/monrep/toto.doc
Pas vraiment agréable à utiliser mais très puissant grâce à un nombre d’options
important. Sous Dos déjà des programmes existaient pour éviter cette syntaxe
rébarbative tels SHEZ par exemple. Puis un nouveau venu (la société RAR) proposait un
programme réunissant interface et programme de compactage sous DOS. Le programme
et le format de compactage RAR était donc remarqué d’autant plus que ses performances
étaient bonnes.
Déjà bien plus sympa…
L’avènement de Windows n’a fait que généraliser ce type de programmes si bien que la
compression de données peut être manipulée sans grands risques par tout le monde ou
presque.
Formats
.ZIP
.LZH
.ARJ
.RAR
2°) Quels logiciels utiliser ?
Pour les trois premiers formats il y a l’embarras du choix, pour le dernier c’est plus
restreint. Il faut savoir qu’il existe des programmes commerciaux capables de créer des
archives compressées mais aussi des Sharewares1, et des Freewares2. Dans la mesure où
ces derniers sont gratuits ou très peu onéreux et souvent plus performants que les
premiers cités, nous nous limiterons à ceux-ci.. La compression est un des domaines
dans lesquels le domaine public3, et le monde universitaire ont beaucoup planché ce qui
peut expliquer ce paradoxe.
De plus ces programmes ont tous une interface très voisine qui fait que l’apprentissage
d’un d’entre eux permet d’être capable de les utiliser tous, au moins dans les fonctions
de base.
Ces programmes permettent donc de :
Créer une ou des archives
Ajouter et/ou supprimer des fichiers dans une archive
Extraire des fichiers contenus dans une archive
Visualiser le contenu d’un fichier présent dans une archive.
Effacer un fichier contenu dans une archive
Tester la compression de cette archive
Créer des archives auto-extractibles : l’extraction des fichiers contenus dans une
archive se fait « seule » sans passer par l’utilisation d’un de ces logiciels
Renommer un fichier contenu dans une archive
Créer des commentaires, et parfois des mots de passe pour protéger le contenu de
certains fichiers de regards indiscrets…(suivant les logiciels)
Analyser le contenu des fichiers contenus dans l’archive à l’aide d’un anti-virus.
1
Shareware: logiciel dont le mode de diffusion, original, vous permet de le tester avant de payer une
redevance à son auteur (engagement moral)
Freeware: Logiciel dont l'utilisation et la diffusion sont libres et gratuits. Par contre l'auteur conserve la
propriété intellectuelle, le code source, la fréquence des mises à jour.
3
Domanine public: Désigne l'ensemble de la communauté informatique qui n'est pas directement dans le
réseau strictement commercial, regroupant auteurs et sociétés de Sharewares/freeware, universitaires,
utilisateurs…
2
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 5/23/
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 6/23/
3°) Manipulation de ZIP Central
Si on se limite qu format .ZIP, qu’on désire un programme gratuit (en toute légalité), et
performant, il semble que ZIP Central soit un bon choix. (disponible sur le serveur FTP de
Tech de Co à l’adresse ftp://www-tc.iutbxmr.u-bordeaux.fr/pub/archive/ )
ZIP Central est un freeware créé par John Savas et traduit par André Vaysse.
Il se présente comme suit, et ressemble donc à la plupart de ces logiciels : (version 2.01)
Cela permet de constater qu’il contient une aide bien pratique, car traduite elle aussi :
Voici ses menus dont l’intitulé est intuitif :
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 7/23/
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 8/23/
Création d’une archive :
Un clic sur l’icône « Nouveau » entraîne l’apparition de la boîte de dialogue suivante :
Dans le répertoire ONZIPPE (que vous chercherez sur le disque dur) se trouve un sous
répertoire COMPACTER qui où se trouvent différents fichiers de type différents à
compacter. Il contient aussi 2 répertoires qui renfermant aussi des fichiers. Tout est à
compacter dans ce même fichier-archive.
A noter qu’il est possible et très pratique d’ajouter des fichiers en faisant un glisserdéplacer avec la souris depuis l’explorateur de Windows :
Zip Central nous demande donc un nom de fichier (comme pour une sauvegarde) et un
répertoire où créer ce ficher archive. Concrètement créer une archive c’est en fait créer
un fichier qui va contenir d’autres fichiers dont le programme aura auparavant réduit leur
taille. Ce fichier a l’extension .ZIP, par exemple ci-dessus il se nomme ZIPCENTRAL.ZIP.
Gentiment il nous demande quels sont les fichiers à intégrer dans l’archive ; il suffit de
développer l’arborescence pour accéder au répertoire où sont situés les fichiers à
compacter.
A l’arrivée on a :
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 9/23/
On voit nettement le contenu de l’archive, le gain en taille (pour le fichier winproxy.doc
on est passé de 53760 octets à 12293 soit un gain de 77%), la localisation de ces fichiers
sur le disque…
Quittez le logiciel, et relancez le.
Ouvrez l’archive : aucun problème tout est là. Testez la (clic sur l’icône TEST)
Renommez quelques fichiers, effacez-en, créez des commentaires, et/ou des mots de
passe…
Tout est totalement transparent. Vous pouvez même visualiser le contenu de certains
fichiers
Exemple avec un double clic sur le fichier jeu.xls créé avec Excel :
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 10/23/
Extraction des fichiers contenus dans une archive.
Un clic sur l’icône EXTRAIRE, ce qui donne :
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 11/23/
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 12/23/
Noter la syntaxe >< pour l’extraction dans un dossier temporaire (c:/windows/temp/)
Voilà à vous de manipuler davantage ce produit.
Ceux qui ne sont pas allergiques à l’anglais peuvent utiliser Power ZIP ou Power Archiver
de loin le plus complet au niveau des formats de compactage, interface comparable à Zip
Central., Freewares, donc gratuits.
4°) Power Archiver 2000
Autre Freeware puissant et disponible sur le serveur FTP de Tech de Co: Power Archiver
2000 (écrit par Ivan Petrovic)
L'interface et le principe de fonctionnement sont similaires à Zip Central; ce logiciel (en
anglais) se montre plus complet que Zip Central. Il gère davantage de formats
d'archives.
Interface générale
En développant l’arborescence on arrive dans le répertoire où on désire extraire ces
fichiers : OK et l’extraction se fait. On peut également créer un nouveau répertoire à cet
effet depuis Zip Central qui accueillera donc les fichiers à extraire.
Création d’une archive auto-extractible.
Zip Central va simplement ici changer l’extension du fichier archive créé (qui deviendra
ZIPCENTRAL.EXE) ce qui permettra l’extraction de son contenu sur un poste dépourvu de
Zip Central ou autre logiciel de compactage…
Pour cela Clic sur l’icône CONVERTIR pour obtenir :
Création d'un archive avec sélection du format.
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 13/23/
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 14/23/
Test de l'archive (avec compte rendu)
5°) Deux mots sur WINZIP
Le premier logiciel a avoir proposé cette interface est un programme proposé en
shareware : WINZIP. Performant, et présent sur tous les CDROM des revues
d’informatique, Winzip donne l’impression que son utilisation est gratuite. Il n’en n’est
rien, et les versions ainsi diffusées le stipulent bien, de même que le fait que faute de
redevance auprès de la société ABSOFT il cesse de fonctionner au bout de 2 mois
environ. Winzip n’est donc pas présent sur les postes de Tech de Co (si ce n’est pour en
tester une nouvelle version de manière ponctuelle) puisqu’il y a aussi bien pour moins
cher…
Il reste quand même une référence pour certains…
Il se pilote exactement comme Zip Central et consort (qualifiés de Winzip Killer…)
Conversion du format de l'archive (très appréciable)
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 15/23/
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 16/23/
Si on sélectionne Ajouter à un ZIP avec ZipCentral, on retombe sur la séquence de
création d’archive. Bien pratique.
A noter que certains petits logiciels de compression ne se pilotent que de cette manière:
c'est le cas du logiciel FreeZip (Freeware bien sûr…)
7°) Utilisation de Windows Commander.
Windows Commander est un gestionnaire de fichier au même titre que l’explorateur
fourni avec Windows, mais qui présente bien des avantages :
Convivialité accrue : 2 fenêtres, boutons, clic droit…
Intégration totale avec les logiciels utilitaires présents sur la machine (module de
configuration très puissant)
Peut être utilisé comme client FTP sur Internet pour tout type de connections
(anonymes ou autres) (depuis la version 4)
Et enfin est capable de gérer les archives de manière très simple :
Winzip version 7.0
A noter un très bon tutorial (Menu AIDE) qui peut servir de guide pour vos premières
manipulations d’archives. : ce qui est expliqué pour Winzip l’est bien souvent aussi pour
les autres.
6°) L’explorateur et le clic droit de la souris
Une fois ZipCentral (ou équivalant) installé sur son ordinateur, on peut l’appeler depuis
l’explorateur de Windows si on veut compacter un fichier. Pour cela un clic droit de la
souris fait apparaître le menu contextuel suivant (sans doute moins complet sur votre
poste) :
Ci-dessus on compacte la fenêtre de droite dans celle de gauche qui correspond à un
autre répertoire. Le menu Fichier est très clair pour le compactage et le décompactage :
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 17/23/
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 18/23/
En anglais dans la version Shareware (il n’est donc pas gratuit), son interface ne
surprendra pas :
On a à l’arrivée :
Son utilisation est donc semblable à Zip Central…
9°) Les formats de compression présents sur les autres plates-formes
L’archive est à gauche, les fichiers de départ restent à droite.
Un double clic sur le fichier archive permet d’en voir le contenu.
Attention : Windows Commander n’est pas un freeware mais un shareware. Son
utilisation vous engage donc moralement à un règlement auprès de Christian Ghisler, son
auteur.
8°) Le format RAR
Comme cela a été précisé plus haut RAR est un format de compression créé au départ
par les produits de la société RAR. Ce nouveau format commence à se rencontrer (sur
Internet notamment) dans le monde Windows. Propriétaire au départ, on peut à présent
créer des archives RZAR avec Winzip, Windows Commander et d’autres produits de ce
type.
Le logiciel de base est Winrar .
Les formats de compactage les plus courants:
Les fichiers compactés se reconnaissent à leur extension qui est
significative du compacteur utilisé (.zip pour PKZIP par exemple.).
Mais le problème se corse un peu dans la mesure où Internet est un
réseau ouvert qui permet à des ordinateurs très différents (sur le plan
matériel et système) de communiquer entre eux. Et si on n'oublie pas
que les pionniers du réseau ont bien souvent travaillé sous UNIX puis
LINUX on comprend mieux le nombre d'extension curieuse auxquelles
l'utilisateur d'un PC sous Windows, ou d'un MAC n'est pas habitué.
Pourtant beaucoup de documents sont compactés, pas seulement les
logiciels, et il est souvent intéressant de récupérer un document qui
doit être décompacté pour être lisible...alors même qu'il a peut-être
été compacté sous un autre système que celui que l'on utilise...
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 19/23/
Voici un petit tableau permettant de mieux s'y retrouver.
Compacteur
Logiciels /PC sous
Logiciels
Logiciels
Extensions
utilisé
Windows
/MAC
/LINUX
.ZIP
Pkzip
Winzip, Pkunzip
ZipIt
Zip
.ARC
Arc
Winzip ou Arc
.ZOO
Zoo
Zoo
Zoo
.LZH ou
Lha
Lha, Winzip
MacLha
.LHA
.LIM
Limit
Limit
.SQZ
Squeeze
Squeeze, Winzip
.BIN
MacBinary
Stuffit Expander
.CPT
Compact Pro
Extract
Compact Pro
.RAR
Rar
WinRAR, RAR, WinZip
MacUnRar
.GZ
Gzip
Winzip
MacGzip
Gzip, Gunzip
.GZIP
Gzip
Winzip
MacGzip
Gzip, Gunzip
.HQX
BinHex
Stuffit Expander
Stuffit Expander
.SEA
Autoextractible
.SIT
Stuffit
Stuffit Expander
Stuffit Expander
.TAR
Tar
Wintar, Winzip
Tar
.TGZ
Tar + Gzip
Winzip
Stuffit Expander Tar
.UU
UUencode
Winzip
Stuffit Expander
.Z
Gzip
Winzip
Stuffit Expander Gzip
.UC
Uc2
Winzip
.ARJ
Arj
Winzip, WinArj
On aura compris que posséder Winzip, Power Archiver (ou équivalent) ou Stuffit
Expander peut s'avérer très utile...
On pourra ajouter que les formats .ZIP et .LHA sont disponibles aussi sous ATARI et
AMIGA pour comprendre leur intérêt pour passer des documents d’un standard à
l’autre…
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 20/23/
L’interface rappelle quelque chose non ?
Interface ne posant pas de problème non plus avec X-Files, semblable à Windows
Commander :
LINUX
Le format LHA sous Linux :
L’archive ZIP créée avec Zip Central sous Windows est ici lisible sans difficulté sous Linux
grâce à X-Files
Notons que les formats courants sous Unix sont Linux sont .TAR et .GZIP. Les
programmes gérant ces formats existent sous Windows tels WINTAR, ou WinZip,
PowerArc.
La syntaxe est la même que sous DOS.
Un programme de compression convivial sous Linux (KZip, livré avec KDE gestionnaire
de fenêtres) avec le contenu de l’archive créée avec Windows commander sous Windows.
Le MAC et le format HQX.
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 21/23/
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 22/23/
Plusieurs compacteurs existent sous Mac qui gèrent les formats de ZIP et LHA, ainsi que
certains formats propriétaires tels le logiciel CompacPro, et surtout Stuffit, dont
l’extension .HQX est de loin la plus répandue, si bien qu’on peut avoir besoin de
décompacter une archive .HQX sous Mac et/ou sous Windows, ne serait-ce que pour
échanger des données.
Le module complet est payant auprès de la société Aladin, mais le module permettant la
décompression est gratuit, et se nomme Stuffit Expander. Son utilisation est très simple :
il suffit de faire glisser depuis l’explorateur un fichier .hqx sur le logiciel pour que celui-ci
crée un répertoire dans lequel il décompacte les fichiers contenus dans l’archive.
Des interfaces conviviales existent : ainsi GuiArc permet de récupérer l’archive crée
depuis Windows :
Le contenu est donc également lisible
De même avec FileQuest :
Rappel: Spontanément un PC ne sait pas lire une disquette venant du MAC
écrite au format MAC (les systèmes sont différents) L'inverse ne pose plus de
problèmes, le MAC, comme l'AMIGA, sachant lire depuis belle lurette les
disquettes au format PC. En cas de problème ou de besoin sachez qu'il existe
(au moins) un utilitaire en Shareware nommé Transmac qui fait cela très bien.
AMIGA :
Le format LHA est le plus répandu ; curieusement son extension change sous Amiga, elle
devient .LHA contre .LZH sous Windows. A ce détail près il s’agit du même algorithme qui
permet de récupérer des données compactées sous d’autres standards.
Le Shell montre la syntaxe LHA en ligne de commande :
10°) Compression et cryptage…
La syntaxe est la même…
Dans la mesure où un logiciel de compression est capable de réduire la taille du fichier,
c’est qu’il intervient sur sa structure même Il va codifier le fichier différemment selon
l’algorithme utilisé avant de sauvegarder l’archive ainsi créée. Le point essentiel de cette
opération c’est que la clé, ou table de correspondance contenue dans l’algorithme est
connue de tous…Mais si elles est masquée, et donc connue du seul créateur de l’archive
on obtient un programme de cryptage, dont l’usage est très réglementé.
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 23/23/
On insère au moment de la compression un mot de passe qui est donc la clé garantissant
la confidentialité des informations contenues dans le fichier compressé.
Utiles pour les transactions commerciales sur Internet ces programmes commencent à se
rencontrer :
Exemple de fichier crypté avec un logiciel approprié. La taille initiale de ce fichier est de
2,2MO.
11°) Quelles sont les données qui se compactent le mieux ?
Tous les fichiers ne se compactent pas de la même manière, et le résultat dépend de la
nature de chacun d’eux :
: Les textes, les bases de données, et les feuilles de calcul : très bon résultats surtout
si la forme n’est pas surchargée : le gain peut être souvent supérieur à 50-60%.
: Les fichiers au format .TXT : Très bon résultats.
: Les sons les images, et la vidéo : Tout dépend du format utilisé, mais les résultats
sont souvent insignifiants pour la bonne raison que les formats de ces fichiers sont déjà
compactés…(GIF, JPG pour les images, .MP3 pour le son, .Mpeg pour la vidéo.). Les
résultats sont meilleurs pour les formats .MID (Midi), et les modules (.Mod).
Les exécutables : Les programmes sont souvent livrés compactés, les résultats sont
donc intéressants. Bien sûr ils ne peuvent s’exécuter en étant compactés…
12°) Quelles sont les performances respectives des compacteurs ?
Vaste débat ayant déjà entraîné de très nombreuses publications…
A titre indicatif voici ce que cela donne chez moi pour les fichiers que vous avez
compactés.
N’en tirez aucune conclusion…tout dépend des fichiers à compacter, de la version utilisée
, et de l’adéquation entre le compacteur choisi et le type de fichiers utilisés.
Bon archivage.
BA.