Bernard Andruccioli 2005-2006 IUT Bordeaux
Transcription
Bernard Andruccioli 2005-2006 IUT Bordeaux
IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 1/23/ IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 2/23/ La compression des données. Bernard Andruccioli 2005-2006 IUT Bordeaux-Montesquieu Département Tech de Co Université Montesquieu-Bordeaux 4 Beaucoup d’entre vous l’ont sans doute constaté : la taille des fichiers créés avec les logiciels actuels grossit et bien souvent ces documents que l’on souhaite emporter ne tiennent pas sur une simple disquette qui est pourtant ce qui est le plus pratique à transporter. Ainsi la taille du fichier relatif au premier poly sur Excel que je vous ai distribué est de plus de 2 MO alors qu’une simple disquette ne contient pas plus de 1,44MO…Pourtant sur cette disquette j’ai pu insérer ce documents accompagné de quelques autres aussi volumineux. La solution adoptée ? La compression de données. La preuve : La compression des données. Ce fichier de plus de 2Mo n’est plus que de 210 à 365 KO selon les cas. Cette diminution considérable de la taille se fait sans perte de données, et permet donc une restitution intégrale. 1°) Quel standard de compression utiliser ? 4 2°) Quels logiciels utiliser ? 4 3°) Manipulation de ZIP Central 5 Création d’une archive : 7 Extraction des fichiers contenus dans une archive. 10 Création d’une archive auto-extractible. 11 4°) Power Archiver 2000 12 5°) Deux mots sur WINZIP 14 6°) L’explorateur et le clic droit de la souris 15 7°) Utilisation de Windows Commander. 16 8°) Le format RAR 17 9°) Les formats de compression présents sur les autres plates-formes 18 LINUX 19 Le MAC et le format HQX. 20 AMIGA : 21 10°) Compression et cryptage… 22 11°) Quelles sont les données qui se compactent le mieux ? 23 12°) Quelles sont les performances respectives des compacteurs ? 23 La compression (ou compactage ou archivage) est une technique déjà ancienne dans l’informatique, présente sur toutes les plates-formes, et qui est couramment utilisée (Documents joints en Email, téléchargement de fichier, …) Le gain de place, et le gain de temps ont motivé les développeurs qui proposent des algorithmes de plus en plus performants et des logiciels de plus en plus et conviviaux. En se limitant aux algorithmes les plus connus, et les plus utilisés sous Windows, quelques programmes sont à connaître : Du temps du DOS ces programmes étaient bien sûr présents mais nécessitaient l’utilisation de la ligne de commande. Ces programmes (PKZIP, ARJ, et LHA pour ne citer que les plus répandus) adoptaient une syntaxe commune (toujours actuelle) et proposaient une aide « en ligne » par le simple fait de saisir leur nom ; ainsi pour LHA : IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 3/23/ IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 4/23/ ATTENTION tout de même : cela nécessite une certaine habitude, et il serait bien hasardeux de se lancer dans une telle sauvegarde pour un document important (le mémoire par exemple) sans une pratique minimum…De toute façon cela ne dispense pas, au début en tous cas, d’une sauvegarde classique d’un gros fichier sur plusieurs disquettes… 1°) Quel standard de compression utiliser ? De très nombreux formats de compression existent, mais il est prudent de se limiter aux formats les plus courants pour les raisons suivantes : Programmes suivis depuis longtemps, sans bogues, sûrs d’utilisation. Très répandus, donc communication avec d’autres personnes aisée Présence sur d’autres plates-formes (nous y reviendrons plus loin) Ces programmes sont les suivants et proposent les formats de sauvegarde suivants : Programmes/Algorithmes Pkzip - Pkunzip LHA ou LHARC ARJ RAR et WINRAR Ce qui, pour compacter un fichier nommé TOTO.DOC présent dans le répertoire /monrep, dans un fichier nommé COUCOU.LZH dans un répertoire /dossier, donne : Lha –a c:/dossier/coucou.lzh c:/monrep/toto.doc Pas vraiment agréable à utiliser mais très puissant grâce à un nombre d’options important. Sous Dos déjà des programmes existaient pour éviter cette syntaxe rébarbative tels SHEZ par exemple. Puis un nouveau venu (la société RAR) proposait un programme réunissant interface et programme de compactage sous DOS. Le programme et le format de compactage RAR était donc remarqué d’autant plus que ses performances étaient bonnes. Déjà bien plus sympa… L’avènement de Windows n’a fait que généraliser ce type de programmes si bien que la compression de données peut être manipulée sans grands risques par tout le monde ou presque. Formats .ZIP .LZH .ARJ .RAR 2°) Quels logiciels utiliser ? Pour les trois premiers formats il y a l’embarras du choix, pour le dernier c’est plus restreint. Il faut savoir qu’il existe des programmes commerciaux capables de créer des archives compressées mais aussi des Sharewares1, et des Freewares2. Dans la mesure où ces derniers sont gratuits ou très peu onéreux et souvent plus performants que les premiers cités, nous nous limiterons à ceux-ci.. La compression est un des domaines dans lesquels le domaine public3, et le monde universitaire ont beaucoup planché ce qui peut expliquer ce paradoxe. De plus ces programmes ont tous une interface très voisine qui fait que l’apprentissage d’un d’entre eux permet d’être capable de les utiliser tous, au moins dans les fonctions de base. Ces programmes permettent donc de : Créer une ou des archives Ajouter et/ou supprimer des fichiers dans une archive Extraire des fichiers contenus dans une archive Visualiser le contenu d’un fichier présent dans une archive. Effacer un fichier contenu dans une archive Tester la compression de cette archive Créer des archives auto-extractibles : l’extraction des fichiers contenus dans une archive se fait « seule » sans passer par l’utilisation d’un de ces logiciels Renommer un fichier contenu dans une archive Créer des commentaires, et parfois des mots de passe pour protéger le contenu de certains fichiers de regards indiscrets…(suivant les logiciels) Analyser le contenu des fichiers contenus dans l’archive à l’aide d’un anti-virus. 1 Shareware: logiciel dont le mode de diffusion, original, vous permet de le tester avant de payer une redevance à son auteur (engagement moral) Freeware: Logiciel dont l'utilisation et la diffusion sont libres et gratuits. Par contre l'auteur conserve la propriété intellectuelle, le code source, la fréquence des mises à jour. 3 Domanine public: Désigne l'ensemble de la communauté informatique qui n'est pas directement dans le réseau strictement commercial, regroupant auteurs et sociétés de Sharewares/freeware, universitaires, utilisateurs… 2 IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 5/23/ IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 6/23/ 3°) Manipulation de ZIP Central Si on se limite qu format .ZIP, qu’on désire un programme gratuit (en toute légalité), et performant, il semble que ZIP Central soit un bon choix. (disponible sur le serveur FTP de Tech de Co à l’adresse ftp://www-tc.iutbxmr.u-bordeaux.fr/pub/archive/ ) ZIP Central est un freeware créé par John Savas et traduit par André Vaysse. Il se présente comme suit, et ressemble donc à la plupart de ces logiciels : (version 2.01) Cela permet de constater qu’il contient une aide bien pratique, car traduite elle aussi : Voici ses menus dont l’intitulé est intuitif : IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 7/23/ IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 8/23/ Création d’une archive : Un clic sur l’icône « Nouveau » entraîne l’apparition de la boîte de dialogue suivante : Dans le répertoire ONZIPPE (que vous chercherez sur le disque dur) se trouve un sous répertoire COMPACTER qui où se trouvent différents fichiers de type différents à compacter. Il contient aussi 2 répertoires qui renfermant aussi des fichiers. Tout est à compacter dans ce même fichier-archive. A noter qu’il est possible et très pratique d’ajouter des fichiers en faisant un glisserdéplacer avec la souris depuis l’explorateur de Windows : Zip Central nous demande donc un nom de fichier (comme pour une sauvegarde) et un répertoire où créer ce ficher archive. Concrètement créer une archive c’est en fait créer un fichier qui va contenir d’autres fichiers dont le programme aura auparavant réduit leur taille. Ce fichier a l’extension .ZIP, par exemple ci-dessus il se nomme ZIPCENTRAL.ZIP. Gentiment il nous demande quels sont les fichiers à intégrer dans l’archive ; il suffit de développer l’arborescence pour accéder au répertoire où sont situés les fichiers à compacter. A l’arrivée on a : IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 9/23/ On voit nettement le contenu de l’archive, le gain en taille (pour le fichier winproxy.doc on est passé de 53760 octets à 12293 soit un gain de 77%), la localisation de ces fichiers sur le disque… Quittez le logiciel, et relancez le. Ouvrez l’archive : aucun problème tout est là. Testez la (clic sur l’icône TEST) Renommez quelques fichiers, effacez-en, créez des commentaires, et/ou des mots de passe… Tout est totalement transparent. Vous pouvez même visualiser le contenu de certains fichiers Exemple avec un double clic sur le fichier jeu.xls créé avec Excel : IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 10/23/ Extraction des fichiers contenus dans une archive. Un clic sur l’icône EXTRAIRE, ce qui donne : IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 11/23/ IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 12/23/ Noter la syntaxe >< pour l’extraction dans un dossier temporaire (c:/windows/temp/) Voilà à vous de manipuler davantage ce produit. Ceux qui ne sont pas allergiques à l’anglais peuvent utiliser Power ZIP ou Power Archiver de loin le plus complet au niveau des formats de compactage, interface comparable à Zip Central., Freewares, donc gratuits. 4°) Power Archiver 2000 Autre Freeware puissant et disponible sur le serveur FTP de Tech de Co: Power Archiver 2000 (écrit par Ivan Petrovic) L'interface et le principe de fonctionnement sont similaires à Zip Central; ce logiciel (en anglais) se montre plus complet que Zip Central. Il gère davantage de formats d'archives. Interface générale En développant l’arborescence on arrive dans le répertoire où on désire extraire ces fichiers : OK et l’extraction se fait. On peut également créer un nouveau répertoire à cet effet depuis Zip Central qui accueillera donc les fichiers à extraire. Création d’une archive auto-extractible. Zip Central va simplement ici changer l’extension du fichier archive créé (qui deviendra ZIPCENTRAL.EXE) ce qui permettra l’extraction de son contenu sur un poste dépourvu de Zip Central ou autre logiciel de compactage… Pour cela Clic sur l’icône CONVERTIR pour obtenir : Création d'un archive avec sélection du format. IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 13/23/ IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 14/23/ Test de l'archive (avec compte rendu) 5°) Deux mots sur WINZIP Le premier logiciel a avoir proposé cette interface est un programme proposé en shareware : WINZIP. Performant, et présent sur tous les CDROM des revues d’informatique, Winzip donne l’impression que son utilisation est gratuite. Il n’en n’est rien, et les versions ainsi diffusées le stipulent bien, de même que le fait que faute de redevance auprès de la société ABSOFT il cesse de fonctionner au bout de 2 mois environ. Winzip n’est donc pas présent sur les postes de Tech de Co (si ce n’est pour en tester une nouvelle version de manière ponctuelle) puisqu’il y a aussi bien pour moins cher… Il reste quand même une référence pour certains… Il se pilote exactement comme Zip Central et consort (qualifiés de Winzip Killer…) Conversion du format de l'archive (très appréciable) IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 15/23/ IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 16/23/ Si on sélectionne Ajouter à un ZIP avec ZipCentral, on retombe sur la séquence de création d’archive. Bien pratique. A noter que certains petits logiciels de compression ne se pilotent que de cette manière: c'est le cas du logiciel FreeZip (Freeware bien sûr…) 7°) Utilisation de Windows Commander. Windows Commander est un gestionnaire de fichier au même titre que l’explorateur fourni avec Windows, mais qui présente bien des avantages : Convivialité accrue : 2 fenêtres, boutons, clic droit… Intégration totale avec les logiciels utilitaires présents sur la machine (module de configuration très puissant) Peut être utilisé comme client FTP sur Internet pour tout type de connections (anonymes ou autres) (depuis la version 4) Et enfin est capable de gérer les archives de manière très simple : Winzip version 7.0 A noter un très bon tutorial (Menu AIDE) qui peut servir de guide pour vos premières manipulations d’archives. : ce qui est expliqué pour Winzip l’est bien souvent aussi pour les autres. 6°) L’explorateur et le clic droit de la souris Une fois ZipCentral (ou équivalant) installé sur son ordinateur, on peut l’appeler depuis l’explorateur de Windows si on veut compacter un fichier. Pour cela un clic droit de la souris fait apparaître le menu contextuel suivant (sans doute moins complet sur votre poste) : Ci-dessus on compacte la fenêtre de droite dans celle de gauche qui correspond à un autre répertoire. Le menu Fichier est très clair pour le compactage et le décompactage : IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 17/23/ IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 18/23/ En anglais dans la version Shareware (il n’est donc pas gratuit), son interface ne surprendra pas : On a à l’arrivée : Son utilisation est donc semblable à Zip Central… 9°) Les formats de compression présents sur les autres plates-formes L’archive est à gauche, les fichiers de départ restent à droite. Un double clic sur le fichier archive permet d’en voir le contenu. Attention : Windows Commander n’est pas un freeware mais un shareware. Son utilisation vous engage donc moralement à un règlement auprès de Christian Ghisler, son auteur. 8°) Le format RAR Comme cela a été précisé plus haut RAR est un format de compression créé au départ par les produits de la société RAR. Ce nouveau format commence à se rencontrer (sur Internet notamment) dans le monde Windows. Propriétaire au départ, on peut à présent créer des archives RZAR avec Winzip, Windows Commander et d’autres produits de ce type. Le logiciel de base est Winrar . Les formats de compactage les plus courants: Les fichiers compactés se reconnaissent à leur extension qui est significative du compacteur utilisé (.zip pour PKZIP par exemple.). Mais le problème se corse un peu dans la mesure où Internet est un réseau ouvert qui permet à des ordinateurs très différents (sur le plan matériel et système) de communiquer entre eux. Et si on n'oublie pas que les pionniers du réseau ont bien souvent travaillé sous UNIX puis LINUX on comprend mieux le nombre d'extension curieuse auxquelles l'utilisateur d'un PC sous Windows, ou d'un MAC n'est pas habitué. Pourtant beaucoup de documents sont compactés, pas seulement les logiciels, et il est souvent intéressant de récupérer un document qui doit être décompacté pour être lisible...alors même qu'il a peut-être été compacté sous un autre système que celui que l'on utilise... IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 19/23/ Voici un petit tableau permettant de mieux s'y retrouver. Compacteur Logiciels /PC sous Logiciels Logiciels Extensions utilisé Windows /MAC /LINUX .ZIP Pkzip Winzip, Pkunzip ZipIt Zip .ARC Arc Winzip ou Arc .ZOO Zoo Zoo Zoo .LZH ou Lha Lha, Winzip MacLha .LHA .LIM Limit Limit .SQZ Squeeze Squeeze, Winzip .BIN MacBinary Stuffit Expander .CPT Compact Pro Extract Compact Pro .RAR Rar WinRAR, RAR, WinZip MacUnRar .GZ Gzip Winzip MacGzip Gzip, Gunzip .GZIP Gzip Winzip MacGzip Gzip, Gunzip .HQX BinHex Stuffit Expander Stuffit Expander .SEA Autoextractible .SIT Stuffit Stuffit Expander Stuffit Expander .TAR Tar Wintar, Winzip Tar .TGZ Tar + Gzip Winzip Stuffit Expander Tar .UU UUencode Winzip Stuffit Expander .Z Gzip Winzip Stuffit Expander Gzip .UC Uc2 Winzip .ARJ Arj Winzip, WinArj On aura compris que posséder Winzip, Power Archiver (ou équivalent) ou Stuffit Expander peut s'avérer très utile... On pourra ajouter que les formats .ZIP et .LHA sont disponibles aussi sous ATARI et AMIGA pour comprendre leur intérêt pour passer des documents d’un standard à l’autre… IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 20/23/ L’interface rappelle quelque chose non ? Interface ne posant pas de problème non plus avec X-Files, semblable à Windows Commander : LINUX Le format LHA sous Linux : L’archive ZIP créée avec Zip Central sous Windows est ici lisible sans difficulté sous Linux grâce à X-Files Notons que les formats courants sous Unix sont Linux sont .TAR et .GZIP. Les programmes gérant ces formats existent sous Windows tels WINTAR, ou WinZip, PowerArc. La syntaxe est la même que sous DOS. Un programme de compression convivial sous Linux (KZip, livré avec KDE gestionnaire de fenêtres) avec le contenu de l’archive créée avec Windows commander sous Windows. Le MAC et le format HQX. IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 21/23/ IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 22/23/ Plusieurs compacteurs existent sous Mac qui gèrent les formats de ZIP et LHA, ainsi que certains formats propriétaires tels le logiciel CompacPro, et surtout Stuffit, dont l’extension .HQX est de loin la plus répandue, si bien qu’on peut avoir besoin de décompacter une archive .HQX sous Mac et/ou sous Windows, ne serait-ce que pour échanger des données. Le module complet est payant auprès de la société Aladin, mais le module permettant la décompression est gratuit, et se nomme Stuffit Expander. Son utilisation est très simple : il suffit de faire glisser depuis l’explorateur un fichier .hqx sur le logiciel pour que celui-ci crée un répertoire dans lequel il décompacte les fichiers contenus dans l’archive. Des interfaces conviviales existent : ainsi GuiArc permet de récupérer l’archive crée depuis Windows : Le contenu est donc également lisible De même avec FileQuest : Rappel: Spontanément un PC ne sait pas lire une disquette venant du MAC écrite au format MAC (les systèmes sont différents) L'inverse ne pose plus de problèmes, le MAC, comme l'AMIGA, sachant lire depuis belle lurette les disquettes au format PC. En cas de problème ou de besoin sachez qu'il existe (au moins) un utilitaire en Shareware nommé Transmac qui fait cela très bien. AMIGA : Le format LHA est le plus répandu ; curieusement son extension change sous Amiga, elle devient .LHA contre .LZH sous Windows. A ce détail près il s’agit du même algorithme qui permet de récupérer des données compactées sous d’autres standards. Le Shell montre la syntaxe LHA en ligne de commande : 10°) Compression et cryptage… La syntaxe est la même… Dans la mesure où un logiciel de compression est capable de réduire la taille du fichier, c’est qu’il intervient sur sa structure même Il va codifier le fichier différemment selon l’algorithme utilisé avant de sauvegarder l’archive ainsi créée. Le point essentiel de cette opération c’est que la clé, ou table de correspondance contenue dans l’algorithme est connue de tous…Mais si elles est masquée, et donc connue du seul créateur de l’archive on obtient un programme de cryptage, dont l’usage est très réglementé. IUT Montesquieu-Bordeaux 4 Dpt Tech de Co BA 2005-2005-2006 la compression des données.doc Page 23/23/ On insère au moment de la compression un mot de passe qui est donc la clé garantissant la confidentialité des informations contenues dans le fichier compressé. Utiles pour les transactions commerciales sur Internet ces programmes commencent à se rencontrer : Exemple de fichier crypté avec un logiciel approprié. La taille initiale de ce fichier est de 2,2MO. 11°) Quelles sont les données qui se compactent le mieux ? Tous les fichiers ne se compactent pas de la même manière, et le résultat dépend de la nature de chacun d’eux : : Les textes, les bases de données, et les feuilles de calcul : très bon résultats surtout si la forme n’est pas surchargée : le gain peut être souvent supérieur à 50-60%. : Les fichiers au format .TXT : Très bon résultats. : Les sons les images, et la vidéo : Tout dépend du format utilisé, mais les résultats sont souvent insignifiants pour la bonne raison que les formats de ces fichiers sont déjà compactés…(GIF, JPG pour les images, .MP3 pour le son, .Mpeg pour la vidéo.). Les résultats sont meilleurs pour les formats .MID (Midi), et les modules (.Mod). Les exécutables : Les programmes sont souvent livrés compactés, les résultats sont donc intéressants. Bien sûr ils ne peuvent s’exécuter en étant compactés… 12°) Quelles sont les performances respectives des compacteurs ? Vaste débat ayant déjà entraîné de très nombreuses publications… A titre indicatif voici ce que cela donne chez moi pour les fichiers que vous avez compactés. N’en tirez aucune conclusion…tout dépend des fichiers à compacter, de la version utilisée , et de l’adéquation entre le compacteur choisi et le type de fichiers utilisés. Bon archivage. BA.