dd et raid
Transcription
dd et raid
BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 1 / 14 Architecture matérielle des systèmes informatiques (1ère année) Lycée Jean Rostand CHANTILLY BTS INFORMATIQUE DE GESTION Cardoni Jean-Marie Les périphériques de stockage 4 Conditions de réalisation En classe Seul Groupe Contenus du référentiel S13 Technologies des périphériques o Décrire le rôle et les principales caractéristiques fonctionnelles et techniques des périphériques. o Identifier les technologies et normes relatives aux périphériques Points forts Les disques durs Introduction à la notion de SGF La technologie RAID Les bandes et les cartouches magnétiques Complément TP n° 4 BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 2 / 14 I) LE DISQUE DUR Définition Il a été inventé au début des années 50 par IBM. a) Le fonctionnement Un disque dur est constitué de plusieurs disques rigides en métal, en verre ou en céramiques empilés les uns après les autres. Ils tournent très rapidement autour d'un axe (5400 ou 7200 tours/mn (tpm) avec un contrôleur Ide, 10 000 tours/mn avec un contrôleur SCSI ou SATA) dans le sens inverse des aiguilles d'une montre. BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 3 / 14 Cependant, les têtes sont liées entre-elles et seulement une seule tête peut lire ou écrire à un moment donné. L'ensemble de cette mécanique de précision est contenue dans un boîtier totalement hermétique, car la moindre particule peut détériorer l'état de surface du disque. b) La lecture et l’écriture Les têtes commencent à inscrire des données à la périphérie du disque (piste 0), puis avancent vers le centre. BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 4 / 14 Les pistes sont séparées en quartiers (entre deux rayons) que l'on appelle Un secteur a une taille minimum de 512 octets Capacité d’un disque dur = Exemple : Trouver la taille du disque dur (données constructeur concernant un disque Maxtor) Nombre de secteurs : 64 1 secteur = 512 octets Nombre de cylindre : 79456 Nombre de têtes : 16 BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 5 / 14 c) Les caractéristiques d’un disque dur Le volume de stockage (mesuré en Go) Le taux de transfert La vitesse de rotation (exprimée en tpm tours par minute) Le temps de latence Le temps d'accès II) Introduction à la notion de Système de Gestion de fichiers (SGF) Définition Système d'exploitation Types de système de fichiers supportés Dos FAT16 Windows 98 FAT16, FAT32 Windows NT4 FAT, NTFS (version 4) Windows 2003/XP FAT, FAT16, FAT32, NTFS (versions 4 et 5) Linux Ext2, Ext3, ReiserFS, Linux Swap(, FAT16, FAT32, NTFS) HFS (Hierarchical File System), MFS (Macintosh File MacOS System) OS/2 HPFS (High Performance File System) Cédérom CDFS FreeBSD, OpenBSD UFS (Unix File System) Sun Solaris UFS (Unix File System) IBM AIX JFS (Journaled File System BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 6 / 14 Il est possible de faire cohabiter différents SGF : Il y a trois sortes de partitions: Un disque peut contenir jusqu'à quatre partitions principales (dont une seule peut être active), ou trois partitions principales et une partition étendue. Dans la partition étendue l'utilisateur peut créer des lecteurs logiques (c'est-à-dire "simuler" plusieurs disques durs de taille moindre). Ci-dessous on voit un disque contenant une partition principale et une partition étendue composée de trois lecteurs logiques Partition principale Une partition principale doit être formatée logiquement, puis contenir un système de fichier correspondant au système d'exploitation installé sur celle-ci. Si jamais vous avez plusieurs partitions principales sur votre disque, une seule sera active et visible à la fois, cela dépendra du système d'exploitation sur lequel vous avez démarré l'ordinateur. En choisissant le système d'exploitation que vous lancez au démarrage, vous déterminez la partition qui sera visible. La partition active est la partition sur laquelle un des systèmes d'exploitation est démarré au lancement de l'ordinateur. Les partitions autres que celle sur laquelle vous démarrez seront alors cachées, ce qui empêchera d'accéder à leurs données. Ainsi, les données d'une partition principale ne sont accessibles qu'à partir du système d'exploitation installé sur cette partition. Partition étendue La partition étendue a été mise au point pour outrepasser la limite des quatre partitions principales, en ayant la possibilité de créer autant de lecteurs logiques que vous désirez dans celle-ci. Au moins un lecteur logique est nécessaire dans une partition étendue, car vous ne pouvez pas y stocker de données directement. Beaucoup de machines sont formatées en une grande partition utilisant l'intégralité de l'espace disponible du lecteur. Ce n'est pourtant pas la solution la plus intéressante en terme de performances et de capacité. La solution est de créer plusieurs partitions, ce qui permettra : BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 7 / 14 Partitions principales partition active FAT32 (Windows XP) NTFS (Windows Server 2008) Partitions étendues (2 lecteurs logiques) HPFS Linux ext2 (OS/2) Linux swap 1) Complément sur les partitions Linux Type de disque Ide Ultra DMA SCSI Appellation Son nom commencera par hd. Le premier disque IDE de la première nappe se nommera hda, le second hdb… hde Sda pour le premier, sdb pour le second… Si le disque est partitionné on ajoute un numéro : hda1, hda2,…, hda5 Attention la numérotation des lecteurs logiques commence à 5 Avec Linux le minimum de partitions gérées est de 1. Cependant, si on partitionne on aura un maximum de 4 partitions primaires. Les lecteurs logiques étant notés à partir de 5. a) la zone de SWAP Presque toutes les distributions Linux (RedHat, Mandriva…) utilisent une partition de SWAP (fichier d’échange). En général, ce SWAP représente le double de la RAM. La zone de SWAP est placée vers le début du disque ce qui rend son accès plus rapide. / : répertoire racine obligatoire. Tous les autres répertoires seront « montés » sous cette partition racine /boot : on peut vouloir installer le système de démarrage dans une partition à part /home : sert à stocker des données personnelles /usr : sert à stocker les programmes. Si on veut pas créer /usr alors les programmes sont stockés à la racine. /var : partition servant à stocker les données exploitées par le système ou les programmes. /root : partition comme le /home mais servant au super user (administrateur) b) logiciel de démarrage Les distributions proposent souvent plusieurs programmes de démarrage : LILO (Linux Loader) : Il a besoin de connaître l’emplacement physique des fichiers de démarrage et il peut être installé sur n’importe quelle partition, voire sur une disquette GRUB : il est capable de « monter » les systèmes de fichiers de chercher les fichiers à démarrer tout seul. LoadLin : logiciel DOS qui sait démarrer un système Linux à partir d’une machine initialement prévue pour DOS/Windows (Dual Boot) BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 8 / 14 2) Complément sur NTFS Le système de fichiers NTFS (New Technology File System) utilise un système basé sur une structure appelée « table de fichiers maître », ou MFT (Master File Table), permettant de contenir des informations détaillées sur les fichiers. Ce système permet ainsi l’utilisation de noms longs, mais, contrairement au système FAT32, il est sensible à la casse, c’est-à-dire qu’il est capable de différencier des noms en majuscules de noms en minuscules. Pour ce qui est des performances, l’accès aux fichiers sur une partition NTFS est plus rapide que sur une partition de type FAT car il utilise un arbre binaire performant pour localiser les fichiers. La limite théorique de la taille d’une partition est de 16 exaoctets. III) La technologie RAID Pour assurer la sauvegarde des informations, on peut recopier régulièrement le contenu du disque dur sur une bande, sur une cartouche DAT... en utilisant des programmes de sauvegarde (backup). Cependant en cas d'accident sur un disque dur on peut alors récupérer (restore) que les données précédemment sauvées et la procédure de récupération peut être relativement longue. Dans certains environnements où on utilise des serveurs de données qui sont sans arrêt sollicités et mis à jour (ventes par correspondance, assurances, banques ... ) il convient de trouver d'autres solutions. C'est le rôle de la technologie RAID (Redundant Array Inexpensive Disks) Les disques assemblés selon la technologie RAID peuvent être utilisés de différentes façons, appelées Niveaux RAID. L'Université de Californie en a défini 6. Chacun d'entre-eux décrit la manière de laquelle les données sont réparties sur les disques numérotés de 0 à 5 Chacun de ces niveaux constitue un mode d'utilisation de la grappe, en fonction : BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 9 / 14 a) Les principaux objectifs Augmenter la capacité des disques durs. En effet, RAID permet de mettre de bout à bout plusieurs disques durs. Améliorer les performances. Les données sont écrites sur plusieurs disques à la fois. Ainsi, chacun des disques durs n’a qu’une partie des données à inscrire. Augmenter la fiabilité des archives en limitant les pannes. b) Présentation de quelques niveaux RAID 0 : Sécurité 0 Le RAID-0 consiste ainsi en la juxtaposition de plusieurs disques durs physiques. En mode RAID-0 les données sont écrites par "bandes" Disque 1 Disque 2 Disque 3 Bande 1 Bande 2 Bande 3 Bande 4 Bande 5 Bande 6 Bande 7 Bande 8 Bande 9 Si un des élements de la grappe est plus grand que les autres, le système de remplissage par bande se trouvera bloqué lorsque le plus petit des disques sera rempli. La taille finale est ainsi égale au double de la capacité du plus petit des deux disques : deux disques de 20 Go donneront un disque logique de 40 Go. un disque de 10 Go utilisé conjointement avec un disque de 27 Go permettra d'obtenir un disque logique de 20 Go (17 Go du second disque seront alors inutilisés). Il est recommandé d'utiliser des disques de même taille pour faire du RAID-0 car dans le cas contraire le disque de plus grande capacité ne sera pas pleinement exploité RAID 1 : disque miroir - Cette méthode est sure mais chère car on utilise vraiment que la moitié de la capacité disque totale (chaque donnée étant copiée deux fois) Disque1 Disque2 Disque3 Bande 1 Bande 1 Bande 1 Bande 2 Bande 2 Bande 2 Bande 3 Bande 3 Bande 3 BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 10 / 14 RAID 5 : Le plus astucieux Disque 1 Disque 2 Disque 3 Disque 4 Bloc 1 Bloc 2 Bloc 3 Parité 1+2+3 Bloc 4 Parité 4+5+6 Bloc 5 Bloc 6 Parité 7+8+9 Bloc 7 Bloc 8 Bloc 9 De cette façon, RAID 5 améliore grandement l'accès aux données (aussi bien en lecture qu'en écriture) car l'accès aux bits de parités est réparti sur les différents disques de la grappe. Le mode RAID-5 permet d'obtenir des performances très proches de celles obtenues en RAID0, tout en assurant une tolérance aux pannes élevées, c'est la raison pour laquelle c'est un des modes RAID les plus intéressant en terme de performance et de fiabilité. c) Performance entre les techniques les plus implantées Les solutions RAID généralement retenues sont le RAID de niveau 1 et le RAID de niveau 5. Le choix d'une solution RAID est lié à trois critères : la sécurité : RAID 1 et 5 offrent tous les deux un niveau de sécurité élevé, toutefois la méthode de reconstruction des disques varie entre les deux solutions. En cas de panne du système, RAID 5 reconstruit le disque manquant à partir des informations stockées sur les autres disques, tandis que RAID 1 opère une copie disque à disque. Les performances : RAID 1 offre de meilleures performances que RAID 5 en lecture, mais souffre lors d'importantes opérations d'écriture Le coût : le coût est directement lié à la capacité de stockage devant être mise en oeuvre pour avoir une certaine capacité effective. La solution RAID 5 offre un volume utile représentant 80 à 90% du volume alloué (le reste servant évidemment au contrôle d'erreur). Formule de calcul pour RAID 5 : La solution RAID 1 n'offre par contre qu'un volume disponible représentant 50 % du volume total (étant donné que les informations sont dupliquées). d) Conclusion e) Sujet : Extrait BTS IG DA 2008 Le serveur « SRV-SQL », récemment acquis, dispose d'un contrôleur RAID assurant les solutions RAID1 et RAID5 et pilotant 4 disques de 300 Go. Calculer et comparer les capacités utiles de stockage du serveur « SRV-SQL » pour chaque solution RAID1 et RAID5. Justifier les calculs. BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 11 / 14 III) Les bandes et les cartouches magnétiques Les solutions de sécurité que représentent les bandes et les cartouches magnétiques présentent l’avantage d’une grande capacité de stockage (jusqu’à 220 Go) au détriment d’un accès lent. Compte tenu de leur coût de revient bas (environ 50 €) elles représentent un rôle important dans les sauvegardes en informatiques. a) La bande magnétique La bande magnétique traditionnelle, compte tenu de son très faible coût de stockage de l'information, a longtemps été un des supports les plus employés en archivage. Remarques La lecture caractère par caractère n'est pas possible sur une bande magnétique car celui-ci n'occupe que quelques centièmes de millimètre. On est donc obligé de lire un ensemble suffisant de caractères à la fois (de quelques centaines à quelques milliers). La qualité de la lecture ou de l'écriture exige un déplacement régulier de la bande devant les têtes, ce qui conduit également à prévoir la lecture ou l'écriture d'ensembles de caractères. Ces ensembles portent le nom de blocs physiques. b) La cartouche magnétique Les bandes traditionnelles, volumineuses et peu aisées à mettre en œuvre, ont assez tôt été concurrencées par les cassettes et les cartouches magnétiques. On rencontre donc de nombreux types de cartouches, cassettes ou mini-cartouches (par exemple : les Cartouches DAT, EXABYTE, QIC, DLT, MLR ou LTO) Caractéristiques : un très faible coût du caractère enregistré un encombrement physique relativement faible en regard du volume stocké En revanche, elle présente aussi certains inconvénients et notamment : une lecture uniquement séquentielle un temps moyen d'accès à l'information long une relative sensibilité à l'environnement (poussière, humidité, ...) BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 12 / 14 d) Applications Exercice 1 Une installation dispose d’un dérouleur de bandes magnétiques, dont les performances sont les suivantes : - longueur maximale d’une bande magnétique manipulable par le dérouleur : 700 mètres, - densité d’enregistrement sur la bande magnétique : 1 600 octets par pouces (un pouce = 2,5 cm), - vitesse de lecture ou d’écriture par le dérouleur : 1 mètre par seconde. Travail à faire Calculer : - la capacité de stockage d’une bande magnétique de 700 mètres, - la vitesse de lecture ou d’écriture exprimée en nombre de caractères par seconde. BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 13 / 14 Exercice 2 On veut stocker sur une bande magnétique, pour une sauvegarde, à l’aide du dérouleur dont les caractéristiques ont été décrites dans l’exercice n°1, le contenu du fichier des 20 000 ouvrages d’une bibliothèque. L’enregistrement d’un ouvrage comporte les rubriques suivantes, avec leurs nombres de caractères : N° de l’ouvrage 6 Nom de l’éditeur 20 Titre 50 Nom de la collection 20 Nom/prénom de l’auteur 30 Date d’achat 6 Thème (mot clé) 10 Résumé de l’ouvrage 200 Travail à faire - Calculer la longueur de la bande occupée par le fichier. Pour cela vous déterminerez le nombre de caractères d’un enregistrement puis le nombre de caractères du fichier et enfin la taille occupée par le fichier - le temps de lecture de la totalité du fichier. Nota : on calculera le temps théorique, supposant une lecture en continu. Dans la réalité, il y a des arrêts en cours d’opération, rendant le temps effectif légèrement plus long que le temps calculé théoriquement. BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 14 / 14 Application 1 Vous allez devoir assurer la sauvegarde des bases de données qui occupent prés de 100 Go sur le serveur de la société. En dehors de l’aspect financier, complétez le tableau ci-dessous afin de déterminer les volumes et les temps nécessaires de sauvegarde. Proposez votre choix. remarque 1 Go = 1 024 Mo Matériel Volume de Nombre de Taux de Taux de Temps de Temps de la cartouche transfert transfert sauvegarde sauvegarde cartouche en seconde en heureminute Exabyte 60 Go 12 Mo/s AIT 50 Go 6 Mo/s DLT 800 40 Go 6 Mo/s Super DLT 100 Go 10 Mo/s Magstar E 20 Go 14 Mo/s LCO Accelis 50 Go 20 Mo/s LCO ultrium 100 Go 10 Mo/s Application 2 Combien de temps devrait théoriquement prendre la sauvegarde des 4 disques durs de 10 Go de votre serveur que vous devez sauvegarder sur un lecteur dont le taux de transfert est de 10 Mo/s ? Application 3 Un lecteur Zip à disques amovibles de 250 Mo est-il une bonne solution de sauvegarde d’un ordinateur comportant un disque dur de 15 Go ? Application 4 Depuis votre BIOS vous lisez les informations suivantes concernant votre disque dur. Quel est la taille du secteur en octets ? Capacité : 850 526 208 octets Cylindres : 824 Têtes : 32 Secteurs : 63 / pistes