dd et raid

Transcription

dd et raid
BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 1 / 14
Architecture matérielle
des systèmes informatiques
(1ère année)
Lycée Jean Rostand
CHANTILLY
BTS INFORMATIQUE DE GESTION
Cardoni Jean-Marie
Les périphériques de
stockage
4
Conditions de réalisation
En classe

Seul
Groupe


Contenus du référentiel

S13 Technologies des périphériques
o Décrire le rôle et les principales caractéristiques
fonctionnelles et techniques des périphériques.
o Identifier les technologies et normes relatives aux
périphériques
Points forts




Les disques durs
Introduction à la notion de SGF
La technologie RAID
Les bandes et les cartouches magnétiques
Complément
TP n° 4
BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 2 / 14
I) LE DISQUE DUR
Définition
Il a été inventé au début des années 50 par IBM.
a) Le fonctionnement
Un disque dur est constitué de plusieurs disques rigides en métal, en verre ou en céramiques
empilés les uns après les autres.
Ils tournent très rapidement autour d'un axe (5400 ou 7200 tours/mn (tpm) avec un
contrôleur Ide, 10 000 tours/mn avec un contrôleur SCSI ou SATA) dans le sens inverse des
aiguilles d'une montre.
BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 3 / 14
Cependant, les têtes sont liées entre-elles et seulement une seule tête peut lire ou écrire à un
moment donné.
L'ensemble de cette mécanique de précision est contenue dans un boîtier totalement
hermétique, car la moindre particule peut détériorer l'état de surface du disque.
b) La lecture et l’écriture
Les têtes commencent à inscrire des données à la périphérie du disque (piste 0), puis avancent
vers le centre.
BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 4 / 14
Les pistes sont séparées en quartiers (entre deux rayons) que l'on appelle
Un secteur a une taille minimum de 512 octets
Capacité d’un disque dur =
Exemple : Trouver la taille du disque dur (données constructeur concernant un disque Maxtor)
Nombre de secteurs : 64
1 secteur = 512 octets
Nombre de cylindre : 79456
Nombre de têtes : 16
BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 5 / 14
c) Les caractéristiques d’un disque dur

Le volume de stockage (mesuré en Go)

Le taux de transfert

La vitesse de rotation (exprimée en tpm tours par minute)

Le temps de latence

Le temps d'accès
II) Introduction à la notion de Système de Gestion de fichiers (SGF)
Définition
Système d'exploitation
Types de système de fichiers supportés
Dos
FAT16
Windows 98
FAT16, FAT32
Windows NT4
FAT, NTFS (version 4)
Windows 2003/XP
FAT, FAT16, FAT32, NTFS (versions 4 et 5)
Linux
Ext2, Ext3, ReiserFS, Linux Swap(, FAT16, FAT32, NTFS)
HFS (Hierarchical File System), MFS (Macintosh File
MacOS
System)
OS/2
HPFS (High Performance File System)
Cédérom
CDFS
FreeBSD, OpenBSD
UFS (Unix File System)
Sun Solaris
UFS (Unix File System)
IBM AIX
JFS (Journaled File System
BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 6 / 14
Il est possible de faire cohabiter différents SGF :
Il y a trois sortes de partitions:
Un disque peut contenir jusqu'à quatre partitions principales (dont une seule peut être active),
ou trois partitions principales et une partition étendue. Dans la partition étendue l'utilisateur
peut créer des lecteurs logiques (c'est-à-dire "simuler" plusieurs disques durs de taille
moindre).
Ci-dessous on voit un disque contenant une partition principale et une partition étendue
composée de trois lecteurs logiques
Partition principale
Une partition principale doit être formatée logiquement, puis contenir un système de fichier
correspondant au système d'exploitation installé sur celle-ci.
Si jamais vous avez plusieurs partitions principales sur votre disque, une seule sera active et
visible à la fois, cela dépendra du système d'exploitation sur lequel vous avez démarré
l'ordinateur. En choisissant le système d'exploitation que vous lancez au démarrage, vous
déterminez la partition qui sera visible. La partition active est la partition sur laquelle un des
systèmes d'exploitation est démarré au lancement de l'ordinateur. Les partitions autres que
celle sur laquelle vous démarrez seront alors cachées, ce qui empêchera d'accéder à leurs
données. Ainsi, les données d'une partition principale ne sont accessibles qu'à partir du
système d'exploitation installé sur cette partition.
Partition étendue
La partition étendue a été mise au point pour outrepasser la limite des quatre partitions
principales, en ayant la possibilité de créer autant de lecteurs logiques que vous désirez dans
celle-ci. Au moins un lecteur logique est nécessaire dans une partition étendue, car vous ne
pouvez pas y stocker de données directement.
Beaucoup de machines sont formatées en une grande partition utilisant l'intégralité de l'espace
disponible du lecteur. Ce n'est pourtant pas la solution la plus intéressante en terme de
performances et de capacité. La solution est de créer plusieurs partitions, ce qui permettra :
BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 7 / 14
Partitions principales
partition active
FAT32
(Windows XP)
NTFS
(Windows Server 2008)
Partitions étendues (2 lecteurs logiques)
HPFS Linux ext2
(OS/2)
Linux swap
1) Complément sur les partitions Linux
Type de disque
Ide
Ultra DMA
SCSI
Appellation
Son nom commencera par hd. Le premier disque IDE de la
première nappe se nommera hda, le second hdb…
hde
Sda pour le premier, sdb pour le second…
Si le disque est partitionné on ajoute un numéro : hda1, hda2,…, hda5
Attention la numérotation des lecteurs logiques commence à 5
Avec Linux le minimum de partitions gérées est de 1. Cependant, si on partitionne on aura un
maximum de 4 partitions primaires. Les lecteurs logiques étant notés à partir de 5.
a) la zone de SWAP
Presque toutes les distributions Linux (RedHat, Mandriva…) utilisent une partition de SWAP
(fichier d’échange). En général, ce SWAP représente le double de la RAM. La zone de SWAP est
placée vers le début du disque ce qui rend son accès plus rapide.
/ : répertoire racine obligatoire. Tous les autres répertoires seront « montés » sous cette
partition racine
/boot : on peut vouloir installer le système de démarrage dans une partition à part
/home : sert à stocker des données personnelles
/usr : sert à stocker les programmes. Si on veut pas créer /usr alors les programmes
sont stockés à la racine.
/var : partition servant à stocker les données exploitées par le système ou les
programmes.
/root : partition comme le /home mais servant au super user (administrateur)
b) logiciel de démarrage
Les distributions proposent souvent plusieurs programmes de démarrage :
LILO (Linux Loader) : Il a besoin de connaître l’emplacement physique des fichiers de
démarrage et il peut être installé sur n’importe quelle partition, voire sur une disquette
GRUB : il est capable de « monter » les systèmes de fichiers de chercher les fichiers à
démarrer tout seul.
LoadLin : logiciel DOS qui sait démarrer un système Linux à partir d’une machine initialement
prévue pour DOS/Windows (Dual Boot)
BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 8 / 14
2) Complément sur NTFS
Le système de fichiers NTFS (New Technology File System) utilise un système basé sur une
structure appelée « table de fichiers maître », ou MFT (Master File Table), permettant de
contenir des informations détaillées sur les fichiers. Ce système permet ainsi l’utilisation de
noms longs, mais, contrairement au système FAT32, il est sensible à la casse, c’est-à-dire qu’il
est capable de différencier des noms en majuscules de noms en minuscules.
Pour ce qui est des performances, l’accès aux fichiers sur une partition NTFS est plus rapide
que sur une partition de type FAT car il utilise un arbre binaire performant pour localiser les
fichiers. La limite théorique de la taille d’une partition est de 16 exaoctets.
III) La technologie RAID
Pour assurer la sauvegarde des informations, on peut recopier régulièrement le contenu du
disque dur sur une bande, sur une cartouche DAT... en utilisant des programmes de
sauvegarde (backup). Cependant en cas d'accident sur un disque dur on peut alors récupérer
(restore) que les données précédemment sauvées et la procédure de récupération peut être
relativement longue.
Dans certains environnements où on utilise des serveurs de données qui sont sans arrêt
sollicités et mis à jour (ventes par correspondance, assurances, banques ... ) il convient de
trouver d'autres solutions. C'est le rôle de la technologie RAID (Redundant Array
Inexpensive Disks)
Les disques assemblés selon la technologie RAID peuvent être utilisés de différentes façons,
appelées Niveaux RAID. L'Université de Californie en a défini 6. Chacun d'entre-eux décrit la
manière de laquelle les données sont réparties sur les disques numérotés de 0 à 5
Chacun de ces niveaux constitue un mode d'utilisation de la grappe, en fonction :
BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 9 / 14
a) Les principaux objectifs



Augmenter la capacité des disques durs. En effet, RAID permet de mettre de
bout à bout plusieurs disques durs.
Améliorer les performances. Les données sont écrites sur plusieurs disques à la
fois. Ainsi, chacun des disques durs n’a qu’une partie des données à inscrire.
Augmenter la fiabilité des archives en limitant les pannes.
b) Présentation de quelques niveaux
RAID 0 : Sécurité 0
Le RAID-0 consiste ainsi en la juxtaposition de plusieurs disques durs physiques. En mode
RAID-0 les données sont écrites par "bandes"
Disque 1
Disque 2
Disque 3
Bande 1
Bande 2
Bande 3
Bande 4
Bande 5
Bande 6
Bande 7
Bande 8
Bande 9
Si un des élements de la grappe est plus grand que les autres, le système de remplissage par
bande se trouvera bloqué lorsque le plus petit des disques sera rempli. La taille finale est ainsi
égale au double de la capacité du plus petit des deux disques :
 deux disques de 20 Go donneront un disque logique de 40 Go.
 un disque de 10 Go utilisé conjointement avec un disque de 27 Go permettra d'obtenir
un disque logique de 20 Go (17 Go du second disque seront alors inutilisés).
Il est recommandé d'utiliser des disques de même taille pour faire du RAID-0 car dans le cas
contraire le disque de plus grande capacité ne sera pas pleinement exploité
RAID 1 : disque miroir
- Cette méthode est sure mais chère car on utilise vraiment que la moitié de la capacité disque
totale (chaque donnée étant copiée deux fois)
Disque1
Disque2
Disque3
Bande 1
Bande 1
Bande 1
Bande 2
Bande 2
Bande 2
Bande 3
Bande 3
Bande 3
BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 10 / 14
RAID 5 : Le plus astucieux
Disque 1
Disque 2
Disque 3
Disque 4
Bloc 1
Bloc 2
Bloc 3
Parité 1+2+3
Bloc 4
Parité 4+5+6
Bloc 5
Bloc 6
Parité 7+8+9
Bloc 7
Bloc 8
Bloc 9
De cette façon, RAID 5 améliore grandement l'accès aux données (aussi bien en lecture qu'en
écriture) car l'accès aux bits de parités est réparti sur les différents disques de la grappe.
Le mode RAID-5 permet d'obtenir des performances très proches de celles obtenues en RAID0, tout en assurant une tolérance aux pannes élevées, c'est la raison pour laquelle c'est un des
modes RAID les plus intéressant en terme de performance et de fiabilité.
c) Performance entre les techniques les plus implantées
Les solutions RAID généralement retenues sont le RAID de niveau 1 et le RAID de niveau 5.
Le choix d'une solution RAID est lié à trois critères :
 la sécurité : RAID 1 et 5 offrent tous les deux un niveau de sécurité élevé, toutefois la
méthode de reconstruction des disques varie entre les deux solutions. En cas de panne
du système, RAID 5 reconstruit le disque manquant à partir des informations stockées
sur les autres disques, tandis que RAID 1 opère une copie disque à disque.
 Les performances : RAID 1 offre de meilleures performances que RAID 5 en lecture,
mais souffre lors d'importantes opérations d'écriture
 Le coût : le coût est directement lié à la capacité de stockage devant être mise en
oeuvre pour avoir une certaine capacité effective. La solution RAID 5 offre un volume
utile représentant 80 à 90% du volume alloué (le reste servant évidemment au contrôle
d'erreur).
Formule de calcul pour RAID 5 :

La solution RAID 1 n'offre par contre qu'un volume disponible représentant 50 % du
volume total (étant donné que les informations sont dupliquées).
d) Conclusion
e) Sujet : Extrait BTS IG DA 2008
Le serveur « SRV-SQL », récemment acquis, dispose d'un contrôleur RAID assurant les
solutions RAID1 et RAID5 et pilotant 4 disques de 300 Go.
Calculer et comparer les capacités utiles de stockage du serveur « SRV-SQL » pour chaque
solution RAID1 et RAID5. Justifier les calculs.
BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 11 / 14
III) Les bandes et les cartouches magnétiques
Les solutions de sécurité que représentent les bandes et les cartouches magnétiques
présentent l’avantage d’une grande capacité de stockage (jusqu’à 220 Go) au détriment d’un
accès lent. Compte tenu de leur coût de revient bas (environ 50 €) elles représentent un rôle
important dans les sauvegardes en informatiques.
a) La bande magnétique
La bande magnétique traditionnelle, compte tenu de son très faible coût de stockage de
l'information, a longtemps été un des supports les plus employés en archivage.
Remarques
 La lecture caractère par caractère n'est pas possible sur une bande
magnétique car celui-ci n'occupe que quelques centièmes de millimètre. On est donc
obligé de lire un ensemble suffisant de caractères à la fois (de quelques
centaines à quelques milliers).
 La qualité de la lecture ou de l'écriture exige un déplacement régulier de la bande
devant les têtes, ce qui conduit également à prévoir la lecture ou l'écriture
d'ensembles de caractères. Ces ensembles portent le nom de blocs physiques.
b) La cartouche magnétique
Les bandes traditionnelles, volumineuses et peu aisées à mettre en œuvre, ont assez tôt été
concurrencées par les cassettes et les cartouches magnétiques. On rencontre donc de
nombreux types de cartouches, cassettes ou mini-cartouches (par exemple : les Cartouches
DAT, EXABYTE, QIC, DLT, MLR ou LTO)
Caractéristiques :
 un très faible coût du caractère enregistré
 un encombrement physique relativement faible en regard du volume stocké
En revanche, elle présente aussi certains inconvénients et notamment :
 une lecture uniquement séquentielle
 un temps moyen d'accès à l'information long
 une relative sensibilité à l'environnement (poussière, humidité, ...)
BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 12 / 14
d) Applications
Exercice 1
Une installation dispose d’un dérouleur de bandes magnétiques, dont les performances sont les
suivantes :
- longueur maximale d’une bande magnétique manipulable par le dérouleur : 700 mètres,
- densité d’enregistrement sur la bande magnétique : 1 600 octets par pouces (un pouce = 2,5
cm),
- vitesse de lecture ou d’écriture par le dérouleur : 1 mètre par seconde.
Travail à faire
Calculer :
- la capacité de stockage d’une bande magnétique de 700 mètres,
- la vitesse de lecture ou d’écriture exprimée en nombre de caractères par seconde.
BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 13 / 14
Exercice 2
On veut stocker sur une bande magnétique, pour une sauvegarde, à l’aide du dérouleur dont
les caractéristiques ont été décrites dans l’exercice n°1, le contenu du fichier des 20 000
ouvrages d’une bibliothèque. L’enregistrement d’un ouvrage comporte les rubriques suivantes,
avec leurs nombres de caractères :
N° de l’ouvrage
6
Nom de l’éditeur
20
Titre
50
Nom de la collection
20
Nom/prénom de l’auteur
30
Date d’achat
6
Thème (mot clé)
10
Résumé de l’ouvrage
200
Travail à faire
- Calculer la longueur de la bande occupée par le fichier. Pour cela vous déterminerez
le nombre de caractères d’un enregistrement puis le nombre de caractères du fichier
et enfin la taille occupée par le fichier
- le temps de lecture de la totalité du fichier.
Nota : on calculera le temps théorique, supposant une lecture en continu. Dans la réalité, il y a
des arrêts en cours d’opération, rendant le temps effectif légèrement plus long que le temps
calculé théoriquement.
BTS Informatique de Gestion – AMSI 1ère année – disque dur et RAID - Page 14 / 14
Application 1
Vous allez devoir assurer la sauvegarde des bases de données qui occupent prés de 100 Go
sur le serveur de la société. En dehors de l’aspect financier, complétez le tableau ci-dessous
afin de déterminer les volumes et les temps nécessaires de sauvegarde. Proposez votre choix.
remarque 1 Go = 1 024 Mo
Matériel
Volume de Nombre de Taux de
Taux de
Temps de
Temps de
la
cartouche transfert
transfert
sauvegarde sauvegarde
cartouche
en seconde
en heureminute
Exabyte
60 Go
12 Mo/s
AIT
50 Go
6 Mo/s
DLT 800
40 Go
6 Mo/s
Super DLT
100 Go
10 Mo/s
Magstar E
20 Go
14 Mo/s
LCO Accelis
50 Go
20 Mo/s
LCO ultrium
100 Go
10 Mo/s
Application 2
Combien de temps devrait théoriquement prendre la sauvegarde des 4 disques durs de 10 Go
de votre serveur que vous devez sauvegarder sur un lecteur dont le taux de transfert est de 10
Mo/s ?
Application 3
Un lecteur Zip à disques amovibles de 250 Mo est-il une bonne solution de sauvegarde d’un
ordinateur comportant un disque dur de 15 Go ?
Application 4
Depuis votre BIOS vous lisez les informations suivantes concernant votre disque dur. Quel est
la taille du secteur en octets ?
Capacité : 850 526 208 octets
Cylindres : 824
Têtes : 32
Secteurs : 63 / pistes