CODAGE DES CARACTERES

Transcription

CODAGE DES CARACTERES
CODAGE DES CARACTERES
Document 1 : CLAVIER
Document 2 : POLICES
Document 3 : CODES ASCII
Document 4 ANSIet OEM
Document 5 : UNICODE
DOCUMENT 6 : UTF-8
ACTIVITE
A- POLICES VECTORIELLE ? ou BITMAP ?
1- expérience
a. Ouvrir le fichier police.txt dans un éditeur de texte
b.
c.
Insérer votre nom entre <p class="st1"> et </p>
Enregistrer sous le nom police.htm et ouvrir ce fichier dans le navigateur internet qui interprétera ces codes. La police
utilisée est-elle vectorielle ou bitmap
d. par des copier/coller et quelques modifications, Faire afficher également votre nom dans la même police mais en taille
10. Enregistrer et visualiser
e. Créer des nouveaux styles pour observer votre nom dans la police Arial avec les mêmes tailles que pour la police
précédente.
2. Conclusion : quelle est la différence entre une police Bitmap et une police vectorielle ?
B- Codes ASCII
Dans les années 60, le code ASCII est adopté comme standard. Il permet le codage de caractères de 128
« caractères possibles ».
1.
2.
3.
4.
5.
Rechercher sur Internet la signification d’ASCII
Combien de bits utilise le codage ASCII ?
ces codes comportent des caractères alphanumériques et des caractères de contrôles. Qu’est-ce que cela signifie ? combien
de chaque sorte ?
Pour quelle raison les codes ASCII ne sont pas suffisants pour écrire la langue française ?
Expérience
a. Ouvrir l’éditeur PSpad, taper votre prénom, passer à la ligne suivante puis taper votre nom (sans accent)
b. A l’aide de la table ASCII (tools/ascii table) vérifier le code de chaque caractère
c. Quels sont les codes non alphanumériques et leur signification ?
C- Code ANSI
Le code ASCII a été mis au point pour la langue anglaise, il ne contient donc pas de caractères accentués, ni de caractères
spécifiques à une langue. Pour coder ce type de caractère il faut recourir à un autre code. Le code ASCII a donc été étendu
à 8 bits (un octet) pour pouvoir coder plus de caractères (on parle d'ailleurs de code ASCII étendu...).
1- Le document 4 montre les codes rajoutés à l’ASCII. Montrer que ces codes sont situés entre 128 et 255.
2- Certains caractères ne sont pas accessibles directement au clavier. Pour les écrire, il faut recourir à la combinaison de
touches ALT en premier maintenu enfoncé puis le code décimal du caractère précédé ou non d’un zéro.
a. Trouver les codes décimaux des caractères spéciaux suivant : Angstrom : Å ; µ ; e dans l’a : æ ; € : euro (il remplace
le caractère 128) .
b. Ouvrir ensuite l’éditeur de texte et taper ces codes précédés ou non d’un zéro. Conclure.
D- UNICODE et UTF-8
1.
2.
3.
4.
L’Unicode est prévu pour coder des caractères présents et futur de toutes les langues et écritures + divers symboles le tout
sur 4 octets au lieu de 1 octet pour les codes ANSI. Combien de caractères peut-on coder sur 4 octet ?
Ouvrir le logiciel BABELMAP pour observer les différents codage présents sur UNICODE (utiliser la police code2000 ou 2001)
Expérience : les problèmes de compatibilité.
a. Reprendre la page police.htm, garder 1 style css en supprimant les commandes font-face. Taper les lettres
suivantes au clavier aeiou puis sur un autre paragraphe àéïôù. Modifier le charset par charset=us-ascii. Enregister
et visualiser dans le navigateur. Que se passera-t-il pour un texte français visualiser aux états-unis ? Essayer
d’autres encodages dans FIREFOX ( affichage/encodage des caractères). Qu’observe-t-on ? Que peut-on conclure ?
b. Rajouter 2 lignes dans le fichier htm. Dans BABELMAP, cliquer sur aeiou puis en bas sur le codage ACN décimal
unicode, copier les codes dans la page htm. Même chose pour les caractères àéïôù. Enregistrer puis visualiser dans
le navigateur. La page de code charset=us-ascii empêche-t-elle l’affichage correct des caractères accentués ?
Le standard UTF-8 (Unicode Transformation Format) est utilisé comme norme actuelle dans les pages htm ou les
applications Java par exemple. Il reprend l’Unicode mais utilise-t-il toujours 4 octets pour chaque caractère ? Est-il
compatible avec ASCII ? Pour vérifier Observer votre dernière page polices.htm et choisir dans le navigateur l’encodage
UTF-8.

Documents pareils