CODAGE DES CARACTERES
Transcription
CODAGE DES CARACTERES
CODAGE DES CARACTERES Document 1 : CLAVIER Document 2 : POLICES Document 3 : CODES ASCII Document 4 ANSIet OEM Document 5 : UNICODE DOCUMENT 6 : UTF-8 ACTIVITE A- POLICES VECTORIELLE ? ou BITMAP ? 1- expérience a. Ouvrir le fichier police.txt dans un éditeur de texte b. c. Insérer votre nom entre <p class="st1"> et </p> Enregistrer sous le nom police.htm et ouvrir ce fichier dans le navigateur internet qui interprétera ces codes. La police utilisée est-elle vectorielle ou bitmap d. par des copier/coller et quelques modifications, Faire afficher également votre nom dans la même police mais en taille 10. Enregistrer et visualiser e. Créer des nouveaux styles pour observer votre nom dans la police Arial avec les mêmes tailles que pour la police précédente. 2. Conclusion : quelle est la différence entre une police Bitmap et une police vectorielle ? B- Codes ASCII Dans les années 60, le code ASCII est adopté comme standard. Il permet le codage de caractères de 128 « caractères possibles ». 1. 2. 3. 4. 5. Rechercher sur Internet la signification d’ASCII Combien de bits utilise le codage ASCII ? ces codes comportent des caractères alphanumériques et des caractères de contrôles. Qu’est-ce que cela signifie ? combien de chaque sorte ? Pour quelle raison les codes ASCII ne sont pas suffisants pour écrire la langue française ? Expérience a. Ouvrir l’éditeur PSpad, taper votre prénom, passer à la ligne suivante puis taper votre nom (sans accent) b. A l’aide de la table ASCII (tools/ascii table) vérifier le code de chaque caractère c. Quels sont les codes non alphanumériques et leur signification ? C- Code ANSI Le code ASCII a été mis au point pour la langue anglaise, il ne contient donc pas de caractères accentués, ni de caractères spécifiques à une langue. Pour coder ce type de caractère il faut recourir à un autre code. Le code ASCII a donc été étendu à 8 bits (un octet) pour pouvoir coder plus de caractères (on parle d'ailleurs de code ASCII étendu...). 1- Le document 4 montre les codes rajoutés à l’ASCII. Montrer que ces codes sont situés entre 128 et 255. 2- Certains caractères ne sont pas accessibles directement au clavier. Pour les écrire, il faut recourir à la combinaison de touches ALT en premier maintenu enfoncé puis le code décimal du caractère précédé ou non d’un zéro. a. Trouver les codes décimaux des caractères spéciaux suivant : Angstrom : Å ; µ ; e dans l’a : æ ; € : euro (il remplace le caractère 128) . b. Ouvrir ensuite l’éditeur de texte et taper ces codes précédés ou non d’un zéro. Conclure. D- UNICODE et UTF-8 1. 2. 3. 4. L’Unicode est prévu pour coder des caractères présents et futur de toutes les langues et écritures + divers symboles le tout sur 4 octets au lieu de 1 octet pour les codes ANSI. Combien de caractères peut-on coder sur 4 octet ? Ouvrir le logiciel BABELMAP pour observer les différents codage présents sur UNICODE (utiliser la police code2000 ou 2001) Expérience : les problèmes de compatibilité. a. Reprendre la page police.htm, garder 1 style css en supprimant les commandes font-face. Taper les lettres suivantes au clavier aeiou puis sur un autre paragraphe àéïôù. Modifier le charset par charset=us-ascii. Enregister et visualiser dans le navigateur. Que se passera-t-il pour un texte français visualiser aux états-unis ? Essayer d’autres encodages dans FIREFOX ( affichage/encodage des caractères). Qu’observe-t-on ? Que peut-on conclure ? b. Rajouter 2 lignes dans le fichier htm. Dans BABELMAP, cliquer sur aeiou puis en bas sur le codage ACN décimal unicode, copier les codes dans la page htm. Même chose pour les caractères àéïôù. Enregistrer puis visualiser dans le navigateur. La page de code charset=us-ascii empêche-t-elle l’affichage correct des caractères accentués ? Le standard UTF-8 (Unicode Transformation Format) est utilisé comme norme actuelle dans les pages htm ou les applications Java par exemple. Il reprend l’Unicode mais utilise-t-il toujours 4 octets pour chaque caractère ? Est-il compatible avec ASCII ? Pour vérifier Observer votre dernière page polices.htm et choisir dans le navigateur l’encodage UTF-8.