Petite explication et table de l`encodage ASCII
Transcription
Petite explication et table de l`encodage ASCII
Travaux dirigés d’algorithmique Cours d’Informatique — IMAC Première Année — L’encodage ASCII (1) • L’encodage ASCII La mémoire de l’ordinateur conserve toutes les données sous forme numérique. Il n’existe pas de méthode pour stocker directement les caractères. Chaque caractère possède donc son équivalent en code binaire : c’est le code ASCII (American Standard Code for Information Interchange). Le code ASCII de base représentait les caractères sur 7 bits (128 caractères possibles). – Les codes 0 à 31 ne sont pas des caractères. On les appelle caractères de contrôle car ils permettent de faire des actions telles que : – retour à la ligne (CR) – Bip sonore (BEL) – Les codes 65 à 90 représentent les majuscules – Les codes 97 à 122 représentent les minuscules (Il suffit de modifier le 6ème bit pour changer la casse. (25 = 32 et 97 - 65 = 32)) • L’encodage ASCII Étendu Le code ASCII a été mis au point pour la langue anglaise, il ne contient donc pas de caractères accentués, ni de caractères spécifiques à une langue. Pour coder ce type de caractère il faut recourir à un autre code. Le code ASCII a donc été étendu à 8 bits (un octet) pour pouvoir coder plus de caractères (on parle d’ailleurs de code ASCII étendu...). Ce code attribue les valeurs 0 à 255 (donc codées sur 8 bits, soit 1 octet) aux lettres majuscules et minuscules, aux chiffres, aux marques de ponctuation et aux autres symboles (caractères accentués dans le cas du code iso-latin1). Le code ASCII étendu n’est pas unique et dépend fortement de la plateforme. (1). source : commentcamarche.net 1 Table de caractère ASCII sur 7 bits caractère NUL (Null) SOH (Start of heading) STX (Start of text) ETX (End of text) EOT (End of transmission) ENQ (Enquiry) ACK (Acknowledge) BEL (Bell) BS (Backspace) TAB (Tabulation) LF (Line Feed) VT (Vertical tabulation) FF (Form feed) CR (Carriage return) SO (Shift out) SI (Shift in) caractère SP (Space) ! ” # $ % & ’ ( ) * + , . / 0 1 2 3 4 5 6 7 code ASCII 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 code ASCII 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 caractère 8 9 : ; < = > ? @ A B C D E F G H I J K L M N O caractère DLE (Data link escape) DC1 (Device control 1) DC2 (Device control 2) DC3 (Device control 3) DC4 (Device control 4) NAK (Negative acknowledgement) SYN (Synchronous idle) ETB (End of transmission block) CAN (Cancel, annulation) EM (End of medium) SUB (Substitute) ESC (Escape) FS (File separator) GS (Group separator) RS (Record separator) US (Unit separator) code ASCII 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 caractère P Q R S T U V W X Y Z [ \ ] ∧ ‘ a b c d e f g 2 code ASCII 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 code ASCII 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 caractère h i j k l m n o p q r s t u v w x y z { | } ∼ (Delete key) code ASCII 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127