l`univers numerique le codage du texte
Transcription
l`univers numerique le codage du texte
L’UNIVERS NUMERIQUE LE CODAGE DU TEXTE EXERCICE N°1 : Lancer le programme « TabCar ». Cette application permet de donner les valeurs décimales, hexadécimale, binaire et l’aperçu d’un caractère en cliquant sur celui-ci dans la table proposée. 1 / Quelle est la valeur maximale du code numérique d'un caractère et combien faut-il d'octets pour l'écrire en base 2? La plus grande valeur est (255)10 = $ FF = % 11111111 Il faut 1 octet par caractère 2 / Combien de cases contient chaque table ? 256 cases La liste déroulante en haut de la fenêtre permet de choisir la police d'affichage. Selon la police choisie, certains codes peuvent désigner des caractères très différents. Lorsqu'un code est représenté par un carré ou un rectangle vide ou noir, c'est qu'il n'y a pas de caractère associé dans la police choisie. Certains codes désignent toujours les mêmes caractères, bien qu'avec un dessin un peu différent et quelle que soit la police choisie (à l'exception bien sûr des polices à vocation graphique ou décorative comme WingDing et Marlett, et de la police Symbol, à vocation mathématique). 3 / Comparez par exemple les polices Arial, Comic Sans, MS Serif et Terminal. Dans quelle partie de la grille se trouvent les caractères qui sont toujours désignés par les mêmes codes? De l'espace (3ème ligne première case) au tilde ~ (8 ème ligne avant dernière case) ............................................................................................................................................................ 4 / Pourquoi à votre avis a-t-il été décidé que ces caractères-là auraient toujours les mêmes codes ? Ce sont les caractères d'usage courant : lettres de l'alphabet, chiffres, ponctuation. (ils sont suffisants pour tout écrire en anglais) Avec les trente-deux codes qui les précèdent, ces caractères et leurs codes forment le code ASCII standard. (ASCII=American Standard Code for Information Interchange). 5 / Combien le code ASCII standard compte-t-il de caractères ? Combien faut-il au minimum de bits pour écrire un code ASCII standard ? A raison de 16 caractères sur 8 lignes, -1 (dernière ligne incomplète) : 16 x 8-1=127 . Il suffit donc de 7 digits pour écrire tous les codes ASCII standards. 6 / Quelle est la police dans laquelle pratiquement tous les codes ont un caractère associé ? Police Terminal BAC Pro SEN L’UNIVERS NUMERIQUE Corrigé Activité 2 Le codage du texte Page 1 Cette police permet de visualiser le code ASCII étendu. Il comprend des caractères accentués, des caractères utilitaires (comme © ) et des caractères semi-graphiques qui permettent de tracer des tableaux ou des dessins sur les écrans ne pouvant afficher que du texte (type minitel). 7 / Complétez le tableau suivant : C e c i Espace e s t Espace Code Hexadécimal 43 65 63 69 20 65 73 74 20 Code décimal 67 101 99 105 31 100 115 116 32 u n Espace t e s t ! Saut de ligne Code Hexadécimal 75 6E 20 74 65 73 74 21 0A Code décimal 117 110 32 116 101 115 116 33 10 8 / Combien d’octets faut-il pour coder cette phrase ? 18 octets 9 / Lancez l’application « Bloc-notes » de Windows ( Démarrer Tous les programmes Accessoires Blocnotes » et saisissez le texte du tableau précédent. Enregistrez le fichier sur votre bureau sous le nom « Act2_Univ_Num ». Lancez l’application « Exafich » puis ouvrez le fichier précédent « Act2_Univ_Num ». Obtenez-vous les mêmes réponses que celles données aux questions 7 et 8 ? Quelle est la différence ? Univ_Num_Act2.txt / 19 octets / 43-65-63-69-20-65-73-74-20-75-6E-20-74-65-73-74-21-0D-0APratiquement les mêmes réponses. Un octet a été rajouté « $0D » correspondant au retour chariot EXERCICE N°2 : .Pour chaque ligne du tableau ci-après effectuez les taches suivantes : o Lancer l’application « Bloc-notes » de Windows ( Démarrer Tous les programmes Accessoires Bloc-notes ») o Saisir le (ou les) caractère(s) demandé(s). o Enregistrer le fichier sous le nom demandé avec le type de codage indiqué dans un dossier nommé « Univ_Num » o Fermer le fichier o Faire un clic-droit sur le fichier puis cliquer sur « Propriétés » et noter la taille du fichier Nom fichier 1_ANSI 2_ANSI 1_Uni 2_Uni 1_UBE 2_UBE 1_UTF 2_UTF Caractères a ab a ab a ab a ab Codage ANSI ANSI Unicode Unicode Unicode big endian Unicode big endian UTF-8 UTF-8 Taille 1 2 4 6 4 6 4 5 Conclusion :.................................................................................................................................................. ..................................................................................................................................................................... BAC Pro SEN L’UNIVERS NUMERIQUE Corrigé Activité 2 Le codage du texte Page 2 EXERCICE N°3 : Codage de fichiers texte Lancer le programme « Exafich ». Le menu « Nouveau fichier » permet de choisir un fichier dont on veut examiner le contenu. Le contenu numérique du fichier s'affiche dans la partie gauche, par lignes de 16 octets, au format hexadécimal ou décimal suivant le choix effectué. A droite, les caractères correspondant, en code ASCII, sont affichés également par ligne de 16. Chaque page contient au maximum 32 lignes de 16 octets, c'est à dire 512 octets. Si le fichier contient plus de 512 octets on peut faire défiler les pages en utilisant les boutons en haut de la fenêtre. Format texte brut Dans « Exafich », choisir 'Nouveau fichier' et ouvrir « texte.txt ». Ce fichier contient le texte suivant : Ce fichier texte pur ne contient que les codes correspondants aux lettres du texte et à quelques caractères de contrôle comme le retour à la ligne ou la tabulation. Vous pourriez le lire en l'ouvrant avec le « bloc-notes », et en sélectionnant dans celui-ci la police Terminal dans le menu « Format » pour voir correctement les caractères accentués. 1 / Le second mot « texte » et le mot « ligne » sont suivis de codes de contrôle permettant le retour à la ligne en début de ligne. Quels sont ces codes ? Retour à la ligne : 13 (hexa:(H)0D) , retour au début de ligne : 10 (hexa:(H)0A) 2 / Avant le mot « tabulation » se trouvent deux signes de tabulation. Quel est le code de contrôle de la tabulation ? tabulation :code 9 Les caractères de contrôle sont aussi dits 'non imprimables' car ils correspondent à des commandes pour l'imprimante. Leurs codes sont compris entre 1 et 31. Format texte enrichi Ouvrir à l'aide d’ « Exafich » le fichier « Enrichi.rtf ». Tous les traitements de texte un peu évolués (donc pas le bloc-notes!) reconnaissent ce format et permettent d'afficher son contenu ainsi : 3 / Que contient le fichier en plus du texte ci-dessus ? Le fichier rtf contient un en-tête assez long, précédent le texte proprement dit, ainsi que des indications de formatage (italique, gras, couleur....) à l'intérieur du texte. Toutes ces indications sont toutefois codées 'en clair' (et en anglais) BAC Pro SEN L’UNIVERS NUMERIQUE Corrigé Activité 2 Le codage du texte Page 3 4 / Dans ce format : comment met-on en mot en italique ? En gras ? Le mot (ou le texte ) mis en italique est entouré des indicateurs \i et \i0 (début et fin de la mise en italique respectivement). Pour mettre en gras : \b et \b0 (b pour bold) . Pour souligner , \ul et \ulnone (ul pour underline) .................................................................................................................................................................. Remarque : le format RTF est codé 'en clair' et très facile à déchiffrer, son mode de codage est très proche de celui des pages Web (html). Si vous ouvrez avec exafich un fichier au format WordPro (*.lwp) ou Word (*.doc) vous constaterez que le codage en est beaucoup moins lisible! BAC Pro SEN L’UNIVERS NUMERIQUE Corrigé Activité 2 Le codage du texte Page 4