l`univers numerique le codage du texte

Transcription

l`univers numerique le codage du texte
L’UNIVERS NUMERIQUE
LE CODAGE DU TEXTE
EXERCICE N°1 :
Lancer le programme « TabCar ». Cette application permet de donner
les valeurs décimales, hexadécimale, binaire et l’aperçu d’un caractère
en cliquant sur celui-ci dans la table proposée.
1 / Quelle est la valeur maximale du code numérique d'un caractère et
combien faut-il d'octets pour l'écrire en base 2?
La plus grande valeur est (255)10 = $ FF = % 11111111
Il faut 1 octet par caractère
2 / Combien de cases contient chaque table ?
256 cases
La liste déroulante en haut de la fenêtre permet de choisir la police d'affichage. Selon la police choisie, certains
codes peuvent désigner des caractères très différents. Lorsqu'un code est représenté par un carré ou un rectangle
vide ou noir, c'est qu'il n'y a pas de caractère associé dans la police choisie.
Certains codes désignent toujours les mêmes caractères, bien qu'avec un dessin un peu différent et quelle que soit
la police choisie (à l'exception bien sûr des polices à vocation graphique ou décorative comme WingDing et Marlett,
et de la police Symbol, à vocation mathématique).
3 / Comparez par exemple les polices Arial, Comic Sans, MS Serif et Terminal. Dans quelle partie de la grille se
trouvent les caractères qui sont toujours désignés par les mêmes codes?
De l'espace (3ème ligne première case) au tilde ~ (8
ème
ligne avant dernière case)
............................................................................................................................................................
4 / Pourquoi à votre avis a-t-il été décidé que ces caractères-là auraient toujours les mêmes codes ?
Ce sont les caractères d'usage courant : lettres de l'alphabet, chiffres, ponctuation. (ils sont suffisants
pour tout écrire en anglais)
Avec les trente-deux codes qui les précèdent, ces caractères et leurs codes forment le code ASCII standard.
(ASCII=American Standard Code for Information Interchange).
5 / Combien le code ASCII standard compte-t-il de caractères ? Combien faut-il au minimum de bits pour écrire
un code ASCII standard ?
A raison de 16 caractères sur 8 lignes, -1 (dernière ligne incomplète) : 16 x 8-1=127 . Il suffit donc de 7
digits pour écrire tous les codes ASCII standards.
6 / Quelle est la police dans laquelle pratiquement tous les codes ont un caractère associé ?
Police Terminal
BAC Pro
SEN
L’UNIVERS NUMERIQUE
Corrigé Activité 2
Le codage du texte
Page 1
Cette police permet de visualiser le code ASCII étendu. Il comprend des caractères accentués, des caractères
utilitaires (comme © ) et des caractères semi-graphiques qui permettent de tracer des tableaux ou des dessins sur
les écrans ne pouvant afficher que du texte (type minitel).
7 / Complétez le tableau suivant :
C
e
c
i
Espace
e
s
t
Espace
Code Hexadécimal
43
65
63
69
20
65
73
74
20
Code décimal
67
101
99
105
31
100
115
116
32
u
n
Espace
t
e
s
t
!
Saut de
ligne
Code Hexadécimal
75
6E
20
74
65
73
74
21
0A
Code décimal
117
110
32
116
101
115
116
33
10
8 / Combien d’octets faut-il pour coder cette phrase ?
18 octets
9 / Lancez l’application « Bloc-notes » de Windows ( Démarrer  Tous les programmes  Accessoires  Blocnotes » et saisissez le texte du tableau précédent.
Enregistrez le fichier sur votre bureau sous le nom « Act2_Univ_Num ».
Lancez l’application « Exafich » puis ouvrez le fichier précédent « Act2_Univ_Num ».
Obtenez-vous les mêmes réponses que celles données aux questions 7 et 8 ? Quelle est la différence ?
Univ_Num_Act2.txt / 19 octets / 43-65-63-69-20-65-73-74-20-75-6E-20-74-65-73-74-21-0D-0APratiquement les mêmes réponses. Un octet a été rajouté « $0D » correspondant au retour chariot
EXERCICE N°2 : .Pour chaque ligne du tableau ci-après effectuez les taches suivantes :
o Lancer l’application « Bloc-notes » de Windows ( Démarrer  Tous les programmes  Accessoires  Bloc-notes »)
o Saisir le (ou les) caractère(s) demandé(s).
o Enregistrer le fichier sous le nom demandé avec le type de codage indiqué dans un dossier nommé
« Univ_Num »
o Fermer le fichier
o Faire un clic-droit sur le fichier puis cliquer sur « Propriétés » et noter la taille du fichier
Nom fichier
1_ANSI
2_ANSI
1_Uni
2_Uni
1_UBE
2_UBE
1_UTF
2_UTF
Caractères
a
ab
a
ab
a
ab
a
ab
Codage
ANSI
ANSI
Unicode
Unicode
Unicode
big endian
Unicode
big endian
UTF-8
UTF-8
Taille
1
2
4
6
4
6
4
5
Conclusion :..................................................................................................................................................
.....................................................................................................................................................................
BAC Pro
SEN
L’UNIVERS NUMERIQUE
Corrigé Activité 2
Le codage du texte
Page 2
EXERCICE N°3 : Codage de fichiers texte
Lancer le programme « Exafich ».
Le menu « Nouveau fichier » permet de choisir un fichier dont on veut examiner le contenu.
Le contenu numérique du fichier s'affiche dans la partie gauche, par lignes de 16 octets, au format hexadécimal ou
décimal suivant le choix effectué. A droite, les caractères correspondant, en code ASCII, sont affichés également
par ligne de 16.
Chaque page contient au maximum 32 lignes de 16 octets, c'est à dire 512 octets. Si le fichier contient plus de 512
octets on peut faire défiler les pages en utilisant les boutons en haut de la fenêtre.
Format texte brut
Dans « Exafich », choisir 'Nouveau fichier' et ouvrir « texte.txt ». Ce fichier contient le texte suivant :
Ce fichier texte pur ne contient que les codes correspondants aux lettres du texte et à quelques caractères de
contrôle comme le retour à la ligne ou la tabulation.
Vous pourriez le lire en l'ouvrant avec le « bloc-notes », et en sélectionnant dans celui-ci la police Terminal
dans le menu « Format » pour voir correctement les caractères accentués.
1 / Le second mot « texte » et le mot « ligne » sont suivis de codes de contrôle permettant le retour à la
ligne en début de ligne. Quels sont ces codes ?
Retour à la ligne : 13 (hexa:(H)0D) ,
retour au début de ligne : 10 (hexa:(H)0A)
2 / Avant le mot « tabulation » se trouvent deux signes de tabulation. Quel est le code de contrôle de la
tabulation ?
tabulation :code 9
Les caractères de contrôle sont aussi dits 'non imprimables' car ils correspondent à des commandes pour
l'imprimante. Leurs codes sont compris entre 1 et 31.
Format texte enrichi
Ouvrir à l'aide d’ « Exafich » le fichier « Enrichi.rtf ». Tous les traitements de texte un peu évolués (donc pas
le bloc-notes!) reconnaissent ce format et permettent d'afficher son contenu ainsi :
3 / Que contient le fichier en plus du texte ci-dessus ?
Le fichier rtf contient un en-tête assez long, précédent le texte proprement dit, ainsi que des indications
de formatage (italique, gras, couleur....) à l'intérieur du texte.
Toutes ces indications sont toutefois codées 'en clair' (et en anglais)
BAC Pro
SEN
L’UNIVERS NUMERIQUE
Corrigé Activité 2
Le codage du texte
Page 3
4 / Dans ce format : comment met-on en mot en italique ? En gras ?
Le mot (ou le texte ) mis en italique est entouré des indicateurs \i et \i0 (début et fin de la mise
en italique respectivement).
Pour mettre en gras : \b et \b0 (b pour bold) .
Pour souligner , \ul et \ulnone (ul pour underline)
..................................................................................................................................................................
Remarque : le format RTF est codé 'en clair' et très facile à déchiffrer, son mode de codage est très proche de
celui des pages Web (html). Si vous ouvrez avec exafich un fichier au format WordPro (*.lwp) ou Word (*.doc)
vous constaterez que le codage en est beaucoup moins lisible!
BAC Pro
SEN
L’UNIVERS NUMERIQUE
Corrigé Activité 2
Le codage du texte
Page 4

Documents pareils