Le traitement des images

Transcription

Le traitement des images
Département
•
Codage
Education et
•
Capture
•
Traitement
Technologie
LE TRAITEMENT DES IMAGES
Monique Colinet
5.86
Mai 2004
Centre pour la formation à
l’Informatique dans le Secondaire
Le traitement des images
Objectifs
Ce document est consacré spécialement aux images (dessins, photos, graphiques, schémas,...).
La compréhension de la manière dont est codée une image pour sa restitution sur écran ou sur
imprimante paraît fondamentale. Sa numérisation permettra de comprendre par exemple,
pourquoi une image récupérée sur Internet et affichée sur tout l’écran dans le navigateur ne sera
qu’une petite icône lors de l’impression.
Le traitement que peut subir une image par l’intermédiaire d’un logiciel de retouche d’images
pourra, pour le cas précédent, permettre son impression dans la taille adéquate.
Codage BITMAP
Une manière de procéder pour numériser une image est de la découper en zones élémentaires,
rectangulaires et uniformément colorées.
Monique Colinet
CeFIS - FUNDP
Page 2
Le traitement des images
Une image numérique est donc constitutée de pixels1 (picture elements), le pixel étant la plus
petite surface homogène d’une image, il est en quelque sorte l’équivalent d’un point.
Définition:
Une image est définie par :
- le nombre de pixels qui la composent en largeur et en hauteur,
- l’étendue des teintes de gris ou des couleurs que peut prendre chaque pixel.
Une image numérique en elle-même est en fait un concept tout à fait abstrait (des données
numériques) qui ne trouve une signification à nos yeux qu’à la visualisation (à l’écran ou à
l’impression) lorsqu’on utilise un logiciel adéquat.
Voici d’ailleurs les informations données sur l’image précédente:
Nombre de pixels
Informations sur la couleur
Nombre de pixels et résolution
Il est clair que la qualité de l’image électronique est d’autant meilleure que le nombre de pixels
utilisés pour la décrire est élevé. On parle d’ailleurs souvent de résolution de l’image.
La résolution d’une image est définie par le nombre de pixels par unité de longueur. Plus on a
de points (ou pixels) par pouce2 (ppp) ou dot per inch (dpi) en anglais, meilleure est la qualité
de l’image.
Ce paramètre est déterminé lors de la numérisation de l’image et peut varier selon les
performances du matériel utilisé pour la numérisation (scanner ou appareil photo numérique).
Plus le nombre de pixels est élevé par unité de longueur, plus la quantité d’informations qui
décrit l’image est importante et plus la résolution est élevée. On peut également dire que la
résolution de l’image définit le degré de détail qui sera présent dans cette image.
La résolution d’une image ne peut être déterminé qu’au moment de sa numérisation. Il est aussi
à noter que certains appareils de numérisation (scanner ou appareil photo numérique) permettent
de faire varier la résolution lors de l’acquisition.
1
Pixel: élément le plus petit d’une surface d’affichage auquel on puisse associer
individuellement une couleur.(Grand Dictionnaire Terminologique)
2
Pouce: 1 pouce = 2,54 cm
Monique Colinet
CeFIS - FUNDP
Page 3
Le traitement des images
Le terme “résolution” est parfois ambigu dans le sens où il a des significations différentes
suivant son utilisation.
La résolution d’une image est le nombre de pixels qu’elle comporte en largeur et en hauteur
tandis que la résolution d’un scanner3 (ou d’un appareil photo numérique) est le nombre de pixels
par pouce (ppp) que cet appareil est capable de capter lors de l’acquisition d’une image.
D’autre part, les résolutions d’un écran et d’une imprimante peuvent encore semer le trouble
dans notre esprit, puisqu’elles sont encore différentes. Nous les détaillerons plus loin.
Résolution d’une image scannée et son nombre de pixels.
Exemple d’une image de 1 x 1 pouce :
Scannée avec une
résolution de :
Elle aura un nombre de
pixels de :
200 dpi (200 pixels par
pouce)
200 x 200 = 40 000 pixels
100 dpi (100 pixels par
pouce)
100 x 100 = 10 000 pixels
75 dpi (75 pixels par
pouce)
75 x 75 = 5 625 pixels
50 dpi (50 pixels par
pouce)
50 x 50 = 2 500 pixels
25 dpi (25 pixels par
pouce)
25 * 25 = 625 pixels
Affichage réel à l’écran ou à
l’impression :
Remarque :les dimensions des images ci-dessus ne sont pas exactes étant donné qu’il faut
également tenir compte de la résolution de l’imprimante.
Reprenons maintenant ces différentes images et observons-les avec la même taille (les mêmes
dimensions en largeur et en hauteur) à l’écran et sur papier.
3
Voir plus loin des caractéristiques d’un scanner
Monique Colinet
CeFIS - FUNDP
Page 4
Le traitement des images
Scannée avec une
résolution de :
Elle aura un nombre de
pixels de :
200 dpi (200 pixels par
pouce)
200 x 200 = 40 000 pixels
100 dpi (100 pixels par
pouce)
100 x 100 = 10 000 pixels
75 dpi (75 pixels par
pouce)
75 x 75 = 5 625 pixels
50 dpi (50 pixels par
pouce)
50 x 50 = 2 500 pixels
25 dpi (25 pixels par
pouce)
25 * 25 = 625 pixels
Affichage à la même taille à
l’écran et à l’impression :
On observe que plus la résolution diminue, plus la précision diminue. L’objet est, en effet,
représenté par un nombre de pixels moins important.
Monique Colinet
CeFIS - FUNDP
Page 5
Le traitement des images
Le choix de la résolution lors de la numérisation est donc un facteur important.
La résolution d’un écran
La résolution d’une image à l’écran dépend de deux facteurs.
1. Les dimensions de l’écran (ou moniteur)
La taille d’un moniteur se mesure également en pouces. Les dimensions les plus couramment
rencontrées sont 15, 17, 19 ou 21 pouces. Ces mesures représentent la diagonale de l’écran.
Mesure de
l’écran en pouces
2. La résolution d’affichage
Cette résolution se choisit aussi en pixels
Affichage en pixels
640 x 480 pixels
800 x 600 pixels
1024 x 768 pixels
1280 x 1024 pixels
A partir de ces deux renseignements, il est possible de calculer la résolution de l’écran.
Exemple : Soit un écran de 15 pouces dont l’affichage est de 800 x 600 pixels.
La diagonale de cet écran contient 1000 pixels. Rappelez-vous du
théorème de Pythagore lors de vos chères études!
Ces 1000 pixels sont répartis sur 15 pouces.
Il y a donc 1000/15 = 66,6... pixels par pouce.
La résolution de cet écran est de 66 dpi.
Remarque: pour connaître l’affichage écran de votre moniteur, plusieurs possibilités existent. En
voici une.
Par l’intermédiaire du bouton Démarrer puis du menu Paramètres - Panneau de
configuration, choisissez
. Dans la nouvelle fenêtre, choisissez l’onglet Paramètres.
Cette dernière fenêtre donne les caractéristiques de l’affichage du moniteur.
Monique Colinet
CeFIS - FUNDP
Page 6
Le traitement des images
Il est bien entendu possible de modifier ces caractéristiques.
La résolution d’une imprimante
Pour connaître la résolution de l’imprimante, il faut regarder dans les paramètres de
configuration de l’imprimante. C’est possible aussi par l’intermédiaire du panneau de
configuration. Cette fois, il faut choisir
, puis sélectionner l’imprimante souhaitée.
Un clic droit permet l’ouverture d’un menu contextuel qui donne accès aux propriétés de cette
imprimante.
Les différentes options des propriétés vont dépendre du type d’imprimante mais généralement,
il est possible d’en connaître la résolution, voire même d’en changer.
Informations sur la couleur de chaque pixel ou profondeur4 de l’image
Comme cela a été signalé précédemment, une autre donnée essentielle concernant la
numérisation des images est l’information de couleur de chacun des pixels.
4
Profondeur d’une image : nombre de bits associés à chacun des pixels d’une image
afin de coder les couleurs (Grand Dictionnaire Terminologique)
Monique Colinet
CeFIS - FUNDP
Page 7
Le traitement des images
Cette information de couleur va dépendre du nombre de valeurs numériques que l’on veut
attribuer à chaque pixel.
Pour les images les plus simples (noir et blanc), un pixel peut prendre uniquement la valeur noir
ou blanc. Le codage peut se faire alors sur 1 bit : 0 correspond au noir et 1 correspond au blanc.
Pour des images en niveau de gris, on dispose de 256 nuances entre le noir et le blanc.
Pour les images en couleurs, un pixel doit pouvoir prendre beaucoup plus de valeurs différentes.
La valeur de chacun d’entre-eux est habituellement enregistrée sous la forme de trois nombres
binaires à 8 bits (d’une valeur de 0 à 255), correspondant respectivement à chacune des couleurs
primaires : rouge, vert et bleu. Cela donne une gamme de 256 x 256 x 256 couleurs possibles
(soit 16 777 216 couleurs). On obtient une image de couleur dite à 24 bits ou encore en couleurs
vraies.
Valeur
R
Valeur
V
Valeur
B
Couleur correspondante
Commentaire
0
0
0
noir
un peu moins noir
(nuance impossible de
détecter à l’oeil par
rapport au noir)
0
0
1
...
...
...
0
0
255
...
...
...
0
255
0
...
...
...
255
0
0
...
...
...
128
128
128
couleur intermédiaire
correspondant à un gris
255
255
255
blanc
...
...
bleu
...
...
vert
...
...
rouge
...
...
L’information couleur de chaque pixel est donc codée sur 3 octets5. Ce qui entraîne des fichiers
volumineux.
Il existe plusieurs modèles de codage des couleurs:
- le modèle RGB (ou RVB): système additif. Le modèle additif se prête aux couleurs qui
seront restituées sur des périphériques de sortie tels que les moniteurs, les téléviseurs, les
projecteurs.
5
1 octet = 8 bits
Monique Colinet
CeFIS - FUNDP
Page 8
Le traitement des images
- le modèle CMYK (ou CMJN): système soustractif. Ce modèle est utilisé dans le domaine
de l’impression.
- le modèle HSL (ou TSL): teinte - saturation (appelée aussi chrominance) - luminosité
(parfois appelée luminance). Ce modèle se fonde sur la perception des couleurs par l’oeil
humain, celles-ci étant définies en fonction de trois caractéristiques fondamentales:
- La teinte est l’impression de couleur proprement dite. La teinte correspond à un
emplacement sur la roue chromatique, plus exactement à un angle compris entre 0° et 360°;
- La saturation désigne la pureté d’une couleur. Elle correspond à la quantité de gris contenu
dans une teinte et s’exprime sous forme de pourcentage, compris entre 0% (gris) et 100%
(saturation totale);
- La luminosité décrit le degré de luminosité de la couleur. Il s’agit d’un pourcentage compris
entre 0% (noir) et 100% (blanc).
Ce modèle de couleur n’est pas directement utilisé en informatique mais la plupart des logiciels
de retouche d’images le propose. Les composantes HSL sont alors converties en RVB.
Les principaux modes de codage sont les suivants:
Type de
codage
Nombre de
bits par pixel
valeurs
possibles
Interprétation de ces valeurs
trait
1 bit
0 ou 1
0 = noir, 1 = blanc
nuances de
gris
8 bits
de 0 à 255
256 niveaux de gris, entre le noir (0) et le
blanc (1)
couleurs
réelles (true
color)
RVB
24 bits (3x8)
3 valeurs
de 0 à 255
chaque valeur représente une intensité de
rouge, de vert ou de bleu. 0 = pas de couleur,
255 = intensité maximale. On obtient ainsi 16
millions de couleurs.
Couleurs
indexées par
une palette
8 bits
de 0 à 255
une table appelée palette établit la
correspondance entre ces 256 numéros de
couleur et les couleurs réelles qu’ils
représentent, codées dans le mode RVB
Remarque: Il est fréquent de rencontrer des problèmes de couleurs lors du collage d’une image
codée par palette donc 8 bits dans une autre: les mêmes indices ne référant pas forcément les
mêmes couleurs. C’est l’image hôte qui impose sa palette. Dans le cas d’un montage, il vaut
mieux utiliser les “couleurs vraies” ou couleurs RVB.
Taille des fichiers images
Pour connaître la taille (en octets) d’une image, il suffit de connaître le nombre de pixels qui la
compose ainsi que la profondeur (taille en octets) de chaque pixel.
Monique Colinet
CeFIS - FUNDP
Page 9
Le traitement des images
Dimensions de
l’image (pixels)
image en noir et
blanc (1 bit par
pixel)
image en 256
niveaux de gris
(8 bits par pixel)
image en
couleurs RVB
(24 bits par
pixel)
320 x 240
320 x 240 x1 =
76800 bits ou
9600 octets ou
encore 9,4 Ko6
320 x 240 x 8 =
614400bits ou
76800 octets ou
75 Ko
320 x 240 x 24 =
1843200 bits ou
230400 octets ou
225 Ko
640 x 480
37,5 Ko
300 Ko
900 Ko
800 x 600
58,6 Ko
468,7 Ko
1,4 Mo7
1024 x 768
96 Ko
768 Ko
2,3 Mo
Pour réduire la taille de certaines images couleurs, il est possible de réduire la profondeur des
pixels en les codant sur un octet au lieu de trois. Le nombre de couleurs différentes possibles est
alors de 256. A chaque pixel sera affecté une valeur comprise entre 0 et 255. A chacun de ces
nombres va correspondre une couleur stockée dans une palette avec les données de l’image. On
parle de couleurs indexées.
Remarque : chaque image contenant 256 couleurs peut “contenir” n’importe laquelle des 16
millions de couleurs disponibles dans l’espace RVB.
Exemple : C’est toujours la même image mais cette fois elle est codée sur 8 bits et une palette8
lui est associée.
6
1Ko (kilo-octet) = 1 024 octets (210 octets)
7
1 Mo (méga-octet) = 1 048 576 octets (220 octets)
8
Palette : table de conversion dont chaque entrée définit une couleur particulière à
l’aide des valeurs des intensités de rouge, de vert et de bleu. (Grand Dictionnaire
Terminologique). Les 256 couleurs de la palette peuvent être choisies parmi les 16 millions
possible.
Monique Colinet
CeFIS - FUNDP
Page 10
Le traitement des images
Les pixels qui portent le numéro 105 dans
le fichier image seront associés lors de
l’affichage à la couleur
R:162, V: 66, B: 13
Si la palette associée à l’image change, la
visualisation de l’image change.
Les principaux formats de fichiers
Comme cela est expliqué depuis le début,
les images numériques sont codées point
par point. Le format originel de ces
images est appelé format BITMAP9. Les
fichiers images bitmap portent l’extension
.bmp.
Devant le volume énorme d’informations
contenu dans les fichiers bitmap, les informaticiens ont développé des algorithmes de
compression10 (et des formats de fichiers capables d’être lus par différents logiciels et systèmes
d’exploitation).
Il existe différents types de compression qui déterminent des formats compressés pour les
fichiers images. L’intérêt de tels formats est qu’ils permettent de compresser une image pour
qu’elle soit moins lourde lors de l’affichage ou du stockage en mémoire. Mais surtout, en
réduisant la taille des fichiers, on assure un transfert plus rapide sur Internet.
Certains modes de compression dits “conservateurs”, restituent une image originale après un
cycle de compression/décompression. Les compressions avec perte de données éliminent
certaines informations qui ne sont pas indispensables pour l’appréciation visuelle des images par
un oeil humain.
Le format JPEG (Join Photo Expert Group)
Ce format est la représentation d’une norme (norme ISO) et est libre de droits. Il permet une
représentation en vraies couleurs (16 millions de couleurs)
Ce format utilise une compression avec perte d’informations. Le but de l’algorithme utilisé dans
ce format est de permettre un taux de compression important sans que les modifications
apportées sur l’image ne soient visibles à l’oeil. Mais attention: ce qui est vrai pour les taux de
compression les plus faibles ne l’est pas nécessairement pour des taux de compression plus
élevés. L’utilisateur peut faire varier le taux de compression de 1% (qualité la meilleure) à 99%
9
Bitmap : matrice de points
10
Compression : c’est la réduction de la quantité de données nécessaires à la
représentation d’une information
Monique Colinet
CeFIS - FUNDP
Page 11
Le traitement des images
(qualité la moins bonne).
Exemple:
Compression minimale 1%
Compression maximale 99%
(1559 octets)
(371 octets)
Modifications invisibles à l’oeil
Modifications visibles à l’oeil
Remarques:
• Le pourcentage de compression ne signifie pas le pourcentage de perte d’informations. (Une
compression de 10% ne signifie pas une perte de 10% d’informations). La perte
d’informations dépend de chaque image.
• De plus, l’échelle de compression n’est pas la même pour tous les logiciels de retouche
d’image.
• Attention aussi, chaque fois qu’une image au format JPEG est enregistrée, il y a perte
d’informations. Ces informations sont irrécupérables. Il est donc préférable de conserver une
copie originale des images que l’on veut compresser.
Ce format est surtout utilisé pour les images “naturelles” présentant de grands dégradés de
couleurs.
Le format GIF
Ce format est un format “propriétaire” (et présente donc certains inconvénients). Il ne supporte
que les images de 256 couleurs avec palette.
L’algorithme de compression permet une compression sans perte mais dont l’efficacité dépend
de plusieurs facteurs:
• de l’existence de zones “homogènes”. Une image avec des zones très homogènes permettra
une compression importante alors qu’une image avec des zones hétérogènes permettra une
compression beaucoup moins importante.
• de l’orientation de l’image. Ceci est simplement dû au fait que la lecture des données de
l’image se fait en commençant par le pixel en haut à gauche et se fait ligne par ligne.
Exemple:
Monique Colinet
CeFIS - FUNDP
Page 12
Le traitement des images
La couleur des pixels de la première ligne
(ainsi que des autres) est homogène (donc
facile à compresser
La couleur des pixels de la première ligne
(ainsi que des autres) varie fortement
(donc plus difficile à compresser)
Ce format d’image est principalement utilisé pour les images contenant peu de nuances de
couleurs et avec des transitions de couleurs brusques, comme les logos par exemple.
Le format PNG
Ce format est le résultat de recommandations du consortium W3 (1996). Il permet l’utilisation
de plusieurs qualités d’images: vraies couleurs (16 millions), niveaux de gris ou encore couleurs
codées sur 8 bits avec utilisation d’une palette.
La compression de ces images se fait sans perte d’informations. Sa définition est assez récente
et son principal inconvénient est d’être inconnu de la plupart des logiciels.
Il existe encore bien d’autres formats d’images, mais la plupart sont des formats propriétaires
c’est-à-dire qu’ils qu’ils sont spécifiques à l’application qui les génèrent.
Voici, ci-dessous, un tableau résumé des principaux formats d’images “bitmap”:
Formats
Type
Remarques
BMP: Bitmap Format.
Extension BMP
sans compression
Format standard avec Windows.
PICT
sans compression
Tous types d’images noir et blanc
+ couleur
Extension PCT
Format standard sur les
Macintosh
Tous types d’images noir et blanc
+ couleur
TIFF: Tagged Image Format
Extension TIF
compression non dégradante
possible
format très classique pour les
images
GIF: Graphics Interchange
Format
Forte compression non
dégradante
format d’images compressées
destiné surtout aux diffusions sur
les réseaux de
télécommunications. Images de
256 couleurs maximum
norme internationale de
compression dégradante
tous types d’images (noir et blanc
+ couleur)
Extension GIF
JPEG: Joint Photographic
Expert Group
plusieurs niveaux de qualité
possibles suivant le taux de
compression
Extension JPG
Ondelettes
Extension WI ou TIF-WI
Fractales
Extension FIF
Monique Colinet
modèle mathématique
compression dégradante
format propriétaire
modèle mathématique
compression dégradante
format propriétaire
CeFIS - FUNDP
Page 13
Le traitement des images
Les outils spécifiques pour traiter des images
Outre les ordinateurs, les centres cybermédias possèdent également des outils plus spécifiques.
Ceux-ci permettent une utilisation plus performante de l’outil informatique. Il s’agit bien sûr de
matériels connus tels que les imprimantes lasers et couleurs dont l’utilisation n’est plus à
expliquer mais aussi d’autres périphériques, peut être connus mais dont la manipulation en laisse
encore perplexe plus d’un. Envisageons la découverte de quelques uns de ces périphériques...
Le scanner
Fonctionnement d’un scanner
Le scanner est un périphérique qui permet de numériser des documents (papier), que ce soit des
textes ou des images, pour les rendre utilisables dans un logiciel de traitement de texte ou dans
un logiciel de retouche d’images.
“Le principe de base d’un scanner est relativement simple: une source lumineuse montée sur un
chariot mobile envoie de la lumière sur le document qui en réfléchit une partie. Le chariot se
déplace du début de l’image, jusqu’à la fin, afin de traiter chaque ligne de l’image.
L’intensité de la lumière réfléchie varie en fonction des parties sombres et claires du document.
Un jeu de miroirs achemine ensuite la lumière vers des capteurs CCD (Charge Coupled Device)
qui transforment l’intensité lumineuse en signal électrique. Un convertisseur achève le travail
Monique Colinet
CeFIS - FUNDP
Page 14
Le traitement des images
en codant le signal électrique analogique sous forme numérique.”11
Ce scanner ne peut évidemment fonctionner correctement que s’il est accompagné de logiciels
qui le pilotent. Ces logiciels de gestion sont à la norme standard TWAIN (Technology Without
A Interesting Name) et permettent souvent de lancer directement le scanner à partir d’autres
programmes. Ce sont des interfaces entre les logiciels de retouche d’images et les périphériques
de capture d’images.
Caractéristiques principales d’un scanner
Les caractéristiques peuvent varier d’un scanner à l’autre. Pour pouvoir utiliser efficacement un
scanner, il faut connaître:
- sa résolution optique: elle détermine la qualité de numérisation et s’exprime en dpi ou ppp. Elle
comprend une résolution horizontale (nombre de capteurs CCD par pouce) et une résolution
verticale (déplacement du chariot mobile).
Un exemple :
Soit un scanner dont la résolution optique est de 300 x 600 dpi signifie que les capteurs sont
espacés de 1/300 de pouce horizontalement et que le moteur du scanner fait avancer le chariot
par pas de 1/600 de pouce verticalement.
- sa résolution interpolée: qui permet d’augmenter, par l’intermédiaire d’un logiciel, la résolution
optique par un calcul de pixels supplémentaires à partir des vrais points placés autour. Cette
interpolation multiplie la résolution optique par 2 ou par 4 ou parfois même par 8.
- le nombre de couleurs que le scanner est capable de numériser. Actuellement, les scanners
numérisent en 24 bits minimum.
Utilisation d’un scanner
Récupération d’images à l’aide d’un scanner
Il faut savoir que les scanners sont pilotés par un logiciel fourni par le fabricant. Ce logiciel
permet de paramétrer le processus de numérisation afin d’obtenir un résultat optimal en fonction
de l’utilisation finale. Les principaux paramètres à fournir sont:
- la profondeur de l’image: c’est-à-dire le type de codage: image en couleurs vraies, images en
teintes de gris, image bicolore. Ce type dépendra bien sûr de l’image originale (dessin avec peu
de couleurs ou photo) mais aussi de l’utilisation future: affichage sur un écran ou impression.
- la taille physique de la portion d’image à scanner. Généralement, on ne numérise qu’une zone
du document. Cette zone est définie en centimètres ou en pouces et est paramétrable après une
prénumérisation de l’image.
- La résolution de l’image. C’est le fameux nombre de points par pouce. Plus ce nombre est élevé
et plus l’image sera de bonne qualité. Mais attention, ce choix dépend de l’utilisation (affichage
uniquement ou impression) que l’on souhaite faire de l’image numérisée. Il est inutile de scanner
une image en 300 dpi pour n’en faire qu’un affichage à l’écran, à moins que vous souhaitiez
11
Windows Plus - n°9 - Juin 94
Monique Colinet
CeFIS - FUNDP
Page 15
Le traitement des images
agrandir cette image. Il faut aussi savoir que si la résolution optique de votre scanner est
inférieure à la résolution que vous souhaitez, c’est la résolution interpolée qui fixera les autres
valeurs des pixels intermédiaires.
Un exemple pour illustrer:
Si on numérise une image de 5 cm x 12 cm avec une résolution de 300 dpi, la taille de
l’image à l’affichage sera de 5/2,54 * 300 = 590 pixels en largeur et 12/2,54 * 300 = 1417
pixels en hauteur.
Lorsque l’image est récupérée, il est encore possible de la transformer. Pour cela, il faut utiliser
un logiciel de retouche d’images. Ce dernier vous permettra :
- de corriger certains détails,
- de modifier les couleurs de l’image,
- d’ajouter des textes sur l’image,
- de modifier sa taille,
- de modifier son format.
Récupération de textes à l’aide d’un scanner
Outre le programme de numérisation associé au scanner, il est nécessaire, si vous souhaitez
pouvoir retravailler le contenu d’un texte, de disposer d’un logiciel de reconnaissance optique
des caractères (ROC ou OCR en anglais) qui va transformer l’image en texte (ensemble de
caractères). La qualité de cette reconnaissance dépend autant du logiciel que du matériel car les
algorithmes qui entrent en jeu peuvent être extrêmement complexes. Ils sont basés sur la
reconnaissance des formes, mais une analyse du contexte n’est pas exclue en cas de doute. La
capture de texte se fait donc en plusieurs étapes. Pour obtenir une bonne qualité de la restitution,
quelques réglages sont nécessaires.
Au moment de l’acquisition, tout d’abord, le
réglage de la résolution est important. Il est
indispensable de choisir une résolution d’au moins
300 dpi afin d’obtenir un maximum de précision
dans le dessin des caractères. De plus, le choix de
numériser en noir et blanc est suffisant et conseillé
pour obtenir un contraste acceptable.
Texte
Après cette étape d’acquisition, il faut ensuite
récupérer l’image obtenue dans le logiciel OCR
afin de transformer l’image en texte. Ici aussi
quelques réglages sont intéressants. Citons le tri
Titre
des fenêtres dans le cas où le document traité est
présenté sous forme de colonnes contenant du
Image
texte et des images (page d’une revue).
L’utilisateur peut indiquer au logiciel les fenêtres
à analyser et dans quel ordre. Il est parfois utile de
préparer l’analyse en précisant la taille des
caractères ainsi que leur espacement ou encore la langue.
On peut également demander au logiciel d’effectuer une analyse interactive du texte, c’est-à-dire
Monique Colinet
CeFIS - FUNDP
Page 16
Le traitement des images
donner la possibilité à l’utilisateur de corriger un caractère alors que celui-ci n’est pas reconnu.
L’analyse peut alors commencer. Pour ce faire, il s’arrête sur tous les objets qui se trouvent dans
l’image et effectue des comparaisons par rapport à une base de données. Les éléments qui
interviennent sont des considérations géométriques telles que le nombre de courbes, leur type
(ouvertes, fermées) et leur orientation (gauche, droite, bas ou haut). Une reconnaissance des
caractères basée sur la comparaison de matrices de points ne fonctionne guère qu’avec des
polices de caractères non proportionnelles et de taille fixe.
Quelques exemples pour lesquels se présentent parfois des difficultés: la lettre i et le chiffre 1,
la lettre l ou le chiffre 1, la lettre O ou le chiffre 0, la lettre S ou le chiffre 5,... Mais les difficultés
peuvent également provenir de la qualité et donc de la lisibilité du document original.
Parfois, le logiciel vérifie son analyse en utilisant un dictionnaire. Après cette dernière opération,
l’utilisateur récupère un fichier de type texte traitable par un logiciel de traitement de texte.
Une perte d’informations plus ou moins importante peut survenir si le texte à numériser est
présenté de manière complexe (textes contenant des caractères de grande taille qui peuvent être
confondus avec des images, encadrés, fond coloré, textes dans des polices de caractères
exotiques,...) ou si les réglages préalables n’ont pas été correctement réalisés.
L’appareil photo numérique
Principe de fonctionnement de l’appareil photo numérique
Le principe d’un appareil photo numérique est fondamentalement le même qu’un appareil photo
traditionnel, à la différence que la pellicule est remplacée par un capteur CCD (muni d’une
multitude de cellules photosensibles) capable de capter l’image et une mémoire chargée de
stocker l’image.
Les éléments importants d’un appareil photo numérique sont:
le capteur CCD: c’est la pièce principale de l’appareil. Il remplace la pellicule de l’appareil
traditionnel. Sa caractéristique est exprimée par sa résolution qui va de 150 000 à plus de 5
millions de pixels. Actuellement, les appareils photos numériques ont des capteurs disposant de
plus de 1,5 millions de cellules.
Monique Colinet
CeFIS - FUNDP
Page 17
Le traitement des images
Les cellules du capteur convertissent la lumière en un signal analogique électrique qui est
numérisé et stocké dans une mémoire flash (non volatile). L’élément atomique de la photo est
le pixel. Trois valeurs numériques lui sont donc associées lors de la prise de vue: une intensité
de rouge, une de vert et une de bleu. La photo numérisée est donc une image de x pixels sur y
et non une image de dimension bien précise. Plus le nombre de pixels est élevé, plus le format
exploitable de la photo, en affichage ou à l’impression pourra être élevé. On trouve aujourd’hui
des appareils produisant des photos de 1.400.000 à 5.000.000 pixels. Attention, le nombre de
pixels n’est pas le seul critère important lors du choix d’un appareil photo. Un appareil travaillant
en 1.400.000 pixels peut réaliser des photos de meilleure qualité qu’un appareil fournissant
3.000.000 de pixels, tout simplement parce que sa mise au point est plus sophistiquée.
Une photo de 2.000.000 de pixels enregistrée sans compression aurait une taille approchant les
6 Mo. Les photos sont donc compressées avant mémorisation en utilisant généralement la
méthode de compression JPEG. C’est une compression avec une perte qui peut cependant être
peu détectable par l’oeil humain. Le format des fichiers produits est habituellement JPG qui est
un format standard plus pratique pour les échanges.
la mémoire: on peut rencontrer deux types de mémoire: mémoire fixe ou mémoire amovible. Les
supports peuvent, eux, être différents. Le plus familier est la disquette qui ne demande pas de
manipulations de transfert particulières avec comme désavantage évident celui de la taille très
limitée du support. Des supports de type “mémoire flash” (Compact Flash, Smart Média)
proposent davantage d’espace: 4, 8, 16, 32, 64 et même 128 Mo. Le nombre de photos qu’il est
possible de stocker va également dépendre de la qualité des images capturées. Les supports de
type “mémoire flash” sont évidemment plus coûteux.
Le transfert des photos sur l’ordinateur:
Le transfert des photos en mémoire centrale ou vers une imprimante est pris en charge par un
logiciel spécialisé qui propose d’ailleurs souvent une planche de contact des photos mémorisées
sur l’appareil. Ce logiciel peut aussi, selon les cas, prendre partiellement le contrôle de
l’appareil.
Le transfert des photos sur PC (ou sur Mac d’ailleurs) peut se faire par l’intermédiaire d’un câble
(série ou USB). Si c’est un câble série, il faut parfois s’armer de patience. Il est également
possible de disposer d’un lecteur de “mémoire flash” qui sera, lui, un périphérique de
l’ordinateur. Quelquefois, il est possible de loger la carte mémoire sur une “fausse” disquette
Monique Colinet
CeFIS - FUNDP
Page 18
Le traitement des images
31/2 pouces et d’utiliser le lecteur de disquette pour le transfert. Les possibilités étant multiples,
le choix se fera en fonction de l’environnement dont vous disposez.
Le logiciel de récupération des photos
Il a pour but principal de transférer les données numériques relatives aux images de l’appareil
photo vers la mémoire vive de l’ordinateur. Il permet également le pilotage de l’appareil photo
numérique (pilote TWAIN). Il permet enfin une sauvegarde des images sur le disque dur de cet
ordinateur. Les formats pris en charge dépendent de l’appareil photo. Les plus courants sont
BMP, TIF ou JPG. Le choix dépendra des utilisations ultérieures de ces photos.
Le logiciel de retouche d’images
La récupération des photos étant faite, l’étape à envisager est le traitement de ces images par
l’intermédiaire d’un logiciel de retouche d’images.
Ceux-ci sont nombreux sur le marché mais ils possèdent pratiquement tous les mêmes fonctions.
On peut citer :
• les transformations simples:
rotations, retournements, déformations,...
• Le changement des dimensions de l’image:
- par re-dimensionnement
- par ré-échantillonnage
• La suppression des défauts
• La modification des couleurs
• La production d’effets spéciaux (filtres)
• L’utilisation des fonctions de dessin et de peinture
• La réalisation de montages (plusieurs techniques)
Monique Colinet
CeFIS - FUNDP
Page 19
Le traitement des images
• ...
• La sauvegarde et éventuellement la conversion de l’image dans un format plus adapté.
Monique Colinet
CeFIS - FUNDP
Page 20

Documents pareils