Le traitement des images
Transcription
Le traitement des images
Département • Codage Education et • Capture • Traitement Technologie LE TRAITEMENT DES IMAGES Monique Colinet 5.86 Mai 2004 Centre pour la formation à l’Informatique dans le Secondaire Le traitement des images Objectifs Ce document est consacré spécialement aux images (dessins, photos, graphiques, schémas,...). La compréhension de la manière dont est codée une image pour sa restitution sur écran ou sur imprimante paraît fondamentale. Sa numérisation permettra de comprendre par exemple, pourquoi une image récupérée sur Internet et affichée sur tout l’écran dans le navigateur ne sera qu’une petite icône lors de l’impression. Le traitement que peut subir une image par l’intermédiaire d’un logiciel de retouche d’images pourra, pour le cas précédent, permettre son impression dans la taille adéquate. Codage BITMAP Une manière de procéder pour numériser une image est de la découper en zones élémentaires, rectangulaires et uniformément colorées. Monique Colinet CeFIS - FUNDP Page 2 Le traitement des images Une image numérique est donc constitutée de pixels1 (picture elements), le pixel étant la plus petite surface homogène d’une image, il est en quelque sorte l’équivalent d’un point. Définition: Une image est définie par : - le nombre de pixels qui la composent en largeur et en hauteur, - l’étendue des teintes de gris ou des couleurs que peut prendre chaque pixel. Une image numérique en elle-même est en fait un concept tout à fait abstrait (des données numériques) qui ne trouve une signification à nos yeux qu’à la visualisation (à l’écran ou à l’impression) lorsqu’on utilise un logiciel adéquat. Voici d’ailleurs les informations données sur l’image précédente: Nombre de pixels Informations sur la couleur Nombre de pixels et résolution Il est clair que la qualité de l’image électronique est d’autant meilleure que le nombre de pixels utilisés pour la décrire est élevé. On parle d’ailleurs souvent de résolution de l’image. La résolution d’une image est définie par le nombre de pixels par unité de longueur. Plus on a de points (ou pixels) par pouce2 (ppp) ou dot per inch (dpi) en anglais, meilleure est la qualité de l’image. Ce paramètre est déterminé lors de la numérisation de l’image et peut varier selon les performances du matériel utilisé pour la numérisation (scanner ou appareil photo numérique). Plus le nombre de pixels est élevé par unité de longueur, plus la quantité d’informations qui décrit l’image est importante et plus la résolution est élevée. On peut également dire que la résolution de l’image définit le degré de détail qui sera présent dans cette image. La résolution d’une image ne peut être déterminé qu’au moment de sa numérisation. Il est aussi à noter que certains appareils de numérisation (scanner ou appareil photo numérique) permettent de faire varier la résolution lors de l’acquisition. 1 Pixel: élément le plus petit d’une surface d’affichage auquel on puisse associer individuellement une couleur.(Grand Dictionnaire Terminologique) 2 Pouce: 1 pouce = 2,54 cm Monique Colinet CeFIS - FUNDP Page 3 Le traitement des images Le terme “résolution” est parfois ambigu dans le sens où il a des significations différentes suivant son utilisation. La résolution d’une image est le nombre de pixels qu’elle comporte en largeur et en hauteur tandis que la résolution d’un scanner3 (ou d’un appareil photo numérique) est le nombre de pixels par pouce (ppp) que cet appareil est capable de capter lors de l’acquisition d’une image. D’autre part, les résolutions d’un écran et d’une imprimante peuvent encore semer le trouble dans notre esprit, puisqu’elles sont encore différentes. Nous les détaillerons plus loin. Résolution d’une image scannée et son nombre de pixels. Exemple d’une image de 1 x 1 pouce : Scannée avec une résolution de : Elle aura un nombre de pixels de : 200 dpi (200 pixels par pouce) 200 x 200 = 40 000 pixels 100 dpi (100 pixels par pouce) 100 x 100 = 10 000 pixels 75 dpi (75 pixels par pouce) 75 x 75 = 5 625 pixels 50 dpi (50 pixels par pouce) 50 x 50 = 2 500 pixels 25 dpi (25 pixels par pouce) 25 * 25 = 625 pixels Affichage réel à l’écran ou à l’impression : Remarque :les dimensions des images ci-dessus ne sont pas exactes étant donné qu’il faut également tenir compte de la résolution de l’imprimante. Reprenons maintenant ces différentes images et observons-les avec la même taille (les mêmes dimensions en largeur et en hauteur) à l’écran et sur papier. 3 Voir plus loin des caractéristiques d’un scanner Monique Colinet CeFIS - FUNDP Page 4 Le traitement des images Scannée avec une résolution de : Elle aura un nombre de pixels de : 200 dpi (200 pixels par pouce) 200 x 200 = 40 000 pixels 100 dpi (100 pixels par pouce) 100 x 100 = 10 000 pixels 75 dpi (75 pixels par pouce) 75 x 75 = 5 625 pixels 50 dpi (50 pixels par pouce) 50 x 50 = 2 500 pixels 25 dpi (25 pixels par pouce) 25 * 25 = 625 pixels Affichage à la même taille à l’écran et à l’impression : On observe que plus la résolution diminue, plus la précision diminue. L’objet est, en effet, représenté par un nombre de pixels moins important. Monique Colinet CeFIS - FUNDP Page 5 Le traitement des images Le choix de la résolution lors de la numérisation est donc un facteur important. La résolution d’un écran La résolution d’une image à l’écran dépend de deux facteurs. 1. Les dimensions de l’écran (ou moniteur) La taille d’un moniteur se mesure également en pouces. Les dimensions les plus couramment rencontrées sont 15, 17, 19 ou 21 pouces. Ces mesures représentent la diagonale de l’écran. Mesure de l’écran en pouces 2. La résolution d’affichage Cette résolution se choisit aussi en pixels Affichage en pixels 640 x 480 pixels 800 x 600 pixels 1024 x 768 pixels 1280 x 1024 pixels A partir de ces deux renseignements, il est possible de calculer la résolution de l’écran. Exemple : Soit un écran de 15 pouces dont l’affichage est de 800 x 600 pixels. La diagonale de cet écran contient 1000 pixels. Rappelez-vous du théorème de Pythagore lors de vos chères études! Ces 1000 pixels sont répartis sur 15 pouces. Il y a donc 1000/15 = 66,6... pixels par pouce. La résolution de cet écran est de 66 dpi. Remarque: pour connaître l’affichage écran de votre moniteur, plusieurs possibilités existent. En voici une. Par l’intermédiaire du bouton Démarrer puis du menu Paramètres - Panneau de configuration, choisissez . Dans la nouvelle fenêtre, choisissez l’onglet Paramètres. Cette dernière fenêtre donne les caractéristiques de l’affichage du moniteur. Monique Colinet CeFIS - FUNDP Page 6 Le traitement des images Il est bien entendu possible de modifier ces caractéristiques. La résolution d’une imprimante Pour connaître la résolution de l’imprimante, il faut regarder dans les paramètres de configuration de l’imprimante. C’est possible aussi par l’intermédiaire du panneau de configuration. Cette fois, il faut choisir , puis sélectionner l’imprimante souhaitée. Un clic droit permet l’ouverture d’un menu contextuel qui donne accès aux propriétés de cette imprimante. Les différentes options des propriétés vont dépendre du type d’imprimante mais généralement, il est possible d’en connaître la résolution, voire même d’en changer. Informations sur la couleur de chaque pixel ou profondeur4 de l’image Comme cela a été signalé précédemment, une autre donnée essentielle concernant la numérisation des images est l’information de couleur de chacun des pixels. 4 Profondeur d’une image : nombre de bits associés à chacun des pixels d’une image afin de coder les couleurs (Grand Dictionnaire Terminologique) Monique Colinet CeFIS - FUNDP Page 7 Le traitement des images Cette information de couleur va dépendre du nombre de valeurs numériques que l’on veut attribuer à chaque pixel. Pour les images les plus simples (noir et blanc), un pixel peut prendre uniquement la valeur noir ou blanc. Le codage peut se faire alors sur 1 bit : 0 correspond au noir et 1 correspond au blanc. Pour des images en niveau de gris, on dispose de 256 nuances entre le noir et le blanc. Pour les images en couleurs, un pixel doit pouvoir prendre beaucoup plus de valeurs différentes. La valeur de chacun d’entre-eux est habituellement enregistrée sous la forme de trois nombres binaires à 8 bits (d’une valeur de 0 à 255), correspondant respectivement à chacune des couleurs primaires : rouge, vert et bleu. Cela donne une gamme de 256 x 256 x 256 couleurs possibles (soit 16 777 216 couleurs). On obtient une image de couleur dite à 24 bits ou encore en couleurs vraies. Valeur R Valeur V Valeur B Couleur correspondante Commentaire 0 0 0 noir un peu moins noir (nuance impossible de détecter à l’oeil par rapport au noir) 0 0 1 ... ... ... 0 0 255 ... ... ... 0 255 0 ... ... ... 255 0 0 ... ... ... 128 128 128 couleur intermédiaire correspondant à un gris 255 255 255 blanc ... ... bleu ... ... vert ... ... rouge ... ... L’information couleur de chaque pixel est donc codée sur 3 octets5. Ce qui entraîne des fichiers volumineux. Il existe plusieurs modèles de codage des couleurs: - le modèle RGB (ou RVB): système additif. Le modèle additif se prête aux couleurs qui seront restituées sur des périphériques de sortie tels que les moniteurs, les téléviseurs, les projecteurs. 5 1 octet = 8 bits Monique Colinet CeFIS - FUNDP Page 8 Le traitement des images - le modèle CMYK (ou CMJN): système soustractif. Ce modèle est utilisé dans le domaine de l’impression. - le modèle HSL (ou TSL): teinte - saturation (appelée aussi chrominance) - luminosité (parfois appelée luminance). Ce modèle se fonde sur la perception des couleurs par l’oeil humain, celles-ci étant définies en fonction de trois caractéristiques fondamentales: - La teinte est l’impression de couleur proprement dite. La teinte correspond à un emplacement sur la roue chromatique, plus exactement à un angle compris entre 0° et 360°; - La saturation désigne la pureté d’une couleur. Elle correspond à la quantité de gris contenu dans une teinte et s’exprime sous forme de pourcentage, compris entre 0% (gris) et 100% (saturation totale); - La luminosité décrit le degré de luminosité de la couleur. Il s’agit d’un pourcentage compris entre 0% (noir) et 100% (blanc). Ce modèle de couleur n’est pas directement utilisé en informatique mais la plupart des logiciels de retouche d’images le propose. Les composantes HSL sont alors converties en RVB. Les principaux modes de codage sont les suivants: Type de codage Nombre de bits par pixel valeurs possibles Interprétation de ces valeurs trait 1 bit 0 ou 1 0 = noir, 1 = blanc nuances de gris 8 bits de 0 à 255 256 niveaux de gris, entre le noir (0) et le blanc (1) couleurs réelles (true color) RVB 24 bits (3x8) 3 valeurs de 0 à 255 chaque valeur représente une intensité de rouge, de vert ou de bleu. 0 = pas de couleur, 255 = intensité maximale. On obtient ainsi 16 millions de couleurs. Couleurs indexées par une palette 8 bits de 0 à 255 une table appelée palette établit la correspondance entre ces 256 numéros de couleur et les couleurs réelles qu’ils représentent, codées dans le mode RVB Remarque: Il est fréquent de rencontrer des problèmes de couleurs lors du collage d’une image codée par palette donc 8 bits dans une autre: les mêmes indices ne référant pas forcément les mêmes couleurs. C’est l’image hôte qui impose sa palette. Dans le cas d’un montage, il vaut mieux utiliser les “couleurs vraies” ou couleurs RVB. Taille des fichiers images Pour connaître la taille (en octets) d’une image, il suffit de connaître le nombre de pixels qui la compose ainsi que la profondeur (taille en octets) de chaque pixel. Monique Colinet CeFIS - FUNDP Page 9 Le traitement des images Dimensions de l’image (pixels) image en noir et blanc (1 bit par pixel) image en 256 niveaux de gris (8 bits par pixel) image en couleurs RVB (24 bits par pixel) 320 x 240 320 x 240 x1 = 76800 bits ou 9600 octets ou encore 9,4 Ko6 320 x 240 x 8 = 614400bits ou 76800 octets ou 75 Ko 320 x 240 x 24 = 1843200 bits ou 230400 octets ou 225 Ko 640 x 480 37,5 Ko 300 Ko 900 Ko 800 x 600 58,6 Ko 468,7 Ko 1,4 Mo7 1024 x 768 96 Ko 768 Ko 2,3 Mo Pour réduire la taille de certaines images couleurs, il est possible de réduire la profondeur des pixels en les codant sur un octet au lieu de trois. Le nombre de couleurs différentes possibles est alors de 256. A chaque pixel sera affecté une valeur comprise entre 0 et 255. A chacun de ces nombres va correspondre une couleur stockée dans une palette avec les données de l’image. On parle de couleurs indexées. Remarque : chaque image contenant 256 couleurs peut “contenir” n’importe laquelle des 16 millions de couleurs disponibles dans l’espace RVB. Exemple : C’est toujours la même image mais cette fois elle est codée sur 8 bits et une palette8 lui est associée. 6 1Ko (kilo-octet) = 1 024 octets (210 octets) 7 1 Mo (méga-octet) = 1 048 576 octets (220 octets) 8 Palette : table de conversion dont chaque entrée définit une couleur particulière à l’aide des valeurs des intensités de rouge, de vert et de bleu. (Grand Dictionnaire Terminologique). Les 256 couleurs de la palette peuvent être choisies parmi les 16 millions possible. Monique Colinet CeFIS - FUNDP Page 10 Le traitement des images Les pixels qui portent le numéro 105 dans le fichier image seront associés lors de l’affichage à la couleur R:162, V: 66, B: 13 Si la palette associée à l’image change, la visualisation de l’image change. Les principaux formats de fichiers Comme cela est expliqué depuis le début, les images numériques sont codées point par point. Le format originel de ces images est appelé format BITMAP9. Les fichiers images bitmap portent l’extension .bmp. Devant le volume énorme d’informations contenu dans les fichiers bitmap, les informaticiens ont développé des algorithmes de compression10 (et des formats de fichiers capables d’être lus par différents logiciels et systèmes d’exploitation). Il existe différents types de compression qui déterminent des formats compressés pour les fichiers images. L’intérêt de tels formats est qu’ils permettent de compresser une image pour qu’elle soit moins lourde lors de l’affichage ou du stockage en mémoire. Mais surtout, en réduisant la taille des fichiers, on assure un transfert plus rapide sur Internet. Certains modes de compression dits “conservateurs”, restituent une image originale après un cycle de compression/décompression. Les compressions avec perte de données éliminent certaines informations qui ne sont pas indispensables pour l’appréciation visuelle des images par un oeil humain. Le format JPEG (Join Photo Expert Group) Ce format est la représentation d’une norme (norme ISO) et est libre de droits. Il permet une représentation en vraies couleurs (16 millions de couleurs) Ce format utilise une compression avec perte d’informations. Le but de l’algorithme utilisé dans ce format est de permettre un taux de compression important sans que les modifications apportées sur l’image ne soient visibles à l’oeil. Mais attention: ce qui est vrai pour les taux de compression les plus faibles ne l’est pas nécessairement pour des taux de compression plus élevés. L’utilisateur peut faire varier le taux de compression de 1% (qualité la meilleure) à 99% 9 Bitmap : matrice de points 10 Compression : c’est la réduction de la quantité de données nécessaires à la représentation d’une information Monique Colinet CeFIS - FUNDP Page 11 Le traitement des images (qualité la moins bonne). Exemple: Compression minimale 1% Compression maximale 99% (1559 octets) (371 octets) Modifications invisibles à l’oeil Modifications visibles à l’oeil Remarques: • Le pourcentage de compression ne signifie pas le pourcentage de perte d’informations. (Une compression de 10% ne signifie pas une perte de 10% d’informations). La perte d’informations dépend de chaque image. • De plus, l’échelle de compression n’est pas la même pour tous les logiciels de retouche d’image. • Attention aussi, chaque fois qu’une image au format JPEG est enregistrée, il y a perte d’informations. Ces informations sont irrécupérables. Il est donc préférable de conserver une copie originale des images que l’on veut compresser. Ce format est surtout utilisé pour les images “naturelles” présentant de grands dégradés de couleurs. Le format GIF Ce format est un format “propriétaire” (et présente donc certains inconvénients). Il ne supporte que les images de 256 couleurs avec palette. L’algorithme de compression permet une compression sans perte mais dont l’efficacité dépend de plusieurs facteurs: • de l’existence de zones “homogènes”. Une image avec des zones très homogènes permettra une compression importante alors qu’une image avec des zones hétérogènes permettra une compression beaucoup moins importante. • de l’orientation de l’image. Ceci est simplement dû au fait que la lecture des données de l’image se fait en commençant par le pixel en haut à gauche et se fait ligne par ligne. Exemple: Monique Colinet CeFIS - FUNDP Page 12 Le traitement des images La couleur des pixels de la première ligne (ainsi que des autres) est homogène (donc facile à compresser La couleur des pixels de la première ligne (ainsi que des autres) varie fortement (donc plus difficile à compresser) Ce format d’image est principalement utilisé pour les images contenant peu de nuances de couleurs et avec des transitions de couleurs brusques, comme les logos par exemple. Le format PNG Ce format est le résultat de recommandations du consortium W3 (1996). Il permet l’utilisation de plusieurs qualités d’images: vraies couleurs (16 millions), niveaux de gris ou encore couleurs codées sur 8 bits avec utilisation d’une palette. La compression de ces images se fait sans perte d’informations. Sa définition est assez récente et son principal inconvénient est d’être inconnu de la plupart des logiciels. Il existe encore bien d’autres formats d’images, mais la plupart sont des formats propriétaires c’est-à-dire qu’ils qu’ils sont spécifiques à l’application qui les génèrent. Voici, ci-dessous, un tableau résumé des principaux formats d’images “bitmap”: Formats Type Remarques BMP: Bitmap Format. Extension BMP sans compression Format standard avec Windows. PICT sans compression Tous types d’images noir et blanc + couleur Extension PCT Format standard sur les Macintosh Tous types d’images noir et blanc + couleur TIFF: Tagged Image Format Extension TIF compression non dégradante possible format très classique pour les images GIF: Graphics Interchange Format Forte compression non dégradante format d’images compressées destiné surtout aux diffusions sur les réseaux de télécommunications. Images de 256 couleurs maximum norme internationale de compression dégradante tous types d’images (noir et blanc + couleur) Extension GIF JPEG: Joint Photographic Expert Group plusieurs niveaux de qualité possibles suivant le taux de compression Extension JPG Ondelettes Extension WI ou TIF-WI Fractales Extension FIF Monique Colinet modèle mathématique compression dégradante format propriétaire modèle mathématique compression dégradante format propriétaire CeFIS - FUNDP Page 13 Le traitement des images Les outils spécifiques pour traiter des images Outre les ordinateurs, les centres cybermédias possèdent également des outils plus spécifiques. Ceux-ci permettent une utilisation plus performante de l’outil informatique. Il s’agit bien sûr de matériels connus tels que les imprimantes lasers et couleurs dont l’utilisation n’est plus à expliquer mais aussi d’autres périphériques, peut être connus mais dont la manipulation en laisse encore perplexe plus d’un. Envisageons la découverte de quelques uns de ces périphériques... Le scanner Fonctionnement d’un scanner Le scanner est un périphérique qui permet de numériser des documents (papier), que ce soit des textes ou des images, pour les rendre utilisables dans un logiciel de traitement de texte ou dans un logiciel de retouche d’images. “Le principe de base d’un scanner est relativement simple: une source lumineuse montée sur un chariot mobile envoie de la lumière sur le document qui en réfléchit une partie. Le chariot se déplace du début de l’image, jusqu’à la fin, afin de traiter chaque ligne de l’image. L’intensité de la lumière réfléchie varie en fonction des parties sombres et claires du document. Un jeu de miroirs achemine ensuite la lumière vers des capteurs CCD (Charge Coupled Device) qui transforment l’intensité lumineuse en signal électrique. Un convertisseur achève le travail Monique Colinet CeFIS - FUNDP Page 14 Le traitement des images en codant le signal électrique analogique sous forme numérique.”11 Ce scanner ne peut évidemment fonctionner correctement que s’il est accompagné de logiciels qui le pilotent. Ces logiciels de gestion sont à la norme standard TWAIN (Technology Without A Interesting Name) et permettent souvent de lancer directement le scanner à partir d’autres programmes. Ce sont des interfaces entre les logiciels de retouche d’images et les périphériques de capture d’images. Caractéristiques principales d’un scanner Les caractéristiques peuvent varier d’un scanner à l’autre. Pour pouvoir utiliser efficacement un scanner, il faut connaître: - sa résolution optique: elle détermine la qualité de numérisation et s’exprime en dpi ou ppp. Elle comprend une résolution horizontale (nombre de capteurs CCD par pouce) et une résolution verticale (déplacement du chariot mobile). Un exemple : Soit un scanner dont la résolution optique est de 300 x 600 dpi signifie que les capteurs sont espacés de 1/300 de pouce horizontalement et que le moteur du scanner fait avancer le chariot par pas de 1/600 de pouce verticalement. - sa résolution interpolée: qui permet d’augmenter, par l’intermédiaire d’un logiciel, la résolution optique par un calcul de pixels supplémentaires à partir des vrais points placés autour. Cette interpolation multiplie la résolution optique par 2 ou par 4 ou parfois même par 8. - le nombre de couleurs que le scanner est capable de numériser. Actuellement, les scanners numérisent en 24 bits minimum. Utilisation d’un scanner Récupération d’images à l’aide d’un scanner Il faut savoir que les scanners sont pilotés par un logiciel fourni par le fabricant. Ce logiciel permet de paramétrer le processus de numérisation afin d’obtenir un résultat optimal en fonction de l’utilisation finale. Les principaux paramètres à fournir sont: - la profondeur de l’image: c’est-à-dire le type de codage: image en couleurs vraies, images en teintes de gris, image bicolore. Ce type dépendra bien sûr de l’image originale (dessin avec peu de couleurs ou photo) mais aussi de l’utilisation future: affichage sur un écran ou impression. - la taille physique de la portion d’image à scanner. Généralement, on ne numérise qu’une zone du document. Cette zone est définie en centimètres ou en pouces et est paramétrable après une prénumérisation de l’image. - La résolution de l’image. C’est le fameux nombre de points par pouce. Plus ce nombre est élevé et plus l’image sera de bonne qualité. Mais attention, ce choix dépend de l’utilisation (affichage uniquement ou impression) que l’on souhaite faire de l’image numérisée. Il est inutile de scanner une image en 300 dpi pour n’en faire qu’un affichage à l’écran, à moins que vous souhaitiez 11 Windows Plus - n°9 - Juin 94 Monique Colinet CeFIS - FUNDP Page 15 Le traitement des images agrandir cette image. Il faut aussi savoir que si la résolution optique de votre scanner est inférieure à la résolution que vous souhaitez, c’est la résolution interpolée qui fixera les autres valeurs des pixels intermédiaires. Un exemple pour illustrer: Si on numérise une image de 5 cm x 12 cm avec une résolution de 300 dpi, la taille de l’image à l’affichage sera de 5/2,54 * 300 = 590 pixels en largeur et 12/2,54 * 300 = 1417 pixels en hauteur. Lorsque l’image est récupérée, il est encore possible de la transformer. Pour cela, il faut utiliser un logiciel de retouche d’images. Ce dernier vous permettra : - de corriger certains détails, - de modifier les couleurs de l’image, - d’ajouter des textes sur l’image, - de modifier sa taille, - de modifier son format. Récupération de textes à l’aide d’un scanner Outre le programme de numérisation associé au scanner, il est nécessaire, si vous souhaitez pouvoir retravailler le contenu d’un texte, de disposer d’un logiciel de reconnaissance optique des caractères (ROC ou OCR en anglais) qui va transformer l’image en texte (ensemble de caractères). La qualité de cette reconnaissance dépend autant du logiciel que du matériel car les algorithmes qui entrent en jeu peuvent être extrêmement complexes. Ils sont basés sur la reconnaissance des formes, mais une analyse du contexte n’est pas exclue en cas de doute. La capture de texte se fait donc en plusieurs étapes. Pour obtenir une bonne qualité de la restitution, quelques réglages sont nécessaires. Au moment de l’acquisition, tout d’abord, le réglage de la résolution est important. Il est indispensable de choisir une résolution d’au moins 300 dpi afin d’obtenir un maximum de précision dans le dessin des caractères. De plus, le choix de numériser en noir et blanc est suffisant et conseillé pour obtenir un contraste acceptable. Texte Après cette étape d’acquisition, il faut ensuite récupérer l’image obtenue dans le logiciel OCR afin de transformer l’image en texte. Ici aussi quelques réglages sont intéressants. Citons le tri Titre des fenêtres dans le cas où le document traité est présenté sous forme de colonnes contenant du Image texte et des images (page d’une revue). L’utilisateur peut indiquer au logiciel les fenêtres à analyser et dans quel ordre. Il est parfois utile de préparer l’analyse en précisant la taille des caractères ainsi que leur espacement ou encore la langue. On peut également demander au logiciel d’effectuer une analyse interactive du texte, c’est-à-dire Monique Colinet CeFIS - FUNDP Page 16 Le traitement des images donner la possibilité à l’utilisateur de corriger un caractère alors que celui-ci n’est pas reconnu. L’analyse peut alors commencer. Pour ce faire, il s’arrête sur tous les objets qui se trouvent dans l’image et effectue des comparaisons par rapport à une base de données. Les éléments qui interviennent sont des considérations géométriques telles que le nombre de courbes, leur type (ouvertes, fermées) et leur orientation (gauche, droite, bas ou haut). Une reconnaissance des caractères basée sur la comparaison de matrices de points ne fonctionne guère qu’avec des polices de caractères non proportionnelles et de taille fixe. Quelques exemples pour lesquels se présentent parfois des difficultés: la lettre i et le chiffre 1, la lettre l ou le chiffre 1, la lettre O ou le chiffre 0, la lettre S ou le chiffre 5,... Mais les difficultés peuvent également provenir de la qualité et donc de la lisibilité du document original. Parfois, le logiciel vérifie son analyse en utilisant un dictionnaire. Après cette dernière opération, l’utilisateur récupère un fichier de type texte traitable par un logiciel de traitement de texte. Une perte d’informations plus ou moins importante peut survenir si le texte à numériser est présenté de manière complexe (textes contenant des caractères de grande taille qui peuvent être confondus avec des images, encadrés, fond coloré, textes dans des polices de caractères exotiques,...) ou si les réglages préalables n’ont pas été correctement réalisés. L’appareil photo numérique Principe de fonctionnement de l’appareil photo numérique Le principe d’un appareil photo numérique est fondamentalement le même qu’un appareil photo traditionnel, à la différence que la pellicule est remplacée par un capteur CCD (muni d’une multitude de cellules photosensibles) capable de capter l’image et une mémoire chargée de stocker l’image. Les éléments importants d’un appareil photo numérique sont: le capteur CCD: c’est la pièce principale de l’appareil. Il remplace la pellicule de l’appareil traditionnel. Sa caractéristique est exprimée par sa résolution qui va de 150 000 à plus de 5 millions de pixels. Actuellement, les appareils photos numériques ont des capteurs disposant de plus de 1,5 millions de cellules. Monique Colinet CeFIS - FUNDP Page 17 Le traitement des images Les cellules du capteur convertissent la lumière en un signal analogique électrique qui est numérisé et stocké dans une mémoire flash (non volatile). L’élément atomique de la photo est le pixel. Trois valeurs numériques lui sont donc associées lors de la prise de vue: une intensité de rouge, une de vert et une de bleu. La photo numérisée est donc une image de x pixels sur y et non une image de dimension bien précise. Plus le nombre de pixels est élevé, plus le format exploitable de la photo, en affichage ou à l’impression pourra être élevé. On trouve aujourd’hui des appareils produisant des photos de 1.400.000 à 5.000.000 pixels. Attention, le nombre de pixels n’est pas le seul critère important lors du choix d’un appareil photo. Un appareil travaillant en 1.400.000 pixels peut réaliser des photos de meilleure qualité qu’un appareil fournissant 3.000.000 de pixels, tout simplement parce que sa mise au point est plus sophistiquée. Une photo de 2.000.000 de pixels enregistrée sans compression aurait une taille approchant les 6 Mo. Les photos sont donc compressées avant mémorisation en utilisant généralement la méthode de compression JPEG. C’est une compression avec une perte qui peut cependant être peu détectable par l’oeil humain. Le format des fichiers produits est habituellement JPG qui est un format standard plus pratique pour les échanges. la mémoire: on peut rencontrer deux types de mémoire: mémoire fixe ou mémoire amovible. Les supports peuvent, eux, être différents. Le plus familier est la disquette qui ne demande pas de manipulations de transfert particulières avec comme désavantage évident celui de la taille très limitée du support. Des supports de type “mémoire flash” (Compact Flash, Smart Média) proposent davantage d’espace: 4, 8, 16, 32, 64 et même 128 Mo. Le nombre de photos qu’il est possible de stocker va également dépendre de la qualité des images capturées. Les supports de type “mémoire flash” sont évidemment plus coûteux. Le transfert des photos sur l’ordinateur: Le transfert des photos en mémoire centrale ou vers une imprimante est pris en charge par un logiciel spécialisé qui propose d’ailleurs souvent une planche de contact des photos mémorisées sur l’appareil. Ce logiciel peut aussi, selon les cas, prendre partiellement le contrôle de l’appareil. Le transfert des photos sur PC (ou sur Mac d’ailleurs) peut se faire par l’intermédiaire d’un câble (série ou USB). Si c’est un câble série, il faut parfois s’armer de patience. Il est également possible de disposer d’un lecteur de “mémoire flash” qui sera, lui, un périphérique de l’ordinateur. Quelquefois, il est possible de loger la carte mémoire sur une “fausse” disquette Monique Colinet CeFIS - FUNDP Page 18 Le traitement des images 31/2 pouces et d’utiliser le lecteur de disquette pour le transfert. Les possibilités étant multiples, le choix se fera en fonction de l’environnement dont vous disposez. Le logiciel de récupération des photos Il a pour but principal de transférer les données numériques relatives aux images de l’appareil photo vers la mémoire vive de l’ordinateur. Il permet également le pilotage de l’appareil photo numérique (pilote TWAIN). Il permet enfin une sauvegarde des images sur le disque dur de cet ordinateur. Les formats pris en charge dépendent de l’appareil photo. Les plus courants sont BMP, TIF ou JPG. Le choix dépendra des utilisations ultérieures de ces photos. Le logiciel de retouche d’images La récupération des photos étant faite, l’étape à envisager est le traitement de ces images par l’intermédiaire d’un logiciel de retouche d’images. Ceux-ci sont nombreux sur le marché mais ils possèdent pratiquement tous les mêmes fonctions. On peut citer : • les transformations simples: rotations, retournements, déformations,... • Le changement des dimensions de l’image: - par re-dimensionnement - par ré-échantillonnage • La suppression des défauts • La modification des couleurs • La production d’effets spéciaux (filtres) • L’utilisation des fonctions de dessin et de peinture • La réalisation de montages (plusieurs techniques) Monique Colinet CeFIS - FUNDP Page 19 Le traitement des images • ... • La sauvegarde et éventuellement la conversion de l’image dans un format plus adapté. Monique Colinet CeFIS - FUNDP Page 20