La vision repouss plus loin ses lim
Transcription
La vision repouss plus loin ses lim
064_066_Sol 1/02/05 15:35 Page 64 Solutions TRAITEMENT D’IMAGES La vision repouss plus loin ses lim ▼ Depuis les premières applications de la vision industrielle au début des années 80, les outils de traitement d’images ont considérablement évolué. Les progrès accomplis en informatique et en électronique ont permis de développer et d’utiliser des algorithmes de plus en plus sophistiqués. Grâce au seuillage, à la corrélation normalisée ou encore à l’analyse géométrique, la vision a désormais réponse à tout, ou presque… A travers un tour d’horizon des principales technologies, Cognex revient sur les principales étapes qui ont marqué cette évolution. M esures dimensionnelles, contrôle d’aspect, de forme, guidage de robots, reconnaissance de caractères, lecture de codes à barres… quelle que soit l’application pour laquelle on utilise la vision industrielle, la première étape est toujours la même : localiser l’objet dans l’image. L’opération est loin d’être simple. Dans un environnement de production, les conditions du contrôle sont toujours soumises à d’infiL’essentiel nies variations. La Reconnaître un objet manière dont se préquelles que soient ses sente l’objet devant la variations de positionnecaméra, ses éventuels ment angulaire, d’échelle, de contraste ou d’état de défauts d’aspect, la cousurface… c’est l’affaire des leur de l’arrière-plan,les algorithmes de traitement variations d’éclairage, d’images. les ombres projetées, les Depuis les débuts de la réflexions parasites… vision, ceux-ci ont considésont autant de facteurs rablement évolué. Du seuillage à l’analyse géoque l’on ne maîtrise pas métrique en passant par la forcément et qui comcorrélation normalisée, ils pliquent lourdement la ont permis de repousser tâche. Le succès (ou toujours plus loin les l’échec) de l’application limites de la vision. repose alors sur les En début d’année, Cognex outils de traitement a de nouveau franchi une étape supplémentaire avec d’images utilisés. son logiciel PatFlex, perPour faire simple, ceuxmettant de contrôler les ci peuvent se résumer objets déformables ou foren trois grandes tement inclinés. familles : la binarisation 64 (ou seuillage des niveaux de gris), la corrélation normalisée et l’analyse géométrique (ou vectorielle). La binarisation est la plus ancienne.Apparue avec les premiers systèmes de vision au début des années 80, elle a été jusqu’en 1987 la seule méthode utilisée dans le domaine du traitement d’images. Son principe est tout ce qu’il y a de plus simple : traiter une image en niveaux de gris pour la transformer en une image binaire (en noir et blanc). L’objet recherché est alors constitué des pixels dont l’intensité lumineuse est inférieure à un certain seuil préétabli. La binarisation est la méthode la plus simple, la plus rapide et la moins coûteuse en termes de puissance de calcul. L’inconvénient, c’est qu’elle repose sur un simple seuil de niveaux de gris. Si les conditions varient (en particulier l’éclairage, l’état de surface de la pièce, ou encore son arrière-plan), le seuil n’est plus valable et le contrôle n’est plus aussi fiable. La méthode convient donc aux applications en environnement maîtrisé et présentant de forts contrastes entre l’objet à localiser et son arrière-plan. C’est le cas par exemple de certains contrôles de présence/absence d’éléments : la présence d’un alésage mis en évidence par un rétroéclairage,le contrôle d’étiquettes blanches sur un fond sombre, etc. La binarisation peut aussi permettre de déterminer le centre de gravité d’un alésage, par exemple, ainsi que de calculer son périmètre ou sa surface, mais cela s’arrête là. Comme elle traite l’image pixel par pixel,la méthode ne permet pas de réaliser des mesures dimensionnelles (à moins de se contenter d’une précision qui ne sera pas meilleure que le pixel). Grâce à la corrélation normalisée, introduite par Cognex en 1987, la vision accomplit un formidable pas en avant. Il n’est plus question de binariser l’image, il n’est d’ailleurs même plus question de “seuils” de niveaux de gris, mais de retrouver un modèle mémorisé au cours de la phase d’apprentissage... L’algorithme fonctionne en fait comme si l’on recopiait le modèle de la pièce sur un papier calque, et que l’on déplace ensuite le papier calque devant l’image jusqu’à retrouver la meilleure correspondance (le meilleur “score”de corrélation). On peut même se contenter de n’apprendre qu’une partie de la pièce (celle où se trouve par exemple l’alésage que l’on souhaite contrôler), du moment bien sûr que l’objet à retrouver dans l’image est unique. La méthode, qui a commencé à se généraliser au milieu des années 90 (lorsque les processeurs des systèmes de vision ont été assez puissants pour l’intégrer), est à l’origine des premiers succès et des premiers élans d’enthousiasme pour la vision industrielle. Considérée comme une méthode de référence pour bon nombre de fournisseurs et d’utilisateurs, elle reste aujourd’hui prédominante sur le marché des systèmes de vision sur base PC. Son principal intérêt, c’est que l’image du modèle est mémorisée sous forme de bitmap, c’est-à-dire avec ses niveaux de gris. On MESURES 769 - NOVEMBRE 2004 064_066_Sol 1/02/05 15:35 Page 65 Solutions se toujours mites peut donc s’affranchir des variations linéaires d’éclairage ou de contraste (il suffit de diminuer ou d’augmenter le niveau de gris du modèle pour améliorer le score). Autre avantage, la précision sur la localisation de l’objet peut atteindre le quart, voire même le dixième de pixel dans les meilleures conditions d’environnement et de répétabilité. Grâce à ces caractéristiques, la corrélation normalisée peut être aussi bien utilisée pour des contrôles dimensionnels que pour des applications de guidage de robots ou encore de reconnaissance de caractères. Elle nécessite bien sûr des processeurs plus puissants que la binarisation, mais cela n’empêche pas certains fournisseurs de l’intégrer aussi (sous une forme simplifiée) dans leurs “capteurs” de vision. En revanche,la méthode ne permet pas de s’affranchir des variations locales d’éclairage ou d’états de surface. La présence d’ombres ou de reflets à la surface de la pièce,de grosses rayures ou encore la présence d’intrus dans l’arrièreplan, sont autant de risques de faux rejets. Il en est de même pour les variations d’échelle ou de positionnement angulaire.Le modèle appris est en effet l’image de la pièce dans une position donnée. Si les pièces à contrôler sont orientées différemment,le modèle ne peut plus s’y superposer parfaitement et le score diminue… L’introduction de l’analyse géométrique en 1997 va permettre de s’affranchir de ces contraintes.Cette année-là,Cognex lance en effet une nouvelle technologie,PatMax,qui change les règles du traitement d’images. Au lieu de représenter l’objet comme un simple amas de pixels ou comme un modèle de la pièce dans une position et un environnement donnés,cette méthode considère la forme géométrique globale de la pièce.Pour cela,elle décompose le modèle en une succession de figures primaires, et les recherche ensuite dans l’image. Un rectangle,par exemple,sera décrit par quatre segments de droite perpendiculaires entre eux.Peu importent alors les variations de positionnement angulaire,de contraste,la couleur de l’arrière-plan,celle de la pièce,ou la présence d’obMESURES 769 - NOVEMBRE 2004 jets occultant partiellement l’image : les quatre segments de droite seront toujours reconnus, avec la même précision. De même, les variations locales d’aspect (reflets, ombres, rayures, tâches d’huile) et les variations d’éclairage (même non uniformes) ne modifient en rien la représentation géométrique de l’objet. La robustesse et la précision du résultat n’ont donc rien de comparable avec celles des méthodes précédentes. Les objets sont localisés avec une précision de l’ordre du quarantième de pixel, et leur orientation angulaire est déterminée au centième de degré près. Quant à la vitesse de traitement, elle n’est pas plus faible qu’en utilisant un algorithme basé sur la corrélation normalisée.PatMax,par exemple,permet de reconnaître jusqu’à 40 pièces par seconde. Autre avantage notable, les variations d’échelle ne sont plus un obstacle à la reconnaissance des formes géométriques primaires de la pièce. Au contraire, il peut même être intéressant de les mesurer afin d’en déduire la hauteur de la caméra (pour faciliter notamment les applications de palettisation). Une application nécessitant auparavant une dizaine de caméras pour s’approcher au mieux de l’objet avec le bras d’un robot et le saisir “au bon moment” peut ainsi se réduire à un contrôle géométrique à l’aide d’un système de vision et d’une seule caméra. Grâce à sa robustesse, l’analyse géométrique est utilisable dans une très large gamme d’applications et dans des environnements relativement difficiles. Du moment que le contraste est suffisant pour extraire les formes Ces copies d’écran présentent les résultats obtenus avec trois algorithmes de traitement d’images :la binarisation (pour les deux copies d’écran en haut de chaque image),la corrélation normalisée (en bas à gauche de chaque image) et l’analyse géométrique (en bas à droite de chaque image). En haut à gauche :Avec un arrière-plan uniforme et dans des conditions optimales de luminosité et de contraste,les alésages de la pièce mécanique sont reconnus par les trois algorithmes.Ceux-ci permettent même de déterminer le centre de gravité de l’alésage et de mesurer son périmètre. En haut à droite :L’algorithme PatFlex,basé sur l’analyse géométrique,permet de contrôler les objets inclinés.Pour cela,il mesure les variations locales d’échelles de l’objet et remet son image “à plat”. En bas :Lorsqu’un objet vient modifier la couleur de l’arrière-plan,la binarisation ne permet plus de reconnaître les alésages,et la corrélation normalisée ne les reconnaît que partiellement.L’analyse géométrique,en revanche,les localise toujours et détermine la position du centre de gravité avec la même précision que dans des conditions idéales. 65 064_066_Sol 1/02/05 15:35 Page 66 Solutions géométriques primaires de l’objet, le système de vision reconnaît tous types de pièces,même lorsqu’elles se présentent de différentes manières devant les caméras. L’analyse géométrique est donc couramment employée en robotique, pour le guidage Cognex, en bref des bras de robots, le Fondé aux États-Unis contrôle d’emballages, en 1981 le conditionnement de Chiffre d’affaires 2003 : pièces en vrac, etc. C’est 150 M$ aussi la méthode la plus 650 personnes dont 250 précise pour réaliser des en R&D mesures dimension 200 000 systèmes de vision nelles. installés dans le monde Seule limite, la métho Siège européen à de ne permet pas de Rueil-Malmaison (92) s’affranchir des déformations locales de l’objet… Ou du moins ne le permettait pas. En début d’année, Cognex a en effet introduit PatFlex, une évolution de PatMax permettant de contrôler les objets déformables (tels que les emballages souples) ou fortement inclinés. L’algorithme intégré dans PatFlex reconstitue en fait l’image du modèle en “mettant à plat” les déformations de l’objet par une 66 mesure locale de l’échelle. Un quadrillage, projeté devant l’image, permet même de visualiser ces déformations. L’intérêt de la méthode est multiple. Une fois l’image redressée, il est possible de reconnaître des cercles devenus ovales par effet de perspective, ainsi que de lire des caractères imprimés sur des emballages légèrement froissés. Autre exemple,un reflet lumineux sur l’alésage d’une pièce métallique peut faire apparaître à l’image une fausse “dilatation” du diamètre de l’alésage. Dans ce cas, l’algorithme redresse les courbes qui définissent l’alésage et reconstruit l’image non déformée. La technologie est bien sûr moins rapide que l’analyse géométrique classique,mais elle lui est complémentaire.Elle n’est pas adaptée,par exemple,aux applications de mesures dimensionnelles. Son objectif est simplement de retrouver l’objet,même s’il est localement déformé. PatFlex trouve ses applications dans le domaine des cosmétiques (pour lire les caractères déformés inscrits sur des produits cylindriques), dans le conditionnement de produits alimentaires (pour contrôler la présence d’étiquettes ou lire les caractères inscrits sur des emballages souples ou froissés), et même en microélectronique (où il permet de s’affranchir des microdéformations locales des cartes à puce). Dès lors, la vision industrielle n’a plus de limites, ou presque. La précision et la robustesse apportées par les algorithmes les plus sophistiquées bénéficient aussi aux applications les plus simples. Dans le domaine de la robotique, désormais, plus rien ne peut empêcher les robots de reconnaître et de saisir des pièces en circulation sur un convoyeur (du moment bien sûr que les pièces ne se chevauchent pas). En matière de contrôle d’assemblage, la vision peut là encore couvrir la grande majorité des applications. C’est le cas aussi dans le domaine du contrôle d’aspect ou de l’identification automatique, pour lequel l’analyse géométrique permet de lire tous types de codes, même s’ils sont salis, partiellement dégradés ou inclinés. Finalement, les technologies de traitement d’images nécessaires existent. Pour les fournisseurs de vision, il ne reste plus désormais qu’à rendre l’existant toujours plus accessible… Alain Duflot Directeur technique de Cognex MLZ MESURES 769 - NOVEMBRE 2004