La vision repouss plus loin ses lim

Transcription

La vision repouss plus loin ses lim
064_066_Sol 1/02/05 15:35 Page 64
Solutions
TRAITEMENT D’IMAGES
La vision repouss
plus loin ses lim
▼
Depuis les premières applications de la vision industrielle au
début des années 80, les outils de traitement d’images ont considérablement évolué. Les progrès accomplis en informatique et
en électronique ont permis de développer et d’utiliser des algorithmes de plus en plus sophistiqués. Grâce au seuillage, à la corrélation normalisée ou encore à l’analyse géométrique, la vision
a désormais réponse à tout, ou presque… A travers un tour d’horizon des principales technologies, Cognex revient sur les principales étapes qui ont marqué cette évolution.
M
esures dimensionnelles,
contrôle d’aspect, de forme,
guidage de robots, reconnaissance de caractères, lecture de codes à barres… quelle que soit l’application pour laquelle on utilise la vision
industrielle, la première étape est toujours la
même : localiser l’objet dans l’image.
L’opération est loin d’être simple. Dans un
environnement de production, les conditions
du contrôle sont toujours soumises à d’infiL’essentiel
nies variations. La
Reconnaître un objet
manière dont se préquelles que soient ses
sente l’objet devant la
variations de positionnecaméra, ses éventuels
ment angulaire, d’échelle,
de contraste ou d’état de
défauts d’aspect, la cousurface… c’est l’affaire des
leur de l’arrière-plan,les
algorithmes de traitement
variations d’éclairage,
d’images.
les ombres projetées, les
Depuis les débuts de la
réflexions parasites…
vision, ceux-ci ont considésont autant de facteurs
rablement évolué. Du
seuillage à l’analyse géoque l’on ne maîtrise pas
métrique en passant par la
forcément et qui comcorrélation normalisée, ils
pliquent lourdement la
ont permis de repousser
tâche. Le succès (ou
toujours plus loin les
l’échec) de l’application
limites de la vision.
repose alors sur les
En début d’année, Cognex
outils de traitement
a de nouveau franchi une
étape supplémentaire avec
d’images utilisés.
son logiciel PatFlex, perPour faire simple, ceuxmettant de contrôler les
ci peuvent se résumer
objets déformables ou foren trois grandes
tement inclinés.
familles : la binarisation
64
(ou seuillage des niveaux de gris), la corrélation normalisée et l’analyse géométrique (ou
vectorielle).
La binarisation est la plus ancienne.Apparue
avec les premiers systèmes de vision au début
des années 80, elle a été jusqu’en 1987 la seule méthode utilisée dans le domaine du traitement d’images. Son principe est tout ce qu’il
y a de plus simple : traiter une image en
niveaux de gris pour la transformer en une
image binaire (en noir et blanc). L’objet
recherché est alors constitué des pixels dont
l’intensité lumineuse est inférieure à un certain seuil préétabli.
La binarisation est la méthode la plus simple,
la plus rapide et la moins coûteuse en termes
de puissance de calcul. L’inconvénient, c’est
qu’elle repose sur un simple seuil de niveaux
de gris. Si les conditions varient (en particulier l’éclairage, l’état de surface de la pièce, ou
encore son arrière-plan), le seuil n’est plus
valable et le contrôle n’est plus aussi fiable.
La méthode convient donc aux applications en
environnement maîtrisé et présentant de forts
contrastes entre l’objet à localiser et son arrière-plan. C’est le cas par exemple de certains
contrôles de présence/absence d’éléments : la
présence d’un alésage mis en évidence par un
rétroéclairage,le contrôle d’étiquettes blanches
sur un fond sombre, etc. La binarisation peut
aussi permettre de déterminer le centre de gravité d’un alésage, par exemple, ainsi que de
calculer son périmètre ou sa surface, mais cela
s’arrête là. Comme elle traite l’image pixel par
pixel,la méthode ne permet pas de réaliser des
mesures dimensionnelles (à moins de se
contenter d’une précision qui ne sera pas
meilleure que le pixel).
Grâce à la corrélation normalisée, introduite par Cognex en 1987, la vision accomplit un
formidable pas en avant. Il n’est plus question
de binariser l’image, il n’est d’ailleurs même
plus question de “seuils” de niveaux de gris,
mais de retrouver un modèle mémorisé au
cours de la phase d’apprentissage... L’algorithme fonctionne en fait comme si l’on recopiait
le modèle de la pièce sur un papier calque, et
que l’on déplace ensuite le papier calque devant
l’image jusqu’à retrouver la meilleure correspondance (le meilleur “score”de corrélation).
On peut même se contenter de n’apprendre
qu’une partie de la pièce (celle où se trouve
par exemple l’alésage que l’on souhaite contrôler), du moment bien sûr que l’objet à retrouver dans l’image est unique.
La méthode, qui a commencé à se généraliser
au milieu des années 90 (lorsque les processeurs des systèmes de vision ont été assez puissants pour l’intégrer), est à l’origine des premiers succès et des premiers élans
d’enthousiasme pour la vision industrielle.
Considérée comme une méthode de référence
pour bon nombre de fournisseurs et d’utilisateurs, elle reste aujourd’hui prédominante sur
le marché des systèmes de vision sur base PC.
Son principal intérêt, c’est que l’image du
modèle est mémorisée sous forme de bitmap, c’est-à-dire avec ses niveaux de gris. On
MESURES 769 - NOVEMBRE 2004
064_066_Sol 1/02/05 15:35 Page 65
Solutions
se toujours
mites
peut donc s’affranchir des variations linéaires
d’éclairage ou de contraste (il suffit de diminuer ou d’augmenter le niveau de gris du
modèle pour améliorer le score).
Autre avantage, la précision sur la localisation
de l’objet peut atteindre le quart, voire même
le dixième de pixel dans les meilleures conditions d’environnement et de répétabilité.
Grâce à ces caractéristiques, la corrélation normalisée peut être aussi bien utilisée pour des
contrôles dimensionnels que pour des applications de guidage de robots ou encore de reconnaissance de caractères. Elle nécessite bien sûr
des processeurs plus puissants que la binarisation,
mais cela n’empêche pas certains fournisseurs de
l’intégrer aussi (sous une forme simplifiée) dans
leurs “capteurs” de vision.
En revanche,la méthode ne permet pas de s’affranchir des variations locales d’éclairage ou
d’états de surface. La présence d’ombres ou de
reflets à la surface de la pièce,de grosses rayures
ou encore la présence d’intrus dans l’arrièreplan, sont autant de risques de faux rejets.
Il en est de même pour les variations d’échelle
ou de positionnement angulaire.Le modèle appris
est en effet l’image de la pièce dans une position
donnée. Si les pièces à contrôler sont orientées
différemment,le modèle ne peut plus s’y superposer parfaitement et le score diminue…
L’introduction de l’analyse géométrique en
1997 va permettre de s’affranchir de ces
contraintes.Cette année-là,Cognex lance en effet
une nouvelle technologie,PatMax,qui change
les règles du traitement d’images. Au lieu de
représenter l’objet comme un simple amas de
pixels ou comme un modèle de la pièce dans
une position et un environnement donnés,cette méthode considère la forme géométrique
globale de la pièce.Pour cela,elle décompose le
modèle en une succession de figures primaires,
et les recherche ensuite dans l’image. Un rectangle,par exemple,sera décrit par quatre segments de droite perpendiculaires entre eux.Peu
importent alors les variations de positionnement angulaire,de contraste,la couleur de l’arrière-plan,celle de la pièce,ou la présence d’obMESURES 769 - NOVEMBRE 2004
jets occultant partiellement l’image : les quatre
segments de droite seront toujours reconnus,
avec la même précision.
De même, les variations locales d’aspect
(reflets, ombres, rayures, tâches d’huile) et
les variations d’éclairage (même non uniformes) ne modifient en rien la représentation géométrique de l’objet.
La robustesse et la précision du résultat n’ont
donc rien de comparable avec celles des
méthodes précédentes. Les objets sont localisés
avec une précision de l’ordre du quarantième
de pixel, et leur orientation angulaire est déterminée au centième de degré près. Quant à la
vitesse de traitement, elle n’est pas plus faible
qu’en utilisant un algorithme basé sur la corrélation normalisée.PatMax,par exemple,permet
de reconnaître jusqu’à 40 pièces par seconde.
Autre avantage notable, les variations d’échelle ne sont plus un obstacle à la reconnaissance des formes géométriques primaires de la
pièce. Au contraire, il peut même être intéressant de les mesurer afin d’en déduire la
hauteur de la caméra (pour faciliter notamment les applications de palettisation). Une
application nécessitant auparavant une dizaine de caméras pour s’approcher au mieux de
l’objet avec le bras d’un robot et le saisir “au
bon moment” peut ainsi se réduire à un
contrôle géométrique à l’aide d’un système
de vision et d’une seule caméra.
Grâce à sa robustesse, l’analyse géométrique
est utilisable dans une très large gamme d’applications et dans des environnements relativement difficiles. Du moment que le contraste est suffisant pour extraire les formes
Ces copies d’écran présentent les résultats obtenus avec trois algorithmes de traitement d’images :la binarisation (pour les deux copies d’écran en
haut de chaque image),la corrélation normalisée (en bas à gauche de chaque image) et l’analyse géométrique (en bas à droite de chaque image).
En haut à gauche :Avec un arrière-plan uniforme et dans des conditions optimales de luminosité et de contraste,les alésages de la pièce mécanique
sont reconnus par les trois algorithmes.Ceux-ci permettent même de déterminer le centre de gravité de l’alésage et de mesurer son périmètre.
En haut à droite :L’algorithme PatFlex,basé sur l’analyse géométrique,permet de contrôler les objets inclinés.Pour cela,il mesure les variations
locales d’échelles de l’objet et remet son image “à plat”.
En bas :Lorsqu’un objet vient modifier la couleur de l’arrière-plan,la binarisation ne permet plus de reconnaître les alésages,et la corrélation
normalisée ne les reconnaît que partiellement.L’analyse géométrique,en revanche,les localise toujours et détermine la position du centre de gravité avec la même précision que dans des conditions idéales.
65
064_066_Sol 1/02/05 15:35 Page 66
Solutions
géométriques primaires de l’objet, le système
de vision reconnaît tous types de pièces,même
lorsqu’elles se présentent de différentes
manières devant les caméras.
L’analyse géométrique est donc couramment
employée en robotique, pour le guidage
Cognex, en bref
des bras de robots, le
Fondé aux États-Unis
contrôle d’emballages,
en 1981
le conditionnement de
Chiffre d’affaires 2003 :
pièces en vrac, etc. C’est
150 M$
aussi la méthode la plus
650 personnes dont 250
précise pour réaliser des
en R&D
mesures dimension 200 000 systèmes de vision
nelles.
installés dans le monde
Seule limite, la métho Siège européen à
de ne permet pas de
Rueil-Malmaison (92)
s’affranchir des déformations locales de l’objet… Ou du moins ne le permettait pas. En
début d’année, Cognex a en effet introduit PatFlex, une évolution de PatMax permettant de
contrôler les objets déformables (tels que les
emballages souples) ou fortement inclinés.
L’algorithme intégré dans PatFlex reconstitue en fait l’image du modèle en “mettant à
plat” les déformations de l’objet par une
66
mesure locale de l’échelle. Un quadrillage,
projeté devant l’image, permet même de
visualiser ces déformations.
L’intérêt de la méthode est multiple. Une fois
l’image redressée, il est possible de reconnaître
des cercles devenus ovales par effet de perspective, ainsi que de lire des caractères imprimés sur des emballages légèrement froissés.
Autre exemple,un reflet lumineux sur l’alésage
d’une pièce métallique peut faire apparaître à
l’image une fausse “dilatation” du diamètre
de l’alésage. Dans ce cas, l’algorithme redresse les courbes qui définissent l’alésage et
reconstruit l’image non déformée.
La technologie est bien sûr moins rapide que l’analyse géométrique classique,mais elle lui est complémentaire.Elle n’est pas adaptée,par exemple,aux
applications de mesures dimensionnelles. Son
objectif est simplement de retrouver l’objet,même
s’il est localement déformé.
PatFlex trouve ses applications dans le domaine des cosmétiques (pour lire les caractères
déformés inscrits sur des produits cylindriques), dans le conditionnement de produits alimentaires (pour contrôler la présence d’étiquettes ou lire les caractères inscrits
sur des emballages souples ou froissés), et
même en microélectronique (où il permet de
s’affranchir des microdéformations locales
des cartes à puce).
Dès lors, la vision industrielle n’a plus de
limites, ou presque. La précision et la robustesse apportées par les algorithmes les plus
sophistiquées bénéficient aussi aux applications les plus simples. Dans le domaine de
la robotique, désormais, plus rien ne peut
empêcher les robots de reconnaître et de saisir des pièces en circulation sur un convoyeur
(du moment bien sûr que les pièces ne se
chevauchent pas). En matière de contrôle
d’assemblage, la vision peut là encore couvrir
la grande majorité des applications. C’est le
cas aussi dans le domaine du contrôle d’aspect ou de l’identification automatique, pour
lequel l’analyse géométrique permet de lire
tous types de codes, même s’ils sont salis,
partiellement dégradés ou inclinés.
Finalement, les technologies de traitement
d’images nécessaires existent. Pour les fournisseurs de vision, il ne reste plus désormais
qu’à rendre l’existant toujours plus accessible…
Alain Duflot
Directeur technique de Cognex
MLZ
MESURES 769 - NOVEMBRE 2004

Documents pareils