Formation et représentations d`image

Transcription

Formation et représentations d`image
Analyse et Synthèse d'Images
James L. Crowley
DESS Génie Informatique
1999/00
Séance 1 :
Plan de la Séance :
2 janvier 2000
Représentation et Formation d'Images
La perception visuelle humaine.......................... 2
La Rétine Humaine ..............................................................2
L'Horopteur........................................................................4
Version et Vergence ............................................................5
Représentation des Images ............................... 6
Acquisition et Affichage.......................................................6
Format Binaire (Bit Map et Pix Map)...................................7
La trame entrelaçait.............................................................8
Représentation en mémoire des images ..................................9
Surfaces virtuelle, lucarne et fenêtre.................................... 10
Modèle Mathématique de la Formation d'Image.....11
Les Repères ...................................................................... 11
Transformation rétine->image............................................ 12
Organisation des Séances
Cours: 8 Séances
TDA: 8 TDAs.
Représentation et Formation d'Images
Séance 1
La perception visuelle humaine
Fovéa
αmin = 1 minute
Cornéa
L'œil Humain est une sphère pilotable en θ, ϕ, et ψ.
L'image est détectée par les récepteurs dans la fovéa.
À une distance de 30 cm, 1 min d'arc est environ 0.0075 cm (0.003 inchs)
Ça correspond à un point ("dot") d'une imprimante à 300 ppp. (dots per inch).
La perception visuelle est une fonction logarithmique du contraste.
Si I o est le contraste minimal perceptible, le contraste apparent est
I1
L = log(I ).
o
L'acuité minimum de l'œil humain est environ 1 minute d'arc.
Ça dépend du contraste.
La Rétine Humaine
Nerf Optique
Fovéa
(cônes)
Fovéa
Cornéa
Périphéríe
(bâtonnets)
Spectre de la lumière visible pour l'homme :
Le système humain est composé de bâtonnets et de cônes.
Les bâtonnets sont responsables de la perception achromatique et des lumières
atténuées.
Ils sont formés d'une pigmentation, la rhodopsine, sensible à tout le spectre,
avec une sensibilité maximale de 510 nm (vert).
1-2
Représentation et Formation d'Images
Séance 1
Ils sont dans la périphérie de la rétine, et donnent une perception de plus faible
résolution.
Les cônes sont responsables de notre vision chromatique.
Ils sont concentrés dans une zone appelée la fovéa.
Il y a trois sortes de cônes, distingués par leurs pigments :
cyanolabe α (445 nm),
chlorolabe β (535 nm), et
erythrolabe γ (570 nm)
1
Reponse
Relative
β
γ
0.5
α
λ
300
400
500
600
700
800 nm
La transformation entre stimuli de cônes et perception de couleur est un phénomène
de la perception humaine qui n'est pas encore bien modélisée.
1-3
Représentation et Formation d'Images
Séance 1
L'Horopteur
∆ = +σ
Point de Fixation
∆ =0
∆ =–σ
B CD
Horopteur :
B
C
D
Le locus des points dans la scène pour lesquels
la disparité est (proche de) zéro.
L'Horopteur est une sorte de Filtre. Il limite l'information traitée.
Il est déplacé tres rapidement par le système visuel.
Horopteur Géométrique :
F
Fixation
Point
P
Interest
point
2µ
Primary
Line of
Sight
Corresponding
Visual Rays
αl
Left
Retina
ηr
ηl
αr
Right
Retina
Fixation Center
Surface de disparité null: ηl = ηr
1-4
Représentation et Formation d'Images
Le cercle Vief - Muller :
Séance 1
Z
2η
η
η
αr
αl
x
Version et Vergence
Z
Z
2η
∆αl
∆αl
∆αr
αc
x
∆αr
αc
X
Version: ∆α l = ∆α r
Vergence
∆α L ≠ ∆α R
Version : déplacer le point de fixation sur l'horopteur avec ∆α l = ∆α r
Vergence : déplacer l'horopteur par ∆α L ≠ ∆α R
Le système de commande neurale de la fixation est colliculus supérieure.
Il est géré les stimulations dans un espace "version-vergence".
Il fusion les stimulus venant des centres de motricité, réaction et délibération.
1-5
Représentation et Formation d'Images
Séance 1
Représentation des Images
Acquisition et Affichage
Modèle de la Caméra Géométrie Physique
Y
j
•
X
Z
Axe Optique
•
i
F
Objective
Rétine
Modèle Mathématique: Projection Centrale
Les coordonnées de l'image sont main gauche.
Y
i
P = (X , Ys , Z s)
s
s
Pc = (X c, Y c , Z c)
F
X
•
•
Z
Image
Objective
Axe Optique
Pi = (i, j)
=> (x r, y r, 0)
j
Affichage d'une image
Image
Ecran
1-6
Représentation et Formation d'Images
Séance 1
Format Binaire (Bit Map et Pix Map)
Pixel = Picture Element.
Une image est un tableau de pixels:
O
0
NCols-1
0
NRows-1
Question : Est-ce que les pixels sont "carrés"?
Réponse : non. (Ça dépend de l'affichage).
Le nombre de pixels de l'image dépend de la matérielle.
Silicon Graphics : 768 colonnes x 576 lignes
VGA : 640 x 480
1-7
Représentation et Formation d'Images
Séance 1
La trame entrelaçait
A fin de minimiser les effets d'affichage, les images sont souvent affichées
(et acquises) en trame entrelaçait.
Lignes "paires".
•
••
0
2
4
NRows-2
Lignes "impaires".
•
••
1
3
5
NRows-1
Ceci peut avoir les effets néfastes pour la perception du mouvement.
1-8
Représentation et Formation d'Images
Séance 1
Représentation en mémoire des images
En mémoire, l'image est un tableau 1-D
0
1
2
•••
NRows-1
ptr
Le vecteur est créé par
unsigned char *image;
image = (unsigned char *) malloc(nRows * nCols * sizeof(char));
L'adresse d'un pixel à colonne i, ligne j est :
ptr = (pixel *) sizeof(pixel) * (j . nCols + i);
Deux façons d'accéder au pixel à colonne i, ligne j.
for(j=0; j < nRows; j++)
for(i=0; i < nCols; i++)
image[ptr++] = getPixel(i, j, image2, nCols, nRows);
Il est fréquent de définir une procédure d'accès "getPixel". Par exemple :
unsigned char getpixel( int i; int j; unsigned char *image; int nCols; int nRows; )
{
int ptr;
ptr = j * nCols + i;
if (ptr > nCols * nRows) return (Err);
else return( image[ptr]);
}
1-9
Représentation et Formation d'Images
Séance 1
Surfaces virtuelle, lucarne et fenêtre
Hello
Hello
Lucarne
Surface Virtuelle
Display Logique
Le travail est fait dans une image "Surface virtuelle".
Une lucarne de cette surface est affichée sur l'écran.
Termes Macinstosh :
Grafport Surface Virtuelle
GrafDevice - Display Logique
ClipRect Lucarne
Termes X Windows
Drawable Display -
Surface d'Affichage (Virtuelle ou Window)
Display Logique
1-10
Représentation et Formation d'Images
Séance 1
Modèle Mathématique de la Formation d'Image
Modèle de la Caméra Géométrie Physique
Y
j
•
X
Z
Axe Optique
•
i
F
Objective
Rétine
Modèle Mathématique: Projection Centrale
Les coordonnées de l'image sont main gauche.
Y
i
P = (X , Y , Z s)
s
s
s
P = (X c, Yc , Z )
c
c
F
X
•
•
Z
Image
Objective
Axe Optique
Pi = (i, j)
=> (x r, y r, 0)
j
Les Repères
Coordonnées de la Scène :
s
Point Scène :
P = (xs, y s, z s)
Coordonnées de la Caméra :
c
Point Caméra :
P = (xc, y c, z c )
r
Point Rétine :
P = (xr , y r )
Coordonnées de l'Image :
i
Point Image :
P = (i, j)
1-11
Représentation et Formation d'Images
Séance 1
Une image, rendu par une numériseur, est un tableau de pixels:
O
NCols-1
0
0
NRows-1
Transformation rétine->image
Échantillonnage et Numérisation :
E
t
Les Paramètre Intrinsèque de la Caméra :
F :
Distance Focale
Ci, C j: Centre Optique de l'Image (en pixels)
Di, D j : Taille Physique d'un Pixel dans la Rétine (pixel/mm)
xr =
i – Ci
Di
yr = –
j – Cj
Dj
i = xr Di (mm . pixel/mm) + Ci (pixel)
j = –yr Dj (mm . pixel/mm) + Cj (pixel)
1-12
Représentation et Formation d'Images
Transformation entre repère de l'image et repère de la rétine :
i
P=
i
rC
Séance 1
r
P
 i   D i 0 C i   xr 
 j  =  0 –D j C j   yr 
 1 
   0
0 1   1 
ou bien:
w iP =
i
rC
w RP
 wi  D i 0 C i   wxr 
 wj =  0 –D j C j   wyr 
w 
   0
0 1   w 
Qu’est-ce que “w” ?
1-13