Dorénavant, nous ne nous intéresserons plus qu'à
la reconnaissance du relief d'une scène à partir d'une ou
de plusieurs images (numériques) de cette scène.
Les images seront supposées représentées en niveaux
de gris (allant du noir au blanc) car on ne s'intéresse plus à
la couleur. Soit une image ayant M lignes et N colonnes. Chaque pixel de
l'image a un niveau de gris Ei,j tel que :
- pour i appartenant à [1,M] et j à [1,N], Ei,j est
positif ou nul ;
- Ei,j est de type integer, float, double, ...
1. Problème général de la vision du relief.
1.1. Les trois éléments en présence.
- Scène (ou objet) dont on veut connaître le relief.
- Appareil photo (ou observateur).
1.2. But de la reconnaissance du relief.
On suppose que l'image est nette (c'est-à-dire
qu'elle ne présente ni flou de mise au point, ni flou par "bougé"),
et on veut connaître le relief de la partie de la scène à
la fois éclairée par les sources lumineuses et visible par
l'appareil photo (ou par l'observateur).
En général, on ne connaît
ni la position, ni les caractéristiques photométriques des
sources lumineuses.
2. Cas où on ne dispose que d'une seule image.
Ce cas est celui de la "monovision".
2.1. Formulation du problème.
On cherche à calculer z pour tout
point de l'image. En fait, on calcule z à
une constante additive près.
2.2. Les différentes méthodes.
On peut utiliser différents critères :
- flou de la mise au point (pas celui du
bougé) : marginal ;
- texture : champ d'application limité
;
- ombres portées : marginal ;
- ombres propres : cas le plus général
("shape from shading").
Ces méthodes présentent toutes un problème majeur
: beaucoup d'hypothèses leur sont nécessaires, et elles sont
donc peu fiables. Elles ne sont pas utilisées industriellement (par exemple en
robotique). Toutes les méthodes utilisées en robotique utilisent
plusieurs images.
3. Cas où on dispose de plusieurs images.
Différentes situations sont possibles :
- Cas 1 : la scène et l'appareil sont fixes, les sources lumineuses se déplacent
("stéréophotométrie").
- Cas 2 : les sources lumineuses et l'appareil sont fixes, la scène se déplace
("mouvement").
- Cas 3 : la scène et les sources lumineuses sont fixes, l'observateur se déplace
("stéréovision").
3.1. Cas 1 : stéréophotométrie.
On prend une photo avec une source lumineuse S1, puis une photo avec une source lumineuse
S2, etc... La scène est fixe.
Exemple de la Lune :
Problème :
Si la scène bouge, ce qui est souvent le cas en robotique, il faut
prendre deux photos simultanément avec deux éclairages différents,
ce qui n'est pas toujours facile à réaliser.
3.2. Cas 2 : mouvement.
On prend plusieurs photos successives d'une scène
mobile, mais cela ne rajoute pas beaucoup d'information vis-à-vis
de la reconnaissance du relief.
Ce domaine a été cité dans
le chapitre 1. Il présente
cependant un point commun avec la vision du relief, car il faut réaliser
la mise en correspondance d'un même point physique sur une séquence
d'images :
Problème :
Le but n'est pas le calcul du relief, mais celui
du mouvement. Le cas 2 correspond donc à l'analyse du mouvement
en monovision.
3.2. Cas 3 : stéréovision.
On change la position de la caméra entre les différentes prises de vue.
On peut aussi utiliser plusieurs caméras et prendre les photos simultanément, ce
qu'on ne pouvait pas faire dans les cas 1 et 2.
Cela est d'ailleurs nécessaire pour l'analyse du mouvement en stéréovision.
En général, on se trouve dans l'un des deux cas suivants :
- 2 caméras : stéréovision
binoculaire ;
- 3 caméras : stéréovision
trinoculaire.
Difficultés :
- Si on utilise plusieurs caméras, elles
ne sont pas caractérisées par les mêmes paramètres
(exemples :).
- Phase 1
= calibrage :
il faudra maîtriser les paramètres des caméras.
- Phase 2
= appariement :
mise en correspondance des pixels correspondant à un même
point physique (comme en vision du mouvement).
- Phase 3
= triangulation :
calcul du relief d'une paire de pixels appariés.
La phase la plus difficile à réaliser
est la phase 2.
Nous y reviendrons dans le chapitre 3.
4. Bilan sur les différents domaines de la
vision par ordinateur.
Remarque :
Il existe un domaine à part entière de la vision du relief
par ordinateur, dont nous ne parlerons pas dans le cadre de ce cours, et
qui s'appelle la "vision active". Pour donner une idée
des méthodes utilisées dans ce domaine, nous en donnons ici
deux exemples :
- Exemple 1 : on place une grille devant la source lumineuse, et on peut
analyser le mouvement de la scène à partir des déformations
de l'ombre de la grille sur la surface de cette scène.
- Exemple 2 : on place la scène sur un plateau pivotant autour
de la verticale. Pour chaque position du plateau, on balaie la scène
verticalement à l'aide d'un faisceau laser, ce qui permet un relevé
très précis de sa surface (ceci est utilisé pour la
reproduction d'objets d'art fragiles).
Ces pages ont été réalisées par
Jean-Denis Durou et Anne-Marie Pocquet.
Pour tout commentaire, envoyer un mail à
durou@irit.fr ou
à pocquet@irit.fr.