Maîtrise d'informatique - Module 11
Vision par ordinateur - Cours

Chapitre 2 :

1. Problème général de la vision du relief.

2. Cas où on ne dispose que d'une seule image.

3. Cas où on dispose de plusieurs images.

4. Bilan sur les différents domaines de la vision par ordinateur.

Dorénavant, nous ne nous intéresserons plus qu'à la reconnaissance du relief d'une scène à partir d'une ou de plusieurs images (numériques) de cette scène.

Les images seront supposées représentées en niveaux de gris (allant du noir au blanc) car on ne s'intéresse plus à la couleur. Soit une image ayant M lignes et N colonnes. Chaque pixel de l'image a un niveau de gris E_i,jtel que :

pour i appartenant à [1,M] et j à [1,N], E_i,jest positif ou nul ;

E_i,jest de type integer, float, double, ...

1. Problème général de la vision du relief.

1.1. Les trois éléments en présence.

Scène (ou objet) dont on veut connaître le relief.

Sources lumineuses.

Appareil photo (ou observateur).

1.2. But de la reconnaissance du relief.

On suppose que l'image est nette (c'est-à-dire qu'elle ne présente ni flou de mise au point, ni flou par "bougé"), et on veut connaître le relief de la partie de la scène à la fois éclairée par les sources lumineuses et visible par l'appareil photo (ou par l'observateur).

En général, on ne connaît ni la position, ni les caractéristiques photométriques des sources lumineuses.

2. Cas où on ne dispose que d'une seule image.

Ce cas est celui de la "monovision".

2.1. Formulation du problème.

On cherche à calculer z pour tout point de l'image. En fait, on calcule z à une constante additive près.

2.2. Les différentes méthodes.

On peut utiliser différents critères :

flou de la mise au point (pas celui du bougé) : marginal ;

texture : champ d'application limité ;

ombres portées : marginal ;

contours : marginal ;

ombres propres : cas le plus général ("shape from shading").

Ces méthodes présentent toutes un problème majeur : beaucoup d'hypothèses leur sont nécessaires, et elles sont donc peu fiables. Elles ne sont pas utilisées industriellement (par exemple en robotique). Toutes les méthodes utilisées en robotique utilisent plusieurs images.

3. Cas où on dispose de plusieurs images.

Différentes situations sont possibles :

Cas 1 : la scène et l'appareil sont fixes, les sources lumineuses se déplacent ("stéréophotométrie").

Cas 2 : les sources lumineuses et l'appareil sont fixes, la scène se déplace ("mouvement").

Cas 3 : la scène et les sources lumineuses sont fixes, l'observateur se déplace ("stéréovision").

3.1. Cas 1 : stéréophotométrie.

On prend une photo avec une source lumineuse S1, puis une photo avec une source lumineuse S2, etc... La scène est fixe.

Exemple de la Lune :

Problème :

Si la scène bouge, ce qui est souvent le cas en robotique, il faut prendre deux photos simultanément avec deux éclairages différents, ce qui n'est pas toujours facile à réaliser.

3.2. Cas 2 : mouvement.

On prend plusieurs photos successives d'une scène mobile, mais cela ne rajoute pas beaucoup d'information vis-à-vis de la reconnaissance du relief.

Ce domaine a été cité dans le chapitre 1. Il présente cependant un point commun avec la vision du relief, car il faut réaliser la mise en correspondance d'un même point physique sur une séquence d'images :

Problème :

cas 2

monovision

3.2. Cas 3 : stéréovision.

On change la position de la caméra entre les différentes prises de vue. On peut aussi utiliser plusieurs caméras et prendre les photos simultanément, ce qu'on ne pouvait pas faire dans les cas 1 et 2. Cela est d'ailleurs nécessaire pour l'analyse du mouvement en stéréovision.

En général, on se trouve dans l'un des deux cas suivants :

2 caméras : stéréovision binoculaire ;

3 caméras : stéréovision trinoculaire.

Difficultés :

Si on utilise plusieurs caméras, elles ne sont pas caractérisées par les mêmes paramètres (exemples :).
Phase 1 = calibrage : il faudra maîtriser les paramètres des caméras.

Phase 2 = appariement : mise en correspondance des pixels correspondant à un même point physique (comme en vision du mouvement).

Phase 3 = triangulation : calcul du relief d'une paire de pixels appariés.

La phase la plus difficile à réaliser est la phase 2. Nous y reviendrons dans le chapitre 3.

4. Bilan sur les différents domaines de la vision par ordinateur.

Remarque :

Il existe un domaine à part entière de la vision du relief par ordinateur, dont nous ne parlerons pas dans le cadre de ce cours, et qui s'appelle la "vision active". Pour donner une idée des méthodes utilisées dans ce domaine, nous en donnons ici deux exemples :

Exemple 1 : on place une grille devant la source lumineuse, et on peut analyser le mouvement de la scène à partir des déformations de l'ombre de la grille sur la surface de cette scène.

Exemple 2 : on place la scène sur un plateau pivotant autour de la verticale. Pour chaque position du plateau, on balaie la scène verticalement à l'aide d'un faisceau laser, ce qui permet un relevé très précis de sa surface (ceci est utilisé pour la reproduction d'objets d'art fragiles).

Ces pages ont été réalisées par Jean-Denis Durou et Anne-Marie Pocquet.
Pour tout commentaire, envoyer un mail à durou@irit.fr ou à pocquet@irit.fr.

Maîtrise d'informatique - Module 11 Vision par ordinateur - Cours Chapitre 2 :

1. Problème général de la vision du relief.

1.1. Les trois éléments en présence.

1.2. But de la reconnaissance du relief.

2. Cas où on ne dispose que d'une seule image.

2.1. Formulation du problème.

2.2. Les différentes méthodes.

3. Cas où on dispose de plusieurs images.

3.1. Cas 1 : stéréophotométrie.

Exemple de la Lune :

Problème :

3.2. Cas 2 : mouvement.

Problème :

3.2. Cas 3 : stéréovision.

Difficultés :

4. Bilan sur les différents domaines de la vision par ordinateur.

Remarque :

Maîtrise d'informatique - Module 11
Vision par ordinateur - Cours

Chapitre 2 :