Vision par ordinateur

Preview:

Citation preview

Vision par ordinateur

Mejdi RADHOUANI &

Majdi SAIBI

C’est quoi la vision ?

La vision (⅓ )★ L’espace qui nous entoure a une structure tri-dimensionnelle

(3D)★ L'être humain sait parfaitement décrire et interpréter ce

monde.

★ Il ne trouve aucune difficulté de nommer les objets et leurs état

★ Pourtant, l'information disponible sur la rétine de ses yeux n'est qu'un ensemble de points (environ un million de picture elements ou pixels).

★ Chaque pixel contient des informations sur la lumière reçue en ce point de la rétine

La vision (⅔ ) ★ Guide à la fois par l'information codée dans l'image ou la

rétine et par ses propres connaissances le processus visuel construit des percepts.

★ Les objets et leurs état sont le résultat final d’un processus d’interprétation qui intègre le système de vision.

★ Le système de vision doit fournir les connaissances nécessaires an de permettre une interprétation non ambiguë.

La vision (3)Image (ensemble de pixels)

System de visionInterprétation

Description de la scène (objets, position, mouvement)

Connaissances a priori (forme, couleur,

comportement physique)

La vision par ordinateur

La vision par ordinateur★La vision humaine est extrêmement complexe (neurosciences)

★La vision par ordinateur ne cherche pas à comprendre ou à reproduire la vision humaine

★Il cherche à construire un modèle algorithmique qui, vu de l'extérieur, possède des propriétés semblables.

★La vision par ordinateur (aussi appelée vision artificielle ou vision numérique) est une branche de l'intelligence artificielle dont le principal but est de permettre à une machine d'analyser, traiter et comprendre une ou plusieurs images prises par un système d'acquisition (par exemple : caméras, etc.)

La vision par ordinateur: quelques applications

★Traditionnellement, le flux vidéo était traité par un opérateur humain, remplacé progressivement par un traitement automatique sur les données enregistrées contenant des événements anormaux. Actuellement, l'objectif est de détecter ces événements en temps réel et de façon automatique.

★Navigation: ex. dans un véhicule autonome ou un robot mobile ★Détection d’événements:ex. pour la surveillance ou le comptage

automatique de personnes.★Reconnaissance d'écriture (OCR)

Une théorie de la visionLes algorithmes de vision sont des expressions des stratégies mises en œuvre :

➢ Extraction de primitives à partir des images

➢ Représentation des connaissances

➢ Mise en correspondance images/connaissances : reconnaissance

Une théorie de la vision : Connaissances à prioriPhysiques (optique, forces/interactions)

Géométriques (forme des objets, formation de l'image)

Sémantiques (fonction des objets, comportement)

Exemple : Exemple : que sait-on de mesurable sur une voiture qui permette de l'identifier dans une image ?

Le paradigme de David MarrVers la n des années 70 David Marr a proposé un modèle calculatoire pour le traitement et la représentation de l'information visuelle :

1.a partir d'une ou de plusieurs images un processus d'extraction de caractéristiques produit un description en termes d'attributs en 2D.Ce niveau de représentation est appelé première ébauche (primal sketch).

2. la première ébauche constitue l'entrée d'un certain nombre de processus: il s'agit de processus d'inférence qui utilisent des connaissances géométriques (analyse des contours) géométriques et statistiques (analyse des textures), photométriques (analyse des ombrages) ou colorimétriques (analyse des reflets).ébauche 2.5D

Le paradigme de David Marr3 . l'ébauche 2.5D est mise en correspondance avec des connaissances 3D afin de construire une description de la scène en termes d'objets et de relations entre les objets il s'agit maintenant d'une représentation centrée sur la scène.

❖Il s'agit maintenant d'une représentation centrée sur la scène ( la description ne dépend plus de la position de l'observateur (le cas de 2éme étape))

Segmentation, reconstruction, reconnaissanceEn pratique le paradigme de David Marr se traduit par trois étapes de traitement segmentation reconstruction et reconnaissance :

On peut appliquer ces 3 étape sur différents types des image :

● optiques (2D) : photo, satellite, document

● médicales (Rayons X, IRM, 2D/3D…)● images fixes ou séquences temporelles● autres (radar, laser, sonar…)

Segmentation

SegmentationLa pierre de base de tout système de vision

Le but de toute méthode de segmentation est l'extraction d'attributs caractérisant ces entités.

Détection de contours: la recherche des discontinuités locales de la fonction des niveaux de gris de l'image.

La segmentation des contours :consiste a approximer les contours par des représentations analytiques exemple droite ou polygone..

L'extraction de régions (zones homogènes)

Frontières de régions ⇔ contours

Reconstruction

ReconstructionOn commence par le calibrage de le détecteur : avoir une idée globale sur la scène en se basant sur un ensemble de caractéristique tel que l’intensité des images

Il ya plusieur approche pour reconstruire la scène pour l’adapter au capteur selon ses capacités :

exemple : Stéréoscopie

Reconnaissance

ReconnaissanceComparer des indices visuels bi ou tridimensionnels avec les indices des objets à reconnaître

Les méthodes de reconnaissance sont souvent couplées avec des méthodes de localisation

On se basant sur un base de connaissance , on obtient donc une description d’objet et les relations entre eux (mouvement..)

Exemple pratiqueMicrosoft cognitive services : Computer vision

https://www.microsoft.com/cognitive-services/en-us/computer-vision-api

ConclusionLa vision par ordinateur est un processus de traitement de

l’information Elle utilise des stratégies bien définies an d’atteindre ses buts

L’entrée d’un système de vision est constituée par une séquence d’images Le système lui-même apporte un certain nombre de

connaissances qui interviennent à tous les niveaux

La sortie est une description de l’entrée en termes d’objets et de relations entre ces objets

Albert Einstein

Les machines un jour pourront résoudre tous les problèmes,

mais jamais aucune d'entre elles ne pourra en poser un

Recommended