Segmentation d images de documents anciens par approche texture - Mo…

  • View
    1.976

  • Download
    0

Embed Size (px)

DESCRIPTION

Ce travail prsente une mthode de segmentation floue des images de documents anciens. Cette mthode permet la sparation des zones de texte et de dessins dimages de documents imprims datant de la Renaissance. Lapproche propose consiste dfinir des bancs de filtres de Gabor capables de localiser les zones de textes et de dessin sparment laide dun processus de classification floue des rsultats de filtrage. Une simple fusion des rsultats des bancs de filtres fournit une version segmente de limage de document ancien en question.

Transcript

  • 1. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureMinistre de lEnseignement Suprieur et de la Recherche Scientifique Universit de La RochelleDpartement dInformatique LABORATOIRE L3I INFORMATIQUE IMAGE INTERACTIONMmoire de fin dEtudes En vue de lobtention du Diplme de Master 2 RechercheSpcialit : Informatique & Mathmatiques et leurs Applications lEconomie(IMAE)Option : Image & Calculs IntitulSegmentation dImages de Documents Anciens parApproche Texture- APPLICATION du filtre de Gabor - Ralisation de : Kamel MOUATS Sous la direction de : Prof. Rmy MULLOT / Nicholas JOURNETJuillet 2006Laboratoire L3i Universit de La RochellePage 1

2. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureSommaireListe des tableauxListe des figuresIntroduction Gnrale 7Problmatique / Contexte9I Au cur des documents anciens10 I.1. Introduction 10 I.2. Traitement des images et documents anciens 10 I.2.1. Binarisatioon11 I.2.2. Segmentation Texte/Graphique 12 II Analyse Texturale des Documents15II.1. Introduction 15II.2. Dfinition de la texture 15II.3. Application de la texture la segmentation15II.4. Mthodes danalyse de texture16II.5. Utilisation de la texture sur les images de documents anciens17II.6. Segmentation des images de documents anciens 17II.7. Segmentation dimages de documents par analyse des 18projections horizontales / verticalesIII Thorie du Filtre de Gabor 20III.1.Paramtrisation / Calcul efficace des paramtres de Gabor24III.2.Les frquences du filtre de Gabor25III.3.Les orientations du filtre de Gabor26III.4.Sparabilit des filtres de Gabor27III.5.Exploitation de la symtrie du filtre27III.6.Implmentation du filtrage 28 IVImplantation34 IV.1. Analyse des rsultats de filtrage 38 IV.1.a. Influence de lorientation sur le rsultat de filtrage38 IV.1.b. Influence de la frquence sur le rsultat de filtrage 38 IV.1.c. Importance entre lorientation et la frquence38 IV.2. Discussion41 IV.3. Dfinition du banc de filtres pour le filtrage des images de41 documents anciens IV.4. Ralisation 42 VClassification floue dimage 44V.1.Introduction 44V.2.Degr dappartenance 44V.3.Lalgorithme des C-Moyennes Floues (CMF) 45 VI Classification des rsultats de filtrage dans chaque Sous 47Banc de Filtres VI.1.Matrice de confiance associe la classification floue50 VI.2.Analyse du seuillage 50 VI.3.Comment fusionner les donnes52Laboratoire L3i Universit de La Rochelle Page 2 3. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureVII Validation53Discussion60VIIIConclusion / Perspectives 63Rfrences Bibliographiques 59AnnexeLaboratoire L3i Universit de La RochellePage 3 4. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureListe des tableauxI.1.Liste des dfauts et prtraitements appropris des images de documents .5 anciens daprs L. Likfoman-SuelemIII Paramtres du filtre de Gabor27IV.1.Rsultat du seuillage des rsultats de filtrage par le filtre de Gabor pour .30 diffrentes valeurs de frquence et dorientation (exemple 1)IV.2.Rsultat du seuillage des rsultats de filtrage par le filtre de Gabor pour .31 diffrentes valeurs de frquence et dorientation (exemple 2)Laboratoire L3i Universit de La RochellePage 4 5. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureListe des figuresI.1.Exemples dimages de documents anciens et leurs images binaires.6I.2.Familles des mthodes de segmentation Texte/Dessin des images de documents8II.1.Verrous empchant lapplication de la mthode des projections pour ...12 lanalyse dimages de documentsII.2.Rsultats de projection horizontale dune image de document13II.3.Les diffrentes zones dun document peuvent tre simules un ...13agencement de textures.III.1. La fonction de Gabor dans le domaine frquentiel15III.2.La fonction de Gabor dans le domaine spatial15III.3.Ensemble de filtres de Gabor dans le domaine frquentiel.15III.4. a)Filtres de Gabor dans une fentre 30x30, reprsents dans le domaine 15 frquentiel f=1/8 et =0 ; b)Filtres de Gabor dans une fentre 30x30, reprsents dans le domaine 15 frquentiel f=1/8 et =45.III.5.Partie relle des 4x4 fonction de Gabor dans le domaine spatial16III.6.Couverture du domaine de Fourier par les canaux frquentiels des .. 16fonctions de Gabor.III.7.Exemples de banc de filtres dans le domaine frquentiel.21III.8.a) Rsultat de filtrage dans le domaine spatial sur une image de synthse..22III.8.b) Rsultat de filtrage dans le domaine spatial sur une image de synthse..23 avec du texte diffrentes tailles de policeIII.8.c) Rsultat de filtrage dans le domaine appliqu sur une image de document 24 ancienIII.9.a) Filtrage dans le domaine frquentiel appliqu sur une image de synthse ..25III.9.b) Filtrage dans le domaine frquentiel appliqu sur une image de document... .26ancienIV.1.Schma du processus de segmentation dimage utilisant un banc de ..37 filtres de Gabor.Laboratoire L3i Universit de La Rochelle Page 5 6. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureVI.1.Phase de calcul des degrs dappartenance et affectation des pixels .. ....41 aux classes correspondantes dans chaque sous banc de filtresVI.2.Processus dassignation des vecteurs caractristiques dans .....43 une classification floueVI.3.Processus de fusion des rsultats de classification floue des............................................46 deux sous banc de filtresVI.4.Lanalyse multirsolution pour la dtection des lments ...54 dune image de documentLaboratoire L3i Universit de La Rochelle Page 6 7. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureIntroduction Gnrale Traditionnellement, le papier tait la source principale pour la publication de journaux,rapports, livres etc. Cependant, la disponibilit et lconomie des ordinateurs puissantsfournissent de nouveaux supports et moyens pour le stockage, la rcupration et la recherchede documents lectroniques stocks. Un article situ un endroit, peut tre extrait dun autrecoin de ce monde en quelques secondes. De plus, si le texte des documents est rang dunemanire adquate, il sera possible de balayer le contenu de diffrents documents en quelquessecondes. Cependant, il nest pas vident de donner une version numrique dun documentautomatiquement. Lapproche Straight forward (Expdition Directe), consiste numriser lensembledu document et le stocker sous une reprsentation bitmap; cependant, cette approchencessite une capacit de stockage importante (mme en utilisant les techniques decompression dimages les plus rcentes) et ne permet pas de retrouver du texte dans cesdocuments. Une mthode de reprsentation plus efficace des documents est de sparer le texte dugraphique, et sauvegarder le texte en texte ASCII et les images en bitmaps. De ce fait,plusieurs approches pour la segmentation texte/images ont t dveloppes et proposes. Lanalyse de document, prcisment lanalyse de limage de document, est leprocessus qui fournit une interprtation globale des images de documents. Ce processus est larponse la question : Comment est combin lensemble du langage, le formatage dudocument, le traitement dimage et la reconnaissance de caractres afin de se donner uneapplication particulire ? .De ce fait, lanalyse de document est concerne par les issues globales impliques dansla reconnaissance de lcriture sur les images. Elle rajoute aux OCRs une super-structure quipermet lorganisation du document et se base sur des connaissances, ou non, pour soninterprtation. Le processus de la dtermination de la structure du document peut tre vu comme unprocessus guid par un modle, explicite ou implicite, de la classe des documents en cours. Lemodle dcrit lapparence physique et les relations qui existent entre les entits composant ledocument. Gnralement un OCR est ltage finale de ce processus, cest dire, il fournit uncodage final des symboles contenus dans des entits logiques telles que des paragraphes outables,...une fois ces derniers sont dfinis et isols par une autre phase du processus.Cependant, il est important de voir quun OCR peut participer la dtermination de ladisposition du document (Layout). Par exemple, comme une partie du processus dextractiondarticles de journaux, le systme peut tre ramen reconnatre des chanes de caractres, dessignatures ou annotations en bas de limage de la page, dans le but de localiser le texte intgral(intgration de la smantiques aux composants extraits). En pratique, un systme danalyse de documents (images de documents) ralise lestches de base dune segmentation dimage, comprhension de la disposition textuelle, lareconnaissance symbolique et lapplication de rgles contextuelles dune manire intgrante.Les mthodes de segmentation Texte/Dessin les plus connues peuvent tre classessoit en approches ascendantes (Top Down), ou en approches descendantes (Bottom Up).Laboratoire L3i Universit de La RochellePage 7 8. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureLes mthodes descendantes sont bases essentiellement sur la technique Run LengthSmoothing : Lissage direct en longueur (connue aussi sous le nom de : Constrained runlength method) et la mthode des Projetions de Profiles. Le principal inconvnient desmthodes descendantes est leur restriction sur des blocs rectangulaires donc elles ne sont pasadquates pour des documents contenant du texte ayant une mise en forme non rgulire(alatoires / inclinaisons).Les mthodes ascendantes sont des variantes typiques de la mthode des ComposantesConnexes. Les inconvnients de cette dernire se rsument dans le fait quelle est dpendantede la taille des caractres, elle est sensible linterligne et les espaces inter-caractres ainsiqu sa sensibilit la rsolution. Cependant, elles ne sont pas restreintes aux blocsrectangulaires comme les approches descendantes.Une nouvelle mthode, diffrente des approches prcdentes et palliant leurslimitations, nayant aucun besoin de connaissances priori sur le document traiter, a tprsente par Jain et Bhattacharjee [3]. Lide de base de