Segmentation d images de documents anciens par approche texture - Mo…

  • Published on
    12-Nov-2014

  • View
    1.973

  • Download
    0

Embed Size (px)

DESCRIPTION

Ce travail prsente une mthode de segmentation floue des images de documents anciens. Cette mthode permet la sparation des zones de texte et de dessins dimages de documents imprims datant de la Renaissance. Lapproche propose consiste dfinir des bancs de filtres de Gabor capables de localiser les zones de textes et de dessin sparment laide dun processus de classification floue des rsultats de filtrage. Une simple fusion des rsultats des bancs de filtres fournit une version segmente de limage de document ancien en question.

Transcript

  • 1. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureMinistre de lEnseignement Suprieur et de la Recherche Scientifique Universit de La RochelleDpartement dInformatique LABORATOIRE L3I INFORMATIQUE IMAGE INTERACTIONMmoire de fin dEtudes En vue de lobtention du Diplme de Master 2 RechercheSpcialit : Informatique & Mathmatiques et leurs Applications lEconomie(IMAE)Option : Image & Calculs IntitulSegmentation dImages de Documents Anciens parApproche Texture- APPLICATION du filtre de Gabor - Ralisation de : Kamel MOUATS Sous la direction de : Prof. Rmy MULLOT / Nicholas JOURNETJuillet 2006Laboratoire L3i Universit de La RochellePage 1

2. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureSommaireListe des tableauxListe des figuresIntroduction Gnrale 7Problmatique / Contexte9I Au cur des documents anciens10 I.1. Introduction 10 I.2. Traitement des images et documents anciens 10 I.2.1. Binarisatioon11 I.2.2. Segmentation Texte/Graphique 12 II Analyse Texturale des Documents15II.1. Introduction 15II.2. Dfinition de la texture 15II.3. Application de la texture la segmentation15II.4. Mthodes danalyse de texture16II.5. Utilisation de la texture sur les images de documents anciens17II.6. Segmentation des images de documents anciens 17II.7. Segmentation dimages de documents par analyse des 18projections horizontales / verticalesIII Thorie du Filtre de Gabor 20III.1.Paramtrisation / Calcul efficace des paramtres de Gabor24III.2.Les frquences du filtre de Gabor25III.3.Les orientations du filtre de Gabor26III.4.Sparabilit des filtres de Gabor27III.5.Exploitation de la symtrie du filtre27III.6.Implmentation du filtrage 28 IVImplantation34 IV.1. Analyse des rsultats de filtrage 38 IV.1.a. Influence de lorientation sur le rsultat de filtrage38 IV.1.b. Influence de la frquence sur le rsultat de filtrage 38 IV.1.c. Importance entre lorientation et la frquence38 IV.2. Discussion41 IV.3. Dfinition du banc de filtres pour le filtrage des images de41 documents anciens IV.4. Ralisation 42 VClassification floue dimage 44V.1.Introduction 44V.2.Degr dappartenance 44V.3.Lalgorithme des C-Moyennes Floues (CMF) 45 VI Classification des rsultats de filtrage dans chaque Sous 47Banc de Filtres VI.1.Matrice de confiance associe la classification floue50 VI.2.Analyse du seuillage 50 VI.3.Comment fusionner les donnes52Laboratoire L3i Universit de La Rochelle Page 2 3. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureVII Validation53Discussion60VIIIConclusion / Perspectives 63Rfrences Bibliographiques 59AnnexeLaboratoire L3i Universit de La RochellePage 3 4. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureListe des tableauxI.1.Liste des dfauts et prtraitements appropris des images de documents .5 anciens daprs L. Likfoman-SuelemIII Paramtres du filtre de Gabor27IV.1.Rsultat du seuillage des rsultats de filtrage par le filtre de Gabor pour .30 diffrentes valeurs de frquence et dorientation (exemple 1)IV.2.Rsultat du seuillage des rsultats de filtrage par le filtre de Gabor pour .31 diffrentes valeurs de frquence et dorientation (exemple 2)Laboratoire L3i Universit de La RochellePage 4 5. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureListe des figuresI.1.Exemples dimages de documents anciens et leurs images binaires.6I.2.Familles des mthodes de segmentation Texte/Dessin des images de documents8II.1.Verrous empchant lapplication de la mthode des projections pour ...12 lanalyse dimages de documentsII.2.Rsultats de projection horizontale dune image de document13II.3.Les diffrentes zones dun document peuvent tre simules un ...13agencement de textures.III.1. La fonction de Gabor dans le domaine frquentiel15III.2.La fonction de Gabor dans le domaine spatial15III.3.Ensemble de filtres de Gabor dans le domaine frquentiel.15III.4. a)Filtres de Gabor dans une fentre 30x30, reprsents dans le domaine 15 frquentiel f=1/8 et =0 ; b)Filtres de Gabor dans une fentre 30x30, reprsents dans le domaine 15 frquentiel f=1/8 et =45.III.5.Partie relle des 4x4 fonction de Gabor dans le domaine spatial16III.6.Couverture du domaine de Fourier par les canaux frquentiels des .. 16fonctions de Gabor.III.7.Exemples de banc de filtres dans le domaine frquentiel.21III.8.a) Rsultat de filtrage dans le domaine spatial sur une image de synthse..22III.8.b) Rsultat de filtrage dans le domaine spatial sur une image de synthse..23 avec du texte diffrentes tailles de policeIII.8.c) Rsultat de filtrage dans le domaine appliqu sur une image de document 24 ancienIII.9.a) Filtrage dans le domaine frquentiel appliqu sur une image de synthse ..25III.9.b) Filtrage dans le domaine frquentiel appliqu sur une image de document... .26ancienIV.1.Schma du processus de segmentation dimage utilisant un banc de ..37 filtres de Gabor.Laboratoire L3i Universit de La Rochelle Page 5 6. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureVI.1.Phase de calcul des degrs dappartenance et affectation des pixels .. ....41 aux classes correspondantes dans chaque sous banc de filtresVI.2.Processus dassignation des vecteurs caractristiques dans .....43 une classification floueVI.3.Processus de fusion des rsultats de classification floue des............................................46 deux sous banc de filtresVI.4.Lanalyse multirsolution pour la dtection des lments ...54 dune image de documentLaboratoire L3i Universit de La Rochelle Page 6 7. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureIntroduction Gnrale Traditionnellement, le papier tait la source principale pour la publication de journaux,rapports, livres etc. Cependant, la disponibilit et lconomie des ordinateurs puissantsfournissent de nouveaux supports et moyens pour le stockage, la rcupration et la recherchede documents lectroniques stocks. Un article situ un endroit, peut tre extrait dun autrecoin de ce monde en quelques secondes. De plus, si le texte des documents est rang dunemanire adquate, il sera possible de balayer le contenu de diffrents documents en quelquessecondes. Cependant, il nest pas vident de donner une version numrique dun documentautomatiquement. Lapproche Straight forward (Expdition Directe), consiste numriser lensembledu document et le stocker sous une reprsentation bitmap; cependant, cette approchencessite une capacit de stockage importante (mme en utilisant les techniques decompression dimages les plus rcentes) et ne permet pas de retrouver du texte dans cesdocuments. Une mthode de reprsentation plus efficace des documents est de sparer le texte dugraphique, et sauvegarder le texte en texte ASCII et les images en bitmaps. De ce fait,plusieurs approches pour la segmentation texte/images ont t dveloppes et proposes. Lanalyse de document, prcisment lanalyse de limage de document, est leprocessus qui fournit une interprtation globale des images de documents. Ce processus est larponse la question : Comment est combin lensemble du langage, le formatage dudocument, le traitement dimage et la reconnaissance de caractres afin de se donner uneapplication particulire ? .De ce fait, lanalyse de document est concerne par les issues globales impliques dansla reconnaissance de lcriture sur les images. Elle rajoute aux OCRs une super-structure quipermet lorganisation du document et se base sur des connaissances, ou non, pour soninterprtation. Le processus de la dtermination de la structure du document peut tre vu comme unprocessus guid par un modle, explicite ou implicite, de la classe des documents en cours. Lemodle dcrit lapparence physique et les relations qui existent entre les entits composant ledocument. Gnralement un OCR est ltage finale de ce processus, cest dire, il fournit uncodage final des symboles contenus dans des entits logiques telles que des paragraphes outables,...une fois ces derniers sont dfinis et isols par une autre phase du processus.Cependant, il est important de voir quun OCR peut participer la dtermination de ladisposition du document (Layout). Par exemple, comme une partie du processus dextractiondarticles de journaux, le systme peut tre ramen reconnatre des chanes de caractres, dessignatures ou annotations en bas de limage de la page, dans le but de localiser le texte intgral(intgration de la smantiques aux composants extraits). En pratique, un systme danalyse de documents (images de documents) ralise lestches de base dune segmentation dimage, comprhension de la disposition textuelle, lareconnaissance symbolique et lapplication de rgles contextuelles dune manire intgrante.Les mthodes de segmentation Texte/Dessin les plus connues peuvent tre classessoit en approches ascendantes (Top Down), ou en approches descendantes (Bottom Up).Laboratoire L3i Universit de La RochellePage 7 8. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureLes mthodes descendantes sont bases essentiellement sur la technique Run LengthSmoothing : Lissage direct en longueur (connue aussi sous le nom de : Constrained runlength method) et la mthode des Projetions de Profiles. Le principal inconvnient desmthodes descendantes est leur restriction sur des blocs rectangulaires donc elles ne sont pasadquates pour des documents contenant du texte ayant une mise en forme non rgulire(alatoires / inclinaisons).Les mthodes ascendantes sont des variantes typiques de la mthode des ComposantesConnexes. Les inconvnients de cette dernire se rsument dans le fait quelle est dpendantede la taille des caractres, elle est sensible linterligne et les espaces inter-caractres ainsiqu sa sensibilit la rsolution. Cependant, elles ne sont pas restreintes aux blocsrectangulaires comme les approches descendantes.Une nouvelle mthode, diffrente des approches prcdentes et palliant leurslimitations, nayant aucun besoin de connaissances priori sur le document traiter, a tprsente par Jain et Bhattacharjee [3]. Lide de base de cette approche est que les zones detexte dune image de document peuvent tre considres approximativement comme unetexture uniforme et les images forment une autre texture. Le document peut tre alorssegment par un schma de Segmentation de Texture. La segmentation de texture reste toujours un sujet de base et important en traitementdimages. Elle consiste segmenter une image texture en plusieurs rgions ayant les mmescaractristiques de texture; elle est bien et belle applique lanalyse des images ariennes,images biomdicales et des images sismiques, et rcemment sur les images de documentsmais ncessitant une bonne dfinition et paramtrisation.Tous comme les autres problmes de segmentation, la segmentation de texturencessite lidentification des caractristiques spcifiques propres la texture avec un bonpouvoir discriminant. Gnralement, les mthodes dextraction des caractristiques peuventtre classes en trois catgories de base : Statistique, Structurale et Spectrale.Dans les approches statistiques, les statistiques des textures base des moments delhistogramme des niveaux de gris ou base de la matrice de co-occurrence, sont calculespour la discrimination entre les diffrentes textures. Pour les approches structurelles, uneprimitive de texture, qui est llment de base de texture, est utilise pour former un modle detexture plus complexe laide de rgles grammaticales qui spcifient et guident la gnrationdu modle de texture en cours. Et enfin, les approches spectrales, limage texture esttransforme en domaine frquentiel. Ensuite, lextraction des caractristiques de texture peuttre ralise en analysant le pouvoir spectral.Le schma de segmentation de texture utilis par Jain et Bhattacharjee [3] estprincipalement le mme que celui propos par Jain et Farrokhnia ; une approche multicanauxutilisant un banc de filtres de Gabor pr-slectionns en frquences et orientations pour filtrerune image dentre. Les caractristiques extraites partir des rponses des images filtres, eten se servant dune fonction dnergie locale et un dcoupage (Clustering) par un classifieurnon-supervis, sont utilises pour la segmentation et la classification de texture. Le filtre deGabor est le filtre le plus utilis, par excellence, pour la segmentation de texture vu sonpouvoir discriminant paramtrable, cependant, linconvnient majeur de lapprochegaborienne est sa complexit de calcul [2].Laboratoire L3i Universit de La Rochelle Page 8 9. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureProblmatique / Contexte La segmentation dimages de documents anciens en vue de les indexer est un sujet derecherche. Les documents anciens possdent de nombreuses particularits qui ne permettent pasdappliquer les techniques classiques danalyse de documents composites et dOCR (OpticalCharacter Recognition) sur ces ouvrages. Ils sont dgrads, reposent sur les anciennestechniques dimprimerie et respectent donc des rgles particulires de typographie et de miseen forme [32].Les diffrents problmes poss par lanalyse des documents anciens en vue de leurindexation sont assez proches de ceux que lon trouve en analyse et interprtation dimages.La chane de traitement comporte gnralement un ensemble dtapes visant construire desinformations structures partir des informations numriques lmentaires (pixels de limage)et dinformations contextuelles lies la nature du document analys. Les objectifs sont donc:1) De sparer les diffrents composants situs sur les pages des ouvrages (texte, illustration,lettrine,)2) Lobjectif trs ambitieux de recomposer le document, de comprendre son organisation etmme dinterprter son contenu.Lobjet de cette tude consiste principalement raliser une tape primordiale danslanalyse de la structure physique des images de documents anciens savoir leursegmentation afin dextraire les zones informatives (texte, Dessin, fond).3) Didentifier les diffrents styles dcriture (gras, italique, taille, manuscrit/imprim) poursimplifier la tche des systmes dOCR en crant des bases de modles pour chacune desfamilles dtectes. On peut alors parler de reconnaissance adaptative. Dans le prsent travail, nous allons adopter loutil Gabor pour dfinir un systme desegmentation dimages de documents anciens, qui soit alors une premire tentative et unpremier pas dans la littrature des mthodes de segmentation dimages de documents anciens. Ce mmoire se prsentera comme suit :En premier lieu, nous prsenterons les proprits des documents anciens, les mthodesdanalyses qui existent dans la littrature et particulirement lanalyse documentaire parapproche texture, ensuite nous donnerons une partie thorique complte du filtre de Gabor etde son utilisation, pour finir cette partie par un descriptif de la mthode de classification non-supervise floue utilise.Ensuite, nous dcrivons au dtail prs la conception et le fonctionnement de notre systmede segmentation dimages de documents anciens propos que nous lavons test sur notre basedocumentaire (contemporains et anciens), vous trouverez ainsi des rsultats de nos tests.Et enfin, nous cl...

Recommended

View more >