Click here to load reader

Segmentation d images de documents anciens par approche texture - Mo…

  • View
    1.982

  • Download
    0

Embed Size (px)

DESCRIPTION

Ce travail présente une méthode de segmentation floue des images de documents anciens. Cette méthode permet la séparation des zones de texte et de dessins d’images de documents imprimés datant de la Renaissance. L’approche proposée consiste à définir des bancs de filtres de Gabor capables de localiser les zones de textes et de dessin séparément à l’aide d’un processus de classification floue des résultats de filtrage. Une simple fusion des résultats des bancs de filtres fournit une version segmentée de l’image de document ancien en question.

Text of Segmentation d images de documents anciens par approche texture - Mo…

  • 1. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureMinistre de lEnseignement Suprieur et de la Recherche Scientifique Universit de La RochelleDpartement dInformatique LABORATOIRE L3I INFORMATIQUE IMAGE INTERACTIONMmoire de fin dEtudes En vue de lobtention du Diplme de Master 2 RechercheSpcialit : Informatique & Mathmatiques et leurs Applications lEconomie(IMAE)Option : Image & Calculs IntitulSegmentation dImages de Documents Anciens parApproche Texture- APPLICATION du filtre de Gabor - Ralisation de : Kamel MOUATS Sous la direction de : Prof. Rmy MULLOT / Nicholas JOURNETJuillet 2006Laboratoire L3i Universit de La RochellePage 1

2. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureSommaireListe des tableauxListe des figuresIntroduction Gnrale 7Problmatique / Contexte9I Au cur des documents anciens10 I.1. Introduction 10 I.2. Traitement des images et documents anciens 10 I.2.1. Binarisatioon11 I.2.2. Segmentation Texte/Graphique 12 II Analyse Texturale des Documents15II.1. Introduction 15II.2. Dfinition de la texture 15II.3. Application de la texture la segmentation15II.4. Mthodes danalyse de texture16II.5. Utilisation de la texture sur les images de documents anciens17II.6. Segmentation des images de documents anciens 17II.7. Segmentation dimages de documents par analyse des 18projections horizontales / verticalesIII Thorie du Filtre de Gabor 20III.1.Paramtrisation / Calcul efficace des paramtres de Gabor24III.2.Les frquences du filtre de Gabor25III.3.Les orientations du filtre de Gabor26III.4.Sparabilit des filtres de Gabor27III.5.Exploitation de la symtrie du filtre27III.6.Implmentation du filtrage 28 IVImplantation34 IV.1. Analyse des rsultats de filtrage 38 IV.1.a. Influence de lorientation sur le rsultat de filtrage38 IV.1.b. Influence de la frquence sur le rsultat de filtrage 38 IV.1.c. Importance entre lorientation et la frquence38 IV.2. Discussion41 IV.3. Dfinition du banc de filtres pour le filtrage des images de41 documents anciens IV.4. Ralisation 42 VClassification floue dimage 44V.1.Introduction 44V.2.Degr dappartenance 44V.3.Lalgorithme des C-Moyennes Floues (CMF) 45 VI Classification des rsultats de filtrage dans chaque Sous 47Banc de Filtres VI.1.Matrice de confiance associe la classification floue50 VI.2.Analyse du seuillage 50 VI.3.Comment fusionner les donnes52Laboratoire L3i Universit de La Rochelle Page 2 3. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureVII Validation53Discussion60VIIIConclusion / Perspectives 63Rfrences Bibliographiques 59AnnexeLaboratoire L3i Universit de La RochellePage 3 4. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureListe des tableauxI.1.Liste des dfauts et prtraitements appropris des images de documents .5 anciens daprs L. Likfoman-SuelemIII Paramtres du filtre de Gabor27IV.1.Rsultat du seuillage des rsultats de filtrage par le filtre de Gabor pour .30 diffrentes valeurs de frquence et dorientation (exemple 1)IV.2.Rsultat du seuillage des rsultats de filtrage par le filtre de Gabor pour .31 diffrentes valeurs de frquence et dorientation (exemple 2)Laboratoire L3i Universit de La RochellePage 4 5. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureListe des figuresI.1.Exemples dimages de documents anciens et leurs images binaires.6I.2.Familles des mthodes de segmentation Texte/Dessin des images de documents8II.1.Verrous empchant lapplication de la mthode des projections pour ...12 lanalyse dimages de documentsII.2.Rsultats de projection horizontale dune image de document13II.3.Les diffrentes zones dun document peuvent tre simules un ...13agencement de textures.III.1. La fonction de Gabor dans le domaine frquentiel15III.2.La fonction de Gabor dans le domaine spatial15III.3.Ensemble de filtres de Gabor dans le domaine frquentiel.15III.4. a)Filtres de Gabor dans une fentre 30x30, reprsents dans le domaine 15 frquentiel f=1/8 et =0 ; b)Filtres de Gabor dans une fentre 30x30, reprsents dans le domaine 15 frquentiel f=1/8 et =45.III.5.Partie relle des 4x4 fonction de Gabor dans le domaine spatial16III.6.Couverture du domaine de Fourier par les canaux frquentiels des .. 16fonctions de Gabor.III.7.Exemples de banc de filtres dans le domaine frquentiel.21III.8.a) Rsultat de filtrage dans le domaine spatial sur une image de synthse..22III.8.b) Rsultat de filtrage dans le domaine spatial sur une image de synthse..23 avec du texte diffrentes tailles de policeIII.8.c) Rsultat de filtrage dans le domaine appliqu sur une image de document 24 ancienIII.9.a) Filtrage dans le domaine frquentiel appliqu sur une image de synthse ..25III.9.b) Filtrage dans le domaine frquentiel appliqu sur une image de document... .26ancienIV.1.Schma du processus de segmentation dimage utilisant un banc de ..37 filtres de Gabor.Laboratoire L3i Universit de La Rochelle Page 5 6. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureVI.1.Phase de calcul des degrs dappartenance et affectation des pixels .. ....41 aux classes correspondantes dans chaque sous banc de filtresVI.2.Processus dassignation des vecteurs caractristiques dans .....43 une classification floueVI.3.Processus de fusion des rsultats de classification floue des............................................46 deux sous banc de filtresVI.4.Lanalyse multirsolution pour la dtection des lments ...54 dune image de documentLaboratoire L3i Universit de La Rochelle Page 6 7. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureIntroduction Gnrale Traditionnellement, le papier tait la source principale pour la publication de journaux,rapports, livres etc. Cependant, la disponibilit et lconomie des ordinateurs puissantsfournissent de nouveaux supports et moyens pour le stockage, la rcupration et la recherchede documents lectroniques stocks. Un article situ un endroit, peut tre extrait dun autrecoin de ce monde en quelques secondes. De plus, si le texte des documents est rang dunemanire adquate, il sera possible de balayer le contenu de diffrents documents en quelquessecondes. Cependant, il nest pas vident de donner une version numrique dun documentautomatiquement. Lapproche Straight forward (Expdition Directe), consiste numriser lensembledu document et le stocker sous une reprsentation bitmap; cependant, cette approchencessite une capacit de stockage importante (mme en utilisant les techniques decompression dimages les plus rcentes) et ne permet pas de retrouver du texte dans cesdocuments. Une mthode de reprsentation plus efficace des documents est de sparer le texte dugraphique, et sauvegarder le texte en texte ASCII et les images en bitmaps. De ce fait,plusieurs approches pour la segmentation texte/images ont t dveloppes et proposes. Lanalyse de document, prcisment lanalyse de limage de document, est leprocessus qui fournit une interprtation globale des images de documents. Ce processus est larponse la question : Comment est combin lensemble du langage, le formatage dudocument, le traitement dimage et la reconnaissance de caractres afin de se donner uneapplication particulire ? .De ce fait, lanalyse de document est concerne par les issues globales impliques dansla reconnaissance de lcriture sur les images. Elle rajoute aux OCRs une super-structure quipermet lorganisation du document et se base sur des connaissances, ou non, pour soninterprtation. Le processus de la dtermination de la structure du document peut tre vu comme unprocessus guid par un modle, explicite ou implicite, de la classe des documents en cours. Lemodle dcrit lapparence physique et les relations qui existent entre les entits composant ledocument. Gnralement un OCR est ltage finale de ce processus, cest dire, il fournit uncodage final des symboles contenus dans des entits logiques telles que des paragraphes outables,...une fois ces derniers sont dfinis et isols par une autre phase du processus.Cependant, il est important de voir quun OCR peut participer la dtermination de ladisposition du document (Layout). Par exemple, comme une partie du processus dextractiondarticles de journaux, le systme peut tre ramen reconnatre des chanes de caractres, dessignatures ou annotations en bas de limage de la page, dans le but de localiser le texte intgral(intgration de la smantiques aux composants extraits). En pratique, un systme danalyse de documents (images de documents) ralise lestches de base dune segmentation dimage, comprhension de la disposition textuelle, lareconnaissance symbolique et lapplication de rgles contextuelles dune manire intgrante.Les mthodes de segmentation Texte/Dessin les plus connues peuvent tre classessoit en approches ascendantes (Top Down), ou en approches descendantes (Bottom Up).Laboratoire L3i Universit de La RochellePage 7 8. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureLes mthodes descendantes sont bases essentiellement sur la technique Run LengthSmoothing : Lissage direct en longueur (connue aussi sous le nom de : Constrained runlength method) et la mthode des Projetions de Profiles. Le principal inconvnient desmthodes descendantes est leur restriction sur des blocs rectangulaires donc elles ne sont pasadquates pour des documents contenant du texte ayant une mise en forme non rgulire(alatoires / inclinaisons).Les mthodes ascendantes sont des variantes typiques de la mthode des ComposantesConnexes. Les inconvnients de cette dernire se rsument dans le fait quelle est dpendantede la taille des caractres, elle est sensible linterligne et les espaces inter-caractres ainsiqu sa sensibilit la rsolution. Cependant, elles ne sont pas restreintes aux blocsrectangulaires comme les approches descendantes.Une nouvelle mthode, diffrente des approches prcdentes et palliant leurslimitations, nayant aucun besoin de connaissances priori sur le document traiter, a tprsente par Jain et Bhattacharjee [3]. Lide de base de cette approche est que les zones detexte dune image de document peuvent tre considres approximativement comme unetexture uniforme et les images forment une autre texture. Le document peut tre alorssegment par un schma de Segmentation de Texture. La segmentation de texture reste toujours un sujet de base et important en traitementdimages. Elle consiste segmenter une image texture en plusieurs rgions ayant les mmescaractristiques de texture; elle est bien et belle applique lanalyse des images ariennes,images biomdicales et des images sismiques, et rcemment sur les images de documentsmais ncessitant une bonne dfinition et paramtrisation.Tous comme les autres problmes de segmentation, la segmentation de texturencessite lidentification des caractristiques spcifiques propres la texture avec un bonpouvoir discriminant. Gnralement, les mthodes dextraction des caractristiques peuventtre classes en trois catgories de base : Statistique, Structurale et Spectrale.Dans les approches statistiques, les statistiques des textures base des moments delhistogramme des niveaux de gris ou base de la matrice de co-occurrence, sont calculespour la discrimination entre les diffrentes textures. Pour les approches structurelles, uneprimitive de texture, qui est llment de base de texture, est utilise pour former un modle detexture plus complexe laide de rgles grammaticales qui spcifient et guident la gnrationdu modle de texture en cours. Et enfin, les approches spectrales, limage texture esttransforme en domaine frquentiel. Ensuite, lextraction des caractristiques de texture peuttre ralise en analysant le pouvoir spectral.Le schma de segmentation de texture utilis par Jain et Bhattacharjee [3] estprincipalement le mme que celui propos par Jain et Farrokhnia ; une approche multicanauxutilisant un banc de filtres de Gabor pr-slectionns en frquences et orientations pour filtrerune image dentre. Les caractristiques extraites partir des rponses des images filtres, eten se servant dune fonction dnergie locale et un dcoupage (Clustering) par un classifieurnon-supervis, sont utilises pour la segmentation et la classification de texture. Le filtre deGabor est le filtre le plus utilis, par excellence, pour la segmentation de texture vu sonpouvoir discriminant paramtrable, cependant, linconvnient majeur de lapprochegaborienne est sa complexit de calcul [2].Laboratoire L3i Universit de La Rochelle Page 8 9. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureProblmatique / Contexte La segmentation dimages de documents anciens en vue de les indexer est un sujet derecherche. Les documents anciens possdent de nombreuses particularits qui ne permettent pasdappliquer les techniques classiques danalyse de documents composites et dOCR (OpticalCharacter Recognition) sur ces ouvrages. Ils sont dgrads, reposent sur les anciennestechniques dimprimerie et respectent donc des rgles particulires de typographie et de miseen forme [32].Les diffrents problmes poss par lanalyse des documents anciens en vue de leurindexation sont assez proches de ceux que lon trouve en analyse et interprtation dimages.La chane de traitement comporte gnralement un ensemble dtapes visant construire desinformations structures partir des informations numriques lmentaires (pixels de limage)et dinformations contextuelles lies la nature du document analys. Les objectifs sont donc:1) De sparer les diffrents composants situs sur les pages des ouvrages (texte, illustration,lettrine,)2) Lobjectif trs ambitieux de recomposer le document, de comprendre son organisation etmme dinterprter son contenu.Lobjet de cette tude consiste principalement raliser une tape primordiale danslanalyse de la structure physique des images de documents anciens savoir leursegmentation afin dextraire les zones informatives (texte, Dessin, fond).3) Didentifier les diffrents styles dcriture (gras, italique, taille, manuscrit/imprim) poursimplifier la tche des systmes dOCR en crant des bases de modles pour chacune desfamilles dtectes. On peut alors parler de reconnaissance adaptative. Dans le prsent travail, nous allons adopter loutil Gabor pour dfinir un systme desegmentation dimages de documents anciens, qui soit alors une premire tentative et unpremier pas dans la littrature des mthodes de segmentation dimages de documents anciens. Ce mmoire se prsentera comme suit :En premier lieu, nous prsenterons les proprits des documents anciens, les mthodesdanalyses qui existent dans la littrature et particulirement lanalyse documentaire parapproche texture, ensuite nous donnerons une partie thorique complte du filtre de Gabor etde son utilisation, pour finir cette partie par un descriptif de la mthode de classification non-supervise floue utilise.Ensuite, nous dcrivons au dtail prs la conception et le fonctionnement de notre systmede segmentation dimages de documents anciens propos que nous lavons test sur notre basedocumentaire (contemporains et anciens), vous trouverez ainsi des rsultats de nos tests.Et enfin, nous clorons par une valuation de notre systme, et des rsultats decomparaison avec un outil de classification supervise existant, des rsultats seront prsentset comments ainsi que des perspectives et ouvertures de notre conception.Laboratoire L3i Universit de La RochellePage 9 10. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureI. Au cur des documents anciensI.1. IntroductionLes documents anciens sont des documents darchives rdigs une autre poque etobissant donc des rgles typographiques et de composition diffrentes de celles appliquessur les documents modernes.En effet, limage dun document ancien numrise est souvent trs tonale, niveauxde gris ou en couleur. Elle peut comprendre des annotations dans les marges, des illustrations,des lettrines, voire mme des critures manuscrites [28].Ces documents se caractrisent par des prsentations et des critures trs varies,variations dues la multiplicit des styles et des techniques dimpression qui ont volu aucours du temps. Lusure du temps a de plus produit des altrations au document original etlimage numrise qui en dcoule contient alors des imperfections (taches, crituresfragmentes) qui nexistent pas dans les documents plus modernes. Les documents anciensimprims, bien que prsentant moins de variabilit, partagent un grand nombre descaractristiques des documents manuscrits [27].Les techniques de traitement (ou analyse) des images de documents anciens, se situent diffrents niveaux : prtraitements, analyse et reconnaissance. Ces niveaux de traitementsutilisent ou produisent des structures de donnes des niveaux de granularit de plus en pluslevs : de limage jusqu son interprtation. Si lobjectif ultime est celui de lareconnaissance de tous les composants du document (graphiques et textuels), dautresobjectifs concernent la visualisation de limage pour en amliorer le dchiffrement, larecherche de structures intermdiaires : blocs, lignes ou mots, et la sparation des couchesgraphiques et symboliques. Lautomatisation de la recherche des lignes de texte estnotamment une aide certaine la cration de liens texte/image dans les images de documentsanciens [27].I.2. Traitement des images et documents anciens La numrisation des documents anciens est un enjeu important pour les servicesdarchives, les bibliothques, les historiens et les chercheurs en sciences littraires pour lespossibilits de manipulation, de visualisation et de recherche dinformation qui en dcoulent.La numrisation physique : scannrisation (ou digitalisation), consiste crer une image dudocument (un tableau de pixels), laide dune camra numrique ou dun scanneur. Unehaute rsolution est souvent ncessaire (de300 600dpi2) pour restituer les lments les plusfins de lcriture et des graphismes. Limage obtenue est en couleur, en niveaux de gris oubitonale suivant les possibilits du capteur et les choix de numrisation. La question du formatde sauvegarde (ou stockage), dpend de lapplication vise et de la taille du support deconservation.Quels sont les apports du traitement des images la numrisation des documents anciens ?Ils permettent de rechercher des informations directement dans les images, den dgager lastructure, den amliorer la qualit visuelle, et cela dans un mode automatique ou semi-automatique.Prtraitement Les documents anciens posent en prambule un problme dacquisition certain ddune part leur positionnement sur le scanner, crant des inclinaisons, des bombages et desLaboratoire L3i Universit de La RochellePage 10 11. K.MOUATS - Segmentation dImages de Documents Anciens par Approche Texturepliures du papier, et dautre part leur contenu htrogne (texte imprim, manuscrit). Leprocessus de vieillissement fait apparatre des taches dhumidit, la transparence de lencresur les rectos, la fragmentation des contours fins, etc. Voici une liste de traitements usuels enfonction des types de problmes rencontrs (voir tableau 1).Dfaut PrtraitementFaible ou forte luminosit Modification dhistogramme*/Prsence de taches*/Filtrage passe haut **/Filtrage passe-bas**/Points parasites**/Filtrages morphologiquesCalcul de langle par projectionRotation lgre de limage Redressement par re-chantillonnage*/Courbure de lcriture sur un bord de*/Calcul de la courbure localelimage*/Re-chantillonnage**/Filtrages (passe haut, passe-bas,**/Ecriture fragmente morphologiques)Contours de lcriture flousFiltrage passe haut, filtrage morphologiqueEcriture du verseau apparaissant sur le recto Combinaison des images recto et versoTableauI.1. Liste des dfauts et prtraitements appropris, daprs L.Likfoman-Suelem[27].I.2.1. BinarisationLopration de binarisation est parfois primordiale pour sparer le fond du texte silimage originale est en niveau de gris ou en couleur. Elle consiste produire une image deux tons : clair pour le fond, et noir pour le texte. Il est ncessaire de conserver la fois tousles caractres et toutes les gravures sans toutefois rcuprer trop de bruit [29]. Il existeplusieurs algorithmes de binarisation (seuillage adaptatif, multi-rsolution, morphologique,classification des pixels,). Ils apportent tous des avantages et des inconvnients en terme devitesse de calcul, de qualit de conservation des traits des caractres et de traits de gravures.La plupart des mthodes conservent efficacement les caractres mais peuvent abmer lesgravures ou inversement. Ces mthodes restent tributaires dun ou de plusieurs seuils dterminer. Dans le cas des documents anciens, en gnral trs htrognes, ces seuils restenttrs difficiles dterminer sans laide dun expert.Laboratoire L3i Universit de La Rochelle Page 11 12. K.MOUATS - Segmentation dImages de Documents Anciens par Approche Texture Figure I.1. Exemples dimages de documents anciens et leurs images binairesI.2.2. Segmentation Texte/Graphique Une fois limage binarise, et le texte spar du fond, il faut procder lextraction desmdias pour des traitements appropris. Contrairement aux techniques de prtraitementprcdentes, celles-ci se placent aux niveaux des entits et non au niveau des pixels. Il sagitdans le cas des images de documents de regrouper dabord les formes en entits similaires,puis de procder ensuite leur classification en texte ou en graphique. Les lmentsgraphiques peuvent tre suivant le document, des lettrines, des illustrations, mais aussi desparaphes, des ratures, des signes de renvoi, des grands traits, etc.Laboratoire L3i Universit de La RochellePage 12 13. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureEtant rguliers et ayant une texture de caractres trs homogne, le texte offre une norme pourla classification. On utilise en gnral la largeur, la rgularit et labondance des composantesconnexes pour la classification. Ainsi, dans un texte, les composantes connexes sont peularges, trs rgulires et trs abondantes. Dans un graphique, les composantes connexes sonttrs larges, pas rgulires et peuvent tre abondantes [28].Il existe deux approches gnrales de segmentation :/La premire suppose que les blocs sont homognes (un seul mdia). Dans ce cas, chaquebloc est class dans le mdia le plus proche en fonction des caractristiques textuellesextraites de limage du bloc./ Dans la seconde approche, on suppose quun bloc contient un mlange texte/non texte(mlange de graphiques et de texte). Dans ce cas, une analyse morphologique fine descomposantes connexes, aides de connaissances a priori sur la position des lments peutaussi aider localiser les diffrentes zones homognes du document.Les lignes de texte dans les documents anciens prsentent trs peu de rgularit exploitable.En effet, les lignes sont de diffrentes longueurs, contenant un enchevtrement decomposantes connexes. La littrature fait tat de trois mthodes principales pour lextractionde lignes dans les images binaires : les mthodes de projection ou groupement decomposantes ou de pixels le long dune direction, les approches multi-rsolution ou filtragediffrentiel, et les mthodes de groupement de points caractristiques. Quelque soit la mthode utilise, trois problmes viendront toujours restreindre lesperformances de la segmentation Texte/Dessin des images de documents anciens : Le problme de lchelle : Comment dfinir une zone de texte sans dfinir commeparamtre la taille minimale et maximale des blocs ? Comment considrer une lettrine ou destitres imprims en grande taille comme des zones de texte ? Le problme de la quantit dinformation : A partir de quel seuil de densit de traits faut-il dcider de la prsence dun bloc de texte ? Cest la raison pour laquelle il est difficile desegmenter un seul caractre isol car il ny a pas assez dinformation statistique par rapport la zone englobante. Par consquent, de nombreux travaux utilisent au minimum la notion deligne, car la ligne de texte est la plus petite rgion lmentaire suffisamment grande danslaquelle on peut trouver cette accumulation. Problme de lorientation prsume du texte : On est oblig de faire des hypothses surlorientation horizontale du texte et beaucoup de mthodes sont sensibles linclinaison dudocument ( skew angle). En conclusion, il existe bien des approches pour sparer les zones graphiques deszones textuelles. Une seule approche nest pas toujours suffisante, et une combinaison demthodes est souvent ncessaire dans les cas difficiles. La segmentation Texte/Dessin a denombreuses applications et reste la premire tape incontournable pour linterprtation etlindexation des images de documents.Laboratoire L3i Universit de La Rochelle Page 13 14. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureMthodes de Segmentation dImages de documentsFiltrage Morphologique Filtrage Diffrentiel Points forts : Points forts : /Efficace : Eroder / Dilater/Efficace pour la localisation /Puissant : Isoler/Fusionnerde texte partir de seule des formes loignes.lorientation des caractres./Robuste et Simple mettre Points faibles : en uvre. /Ncessite beaucoup de paramtres externes (nombrePoints faibles : drosions,..)/Besoin de connaissances a /Extrmement coteux en priori. temps de calcul pour de/Coteux cause de la notion grandes images.de voisinage.Filtrage frquentiel directionnelAnalyse de la Texture Binaire Points forts : Points forts : /Slectivit du filtre/ Facile Raliser (RLSA). (en frquence et orientation) /Trop efficace pour la dtectionPoints faibles : de texte./ncessite des informations et /Adaptatif au niveau ligne de oprations complmentaires pour texte (filtrage des fentres donner un parfait rsultat de glissantes). segmentation. Points faibles : /Un long temps de calcul. /Difficile implmenter. /Difficile paramtrer. Figure I.2. Familles des mthodes de segmentation Texte/Dessin des images de documentsLaboratoire L3i Universit de La RochellePage 14 15. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureII. Analyse texturale des documentsII.1. IntroductionLes images de document peuvent tre vues comme des images textures dans lesquelleschaque typographie correspond une texture diffrente. De ce fait, la notion de texture seprsente selon deux approches : Une approche Analyse et Reconnaissance du Document (ARD), qui examine limageau niveau pixel condition quelle soit dj segmente. Une approche traitement des images qui considre limage dans sa globalit comme unmlange de signaux de frquences et dorientations diffrentes.Ces deux approches sont utilises pour obtenir des mesures de texture caractristiques etrobustes [18].II.2. Dfinition de la texture Il nexiste pas de dfinition universelle de ce que les chercheurs semploient caractriser comme texture. Chacun propose sa propre explication de ce qui apparatvisuellement comme une vidence en termes de granularit, rgularit en fonction delutilisation quil en fait (certains sattachent laspect perceptif, alors que dautres ladfinissent par le domaine dapplication)Dun point de vue formel, on admet gnralement que la texture est une fonction desvariations dintensit observes dans limage. Une dfinition gnrale de la texture [14] laconsidre comme : Une mesure de la variation de lintensit dune surface, mesurant desproprits telles que la douceur, la grossiret et la rgularit. Elle est employe souventcomme un {descripteur de rgion} dans le domaine de lanalyse dimage et de la vision parordinateur. Les trois principales approches employes pour dcrire la texture sont statistiques,structurales et spectrales. Les techniques statistiques caractrisent la texture par lesproprits statistiques des niveaux de gris des points comportant/composant une surface.Typiquement, ces proprits sont calcules partir de lhistogramme des niveaux de gris oude la matrice de cooccurrence de la surface. Les techniques structurales caractrisent latexture comme une surface compose de primitifs simples appels les texels (des lmentsde texture), ils sont rgulirement arrangs sur une surface selon quelques rgles. Ces rglessont formellement dfinies par {une ou plusieurs grammaires} de divers types. Lestechniques spectrales sont bases sur des proprits du spectre de Fourier et dcrivent lapriodicit globale des niveaux de gris dune surface en identifiant des crtes dnergie levedans le spectre.II.3. Application de la texture la segmentationLa texture sert gnralement la segmentation des images et sous-entend lareconnaissance de zones homognes au sens dune texture donne.La distinction aisment faite par lil humain entre plusieurs textures est une tche difficile raliser en vision par ordinateur, dans la mesure o il existe un nombre infini de textures et ochacune possde ses propres caractristiques de luminance, orientation, frquence.[18]Dans ces conditions, il nexiste pas de mthode capable de caractriser compltement chaquetexture ; lobjectif de la majeure partie dentre elles est danalyser limage de manire dcrire au mieux les impressions visuelles. Pour cela, on attribue la texture les propritssuivantes [14]:La texture est une proprit de rgion qui ne peut pas tre dfinie en un point, ceci faitLaboratoire L3i Universit de La RochellePage 15 16. K.MOUATS - Segmentation dImages de Documents Anciens par Approche Texturedonc intervenir la notion de voisinage.La texture est une rpartition spatiale de niveaux de gris.La texture peut tre apprhende diffrents niveaux ou diffrentes rsolutions.Une rgion est considre comme texture lorsquelle prsente un grand nombre depetits objets ou un motif lmentaire rptitif.II.4. Mthodes danalyse de texturea) Mthode structurelleLa texture est dfinie comme une organisation spatiale de niveaux de gris, cest--direquelle laisse apparatre des arrangements spatiaux de motifs de base dtermins, ce qui nesapplique a priori que dans le cas de structures trs rgulires.La plupart des mthodes danalyse de ces textures se dcomposent en deux phases : lapremire sert dterminer les lments de base composant la texture, tandis que la deuximevise en dterminer larrangement spatial.Les mthodes structurelles sont gnralement peu intressantes, dans la mesure o ellesimposent de travailler sur des textures extrmement rgulires, ce qui nest pas notre cas (lesimages de documents anciens possdent un grand nombre de paramtres) [18].b) Mthode statistiqueCes mthodes dfinissent la texture en termes de distribution de niveaux de gris ; cesont les premires avoir t utilises en vision artificielle.La mthode des matrices de co-occurrence en niveaux de gris est la plus connue et la plusutilise des mthodes statistiques. Le principe de cette technique est de parcourir limage dansquatre directions privilgies (0,/4,/2,3/4) et de reprer combien de fois des pixels deluminosits diffrant de z sont spars dune distance donne D.Il sagit dun problme la fois facile mettre en uvre (mme si le choix des paramtres etla slection des rsultats les plus pertinents restent difficiles) mais largement coteux entermes de temps de calcul et de ressources mmoire ncessaires.On peut aussi utiliser la fonction dauto-corrlation, qui permet dvaluer aussi bien le degrde rgularit de limage, que la finesse ou la grosseur de la texture dans limage.Daprs sa formulation mathmatique, pour une image I M lignes et N colonnes :(II.1)Si le trac de la fonction dauto-corrlation chute lentement, alors la texture est plutt fine(limage est trs similaire dun pixel dobservation son voisin), et linverse si elle chuterapidement, cela signifie que la texture est plus grossire (deux voisinages proches prsententpeu de similarits) [18] [19]Laboratoire L3i Universit de La RochellePage 16 17. K.MOUATS - Segmentation dImages de Documents Anciens par Approche Texture Variabilit de la disposition de textures dans une mme imagec) Mthodes issues du traitement de signalLe but de ces mthodes est de dcrire la texture comme un mlange de signaux defrquences, damplitudes et de directions diffrentes. Celles-ci sont particulirement efficacesen gnral dans la mesure o elles cherchent imiter le processus de vision humaine quiopre une dcomposition frquentielle systmatique des images qui parviennent sur la rtine.Dans le domaine spatial, lide est de caractriser la texture par le nombre de transitions (oucontours) quelle affiche par unit de surface, plutt que dutiliser les frquences ; Haralickparle aussi de textural edgeness . On peut, pour cela, utiliser des techniques de dtectionde contours classiques. Parmi les plus simples, loprateur Laplacien ou loprateur deRobert [18].Dans le domaine frquentiel, le principe consiste reprer les frquences et les orientationsqui composent les textures contenues dans limage. Ces mthodes sont particulirementadaptes aux cas des images contenant des textures rgulires. Le principe est dappliquer limage originale la transformation de Fourier qui permet de mettre en vidence les rgularitsen passant dans le domaine frquentiel. Le problme pos par cette opration, qui agitglobalement sur limage, est quelle perd une information prcieuse de localisation spatialei.e. on connat les caractristiques (en frquence et en orientation) des textures qui composentlimage mais on ne peut pas les situer dans limage originale [14].La solution cela est dutiliser une transformation alternative appele transformation deFourier fentre glissante, o le principe est dappliquer la transformation de Fourier dansune fentre dobservation que lon dplace dans limage ; la formulation en 1 dimension decette opration est : (II.2)O f dsigne la fonction laquelle on applique la transforme de Fourier, et w lamplitude dela fentre dobservation. Lorsque cette dernire est gaussienne, on parle de transforme deGabor.II.5. Utilisation de la texture sur les images de documents anciensLanalyse dimages de document, telle que nous lentendons, consiste en undcoupage (ou segmentation) de limage en rgions homognes au sens de leur fonction.Classiquement, on considre que dans les images de documents il existe principalement troisclasses particulires discriminer : le Texte, le Dessin et le Fond.Laboratoire L3i Universit de La RochellePage 17 18. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureDans la plupart des cas, la notion de texture est utilise pour la segmentation dimages dedocuments imprims o on cherche classer les zones dintrt en deux ou trois catgories,cest--dire Texte/non-Texte, Texte/Dessin ou Texte/Dessin/Fond.II.6. Segmentation des images de documents anciensQuel que soit le type dimage, la sparation des zones textuelles des zones graphiquesseffectue en localisant les lignes de texte. En effet, de nombreux travaux dans diffrentsdomaines dmontrent que la ligne de texte, grce sa texture rgulire et son alignement,reste llment le moins difficile localiser quelque soit le support. On peut dfinir une zonede texte comme une rgion de limage prsentant une trs forte densit de traits qui formentdes alignements une chelle donne . Dans une image naturelle, une telle configuration esttrs rare [18].Les mthodes utilises sont principalement celles bases sur des oprationsmorphologiques par filtrage diffrentiels ou frquentiels directionnels. Il sagit dapprochesdites ascendantes (data-driven) o lon cherche une interprtation sans connaissances a priori partir seulement des seules informations sur les pixels de limage. Les approchesdescendantes (model-driven) ncessitent des connaissances a priori sur la forme de lalocalisation des zones de texte ce qui est difficile obtenir sur des documents anciens [29].Les images de documents anciens soulvent trois types de difficults. La premire difficultvient de la mise en page de ces documents qui peuvent tre complexes et prsenter plusieurscolonnes de taille de corps et dinterlignes diffrents. Le second problme concernelinvitable courbure des lignes de texte produite par la reliure des livres. Enfin la derniredifficult provient des faibles espaces entre les lignes qui entrane de nombreux contacts entreles caractres appartenant de lignes diffrentes [29].Cas1 : mise en page complexeCas2 : CourbureCas3 : connexions entre caractres Figure II.1. Verrous empchant lapplication de la mthode des projections pourlanalyse dimage [29]Laboratoire L3i Universit de La RochellePage 18 19. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureII.7. Segmentation dimage de documents anciens par analyse des projectionshorizontales/ verticalesCette mthode consiste projeter les valeurs des pixels ou lpaisseur du rectanglecirconscrit des caractres, dans les directions horizontales et verticales de faon obtenir deuxhistogrammes. Lhistogramme des projections horizontales possde des maxima quireprsentent les centres des lignes et des minima qui dlimitent les bords infrieurs etsuprieurs des lignes. Lhistogramme des projections verticales donne les bords extrieursgauches et droits des colonnes. Cette mthode ne marche pas pour les documents multi-colonnes (cas1) et supposent que les lignes soient correctement alignes horizontalement(cas2). Cette approche ncessite une correction pralable de la courbure et de linclinaison etne peut traiter que des documents de structure simple. De plus, il faut binariser correctementlimage de faon sparer correctement les lignes. Cette mthode nest donc pas utilisable surtoutes les images de documents anciens. Cependant, la mthode de projection peut treappliques sur des morceaux de lignes de faon rduire la sensibilit linclinaison et viterlimbrication multiple avec des zones graphiques [29].Les mthodes de projection permettent toutefois dextraire la ligne de base ( base-line ), lecorps du texte ( x_line base-line ) qui dlimitent les caractres sans hampes ni jambage.Ces informations importantes peuvent tre extraites par projection de chaque mot du texte[18].Motif RgulierMotif IrrgulierMotif Rgulier Figure II.2. Rsultat de projection horizontale dune image de document [31]Voici un rsum de quelques travaux, portant sur la segmentation dimages de documents,utilisant de nombreuses approches intressantes : Jain et Bhattacharjee [3] proposent une mthode directe de segmentation texte/dessin enutilisant un banc de filtres de Gabor, la mthode ainsi dfinie ne permet que de marquer leszones de texte des images de documents traites. Trygve et al. [2] reposent sur les travaux de Jain et Bhattacharjee pour mettre au point unsystme de segmentation supervis, mais plus avanc, capable de dfinir le texte, le dessin etle fond des images de documents fortement bruits. Mausumi et Malay [4] dveloppe une mthode de segmentation dimages de documents laide du filtre de Gabor utilis dans un environnement base dondelette. Le travail ainsidfini opte seulement pour le marquage des zones de texte prsentes dans le document.Laboratoire L3i Universit de La Rochelle Page 19 20. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureNotre travail reprsente une premire tentative dans ltablissement dun systme desegmentation Texte / Dessin dimages de documents anciens par approche texture utilisant unbanc de filtres de Gabor.Il tait une fois une t| x y| x v{txmchante sorcire siv|x | }tx wx t uxt wxjalouse de la beautt uxx x|x y|x Utv{xAde sa belle petite} x t }xt wt fille Blanche.un jour |xtA fx x| t|Il tait une fois unemchante sorcire sijalouse de la beautde sa belle petitefille Blanche.un jourFigure II.3. Les diffrentes zones dun document peuvent tre simules un agencement de texturesIII. Thorie du filtre de GaborUn filtre de Gabor est une fonction sinusodale laquelle on a rajout une enveloppegaussienne. Dans le plan frquentiel, cette fonction se transforme en gaussienne. La fonctionsinusodale est caractrise par sa frquence et par son orientation. Ainsi appliqu sur uneimage, un filtre de Gabor peut tre vu comme un dtecteur de segments dorientationparticulire, puisquil ragira aux artes perpendiculaires la direction de propagation dusinus. La frquence du sinus, indique quelles frquences le filtre sera sensible et ragira. Il ade plus t montr que les fonctions de Gabor forment un set complet, cest dire quenimporte quelle fonction peut tre exprime en une somme (infinie) de fonctions de Gabor,pour autant que le produit des densits frquentielle et spatiale du set soit suprieur 1[4].Les techniques de filtrage multi-canal permettent lextraction des caractristiques detexture localement, en frquence et orientation, en dautres termes, les calculs descaractristiques de texture (en frquence et orientation) peuvent tre effectus pour tout pixeldans une rgion dintrt. Cette mthode est particulirement intressante vue quelle estinspire du systme de vision humain qui dcompose limage projete sur la rtine en unnombre important dimages filtres, chacune contenant des variations dintensit fines defrquences et dorientations.Lide de lapproche gaborienne est alors de concevoir un filtrage particulirement slectif enfrquence et orientation dans le but de caractriser au dtail prs les textures. Chaque filtre estalors appliqu limage dorigine, et une analyse ventuelle permettra de crer un simplevecteur de caractristiques ( base de calculs statistiques).Les fonctions de Gabor prsentent les avantages suivants : Localisation maximale dans les espaces spatial et frquentiel; Flexibilit: les fonctions de Gabor peuvent tre positionnes librement et continuellementdans lespace, des frquences et des orientations choisies arbitrairement sans contraintes;Laboratoire L3i Universit de La Rochelle Page 20 21. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureUne fonction de Gabor 2D h est une onde plane sinusodale module par une enveloppegaussienne et oriente avec un angle partir de laxe X. La formulation mathmatique, dansle domaine spatial pour une frquence fondamentale u0 tout au long de laxe X (c..d. = 0),est : 1 x2y2 h(x,y)= exp[- 2 2 2] cos (2u0x) (III.1) x yo x (respectivement y) est la variance de la gaussienne selon laxe X (respectivement Y).Les filtres orientation (0) sont obtenus en effectuant une rotation de lquationprcdente.La slectivit du banc de filtre en orientation et frquence est claire dans le domainefrquentiel, cest pour cette raison quon applique la transforme de Fourier lquation (1), eton obtient : 2 22 2 1 u u0v1 u u0vH(u,v)=TF(h(x,y))=A.{exp[- 2 2 2 ]+exp[-2 2 2 ]} u vu v(III.2)avec u = 1 / 2x , v = 1 / 2y et A = 2xy .De ce fait, dans le domaine frquentiel, le signal est reprsent par deux gaussiennes le longde laxe X, centres en +u0 et -u0 comme montr sur la figureIII.1.Impossible dafficher limage. Impossible dafficher limage.Figure III.1. La fonction de Gabor dans le domaine frquentiel Figure III.2. La fonction de Gabor dans le domaine SpatialDans le domaine frquentiel, la fonction de GaborDans le domaine spatial, la fonction de Gaborest reprsente par deux piques gaussiennes. est une fonction sinusodale module par une gaussienneLaboratoire L3i Universit de La Rochelle Page 21 22. K.MOUATS - Segmentation dImages de Documents Anciens par Approche Texture Impossible dafficher limage.Impossible dafficher limage.Figure III.3. Ensemble de filtres de Gabor dans le domaine frquentiel (le multi-canaux)Le filtre de Gabor est un filtre directionnel et modulable.Chaque filtre dcrit par une orientation et une frquence spcifiques dfinit un Canal de filtrage.Lassociation et lagencement dun ensemble de filtres de Gabor permet de couvrir tout lespace frquentiel, on parle alors de filtrage multi-canaux. Impossible dafficher limage.Figure III.4.(a) Filtres de Gabor dans une fentre 30 x 30,reprsents dans le domaine spatial et frquentiel pour u0 = 1/8 et =0(b) Filtres de Gabor dans une fentre 30 x 30,reprsents dans le domaine spatial et frquentiel pour u0 = 1/8 et =45 Laboratoire L3i Universit de La Rochelle Page 22 23. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureImpossible dafficher limage.Figure III.5. Partie relle des 4 x 4 fonctions de Gabor dans le domaine spatial Laspect du filtre dpend de la frquence, de son orientation et de ses carts types; Lorientation du filtre dfinit la direction du filtre ; La frquence dfinit la sensibilit du filtre ; Les carts types dfinissent la rceptivit (largeur) du filtre.Impossible dafficher limage. Figure III.6. Couverture du domaine de Fourier par lescanaux frquentiels des fonctions de Gabor Le filtrage multi-canaux est simplement et efficacement ralis par le filtre de Gabor qui permet de couvrir tout le domaine frquentiel et dans de multiples orientations. Chaque canal permet dextraire les composantes de limage dont les valeurs correspondent aux paramtres du filtre (frquence et orientation).Laboratoire L3i Universit de La Rochelle Page 23 24. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TextureDune manire pratique plus dtaille, un filtre symtrique impair de Gabor possde la formegnrale suivante dans le domaine spatial :221 xyh(x,y,,f) = exp {- 2 [ 22 ]}cos(2 f x) (III.3)xyavec x = x cos + y sin , et y = -x sin + y cos .Ce filtre consiste en une enveloppe gaussienne (de paramtres x et y) module par unesinusode de frquence f le long de la direction de laxe x . Langle permet la rotation de ladirection de la rponse. La frquence f peut tre vue comme linverse de la moyenne desdistances inter-directions.La valeur de est donne par : k = (k 1)/m, k =1...m, o m reprsente le nombre dedorientations.Pour chaque bloc d image (fentre) de taille W x W, centr au point (X,Y), avec W impair, oncalcule la grandeur de la caractristique de Gabor comme suit, pour k = 1....m :g(X,Y,k,f,x,y) = I(X+x0,Y+y0)h(x0,y0,k,f,x,y)(III.4)o I(x,y) est la valeur du niveau de gris du pixel (x,y).Comme rsultat, on obtient m caractristiques gaboriennes pour chaque bloc de W x W delimage.Dans des blocs contenant un motif aigu, les valeurs dune ou de plusieurs valeurscaractristiques gaboriennes sera (seront) plus importante(s) que les autres valeurs (cesvaleurs correspondent langle de rotation du filtre qui concide avec langle directionnel dumotif ou traits du bloc en cours). Dun raisonnement similaire, pour un bruit non-orient(alatoire)des blocs de fond, les m valeurs caractristiques seront similaires. De ce fait, lavariance G des m valeurs caractristiques permet de segmenter ou de sparer le fond (arrireplan) de lavant-plan (domaine dintrt).Si G est infrieure un certain seuil donn, le bloc est tiquet comme un bloc de fond(background), sinon le bloc est tiquet comme un bloc dintrt (foreground). Cependant, cette mthode nest pas prcise sur les bords des rgions dintrt ou desblocs ayant un faible contraste (rsolution), comme on peut perdre de linformationminiaturise en arrire plan si les paramtres ne sont pas bien ajusts. Les filtres de Gabor bidimensionnels permettent lextraction directe de caractristiquesde textures localises en frquence et en orientation, cest--dire que pour chaque pixel, ilspermettent le calcul de caractristiques dans un voisinage lenglobant. Cette technique,prcisment inspire du mcanisme de la vision humaine qui opre une dcompositionfrquentielle systmatique des images qui parviennent sur la rtine, se rvle particulirementLaboratoire L3i Universit de La Rochelle Page 24 25. K.MOUATS - Segmentation dImages de Documents Anciens par Approche Textureefficace. Le principe des filtres de Gabor est donc de btir un banc de filtres trs slectifs enfrquence et en orientation, et de filtrer limage analyser avec chacun deux ; le calcul aposteriori de paramtres sur les images rsultats, permet de caractriser les texturescontenues dans limage analyser.Il est noter que lorsque la frquence fondamentale u0 augmente, la bande passante dufiltre en frquence augmente elle aussi : le filtre devient moins slectif ; ce phnomneapparat clairement sur la reprsentation dun banc de filtres de Gabor 6 frquences (u0=12,22, 32, ) et 4 orientations (=0, 45, 90 et 135). Par ailleurs, le banc de filtres deGabor permet de couvrir la quasi-totalit de lespace des frquences et, dans la mesure o ilny a que peu de recouvrement entre eux, la dcomposition dune texture dans ce plan estunique et caractristique.III.1. Paramtrisation / Calcul efficace des paramtres de GaborDans ce qui suit, on prsentera les mthodes de slection et de calcul des paramtresdu filtre de Gabor.Un filtre de Gabor 2-D est un produit dune gaussienne elliptique dans toute rotation et unexponentiel complexe reprsentant une onde plane sinusodale.La sensibilit du filtre est commande principalement par ses carts types, associs au grandet petit axes x et y respectivement. Deux autres paramtres dcrivent un filtre de Gabor quisont f0 (frquence centrale) et (angle dorientation).Lallongement de la gaussienne est donn par : = x / y.Une caractristique gaborienne consiste en le calcul de la rponse des diffrents filtres pourdes valeurs diffrentes dorientations et de frquences : rponse du banc de filtres.Un banc de filtres est compos de plusieurs filtres et utilis dans le processus dereconnaissance dobjets base de la relation existante entre les diffrentes rponses desfiltres.a) La rpartition angulaireDans la littrature, la slection dangles dorientation l a t dmontre [3][21] ; un rsultatcl annonce lespacement uniforme des diffrentes orientations.l = 2l/n, l={0,1,2,.,n-1} (III.5)o l est la lme orientation et n et le nombre total dorientations envisages.Le calcul peut tre rduit moiti vu que les rponses aux angles [,2] sont des complexesconjugus aux rponses sur [0, ] dans le cas des valeurs dentre relles.Laboratoire L3i Universit de La Rochelle Page 25 26. K.MOUATS - Segmentation dImages de Documents Anciens par Approche Textureb) La rpartition frquentiellePour les valeurs de la frquence, elles vrifient lexpression suivante :fl = k-1fmax ,l={0,1,,2,..m-1} (III.6)k =2 pour une octave despacement ou bien k=2 pour un espacement dun demi doctave.c) Les Vecteurs caractristiquesEn utilisant ces schmas de slection pour couvrir les frquences dintrt f0,.,fm-1 et lesorientations pour la discrimination angulaire dsire, on construit un ensemble decaractristiques pour tout pixel (x0,y0) de notre image, soit G cette matrice. G peut scriresous la forme suivante : r(x0,y0 ;f0,0). r(x0,y0 ;f0,n-1) r(x0,y0 ;f1,1). r(x0,y0 ;f1,n-1) . ......G= . ...... . ...... . ...... r(x0,y0 ;fm-1,0). r(x0,y0 ;fm-1,n-1)Cette matrice caractristique peut tre utilise comme un vecteur dentre dans un processusde classification.Seule la dtermination des valeurs de f, et nest pas suffisante pour travailler efficacementavec le filtrage gaborien, il faudrait trouver leurs valeurs optimales. Il existe plusieursmthodes doptimisation, cependant, le caractre dinterdpendance des paramtres gaborienset lhtrognit de leurs domaines de dfinition compliquent cette tche et la rendent desfois impraticable.III.2. Les frquences du filtre de GaborDans la littrature [3][4][21], il existe une multitude dapproches pour la dterminationdes valeurs des frquences utilises pour le filtrage. Principalement, ladoption duneapproche spcifique est commande par le domaine dapplication et la nature des imagesutilises.Les frquences des filtres dans un banc de filtres sont : f0=fmax, f1=fmax/k, f2=fmax/k2 , fn=fmax/km-1. Les valeurs slectionnes de k et x sont interdpendantes. Elles doivent trechoisies de telle sorte que le banc de filtres capture toutes les frquences utiles et descriptivespour lapplication envisage.Laboratoire L3i Universit de La Rochelle Page 26 27. K.MOUATS - Segmentation dImages de Documents Anciens par Approche TexturePremier rsultat important : Les valeurs de x et f sont mutuellement dpendants.Sans trop sattarder sur des dmonstrations, on admet les conclusions suivantes : 1 k + 1 x = ln p1 k 1III.7 p1 correspond au point de passage entre les filtres dans des frquences adjacentes. k 1 2 ()p1 = e k +1 III.8Pour trouver la valeur de k, tant donn f0=fmax, fm-1=fmin et m est :ln f min ln f max1 f min = m 1f max k = em 1 III.9kUne valeur indicative de m sachant fmax, fmin et k peut tre calcule comme suit : ln f min ln f maxm=+1 III.10 ln kLa valeur retourne de m nest pas directement utilisable, car m doit tre un entier.III.3. Les orientations du filtre de Gabor La valeur de y est troitement lie aux nombres dorientations choisies.En dfinissant un autre point p2 qui correspond au point de passage entre les filtres dansdes orientations adjacentes, la valeur de y se calcule comme suit, avec n lenombre dorientation du filtre:f0 ln p 2y =III.11 ub u b = tan f 0III.12 2n Laboratoire L3i Universit de La RochellePage 27 28. K.MOUATS - Segmentation dImages de Documents Anciens par Approche Texture f 0Si n