Theorie Des Jeux Et Applications Reseaux

Embed Size (px)

DESCRIPTION

Theorie Des Jeux Et Applications Reseaux

Citation preview

  • UNIVERSITE HASSAN 1er

    Facult des sciences et techniques de SETTAT

    THEORIE DES JEUX ET APPLICATIONS RESEAUX

    Ralis par : KASDI Yassir

    RIBAT Mohamed

    MINAOUI Amine

    MODELISATION ET PERFORMANCES DES RESEAUX Pr.S.KAFHALI

    Anne Uiversitaire 2013/2014

  • UNIVERSITE HASSAN 1er Facult des sciences et techniques de SETTAT

    THEORIE DES JEUX ET APPLICATIONS RESEAUX 1

    Table des matires 1. Introduction.......................................................................................................................................................... 2

    2. Historique ............................................................................................................................................................. 2

    3. Dfinition .............................................................................................................................................................. 2

    4. Le jeu stratgique ................................................................................................................................................. 3

    4.1. Dfinition : .................................................................................................................................................... 3

    4.2. Les typologies : ............................................................................................................................................. 3

    4.2.1. Jeux coopratifs / comptitifs : ............................................................................................................ 3

    4.2.2. Jeux avec dcisions simultanes / squentielles :................................................................................ 3

    4.2.3. Jeux information parfaite/imparfaite : .............................................................................................. 4

    4.2.4. Jeux information complte/incomplte : .......................................................................................... 4

    4.3. Prsentation : ............................................................................................................................................... 4

    4.3.1. Forme extensive : .................................................................................................................................. 4

    4.3.2. Forme normale (forme stratgique) : .................................................................................................. 5

    4.4. Stratgie mixte :............................................................................................................................................ 5

    4.5. Lquilibre : ................................................................................................................................................... 6

    4.5.1. Dfinition : ............................................................................................................................................. 6

    4.5.2. Type : ..................................................................................................................................................... 6

    4.6. Les jeux rpts : .......................................................................................................................................... 8

    4.6.1. Dfinition : ............................................................................................................................................. 9

    5. La radio cognitive ...............................................................................................................................................10

    5.1. Dfinition : ..................................................................................................................................................10

    5.2. Lutilisation de la thorie des jeux pour laccs dynamique au spectre : .................................................11

    5.3. Solution propose : ....................................................................................................................................11

    5.4. Algorithme propos : ..................................................................................................................................14

    5.5. Organigramme : ..........................................................................................................................................16

    6. Conclusion : ........................................................................................................................................................17

    Rfrences bibliographiques et webographiques ....................................................................................................17

  • UNIVERSITE HASSAN 1er Facult des sciences et techniques de SETTAT

    THEORIE DES JEUX ET APPLICATIONS RESEAUX 2

    1. Introduction

    La thorie des jeux constitue une approche mathmatique de problmes de stratgie tels quon en

    trouve en recherche oprationnelle et en conomie.

    Cet outil a pour objectif de tenter de formaliser comment dcider que telle configuration ou dcision

    est meilleure qu'une autre ? Nous chercherons pour cela trouver l'optimum de certains paramtres qui

    permettent de quantifier la qualit stratgique d'une situation. Il faut galement dterminer quelles conditions

    conduisent une configuration qui est juge optimale.

    La thorie des jeux est aujourd'hui assez rpandue et utilise dans les milieux universitaires, non

    seulement en conomie (finance d'entreprise particulirement), mais galement par toute une classe d'autres

    sciences dans lesquelles l'tude des situations de confits est pertinente : sociologie, biologie, volution,

    informatique, tlcommunication

    2. Historique

    En 1654, Antoine GOMBAULD, posa une nigme Blaise PASCAL comment rpartir entre deux joueurs

    l'enjeu d'un jeu de hasard, lorsque celui-ci est inachev et qu'un des joueurs a l'avantage sur l'autre. .

    En 1912, E. ZERMELO dmontre le premier thorme mathmatique de la thorie des jeux : la

    dcidabilit du jeu d'checs. Le thorme justifie l'introduction du concept mathmatique de jeu deux

    joueurs de somme nulle . Emile BOREL contribuera galement la thorie des jeux entre 1921 et 1927 :

    application du concept de jeu aux sciences sociales et en donne une approche mathmatique.

    3. Dfinition

    La thorie des jeux est un outil danalyse des comportements humains qui a connu un essor considrable

    depuis la parution de louvrage de Von Neumann et Mogenstern The Theory of Games and Economic

    Behavior en 1944.

    Et elle peut tre aussi dfinit comme une approche mathmatique, qui se compose des modles et

    techniques utilises pour analyser le comportement dcisif des individus rationnels, en gnral les jeux peuvent

    tre classs en deux types : jeux coopratifs et jeux comptitifs.

  • UNIVERSITE HASSAN 1er Facult des sciences et techniques de SETTAT

    THEORIE DES JEUX ET APPLICATIONS RESEAUX 3

    4. Le jeu stratgique

    4.1. Dfinition : Le jeu stratgiques est lensemble des rgles qui encadre le comportement des joueurs et qui dtermine

    le gain des joueurs sur la base des actions entreprises selon cette terminologie, un jeu stratgique suppose une

    dfinition claire des rgles de comportements des joueurs.

    4.2. Les typologies : Les jeux stratgiques peuvent tre typs selon quelques critres comme le comportement, linformation

    du jeu et la dcision.

    4.2.1. Jeux coopratifs / comptitifs :

    Les jeux sont typs selon le comportement du joueur par rapport aux autre joueurs, pour un joueur soit

    il est en coopration/comptition avec les autres joueurs.

    Jeux coopratifs

    Un jeu est coopratif lorsque des joueurs peuvent passer entre eux des accords qui les lient de manire

    contraignante (par exemple, sous la forme dun contrat qui prvoit une sanction lgale dans le cas du non-

    respect de laccord). On dit alors quils forment une coalition dont les membres agissent de concert.

    Jeux comptitifs

    Par dfinition, dans un jeu comptitif nous spcifions toutes les options stratgiques offertes aux joueurs,

    alors que les contrats qui sous-tendent les coalitions dans un jeu coopratif ne sont pas dcrits. Chaque joueur

    cherche avoir ses biens sans tenir compte aux autres joueurs.

    4.2.2. Jeux avec dcisions simultanes / squentielles : Les jeux sont typs selon lordre de dcision des joueurs, les dcisions des joueurs sont prises soit

    simultanes ou squentielles.

    Jeux avec dcisions simultanes

    Dans ce type de jeux, les joueurs prennent leur dcisions simultanment, sans connaitre la dcision des

    autre joueurs, nous pouvons citer quelque exemple : Dilemme des prisonniers, pierre-feuille-ciseau.

    Jeux avec dcisions squentielles

    Ici les dcisions de joueurs se font squentiellement (ne se font pas en mme temps), autrement dit les

    dcisions des joueurs sont pris avec un dcalage temporelle). La dcision du joueur est influe par les dcisions

    dj prises des autre joueurs, quelque exemples des jeux dcision squentielle, le plus populaire cest : le jeu

    dchec.

  • UNIVERSITE HASSAN 1er Facult des sciences et techniques de SETTAT

    THEORIE DES JEUX ET APPLICATIONS RESEAUX 4

    4.2.3. Jeux information parfaite/imparfaite : Dans ce typage les jeux sont typs selon linformation sur les autres joueurs, autrement dis cest ce que

    le joueur connaissent au moment o il prend sa dcision. Jeux information parfaite est un jeux ou les actions

    effectus auparavant par les joueur influent sur la dcision du joueur dsirant prendre une dcision, car le

    joueur possde des information sur les actions dj effectues par les autres joueurs et il faut que les dcisions

    des joueurs se font squentiellement, hors que dans le jeu information imparfaite le joueur ne possde pas

    toutes les informations sur les autres joueurs ou bien aux moins deux dcisions sont dj effectue

    simultanment, ce qui rend la dcision plus dlicate que dans le jeu a information parfaite.

    4.2.4. Jeux information complte/incomplte : Ce typage se base sur linformation des joueurs par rapport aux autres joueurs.

    Jeux information complte

    Tous lments de jeux est une connaissance commune entre les joueurs, plus prcisment chaque joueur

    connait lensemble des comportements possible pour tous les autres joueurs et il connait tous le paiement.

    Jeux information incomplte Cest un jeu ou chaque joueur ne connat pas tous les comportements des autres joueurs.

    4.3. Prsentation : Afin de rendre le jeu stratgique plus simple et plus lisible, des techniques de prsentation sont mises en

    place, les type de forme de prsentation sont :

    4.3.1. Forme extensive : Dans cette forme le jeu est reprsent sous forme dun arbre ou les joueurs sont reprsents par les

    nuds de larbre, les dcisions de joueurs sont les arcs descendus du nud qui prsente le joueur, la racine de

    larbre reprsente le joueurs qui initialise le jeu (le premier joueur qui commence), les feuille de larbre

    reprsente le gain de chaque joueur reprsents sous format de vecteur qui a comme dimension le nombre

    des joueurs participants dans le jeu. La figure qui suit illustre et montre bien clairement la notion de forme

    extensive du jeu stratgique, le joueurs 1 a deux choix de dcision le choix 1 et le choix 2, le joueur 2 a aussi

    galement deux choix choix1 et choix2 , le joueur 1 est celui qui joue le premier et le joueur 2 cest le deuxime

    qui joue , si le joueur 1 dcide de prendre le choix 1 comme dcision alors la rcompense est de x1 , et s il

    dcide choix2 alors la rcompense est de x2 , pour le joueur 2 si son choix est choix1 il aura y1 comme

    rcompense et sil choisi choix2 la rcompense est de y2 , si le joueurs 1 choisis choix1 et le joueurs 2 choisis

    choix 1 la rcompense des deux joueurs est x1 y1 respectivement ce qui est montrer dans la feuille gauche de

    larbre.

  • UNIVERSITE HASSAN 1er Facult des sciences et techniques de SETTAT

    THEORIE DES JEUX ET APPLICATIONS RESEAUX 5

    4.3.2. Forme normale (forme stratgique) : Cette reprsentation de jeu est spciale aux jeux deux joueurs, elle consiste reprsenter le jeu avec

    une matrice ou les lignes et les colonnes reprsentent les gains des combinaisons de stratgies des deux

    joueurs, nous allons reprendre lexemple prcdant, sa reprsentation sous forme normale est comme suit :

    4.4. Stratgie mixte : Dans la thorie des jeux un joueur est dit d'utiliser une stratgie mixte chaque fois qu'il choisit de faon

    alatoire sur l'ensemble des actions possible. Formellement, une stratgie mixte est une probabilit de

    distribution qui associe chaque action disponible une probabilit d'tre slectionn.

    Un profil de stratgie mixte est une liste de stratgies, l'une pour chaque joueur dans le jeu. Un profil de

    stratgie mixte induit une distribution de probabilit sur les rsultats possibles de la partie. Un quilibre de

    Nash (en stratgies mixtes) est un profil de stratgies avec la proprit qu'aucun joueur unique peut, en dviant

    unilatralement une autre stratgie, induisent une de probabilit qu'il trouve strictement prfrable.

  • UNIVERSITE HASSAN 1er Facult des sciences et techniques de SETTAT

    THEORIE DES JEUX ET APPLICATIONS RESEAUX 6

    4.5. Lquilibre : Lquilibre de jeux est un lment de base dans la thorie des jeux, car cest le point fort qui conduit

    stabiliser le jeu stratgique en satisfaisant tous les joueurs de point de vu utilit.

    4.5.1. Dfinition : Un tat ou situation ou aucun joueur ne souhaite modifier son comportement compte tenu des

    comportements des autres joueurs de faon plus prcise, lquilibre est une combinaison de stratgies compte

    tenu des stratgies des autres joueurs .Une fois que lquilibre est atteint dans un jeu il ny a aucune raison de

    le quitter.

    4.5.2. Type : Ils existent plusieurs techniques qui mnent un jeu stratgique un tat dquilibre, les techniques

    dquilibre sont :

    Lquilibre de NASH

    Pour bien comprendre ce type dquilibre, il sera mieux dillustrer des exemples simples: soit deux firmes

    de production des voitures : BMW et Mercedes, ces deux producteurs concurrents font un jeu comptitif pour

    maximiser le gain en tenant compte de comportements de lautre :

    Exemple1 : jeux des firmes BMW

    Les deux firmes MERCEDES et BMW veulent maximiser leurs gains par laugmentation de leurs taux des

    ventes et pour cela avant de prendre une dcision sur le prix de vente chaque firme doit consulter le prix de

    vente de lautre firme. Le tableau2.2 montre le bnfice de chaque firme selon son choix daugmenter ou de

    baisser le prix et selon le choix de lautre firme.

    Expliquant le tableau plus clairement, si les deux firmes baissent leurs prix alors chaque une delles

    reoit un gain de 300 millions deuros, si lune des deux lvent son prix et lautre le baisse alors la premire

    reoit 100 million deuros tandis que la deuxime reoit 700 millions deuros, enfin si les deux lvent le prix

    chaque firme se bnfice de 500 million deuros, remarquer que plus le prix est bas plus taux de ventes

    saccroit et plus le gain augmente.

    PRIX BAS PRIX ELEVE

    PRIX BAS

    300,300

    700,100

    PRIX ELEVE

    100,700

    500,500

    Tableau: Jeu de prix entre BMW et MERCEDES (les gains sont en million deuro)

  • UNIVERSITE HASSAN 1er Facult des sciences et techniques de SETTAT

    THEORIE DES JEUX ET APPLICATIONS RESEAUX 7

    Sachant que ce jeu est comptitif, les deux firmes doivent choisir la bonne stratgie pour augmenter les

    gains et minimiser les dgts.

    Selon le tableau pour la firme BMW, quand MERCEDES baisse le prix ,alors la meilleur stratgie pour

    BMW est de baisser le prix aussi car elle obtient 300 million deuros au lieu de 100 million deuro en levant le

    prix , et si Mercedes lve le prix , le meilleur stratgie pour BMW est de baisser le prix car elle obtient 700

    million deuro au lieu de 500 million en levant le prix , mme chose pour la firme MERCEDES, si BMW baisse le

    prix alors la meilleur stratgie pour MERCEDES est de basse le prix car elle obtient 300 million deuros au lieu

    de 100 million deuros en levant le prix , et si BMW lve le prix la meilleur stratgie pour MERCEDES est de

    baisser le prix car elle obtient 700 million deuros au lieu de 500 million deuros en levant le prix. Les deux

    firmes doivent baissent le prix pour maximiser leurs gains , la combinaison de stratgie (baisse le prix , baisse

    le prix) est meilleur que les autres combinaisons (baisse le prix , lever le prix) , ( lever le prix , baisse le prix) ,(

    lever le prix , lever le prix) , arrivant cette situation stable , aucune des deux firme ne souhaitent changer

    sa stratgie , alors cest ce que nous appelons lquilibre de Nash de ce jeu.

    Exemple2 : le jeu de lurne.

    Ce jeu est deux joueurs ou chaque joueur a la possibilit de participer au jeu avec deux somme

    dargent qui sont : soit 0 ou bien 20 et la mise dans une urne, la fonction dutilit (Ui) de joueur i est

    calculer comme suit :

    Somme (urne)= [somme (joueur1) + somme (joueur2)] Payoff(joueur_i)=[(Somme(urne)*3/2)]/2 Ui = somme (joueur_i) - Payoff(joueur_i) Joueur 2

    Joueur 1

    Met 0 Met 20

    Met 0

    (0, 0)

    (15, -5)

    Met 20

    (-5, 15)

    (10, 10)

    Si le joueur1 attend que le joueur2 met 0 alors son meilleur choix sera de mettre 0 car si il met 20

    euro il va perdre 5 sinon il va rien perdre, et sil attend que le joueur 2 de mettre 20 son meilleur choix est

    de mettre 0 car il va gagner 15 au lieu de 10 sil met 20 . Mme raisonnement pour le joueur2 alors ce

    jeux admis un quilibre de Nash dans le cas o la combinaison des stratgies est (met 0 , met 0 ).

    Lquilibre stratgie dominante Comme cest dj expliqu lquilibre de Nash est la dfinition dune situation dquilibre l ou nous

    supposons que les joueurs ont initialement atteint une certaine configuration de choix stratgique tenons

    compte uniquement des dviations individuelles possibles de telle configuration dans laquelle chaque joueur

    a la possibilit de dvier.

    Tableau : Les utilits des joueur dans le jeu de lurne(en uro)

  • UNIVERSITE HASSAN 1er Facult des sciences et techniques de SETTAT

    THEORIE DES JEUX ET APPLICATIONS RESEAUX 8

    A ce point-l lquilibre de Nash nous dit que rien ne pousse le joueur changer sa stratgie tant

    donn la configuration stratgique. Mais lquilibre de Nash ne donne aucune information sur comment ou

    pourquoi une certaine configuration de choix est arrte initialement. Pour bien comprendre ce concept nous

    allons faire rfrence lexemple prcdent (BMW et MERCEDES), nous pouvons en effet remarquer que fixer

    un prix bas est le meilleur choix pour chaque firme quel que soit le choix attendu de son rival.

    Examinons la dcision de MERCEDES. (BMW tant dans une situation symtrique, le mme

    raisonnement sapplique sur cette firme). Si MERCEDES sattend ce que BMW fixe un prix lev sa meilleure

    rponse est de fixer un prix bas car il gagne 700 million au lieu de 500 mi llion deuro (gain de stratgie de prix

    lev). Dautre part si MERCEDES sattend ce que BMW un prix bas, sa meilleur rponse est encore de fixer

    un prix bas. En ne choisissant pas un prix lev, il vite ainsi de perdre de largent : son gain est de 300 au lieu

    de 100 million deuro. Clairement MERCEDES est toujours mieux en fixant un prix bas quel que soit la stratgie

    attendue de BMW.

    Quand la stratgie est meilleur a toute les stratgies possibles de ses rivaux nous disons que cest une

    stratgie dominante cette stratgie domine toutes les autres stratgies des autres joueurs dans lexemple

    prcdent les deux firmes ont une stratgie dominante qui consiste fixer un prix bas. Lquilibre de ce jeu

    est alors appel quilibre en stratgie dominante.

    Lquilibre corrl

    Est un quilibre spcial dfini par Robert J.Aumann en 2006 qui a eu grce son introduction du

    concept de lquilibre corrl le prix Nobel. diffremment de lquilibre de Nash ou chaque joueur prend

    seulement en considration sa propre stratgie, lquilibre de corrlation garanties des meilleurs

    performances par lautorisation chaque joueur tient compte lensemble de comportement (action) des

    autres joueurs ,autrement dit chaque joueur a besoin de prendre en considration le comportement des

    autres joueurs sil existe un but mutuelle, lide est que le profil de stratgie est choisi alatoirement selon

    certaines distributions. Le joueur est oblig de suivre la stratgie recommande sil veut raliser le meilleur

    profit, il est prouv que lquilibre corrl est meilleur que lquilibre de Nash de point de vue profit de

    joueur. Si un joueur suit une action chaque situation atteignable possible dans un jeu, la stratgie est

    appele une stratgie pure.

    La corrlation est une manire de randomiser plus gnrale que le mixage. Dans les deux cas, les

    joueurs basent leurs choix sur lobservation dun vnement alatoire. Dans le cas de stratgie mixte, ces

    observations sont indpendantes, tandis que dans le cas de stratgies corrles, elles peuvent ne pas ltre.

    4.6. Les jeux rpts :

    Jusqu' maintenant les jeux prsents auparavant ; nous les avons suppos quils sont jous une seule

    fois, mais dans la ralit nous savons que les jeux peuvent se jouent plusieurs fois successivement ; par

    exemple les constructeur dautomobile allemands BMW et MERCEDES choisissent le prix et le style de leur

    vhicules puis se concurrent sur le march, sachant que les conditions de jeux samliorent au cours du temps

    nous pouvons le considrer comme la rptition de mme jeu.

  • UNIVERSITE HASSAN 1er Facult des sciences et techniques de SETTAT

    THEORIE DES JEUX ET APPLICATIONS RESEAUX 9

    4.6.1. Dfinition : Les jeux rpts sont des jeux dans lesquelles un ensemble finit des joueurs se rencontrent de faon

    rpte, ou les gains de chaque priode ne sont pas influs par les gains de les rsultats des priodes

    prcdents et aussi les conditions de jeu ne se changent pas.

    Dilemme du Prisonnier Le dilemme de prisonnier est presque utilis dans la plupart des manuelles de thorie des jeux qui

    introduisent les jeux rpts avec ce dilemme. Lhistoire de ce jeu se droule comme suit : La police arrte

    deux suspects et les place en garde a vus. La police est convaincue quils ont commis un crime mais ne dispose

    pas de preuves suffisantes. Les policiers dcident alors dinterroger les deux suspects sparment pour

    obtenir des aveux.

    Chaque suspects se voit offrir deux choix possibles, soit il se tait, soit il dnonce son complice. Si les

    deux gardent le silence, ils ne peuvent tre condamns que pour un dlit mineur comme le porte darme et

    ne resteront pas longtemps en prison. Si Lun dnonce et lautre se tait, alors le premier est relch et le

    seconde cope dune longue peine de prison. En revanche si les deux se dnoncent, ils sont envoys en prison

    mais la sentence est lgrement moins svre que si un seul est dnonc. Cette situation stratgique peut

    tre dcrite de manire plus formelle. Soit deux joueurs suspect1 et suspect2 .Chacun deux stratgies

    possibles (dnoncer ou se taire).

    chaque combinaison de choix sont associes une peine de prison pour suspect1 et une peine de

    prison pour suspect2 le tableau donne les exemples de peines. En ligne nous avons le choix du suspects1 et en

    colonne celui du suspect2. Dans chacune des cases du tableau, la premire peine de prison est celle du

    suspect1 et la seconde peine est celle du suspect2 par exemple si le suspect1 se dnonce et son complice se

    tait, le premier est relch et le second est condamn six ans de prison. Si les deux se dnoncent, ils sont

    condamns quatre ans de prison chacun. Si les deux de se taisent, ils resteront une anne de prison.

    Suspect2

    Su

    spec

    t1

    Dnoncer Se taire

    Dnoncer (4 ,4) (0, 6)

    Se taire (6, 0) (1, 1)

    Chaque suspect cherche maximiser sa fonction dutilit qui est une fonction dcroissante de la dure

    pass en prison, le choix dnoncer est une stratgie dominante pour les deux suspects. Si le suspect1

    sattend ce que son complice se taise, il est relch sil dnonce le suspect2 et il est condamn un an sil se

    tait, alors que si le suspect1 sattend ce que son complice dnonce sa meilleur rponse est de dnoncer car

    il est condamn a quatre ans contre six ans sil se tait. Quel que soit le choix de son complice le suspect1

    obtient une plus grande utilit en dnonant son complice (mme raisonnement pour le suspect2). Le seule

    quilibre de ce jeu est (dnoncer, dnoncer).

    Tableau : les peine de prison dans le dilemme du prisonniers (en anne)

  • UNIVERSITE HASSAN 1er Facult des sciences et techniques de SETTAT

    THEORIE DES JEUX ET APPLICATIONS RESEAUX 10

    5. La radio cognitive

    5.1. Dfinition :

    La radio cognitive est une forme de communication sans fil connue sous la norme IEEE 802.22, dans

    laquelle un utilisateur peut dtecter intelligemment les canaux de communication (soit utiliss ou

    vacants), et de dplacer instantanment vers des canaux vacants. Cela permet d'optimiser l'utilisation des

    ressources disponibles radiofrquence tout en minimisant les interfrences avec dautres utilisateurs.

    Le terme radio cognitive est utilis pour dcrire un systme ayant la capacit de dtecter et de

    reconnatre son cadre d'utilisation, ceci afin de lui permettre dajuster ses paramtres de fonctionnement

    radio de faon dynamique et autonome et d'apprendre des rsultats de ses actions et de son cadre

    environnemental d'exploitation.

    La RC est une forme de communication sans fil dans laquelle un metteur/rcepteur peut

    dtecter intelligemment les canaux de communication qui sont en cours d'utilisation et ceux qui ne le

    sont pas, et peut se dplacer dans les canaux inutiliss. Ceci permet doptimiser lutilisation des

    frquences radio disponibles du spectre tout en minimisant les interfrences avec d'autres utilisateurs.

    La radio cognitive est une nouvelle technologie qui permet, l'aide d'une radio logicielle, de

    dfinir ou de modifier les paramtres de fonctionnement de la frquence radio dun nud rseau

    (tlphone sans fil ou un point daccs sans fil), comme par exemple, la gamme de frquences, le type de

    modulation ou la puissance de sortie.

    Cette capacit permet d'adapter chaque appareil aux conditions spectrales du moment et offre

    donc aux utilisateurs un accs plus souple, efficace et complet cette ressource. Cette approche peut

    amliorer considrablement le dbit des donnes et la porte des liaisons sans augmenter la bande passante

    ni la puissance de transmissions. La RC offre galement une solution quilibre au problme de

    l'encombrement du spectre en accordant d'abord l'usage prioritaire au propritaire du spectre, puis en

    permettant d'autres de se servir des portions inutilises du spectre.

    "Une radio intelligente est une radio dans laquelle les systmes de communications sont

    conscients de leur environnement et tat interne, et peuvent prendre des dcisions quant leur

    mode de fonctionnement radio en se basant sur ces informations et objectifs prdfinis. Les informations

    issues de lenvironnement peuvent comprendre ou pas des informations de localisation relatives aux

    systmes de communication".

    Le principe de la radio cognitive, repris dans la norme IEEE 802.22, ncessite une gestion

    alternative du spectre qui est la suivante : un mobile dit secondaire pourra tout moment accder

    des bandes de frquence quil juge libre, cest--dire, non occupes par lutilisateur dit primaire possdant

    une licence sur cette bande. Lutilisateur secondaire devra les cder une fois le service termin ou une fois

    quun utilisateur primaire aura montr des vellits de connexion.

  • UNIVERSITE HASSAN 1er Facult des sciences et techniques de SETTAT

    THEORIE DES JEUX ET APPLICATIONS RESEAUX 11

    5.2. Lutilisation de la thorie des jeux pour laccs dynamique au spectre : En fait, nous avons intgr deux aspects tirs de la thorie des jeux qui sont laspect coopratif et

    laspect comptitif.

    Entre les PUs cest la coopration avec la mise en place dun jeu de type dilemme de prisonnier. Ce jeu

    est dclench entre deux PUs avec la prsence dun agent coordinateur, lorsque un PU ne peut pas

    satisfaire la demande dun SU il demande la coopration avec un autre PU qui le trouve laide du

    coordinateur qui possde une vue globale sur rseau, le jeu se dclenche par la dcision de cooprer ou

    pas entre les deux PUs.

    Au niveau SUs cest la comptition avec un jeu similaire au jeu de lurne dj prsent dans le

    chapitre prcdent, ce jeu a besoin de deux SUs et un PU.

    Pour chaque PU chaque allocation de canaux, un compteur est incrment ce SU afin de calculer

    une valeur de fidlit de ce SU li au PU, lorsque deux SUs atteignent un seuil de cinq points de fidlit, le PU

    demande aux deux SUs sils veulent jouer, si le PU reoit laccord des deux SUs il dclenche le jeu de lurne

    entre les deux SUs et chaque SU a le droit de participer avec une somme de zro ou vingt(le calcul

    des rsultat est dtaill dans le chapitre 2) ensuite le PU envoie chaque SU son utilit.

    5.3. Solution propose : Pour mettre en uvre notre solution nous utilisons trois types dagent :

    Agent PU reprsentant des utilisateurs primaires, Agent SU reprsentant des utilisateurs

    secondaires et un Agent Coordinateur pour la coordination entre les PUs.

    La solution propose est prsente en deux tapes :

    Coopration entre les Pus

    Notre proposition consiste raliser une coopration entre les utilisateurs primaires lorsquils ne

    peuvent pas satisfaire la demande des utilisateurs secondaires avec lesquelles ils partagent le spectre

    et qui dsirent y accder, par revanche lorsquun utilisateur primaire coopre avec un autre utilisateur

    primaire il perd lnergie qui est une ressource prcieuse et il partage le gain obtenu moiti. Dans ce projet

    nous avons suppos que lnergie a une valeur et nous supposons que les utilisateurs primaires

    cooprent lorsque lnergie est suprieure un seuil dtermin.

    Le coordinateur est un agent qui a une vue globale sur tout le rseau, il possde un annuaire ou il

    enregistre les PUs prsents dans le rseau ainsi le nombre de canaux disponibles dans chaque PU.

    Lorsque le PU ne peut pas satisfaire la demande dallocation de ressources dun SU il contacte le

    coordinateur qui cherche un PU dans son annuaire, si le coordinateur trouve un PU satisfaisant la demande

    alors il rpond le PU qui la contact par lidentifiant du PU trouver. A ce moment la coopration entre les

    deux PUs est entame.

    Notre solution est base sur ladaptation du dilemme du prisonnier expliqu dans le chapitre prcdent,

    sa forme stratgique est montre dans le tableau 1 Supposons que :

    nb = nombre de canaux demands par lutilisateur secondaire.

  • UNIVERSITE HASSAN 1er Facult des sciences et techniques de SETTAT

    THEORIE DES JEUX ET APPLICATIONS RESEAUX 12

    La forme stratgique de jeu entre les PUs (les valeurs sont )

    Comptition entre les SUs Nous avons adapt le jeu de lurne pour simuler le comportement comptitif entre les SUs. Nous

    supposons dans ce scnario que lutilisateur primaire travail avec les points de fidlit. Les utilisateurs

    secondaires bnficient des point de fidlit qui sincrmente chaque allocation, lorsque lutilisateur

    secondaire atteint un seuil de fidlit fixe (cinq points dans notre cas), lutilisateur primaire demande

    lutilisateur secondaire son accord de participation au jeu avec un autre joueur qui a dj atteint le seuil et

    qui veut participer au jeu. Dans ce cas, le jeu de lurne est dclench entre ces deux joueurs secondaires

    comme indiqu dans le tableau

    Les utilits des joueurs de jeux de lurne en euro

    Topologie de rseau utilis

  • UNIVERSITE HASSAN 1er Facult des sciences et techniques de SETTAT

    THEORIE DES JEUX ET APPLICATIONS RESEAUX 13

    La division de spectre dans le rseau de radio cognitive

    Nous allons simuler le comportement et linteraction des agents dans un rseau de radio cognitive, les

    agents sont de diffrents types : Agent primaire , Agent secondaire et Agent coordinateur ,

    dans notre application nous avons utilis quatre agents primaires, cinq agents secondaires et un agent

    coordinateur.

    La comptition entre les SUs est dclenche par lutilisateur primaire qui a dj allou les ressources

    aux deux SUs et chacun deux atteint cinq points de fidlit et aussi chacun veut participer au jeu. Les SUs

    entre en comptition pour raliser et maximiser le gain du jeu en choisissant une valeur de participation au

    jeu entre zro et vingt sans connatre le choix de lautre joueur car nous sommes dans le cas dun jeu

    simultan.

    Le spectre est divis en quatre partis quitables de cinq canaux ou chaque partie est sous le contrle

    dun agent primaire, lagent primaire partage une partie de canaux qui est de quatre canaux et lautre partie

    la garde pour lui. Lutilisateur secondaire accde au spectre (les canaux partags par lutilisateur primaire)

    aprs lenvoie dun message qui contient le nombre de canaux demands au utilisateur primaire qui possde

    lautorit sur la partie du spectre dsire, lorsque lutilisateur primaire peut satisfaire la demande il fait

    lallocation des canaux pour le SU et il notifie le coordinateur pour quil fasse la mise jour des canaux libres

    pour le PU et il incrmente les point de fidlit de SU qui a demand les ressource ensuite il vrifie si le SU

    satisfait le critre de fidlit si oui et quun autre SU satisfait le critre de fidlit le PU envoie aux deux Sus

    sils veulent participer au jeu, si les deux SUs acceptent de participer au jeu, le jeu de lurne est

    dclench. Sinon lutilisateur primaire passe une demande qui contient le nombre de canaux demands par

    le SU au coordinateur, ce dernier consulte son annuaire pour chercher un utilisateur primaire qui peut

    satisfaire cette demande. Si le coordinateur trouve le PU qui peut satisfaire la demande, il envoie

    lidentifiant de ce PU lutilisateur primaire qui a formul la demande pour entamer le comportement

    coopratif entre les 2 PUs. Dans le cas contraire, le PU est inform par le coordinateur du non disponibilit

  • UNIVERSITE HASSAN 1er Facult des sciences et techniques de SETTAT

    THEORIE DES JEUX ET APPLICATIONS RESEAUX 14

    dun PU satisfaisant la demande. Quand lutilisateur primaire reoit une rponse de la part du

    coordinateur, si le message reu contient lidentifiant dun autre PU il envoie immdiatement un message

    de demande de coopration contenant lidentifiant de SU et le nombre de canaux demands, si lautre PU

    accepter de cooprer il prend en charge ce SU, sinon la demande est tout simplement ignor.

    5.4. Algorithme propos : Dbut de lalgorithme

    1. SU formule une demande de ressources (ID_SU, NB_CAN) et lenvoie au PU

    2. PU reoit la demande (ID_SU, NB_CAN)

    2.1. Si (PU possde NB_CAN disponibles) alors

    2.1.1. PU prend ID_SU en charge (allocation des ressources)

    2.1.2. Incrmenter les points de fidlit

    2.1.3. Si (ID_SU satisfait le critre de fidlit)

    2.1.3.1. Si (il existe un autre SU qui satisfait le critre de fidlit)

    Envoyer demande de jeu aux deux Sus

    2.1.3.1.1. Si les deux SUs acceptent loffre de PU

    Recevoir les deux sommes de jeu des deux SUs)

    Dclencher le jeu

    Envoyer chaque SU son utilit

    Fin si

    Fin si

    Fin si

    2.2. Sinon

    2.2.1. PU formule une demande (NB_CAN, ID_PU) et lenvoie au coordinateur

    2.2.2. Coordinateur reoit demande (NB_CAN, ID_PU)

    2.2.2.1. Coordinateur cherche dans son annuaire

    2.2.2.2. Si coordinateur trouve un PU alors

    2.2.2.2.1. Envoie rponse (ID_PU_trouv) ID_PU

    2.2.2.3. Sinon rponse (ngatif) a ID_PU

    Fin si

    2.2.3. ID_PU reoit la rponse du coordinateur

  • UNIVERSITE HASSAN 1er Facult des sciences et techniques de SETTAT

    THEORIE DES JEUX ET APPLICATIONS RESEAUX 15

    2.2.3.1. Si = rponse (ID_PU_trouv) alors

    2.2.3.1.1. ID_PU formule demande_coop(ID_SU) et lenvoie

    ID_PU_trouv

    2.2.3.1.2. ID_PU_trouv reoit la demande

    2.2.3.1.3. ID_PU_trouv formule une rponse avec une Rponse

    (oui/non) selon ltat de lnergie et lenvoie ID_PU

    Fin si

    2.2.3.2. ID_PU reoit rponse (oui) alors ID_PU_trouv prend ID_SU en

    charge (allocation des ressources)

    2.3. Fin si

    Fin de lalgorithme

  • UNIVERSITE HASSAN 1er Facult des sciences et techniques de SETTAT

    THEORIE DES JEUX ET APPLICATIONS RESEAUX 16

    5.5. Organigramme :

  • UNIVERSITE HASSAN 1er Facult des sciences et techniques de SETTAT

    THEORIE DES JEUX ET APPLICATIONS RESEAUX 17

    6. Conclusion :

    Nous avons prsent dans ce rapport la thorie des jeux qui est aujourdhui un outil indispensable

    pour comprendre lvolution de domaines aussi divers que lapprentissage, la tarification, loptimisation

    distribue ou lalgorithmique des rseaux de communications.

    Nous avons vu lintgration de la thorie des jeux dans le domaine des rseaux sans fil gnralement

    et dans la radio cognitive spcialement qui sont considrs comme les rseaux de futur gnration(la

    cinquime gnration de tlcommunication), et on a dtudier quelque travaux dj raliss dans le cadre de

    la thorie des jeux dans les rseaux sans fil et aussi dans la radio cognitive et les solution propos qui inclut

    laspect coopratif et laspect comptitif.

    Rfrences bibliographiques et webographiques

    THESE : Utilisation de la thorie des jeux dans les rseaux de radio cognitive pour laccs dynamique au spectre - Benhamida Mahmoud et Benyahia Belahcene

    COURS DE THORIE DES JEUX ET DE LA DCISION - gestion.coursgratuits.net/theorie-des-jeux/ THESE : Application de la thorie des jeux l'optimisation du routage rseau - solutions

    algorithmiques - Octave Boussaton