m06 Statistiques Ter Tsge

Embed Size (px)

Citation preview

  • 5/26/2018 m06 Statistiques Ter Tsge

    1/136

    ROYAUME DU MAROC Office de la Formation Professionnelle et de la Promotion du Travail

    DIRECTION RECHERCHE ET INGENIERIE DE FORMATION

    RESUME THEORIQUE&

    GUIDE DE TRAVAUX PRATIQUES

    MODULE : STATISTIQUES

    SECTEUR : TERTIAIRE

    SPECIALITE : COMPTABILITE DESENTREPRISES

    NIVEAU : TECHNICIEN

    OFPPT

  • 5/26/2018 m06 Statistiques Ter Tsge

    2/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 2

    Document labor par :

    Mlle Nadia BENHADDOU BAKKIOUI ISTA Taroudant DR SMD

    Rvision linguistique:---

    Validation :-

    --

  • 5/26/2018 m06 Statistiques Ter Tsge

    3/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 3

  • 5/26/2018 m06 Statistiques Ter Tsge

    4/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 4

    SOMMAIREPrsentation du module

    RESUME DE THEORIE

    Chapitre I- Les statistiques descriptives :

    I- Terminologie :

    II- Tableaux statistiques :A- Cas dune seule variableB- Cas de deux variables

    III- Reprsentations graphiques :A- Variable qualitative

    B- Variable quantitative1) Variable discrte2) Variable classe

    IV- Caractristiques de tendance centrale et de position :A- ModeB- MdianeC- Moyenne arithmtiqueD- Moyenne gomtriqueE- Moyenne harmoniqueF- Moyenne quadratique

    G- Quantiles

    V- Caractristiques de dispersion :A- tendueB- Intervalle inter-quartileC- Variance et cart-typeD- Coefficient de variation

    VI- La concentration :A- Valeurs globalesB- MdialeC- Courbe de concentration (ou de LORENZ)D- Indice de GINI

    VII- Les indices :A- Indices lmentairesB- Indices de LASPEYRES et de PAASCHE1) Indice de Laspeyres des prix2) Indice de Laspeyres des quantits3) Indice de Paasche des prix4) Indice de Paasche des quantits

    9

    10

    11

    11

    121213

    1414

    161617

    19192021222222

    23

    2323232424

    2525252626

    27272829292929

  • 5/26/2018 m06 Statistiques Ter Tsge

    5/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 5

    VIII- Rgression et corrlation :A- Ajustement dun nuage de points une fonction une fonction

    mathmatiqueB- Mesure de lintensit de la relation linaire entre deux variables

    1) Covariance2) Coefficient de corrlation linaire3) Droites de rgression

    IX- Sries chronologiques :A- Dcomposition des chroniquesB- La dtermination du trendC- Analyse de la composante alatoireD- DsaisonnalisationE- Srie ajusteF- Prvisions court terme

    Chapitre II. Ralisation des enqutesI. Dtermination optimale dun chantillonII. Elaboration du questionnaire

    Chapitre III. Ralisation des sondagesI- Estimateur dune moyenne ou dune proportionII- Variance de ces estimateursIII- Estimation par intervalle de confiance

    Contrle continu

    GUIDE DES TRAVAUX PRATIQUESTP1 : reprsentation graphique, paramtres de tendance centrale, de dispersion.TP2 : reprsentation graphiqueTP3 : paramtres de tendance centraleTP4 : reprsentation graphique, la corrlationTP5 : reprsentation graphique, paramtres de tendance centrale et de dispersionTP6 : ajustement linaire, prvisions et corrlationTP7 : QCMEvaluation de fin de moduleListe bibliographique

    3030

    31313232

    33333435353535

    373738

    40404344

    46

    47484950525355567677

  • 5/26/2018 m06 Statistiques Ter Tsge

    6/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 6

    Module : Statistiques

    Dure : 50 H40% : Thorique60% : Pratique

    OBJECTIF OPERATIONNEL DE PREMIER NIVEAUDE COMPORTEMENT

    COMPORTEMENT ATTENDU

    Pour dmontrer sa comptence, le stagiaire doitappliquer les mthodes statistiques.Selon les conditions, les critres et les prcisions qui suivent :

    CONDITIONS DEVALUATION

    A partir des tudes de cas, mise en situation, consignes du formateur, toutedocumentation ncessaire ;

    A laide de : calculatrice, tableur et logiciel de statistiques.

    CRITERES GENERAUX DE PERFORMANCE

    o Respect de la dmarche de calcul

    o Respect des principes de gestion de temps

    o Respect des pratiques courantes et des rgles tablies par lentreprise

    o Exactitude des calculs

    o Vrification approprie du travail.

  • 5/26/2018 m06 Statistiques Ter Tsge

    7/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 7

    OBJECTIF OPERATIONNEL DE PREMIER NIVEAUDE COMPORTEMENT

    PRECISION SUR LECOMPORTEMENT ATTENDU

    A. Comprendre les variables statistiques

    B. Raliser des reprsentationsgraphiques

    C. Calculer les caractristiques des

    distributions

    D. Dterminer les liens entre deuxvariables

    CRITERES PARTICULIERS DEPERFORMANCE

    o Qualification dune variablequalitative

    o Qualification dune variablequantitative discrte

    o Qualification dune variablequantitative continue

    o Reprsentation correcte desvariables quantitatives discrtes

    o Reprsentation correcte desvariables quantitatives continues

    o Calcul et interprtation juste desparamtres de tendance centrale

    Mode Mdiane Quartiles Moyennes

    o Calcul et interprtation correcte desparamtres de dispersion

    Etendue Ecart absolu moyen et cart

    quantile Variance, cart-type et coefficient

    de variation

    o Traitement du cas de deuxcaractres quantitatifs (coefficient decorrlation linaire, ajustement par ladroite des moindres carrs, rapport decorrlation)

    o Traitement du cas dun caractrequantitatif et dun caractre qualitatif

    (rapport de corrlation)o Traitement du cas de deux

    caractres qualitatifs

  • 5/26/2018 m06 Statistiques Ter Tsge

    8/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 8

    E. Raliser des sondages

    F. Raliser des enqutes

    o Ralisation de sondage simpleavec :

    estimateur dune moyenne ou

    dune proportion variance de ces estimateurs estimateurs de ces variances algorithmes de tirages

    o Dtermination optimale delchantillon

    o Elaboration du questionnaireo Recueil des donnes

    o Dpouillement, codage et saisieo Validation des donneso Traitement statistiqueo Analyse des rsultats

  • 5/26/2018 m06 Statistiques Ter Tsge

    9/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 9

    OBJECTIFS OPERATIONNELS DE SECOND NIVEAU

    Avant dapprendre comprendre les variables statistiques, le stagiaire doit :

    1- Comprendre la notion des statistique 2- Comprendre les objectifs des statistiques

    Avant dapprendre raliser les reprsentations graphiques, le stagiaire doit :

    3- Distinguer entre les variables qualitatives et les variables quantitatives4- Distinguer entre les variables quantitatives discrtes et les variables quantitatives continues5- Prsenter les sries statistiques dans des tableaux

    Avant dapprendre calculer les caractristiques des distributions, le stagiaire doit :

    6- Raliser des reprsentations graphiques7- Interprter ces reprsentations graphiques

    Avant dapprendre dterminer les liens entre deux variables, le stagiaire doit :

    8- reprsentez les distributions deux variables dans des tableaux9- reprsentez graphiquement ces distributions10- calculer les caractristiques des distributions11- Interprter ces caractristiques des distributions

    Avant dapprendre raliser des sondages, le stagiaire doit :

    12- dfinir le sondage13- comprendre les objectifs de la ralisation des sondages14- calculer les caractristiques des distributions

    Avant dapprendre raliser des enqutes, le stagiaire doit :

    15- dfinir lenqute16- comprendre les objectifs de la ralisation des enqutes

  • 5/26/2018 m06 Statistiques Ter Tsge

    10/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 10

    PRESENTATION DU MODULE

    Ce module sadresse en priorit aux techniciens comptables desentreprises et aux techniciens spcialiss en gestion des entreprises.

    Il rpond trois objectifs fondamentaux :1) Lacquisition des connaissances : chaque chapitre comprend ainsi une

    partie Cours dtaille : les formules mathmatiques fondamentales, maisaussi les points dlicats du cours sont abords.

    2) Lutilisation des connaissances : chaque chapitre comprend desapplications nombreuses et varies qui permettent aux stagiaires dutiliserleurs connaissances.La plupart de ces applications sont accompagnes dindications dersultats ou lments de rponse.

    3) Ladaptation des connaissances : des Travaux Pratiques proposs, devrontpermettre aux stagiaires de mettre en application leurs qualits deraisonnement et dadaptation face des problmes plus longs o denombreuses connaissances sont exiges.

    La masse horaire affecte ce module est de 50 heures dont 30heures consacres aux travaux pratiques.

  • 5/26/2018 m06 Statistiques Ter Tsge

    11/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 11

    Module : Statistiques DescriptivesRESUME THEORIQUE

  • 5/26/2018 m06 Statistiques Ter Tsge

    12/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 12

    Chapitre I- Les statistiques descriptives :

    I- Terminologie :

    1. Statistique :La statistique est une mthode scientifique dont lobjet est de recueillir, dorganiser, dersumer et danalyser les donnes dune enqute, dune tude o dune exprience, aussi bienque de tirer les conclusions logiques et de prendre les dcisions qui simposent partir desanalyses effectues.

    2. Population :Ensemble d'individus dfinis par une proprit commune donne.

    Exp : si lon veut tudier la dure de vie des ampoules lectriques fabriques par unecompagnie, la population considre est lensemble de toutes les ampoules fabriques parcette compagnie.

    3. Echantillon :Sous-ensemble de la population.Exp : pour tablir la dure de vie des ampoules lectriques produites par une machine, on peutprlever au hasard un certain nombre dampoules - un chantillon- parmi toutes les cellesproduites par cette machine.

    4. Individu ou unit statistique :Chaque lment de la population ou de lchantillon.

    Exp : dans lexemple prcdant, chaque ampoule constitue un individu ou une unitstatistique.

    5. La taille :Reprsente le nombre dindividus dun chantillon ou dune population. Elle est symbolisepar n dans le cas dun chantillon et par N dans le cas dune population.

    6. Le caractre :Cest laspect particulier que lon dsire tudier.Exp : concernant un groupe de personnes, on peut sintresser leur age, leur sexe leurtaille

    7. Les modalits :

    Les diffrentes manires dtre que peut prsenter un caractre.Exp 1 : le sexe est un caractere qui presente deux modalits : feminin ou masculinExp 2 : quant au nombre denfants par famille, les modalits de ce caractere peuvent etre 0,12,3,20.

    8. Caractre qualitatif :Ses modalits ne sexpriment pas par un nombreExp : la religion, le sexe, lopinion

    9. Caractre quantitatif :Ses modalits sont numriques.Exp : lage, la taille, le poids

  • 5/26/2018 m06 Statistiques Ter Tsge

    13/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 13

    10. Caractre quantitatif discretLensemble des valeurs que peut prendre le caractre est fini ou dnombrable. Le plussouvent, ces valeurs sont entires.Exp :le nombre denfant dans une famille, le nombre de tlviseurs par foyer et la pointuredes souliers.

    11. Caractre quantitatif continu :Le caractre peut prendre thoriquement nimporte quelle valeur dans un intervalle donn denombres rels.Exp : la taille dun individu, le poids

    12. Srie statistique :Lensemble des diffrentes donnes associes un certain nombre dindividus.Exp : la srie suivante rsulte dune courte enqute auprs de quelques personnes pourconnatre leur age :18 21 19 19 17 22 27 18 18 17 20 20 23

    II- Tableaux statistiques :

    A- Cas dune seule variable :

    Le tableau brut se prsente sous la forme suivante:

    Le nombre d'individus observ tant en gnral important, le tableau prcdant ne permet pasd'analyser l'information obtenue. Il est donc ncessaire de crer un tableau plus synthtique oles observations identiques (possdant la mme modalit) ont t regroupes.

    Pour une variable qualitative, les modalits ne sont pas mesurables.

    Pour une variable quantitative, les modalits sont mesurables. Ce sont

    des valeurs numriques ponctuelles lorsque la variable est discrte des intervalles lorsque la variable est continue ou lorsque la variable est discrte etqu'elle comporte beaucoup de modalits.

  • 5/26/2018 m06 Statistiques Ter Tsge

    14/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 14

    Application :Nous tudions une population de 1000 entreprises selon le caractre modalit formejuridique .Les modalits retenues : S.A (Socit Anonyme), SARL (Socit A Responsabilit Limite), EI(Entreprise Individuelle), SNC ( Socit en Nom Collectif).Leurs effectifs respectifs : 200, 400, 340, 60.T.A.F :Prsentez cette srie dans un tableau.

    B- Cas de deux variables :

    Le tableau brut se prsente sous la forme suivante:

    On dsire crer un tableau appel tableau de contingence donnant le nombre d'individuspossdant simultanment la modalit i de variable1 et la modalit j de variable2 qui seprsentera sous la forme suivante:

  • 5/26/2018 m06 Statistiques Ter Tsge

    15/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 15

    Application:Dans une entreprise, une enqute statistique a t faite sur 300 employs, et portant sur deuxcaractres, lage et la rmunration. Les rsultats de lenqute sont prsents dans les deuxtableaux suivants :

    Age n20 2525 3030 3535 40

    15010020050

    Rmunration en dhs nMoins de 15001500 20002000 2500plus de 2500

    20015010050

    TAF :Prsentez dans un mme tableau la distribution de ces deux caractres.

    III- Reprsentations graphiques :

    Lorsqu'on observe un caractre sur des individus, on aboutit un tableau de chiffres peuparlant. L'objectif est de donner une reprsentation graphique de ce tableau qui permette d'unseul coup d'il d'avoir une ide de la manire dont se rpartissent les individus.

    A- Variable qualitative :

    A chaque modalit i est associ un effectif ni.La seule reprsentation qui nous intresse est celle des effectifs ni (ou des frquences ni/n).Suivant la variable observe, de nombreuses reprsentations plus ou moins informativespeuvent tre utilises. Cependant les 2 plus classiques sont:

    Les tuyaux d'orgue (ou diagramme en barre ou diagramme bandes)

    - les modalits de la variable sont places sur une droite horizontale (attention: ne pasorienter cette droite car les modalits ne sont pas mesurables et il n'y a donc pas derelation d'ordre entre elles).- les effectifs (ou les frquences) sont placs sur un axe vertical. La hauteur du tuyau estproportionnelle l'effectif.

  • 5/26/2018 m06 Statistiques Ter Tsge

    16/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 16

    les diagrammes secteurs (ou camemberts) - L'effectif total est reprsent par un disque.- Chaque modalit est reprsente par un secteur circulaire dont la surface (pratiquement :l'angle au centre) est proportionnelle l'effectif correspondant.

    Application :

    La rpartition des candidats convoqus pour participer au Test dAdmissibilit la Formationen Management (TAFEM 1998) pour laccession LEcole Nationale de Commerce et deGestion dAgadir , selon la srie du baccalaurat se prsente comme suit :Srie du Bac xi Nombre de candidats niSciences conomiquesSciences mathmatiquesSciences exprimentalesT.G.AT.G.C

    25020040050

    100Total 1000

    TAF: reprsentez cette distribution en Tuyaux dorgues et Diagramme circulaire.

  • 5/26/2018 m06 Statistiques Ter Tsge

    17/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 17

    B- Variable quantitative :

    Avant toute tentative de reprsentation, il y a lieu de distinguer entre variable discrte etvariable classe (regroupements en classes).

    Deux types de graphiques sont intressants de reprsenter:a) les diagrammes diffrentiels qui mettent en vidence les diffrences d'effectifs (ou defrquences) entre les diffrentes modalits ou classes.b) les diagrammes cumulatifs qui permettent de rpondre aux questions du style "combiend'individus ont pris une valeur infrieure (ou suprieure) tant?".

    1) Variable discrte

    Diagramme diffrentiel : le diagramme en btonsLes valeurs discrtes xi prises par les variables sont places sur l'axe des

    abscisses, et les effectifs (ou les frquences) sur l'axe des ordonnes. Lahauteur du bton est proportionnelle l'effectif.

    Diagrammes cumulatifs : ils permettent de visualiser l'volution des effectifs(frquences) cumuls croissants ou dcroissants.

    Remarque: les deux courbes sont symtriques par rapport un axe horizontal d'ordonne n/2pour les effectifs, pour les frquences.On utilise l'effectif (frquence) cumul croissant pour rpondre aux questions du style :

    Quel est le nombre (%) d'individus dont la valeur du caractre est infrieure ou gale x ?On utilise l'effectif (frquence) cumul dcroissant pour rpondre aux questions du style :Quel est le nombre (%) d'individus dont la valeur du caractre est strictement suprieure x ?

  • 5/26/2018 m06 Statistiques Ter Tsge

    18/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 18

    Se souvenir:(au plus x) quivalent ( < x) donc utiliser N(x) ou F(x)

    (plus que x) quivalent ( > x) donc utiliser N '(x) ou F '(x)

    Exemple:

    - (au plus 6) quivalent ( < 6)donc on pourra lire la frquence cumule croissante en 6, c--d. F(6) = 0,3 - (plus de 6)quivalent ( > 6)donc on pourra lire la frquence cumule dcroissante en 6,c..d. F '(6) = 0,7 - (moins de 6) quivalent (< 6) quivalent ( < 6- )o est une trs faible valeurpositive, donc on pourra lire la frquence cumule croissante en 6- , c..d. F(6- ) = 0,2

    - (au moins 6) quivalent ( > 6)quivalent ( > 6- ) o est une trs faible valeurpositive, donc on pourra lire la frquence cumule dcroissante en 6- , c..d. F '(6- ) = 0,8

    Application :Reprsentez graphiquement la distribution des 50 tudiants en fonction du nombre de personnespar mnage suivante :Nombre de personnes par mnage xi Nombre dtudiants ni

    346

    78

    51515

    105Total 50

    2) Variable classe

    Diagramme diffrentiel : l'histogramme

    C'est un ensemble de rectangles contigus, chaque rectangle associ chaque classe ayant unesurface proportionnelle l'effectif (frquence) de cette classe.

    Attention: Avant toute construction d'histogramme, il y a lieu de regarder si les classes sontd'amplitudes gales ou ingales.

  • 5/26/2018 m06 Statistiques Ter Tsge

    19/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 19

    Le cas des classes d'amplitudes gales ne pose aucune difficult car il suffit de reporter enordonne l'effectif (la frquence).Dans le cas d'amplitudes ingales on reporte en ordonne la densit di (effectif divis parl'amplitude de la classe)

    Diagrammes cumulatifs

    L'utilisation des courbes est identique au cas discret.Exemple:

  • 5/26/2018 m06 Statistiques Ter Tsge

    20/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 20

    Application :Reprsentez graphiquement la distribution de 50 tudiants en fonction de leur taille suivante :Taille en cm xi Nombre dtudiants150-160160-165

    165-170170-175175-180

    166

    12142

    Total 50

    IV- Caractristiques de tendance centrale et de position :

    Les caractristiques de tendance centrale essayent de donner la valeur la plusreprsentative d'un ensemble de valeurs numriques.

    A- Mode :

    C'est la valeur observe d'effectif maximum.

    Variable discrte: classer les donnes par ordre croissant. Celle d'effectif maximum donne lemode.Il est fortement conseill d'utiliser le diagramme en btons pour dterminer le mode. En effet,deux valeurs conscutives xi , xi+1 peuvent avoir le mme effectif maximum; on parlerad'intervalle modal [xi , xi+1]. Il peut aussi y avoir un mlange de deux populations quiconduit un diagramme en btons o apparaissent deux bosses; on considrera deux modes.Il est dconseill, sauf raison explicite, d'envisager plus de deux modes.

    Variable classe:la classe modale correspond la classe ayant l'effectif maximum. Il estfortement conseill d'utiliser l'histogramme pour dterminer le mode. Comme pour le casdiscret, on peut avoir deux classes modales. Toutes les valeurs de la classe pouvant priori seraliser, on ne se contentera pas de dterminer la classe modale. Une des valeurs de cetteclasse sera le mode. Certains auteurs prconisent par simplicit de prendre le centre de laclasse modale. Il est prfrable cependant de tenir compte des classes adjacentes de la maniresuivante:

  • 5/26/2018 m06 Statistiques Ter Tsge

    21/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 21

    Application :Dterminez la valeur modale de la distribution suivante, de 50 tudiants selon leur taille :Taille en cm : xi Nombre dtudiants : ni150-160

    160-170170-175175-180185-200

    15

    610163

    Total 50Elments de rponse :Mo = 173.77 cm

    B- Mdiane :Les valeurs tant ranges par ordre croissant, c'est la valeur de la variable qui spare

    les observations en deux groupes d'effectifs gaux.

    Variable discrte: la dtermination peut s'obtenir partir du tableau statistique enrecherchant la valeur de la variable correspondant une fonction cumule gale n/2 (effectifcumul) ou (frquence cumule). Il est encore plus facile de lire sur les graphiquescumulatifs les abscisses des points d'ordonne n/2 (effectif cumul) ou (frquencecumule). Si tout un intervalle a pour image n/2 ( pour la frquence), on parlera d'intervallemdian (on peut prendre le milieu de l'intervalle comme mdiane)

    Application :

    Soit la srie statistique suivante :19 17 20 18 17 17 20 19 15 16 20 23 22 14 15 24TAF : Calculez la mdiane de cette srieElments de rponse :Me=18.5

    Variable classe:l'abscisse du point d'ordonne n/2 ( pour la frquence)se situe en gnral l'intrieur d'une classe. Pour obtenir une valeur plus prcise de la mdiane, on procde uneinterpolation linaire. La valeur de la mdiane peut tre lue sur le graphique ou calculeanalytiquement.

  • 5/26/2018 m06 Statistiques Ter Tsge

    22/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 22

    d'o la valeur de la mdiane.De manire gnrale, si a et b sont les bornes de la classe contenant la mdiane, F(a) et F(b)les valeurs de la frquence cumule croissante en a et b, alors

    Application :Dterminez la valeur mdiane de la distribution des tailles suivantes :Taille en cm xi Nombre dtudiants ni N N150-160160-165

    165-170170-175175-180

    155

    10182

    1520

    304850

    5035

    30202

    Total 50 # #Elments de rponse : Me = 167.5

    C- Moyenne arithmtique :Si xi sont les observations d'une variable discrte ou les centres de classe d'une variable

    classe,La moyenne arithmtique est un paramtre de tendance centrale plus utilis que les autres depar ses proprits algbriques:a) Pour plusieurs populations d'effectifs n1, n2, ....., nk, de moyennes

    respectivesmoyenne globale = moyenne des moyennes

    b) La moyenne arithmtique conserve les changements d'chelle et d'origine

  • 5/26/2018 m06 Statistiques Ter Tsge

    23/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 23

    Application :Dterminez la taille moyenne des 50 tudiants dont la distribution par taille se prsente commesuit :Taille en cm xi Nombre dtudiants

    150-160160-165165-170170-175175-180

    16612142

    Total 50

    Elments de rponse :x = 168.3 cm

    D- Moyenne gomtrique :

    Si xi sont les observations d'une variable quantitative, la moyenne gomtrique est gale

    Ce type de moyenne est surtout utilis pour calculer des pourcentages moyens.r tant un taux d'accroissement, 1+r est appel coefficient multiplicateur; et le coefficientmultiplicateur moyen est alors gal la moyenne gomtrique des coefficientsmultiplicateurs.

    E- Moyenne harmonique :

    Si xi sont les observations d'une variable quantitative, la moyenne harmonique est gale

    Il n'est pas vident d'utiliser ce type de moyenne.Elle intervient lorsqu'on demande une moyenne de valeurs se prsentant sous forme dequotient de deux variables x/y (km/h, km/litre,...). Attention, il faut cependant biendcortiquer le problme car il peut aussi s'agir d'une moyenne arithmtique.

    Application :Un cycliste effectue une travers de 50 kms. Pendant les 20 premiers kms il roulait avec unevitesse constance de km/h, les 15 kms suivants une vitesse constante de 30 km/h. Du pointkilomtrique 35 au 55 la vitesse de notre cycliste nest que de 10 km/h et au-del du pointkilomtrique sa vitesse nest que de 5 km/h.TAF :Quelle est la vitesse de ce cycliste sur lensemble du parcours ?Elments de rponse :H = 16.67

    F- Moyenne quadratique :

    Si xi sont les observations d'une variable quantitative, la moyenne harmonique est gale

  • 5/26/2018 m06 Statistiques Ter Tsge

    24/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 24

    G- Quantiles :Ce sont des caractristiques de position.Il y a 1 mdiane Me qui spare les observations en 2 groupes d'effectifs gaux3 quartiles Q1, Q2, Q3 qui sparent les observations en 4 groupes d'effectifs gaux

    9 dciles D1, D2, ..., D9 qui sparent les observations en 10 groupes d'effectifs gaux99 centiles C1, C2, ..., C99 qui sparent les observations en 100 groupes d'effectifs gauxLa dtermination de ces caractristiques est identique celle de la mdiane.Les quartiles sont obtenus lorsqu'on a cumul 25, 50, 75% de la populationLes dciles sont obtenus lorsqu'on a cumul 10, 20,...., 90% de la populationLes centiles sont obtenus lorsqu'on a cumul 1, 2,...., 99% de la populationRemarque: la notion de dciles et de centiles n'a de sens que s'il y a beaucoup d'observationset donc essentiellement pour une variable classe.

    Application :Soit la population de 80 salaris classs daprs le niveau de leur salaire journalier.

    Classes en dhs ni ni cumuls12345678

    90 100100 110110 120120 130130 140140 150150 160160 170

    59162513732

    514305568757880

    Total 80TAF : calculez la mdiane et les deux quartilesElments de rponse :

    Me = 124Q1= 110+ (10x6)/16 = 113.7Q3= 130+(10x5)/13 = 133.8

    V- Caractristiques de dispersion :Comme leur nom l'indique, ces caractristiques essayent de synthtiser par une seule valeurnumrique la dispersion de toutes les valeurs observes.

    A- tendue :C'est la diffrence entre la plus grande et la plus petite observation

    Application :Quelle est ltendue de la srie statistique suivante :10 390 395 405 410 1000Elments de rponse :Etendue = 990

    B- Intervalle inter-quartile :

    C'est la diffrence entre le troisime et le premier quartile

    Application :

    Reprenez les donnes de lapplication sur les quartiles et calculez lintervalle inter-quartile.Elments de rponse :Q3-Q1=20

  • 5/26/2018 m06 Statistiques Ter Tsge

    25/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 25

    C- Variance et cart-type :Si xi sont les observations d'une variable discrte ou les centres de classe d'une variableclasse, la variance

    On utilise plus couramment l'cart type qui est la racine carre de la variance et qui al'avantage d'tre un nombre de mme dimension que les donnes (contrairement la variancequi en est le carr)La variance est un paramtre de dispersion plus utilis que les autres de par ses proprits

    algbriques:

    D- Coefficient de variation :

    C'est un coefficient qui permet de relativiser l'cart type en fonction de la taille des valeurs. Ilpermet ainsi de comparer la dispersion de sries de mesures exprimes dans des unitsdiffrentes

    Applications :App.1- Les sries suivantes reprsentent la mesure dun caractre auprs des individus dunepopulation :a. 6 1 8 10 5 4 11 3 2 9 7 12 13b. 19 17 7 1 4 24 15 22 10 13c. 15 12 17 15 20 15 20 15 15 9 7d. 21 25 34 10 20 27 14 20 34Dans chacun de ces cas calculez : la moyenne, la mdiane, le mode,la variance, lcart type et lecoefficient de variation.Elments de rponse :

    a. x=7, Me=7, pas de mode, =14, =3.74, V=53.4%

    b. x=13.2, Me=14, pas de mode, =52.76, =7.26, V=55%c. x=14.5, Me=15, Mo=15, =14.61, =3.82, V=26.3%d. x=22.8, Me=21, deux modes :20 et 34, =59.28, =7.70, V=33.8%

  • 5/26/2018 m06 Statistiques Ter Tsge

    26/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 26

    App.2- La distribution suivante reprsente la rpartition de la longueur de pinces dcrevisseprovenant dune rivire :

    Limites ni1.02---1.231.24---1.45

    1.46---1.671.68---1.891.90---2.112.12---2.332.34---2.552.56---2.77

    57

    414631

    TAF : calculez : la moyenne, la mdiane, le mode,la variance, lcart type et le coefficient devariation.Elments de rponse :x=1.757, Mo=1.345 (le centre de la classe modale), Me=1.648, =0.238, =0.488, V=27.8%

    VI- La concentration :L'objectif est de mesurer les ingalits dans la rpartition d'une variable l'intrieur d'unepopulation. Cette notion n'a d'intrt que dans la mesure o les valeurs globales suivantes ontune signification concrte

    A- Valeurs globales :xi reprsentent les valeurs ponctuelles ou les centres des classes, ni les effectifscorrespondants.Les valeurs globales de la srie (xi , ni) sont les quantits gi = ni xi

    B- Mdiale :La mdiale de la srie (xi , ni) est la mdiane de la srie (xi , gi)

    Application :Limportance quantitative des portefeuilles de titres dposs dans une socit de portefeuille Maroc Invest en Kdh en 1996.

    Importance du portefeuille en kdh f% f cumul f% fcumulMoins de 10.00010.000 50.00050.000 100.000100.000 200.000

    200.000 500.000500.000 plus

    4137106

    42

    41788894

    98100

    2151113

    1940

    2172841

    60100Total 100 - 100 -

    f reprsentent les pourcentages du nombre total des portefeuilles.f reprsentent les pourcentages de la valeur totale des portefeuilles.TAF : calculez la mdiane et la mdiale de cette distributionElments de rponse :Me = 19730, Ml= 342105 kdh

  • 5/26/2018 m06 Statistiques Ter Tsge

    27/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 27

    C- Courbe de concentration (ou de LORENZ)C'est la courbe obtenue en reprsentant

    L'allure de la courbe permet d'avoir une ide de laconcentration

    D- Indice de GINI

    Proprits:

    Exercice synthtique : (voir TP N1)

  • 5/26/2018 m06 Statistiques Ter Tsge

    28/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 28

    VII- Les indices :

    Permettent de mesurer l'volution d'un phnomne au cours du tempsA- Indices lmentaires :

    L'indice d'volution d'une variable lmentaire y entre la date t0, dite date de rfrence oudate de base, et la date t, dite date courante est

    L'indice base 100, c..d. exprim en pourcentage est

    Remarque: Il est toujours prfrable d'effectuer les calculs avec i et de donner le rsultat enbase 100 la fin des calculs.On utilise essentiellement l'indice des prix (P), l'indice des quantits ou volumes (Q), et

    l'indice des valeurs ou dpenses (V = P Q)Proprits:

    - identit

    - rversibilit

    - circularit- L'indice est troitement li au taux de croissance

    i = r +1 est aussi appel coefficient multiplicateur par les conomistes

  • 5/26/2018 m06 Statistiques Ter Tsge

    29/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 29

    Applications :App.1- Le prix de la tomate au Maroc a t de 1.5 dhs en moyenne en 1980 et de 2.3 dhs en 1995.TAF : calculez lindice lmentaire du prix de la tomate en 1995, base 100 en 1980 et interprtez-le.

    Elments de rponse :I95/80= G95 =(2.3/1.5) x 100 = 153.33

    G80Le prix de la tomate au Maroc a augment de 53.33% entre 1980 et 1995

    App.2- On savait que le prix du sucre dans un pays X a augment de 2.5% entre 1960 et 1975 etde 7.5% entre 1960 et 1995.TAF : dterminez lindice lmentaire du prix du sucre en 1995 base 100 en 1975, pour le paysen question.Elments de rponse :I95/75= I95/75 = 107.5x100 104.88

    I75/60 102.5

    Exercice de synthse :Les donnes concernant lvolution des prix de plusieurs articles entre les priodes 1995 et 1985,ainsi que leur poids sont groups dans le tableau suivant :

    PrixArticles

    P85 P 95 i

    ABCDE

    FGH

    3612401542

    5308

    4015451350

    84010

    0.150.100.250.050.15

    0.100.050.15

    TAF: calculez les indices lmentaires des prix des diffrents articles, puis dterminez lindicegnral des prix.Elments de rponse :I95/85 ( PA) = 40/36 x 100 = 111.11I95/85 ( PB) = 15/12 x 100 = 125I95/85 ( PC) = 45/40 x 100 = 112.5I95/85 ( PD) = 13/15 x 100 = 86.67I95/85 ( PE) = 50/42 x 100 = 119.05

    I95/85 ( PF) = 8/5 x 100 = 160I95/85 ( PG) = 40/30 x 100 = 133.33I95/85 ( PH) = 10/8 x 100 = 125- Lindice des moyennes: I95/85= P 95 = 31.2/26.85 x 100 = 116.2

    P85- La moyenne des indices : I95/85 (P) =

    iI 95/85i=120.9

    B- Indices de LASPEYRES et de PAASCHE

    Ce sont des indices synthtiques qui sont des rsums numriques des indices lmentaires

    lorsqu'on cherche mesurer l'volution d'un ensemble de plusieurs produits.coefficient de pondration ou budgtaire du produit j par rapport la date t :

  • 5/26/2018 m06 Statistiques Ter Tsge

    30/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 30

    a) Indice de Laspeyres des prix

    b) Indice de Laspeyres des quantits

    c) Indice de Paasche des prix

    d) Indice de Paasche des quantits

  • 5/26/2018 m06 Statistiques Ter Tsge

    31/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 31

    Application :

    Les donnes concernant lvolution des prix et des quantits de plusieurs articles entre lespriodes 1995 et 1985 :

    PrixArticles

    P85 P 95 Q 85 Q 95

    ABCDEFGH

    36124015425

    308

    40154513508

    4010

    62013159

    251030

    720111518259

    30TAF : calculez les diffrents indices synthtiques des prix, des quantits et des valeurs.Elments de rponse :- Indice de Laspeyrs des prix :L95/85(P) = 125- Indice de Paasche des prix :P (P) = 119- Indice de Laspeyrs des quantits:L95/85(Q) = 119- Indice de Paasche des quantits :P (P) = 134- indice des valeurs (indice des dpenses totales) :D 95/85 = P 95 Q 95 = 3030/2136 x 100 =142

    P 85Q 85

    VIII- Rgression et corrlation :

    Lorsqu'on observe deux variables quantitatives sur les mmes individus, on peut s'intresser une liaison ventuelle entre ces deux variables.La rgression fournit une expression de cette liaison sous la forme d'une fonctionmathmatique.La corrlation renseigne sur l'intensit de cette liaison.

    A- Ajustement dun nuage de points une fonction mathmatique :

    a) Ajustement linaire par la mthode des moindres carrsLorsque le nuage de points (xi , yi) est peu prs rectiligne, on peut envisager d'exprimer laliaison entre x et y sous forme de fonction affine y = ax + b

  • 5/26/2018 m06 Statistiques Ter Tsge

    32/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 32

    b) Ajustement une fonction exponentielle

    Pour ajuster un nuage de points une courbe exponentielle , il suffit de faire lechangement de variable Y = ln y , X = x , A = ln a , B = ln b , pour obtenir l'quation Y = AX+ B, et d'utiliser ensuite l'ajustement linaire par la mthode des moindres carrs sur les points(Xi , Yi).

    c) Ajustement une fonction puissance

    Pour ajuster un nuage de points une courbe puissance , il suffit de faire lechangement de variable Y = ln y , X = ln x , A = a , B = ln b , pour obtenir l'quation Y = AX+ B , et d'utiliser ensuite l'ajustement linaire par la mthode des moindres carrs sur les

    points (Xi , Yi).

    B- Mesure de lintensit de la relation linaire entre deux variables :1) Covariance

    x et y varient dans le mme sens

    x et y varient en sens contraire

  • 5/26/2018 m06 Statistiques Ter Tsge

    33/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 33

    2) Coefficient de corrlation linaire

    relation fonctionnelle linaire

    indpendance linaire

    dpendance linaire d'autant plus forte que est grand

    Attention:Une forte causalit entre x et y implique une forte relation entre x et y qui n'estpas forcment linaire; on n'a donc pas obligatoirement une forte corrlationlinaire.Une forte corrlation linaire n'implique pas forcment une forte causalit.

    3) Droites de rgression

    Dy/x : y = ax + b avec

    Dx/y : x = a'y + b' avecLa position des deux droites de rgression l'une par rapport l'autre donne un renseignementsur l'intensit de la relation linaire:

    * droites de rgression confondues relation fonctionnelle linaire

    * droites de rgression perpendiculaires dont une de pente nulle

    indpendance linaire* Plus les droites sont proches, plus la relation linaire est importante

    Relations intressantes:r = aa'

  • 5/26/2018 m06 Statistiques Ter Tsge

    34/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 34

    Application :Les sries statistiques simples de deux variables continues X et Y se prsentent comme suit :Individus 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15X 2 12 13 7 6 3 12 10 9 7 4 2 10 6 3Y 22 2 4 14 15 19 7 8 10 11 16 18 11 12 21

    TAF : aprs avoir labor un tableau de contingence, en adoptant des classes damplitudesgales 4 units pour la variable X et des amplitudes 5 units pour la variable Y, il vous estdemand dapprcier la liaison qui existe entre ces deux variables.

    Elments de rponse :Y

    X2 7 7 12 12 17 17 22 n.j

    2 6 0 0 2 3 56 10 0 3 2 0 510 14 3 2 0 0 5ni. 3 5 4 3 15

    Les quations des droites dajustement linaire :-lajustement linaire de Y X : Y= a.X + b = -1.37 X+ 22.79-lajustement linaire de X Y : X = a.Y + b = -0.56 Y+14.62- coefficient de corrlation r : r = -0.87 Forte liaison linaire ngative entre les deux variables.

    IX- Sries chronologiques :

    Ce sont des sries d'observations chelonnes dans le temps. L'objectif de l'tude des srieschronologiques est double:

    analyse d'un phnomne temporel en mettant en vidence essentiellement la tendancegnrale et les fluctuations saisonnires

    laboration d'un modle permettant de faire de la prvision court terme

    A- Dcomposition des chroniques :Lvolution dans le temps dun phnomne rsulte de plusieurs facteurs :- le Trend ou Tendance : T. Cest le mouvement de longue priode que lon considre le plussouvent comme une droite (tendance linaire)- les cycles : C. Cest une alternance de mouvements croissants et dcroissants de moyenterme.- les variations saisonnires : S. On estime quil y a une composante saisonnire dans unesrie, si, chaque anne, la mme priode, il se produit une variation du phnomne daumoins 25% par rapport la valeur moyenne.

    - le rsidu ou ala : . Cest un vnement exceptionnel impossible ou difficile estimer.

    Lvolution dune variable X peut alors sexprimer comme suit :(1) X= T+C+S+ ou (2) X= T.C.S. Le modle additif (1) suppose que chaque composante apporte une contribution pure lvolution observe.Le modle multiplicatif (2) montre que chaque composante amplifie les autres et traduitlinterdpendance entre les composantes.

  • 5/26/2018 m06 Statistiques Ter Tsge

    35/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 35

    B- La dtermination du Trend :

    1) Ajustement linaire par la mthode des moindres carrsLa droite de rgression de Y par rapport au temps t donne pour chaque t une valeur Tt

    2) Lissage par moyennes mobiles d'ordre k (k = nombre d'observations dans un cycle)

    temps variable moyennes mobiles d'ordre 3 moyennes mobiles d'ordre 4

    1 y1

    2 y2 (y1 + y2 + y3)/3

    3 y3 (y2 + y3 + y4)/3 (y1/2 + y2 + y3 + y4 + y5/2)/4

    4 y4 (y3 + y4 + y5)/3 (y2/2 + y3 + y4 + y5 + y6/2)/4

    5 y5 (y4 + y5 + y6)/3 (y3/2 + y4 + y5 + y6 + y7/2)/46 y6 (y5 + y6 + y7)/3

    7 y7

    les moyennes mobiles donnent pour chaque t (mis part les valeurs extrmes) une valeur Tt

    Application :La socit BMT a pour activit la vente de systme dalarme. Le caractre porteur de ce marchlui a permis sur les cinq dernires annes denregistrer les ventes suivantes en KDH :

    Annes N 4 N 3 N 2 N 1 NChiffre

    daffaires

    71697 90574 94550 125257 138150

    TAF :estimez la prvision des ventes pour lanne N+1 en utilisant la mthode des moindrescarrs.Elments de rponse :soit x le rang de lanne et y le chiffre daffaires

    xi yi xiyi xi12345

    7169790574 94550 125257138150

    71697181148283650501028690750

    1491625

    Sommes 15 520228 1728272 55Moyennes 3 104046

    a=16759 et b=53769le chiffre daffaires y sexprimerait donc en fonction du rang x de lanne :y=16759x + 53769

    Pour lanne N+1 (rang 6), la prevision serait la suivante : y=16759 x 6+53769 = 154323 kdh

  • 5/26/2018 m06 Statistiques Ter Tsge

    36/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 36

    C- Analyse de la composante saisonnire :

    1) modle additif- calcul des diffrences Yt - Tt = St + At- calcul des coefficients saisonniers bruts S'j : pour chaque saison j, S'j = moyenne desdiffrences de la saison j

    - calcul des coefficients saisonniers2) modle multiplicatif- calcul des rapports Yt / Tt = St . At- calcul des coefficients saisonniers bruts S'j : pour chaque saison j, S'j = moyenne desrapports de la saison j

    - calcul des coefficients saisonniers

    D- Analyse de la composante alatoire1) modle additifAt = Yt - Tt - St

    2) modle multiplicatifAt = Yt / (Tt . St)

    E- Dsaisonnalisation :Pour exprimer ce qu'aurait t le mouvement brut sans l'influence saisonnire, on utilise lasrie corrige des variations saisonnires Y* (ou Ycvs)1) modle additifY*t = Yt - St

    2) modle multiplicatifY*t = Yt / St

    F- Srie AjusteCette srie est utilise pour reprsenter ce qu'aurait t le phnomne en l'absence de phnomnesalatoires1) modle additif

    = Tt + St2) modle multiplicatif

    = Tt . StF- Prvision court terme:

    Lorsque le trend est obtenu par la mthode des moindres carrs, il est possibled'obtenir une prvision postrieure l'intervalle d'tude ( condition de rester dans deslimites raisonnables), en utilisant le modle prcdent. Pour une date x correspondant un coefficient saisonnier Sx , la tendance vaut Tx , et la prvision est donc donne parTx + Sx en modle additif ou Tx . Sx en modle multiplicatif

  • 5/26/2018 m06 Statistiques Ter Tsge

    37/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 37

    Application :La socit Jihane fabrique des jouets en plastique. Son activit a un caractre saisonnier trsmarqu. On dispose des donnes suivantes relatives aux annes N-2, N-1 et N :

    N 2 N 1 NTrimestre 1 18912 25052 27635

    Trimestre 2 28362 37579 41440Trimestre 3 33098 43837 48357Trimestre 4 14178 18789 20718Total 94550 125257 138150TAF :1. Reprsentez graphiquement cette srie statistique2. Calculez les coefficients saisonniers de cette srie.3. Dterminez la srie corrige des variations saisonniers4. Quelles sont les prvisions pour les annes N+1, N+2, N+3 et N+4 ?Elments de rponse :

    0

    10000

    20000

    30000

    40000

    50000

    60000

    1 2 3 4 5 6 7 8 9 10 11 12

    trimestres

    ventes

    2.

    Trimestr1 Timestre2 Trimestre3 Trimestre4yt y t y t/yt y t y t y t/yt y t y t y t/yt y t y t y t/yt

    N 2 18912

    28362 33098 24405 1.36 14178 26325 0.54

    N-1 25052

    28819 0.87 37579 30738 1.22 43837 31637 1.39 18789 32443 0.58

    N 276

    35

    33490 0.83 27635 34296 1.21 48357 20718

    Coeffsaisonniers

    0.85 1.215 1.375 0.56

    Coefficient saisonnier 1er trimestre = (0.87+0.83)2 = 0.853.Trimestret

    1 2 3 4 5 6 7 8 9 10 11 12

    yt 18912 28362 33098 14178 25052 37579 43837 18789 27635 41440 48357 20718Coeff.sais. 0.85 1.215 1.375 0.56 0.85 1.215 1.375 0.56 0.85 1.215 1.375 0.56Sriecorrige

    21013 22690 25460 25778 27836 30063 33721 34162 30706 33152 37198 37669

  • 5/26/2018 m06 Statistiques Ter Tsge

    38/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 38

    4. la prvision de la tendance ncessite un ajustement de la srie corrige des variationssaisonniers (les moyennes mobiles).Droite dajustement de yt => yt = 1391x + 21228On obtient les prvisions suivantes pour la tendance :Trimestre 13 14 15 16

    Prvision 39311 40702 42093 43484Prvisions des ventes des trimestres 13,14,15 et 16 ( N+1, N+2, N+3 et N+4)Trimestre 13 14 15 16Prvision de latendance

    39311 40702 42093 43484

    Coeff. Saisonn. 0.85 1.215 1.375 0.56Prvisions desventes

    33414 49453 57878 24351

    Chapitre II. Ralisation des enqutes

    Enqute : Investigation auprs dune population donne pour obtenir des rponsesprcises des questions sur un march (enqute par tlphone, enqute postale,enqute par Internet..)

    I- Dterminationoptimale dun chantillon

    Echantillon : fraction reprsentative dune population ou dun univers statistique sur lequelporte une tude. Tous les membres de la population considrs doivent avoir la mme chancedtre choisis.

    A. Mthodes dchantillonnage :Il existe diffrentes manires dextraire un chantillon dune population. Nous ne verrons queles deux pratiques les plus courantes :

    1- Echantillon alatoire :Tous les individus dune population possdent au dpart des chances gales de faire partie delchantillon. On effectue un choix au hasard.

    2- Echantillon stratifi :

    On divise en strates le population et on tire au hasard dans chaque strate homogne, leslments obtenus dans chaque strate sont combins pour obtenir le rsultat final.

    3- Tirage par quota :Il consiste reconstituer une population mre miniaturise, au sein de lchantillon.Lchantillon est considr comme reprsentatif de la population mre.

    Exp : dans une population donne, il y a 49% de femmes et 51% dhommes ; on dfinit lesquotas qui permettront dobtenir un chantillon comprenant 49% de femmes et 51%dhommes.

    B. Dtermination optimale de la taille de lchantillon :

  • 5/26/2018 m06 Statistiques Ter Tsge

    39/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 39

    Exp : un calcul financier prvisionnel a un chef de produit que sa nouvelle marque doitobtenir une part de march dau moins 15%, sil veut dgager un bnfice. Une tude estmene auprs de s acheteurs potentiels. Le chef de produit fait pari quune part de march de20% est tout fait probable. Il se donne une marge de fluctuation de 3 points autour de ce

    chiffre. Il veut organiser un test qui simule un achat rel, en prsentant les principalesmarques du march. Combien faudra-t-il interroger de consommateurs potentiels pour vrifierla prvision,

    Formule de calcul : n=zp qe

    avec :n : taille de lchantillon ncessairez : valeur fournie par la table de la loi normale ; elle varie selon le risque derreur que lonaccepte pour gnraliser les rsultats. Lusage est de retenir 5% soit une valeur de z=1.96p : pourcentage prvu de consommateurs qui achtent la nouvelle marque, soit ici 20%

    q =1-p : pourcentage de consommateurs qui choisissent une autre marque , ici 80%.e: marge de fluctuation (prcision) accepte pour gnraliser les rsultats : ici 3 points depart de march, soit 0.03.

    Rsultats :

    n= (1.96)(0.2)(0.8)=683(0.03)

    II- Elaboration du questionnaire

    A- Dfinition :Instrument de collecte de l'information. Il est fond sur un recueil de rponses un ensemblede questions poses gnralement un chantillon reprsentatif dune population.

    B- Finalits :

    Recueillir des informations auprs des personnes concernes par le sujet traiterDresser le portrait dune ralit un moment prcis dans le tempsEvaluer les effets d'une actionRaliser un sondage sur un chantillon important

    C- Domaine dapplication :

    Tout type de sujet

    Analyse del'existant

    Critique de l'existant Diagnostic Elaboration etchoix desolutions

    Mise enuvre

    Suivi etajustement

    D- Caractristiques :

  • 5/26/2018 m06 Statistiques Ter Tsge

    40/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 40

    Le questionnaire implique gnralement le choix dun chantillon de la populationconcerne

    La standardisation du questionnaire est ncessaire : il est prsent tous lesinterlocuteurs sous la mme forme, avec les mmes modalits

    Le questionnaire est un instrument pr-test : il doit tre mis lessai avant dtreutilis pour vrifier sa pertinenceLe questionnaire permet dobtenir trois catgories dinformations :- Les faits, les attitudes, les attentes, les opinions- Les caractristiques associes aux rpondants (sexe, ge, fonction)- Les informations relies ladministration du questionnaire (date, lieu, groupe de

    rpondants, etc)Le questionnaire doit tre accompagn en amont par une communication sur les

    objectifs et l'utilit du questionnaire, et en aval par une communication sur les rsultatsobtenus.

    E- Mode demploi :Dmarche en 8 tapes :Dfinition de la problmatiqueDfinition de la population

    choix du type de questionnaire. Il existe deux types de questionnaires : Le questionnaireauto-administr o le sujet rpond lui mme et le questionnaire administr individuellementcomplt par lenquteur lui mme lors dun entretien individuel.Formulation des questions. Les questionnaires possdent en gnral la fois des questionsouvertes et fermes :

    conception du questionnairePr-test du questionnaire : Il consiste vrifier si le questionnaire fonctionne ou si

    certaines modifications simposent en termes de contenu et de formeCodification des rsultats. Raliser une matrice de donnes double entre :

    *Chaque ligne correspond un rpondant*Chaque colonne correspond une variable ou information demande

    Questions fermes : A laide dun code numrique ou alphanumrique, on transformelinformation dans un format qui la rend exploitableQuestions ouvertes : Il faut posteriori dvelopper une liste de codes pour identifier lesdiverses rponses des interlocuteursExemple :Questions 1 2 3 4 5 n

    Rponses 1 2 3 O N 1 2 1 2 3 1 2 3 Question1Question2Question3Question n

    Analyse et interprtation des rsultats. Lanalyse a pour but de rsumer les donnesrecueillies de faon rpondre aux questions souleves par la problmatique aborde.

    Dmarche en 3 tapes

    - Lanalyse quantitative

  • 5/26/2018 m06 Statistiques Ter Tsge

    41/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 41

    Il sagit grce au calcul statistique danalyser les informations recueillies, en seplaant du point de vue prcis des objectifs de lenqute.

    Deux grandes catgories dapproche statistique sont gnralement utilises :

    Les statistiques descriptives :Utilisation des mesures de tendance centrales (moyenne, mdiane, mode), ainsique des indices de dispersion autour de ces mesures (cart type, interquartile)

    Les statistiques dductives :Utilises pour rechercher des rapports significatifs entre des variables(corrlation). Elles permettent de faire ressortir des liaisons que lon n'avait passouponnes lors du lancement de lenqute

    - Lanalyse qualitative

    Elle privilgie les aspects socio-conomiques et psychologiques des rsultats. Ellevise l'interprtation des rponses fournies.

    - Le rapport d'enquteIl fournit une srie de tableaux accompagns de commentaires sur les points lesplus importants. ; il est structur de la manire suivante :

    La prsentation de lenqute qui comprend ;La prsentation des rsultats qui concerne ;Les conclusions .

    Chapitre III. Ralisation des sondages

    Quelques dfinitions :

    Sondage : Etude dune partie dune population considrs directement ou aprs redressement,comme reprsentative de la population totale. Les rsultats obtenus sont rapports la totalitde cette population.Le sondage soppose au recensement qui est ltude exhaustive de toutes les units dunensemble .Base de sondage : liste ou fichier regroupant lunivers tudi et permettant le tirage au sortdes units de lchantillon.La statistique : toute mesure calcule partir des donnes chantillonnalesParamtre : toute mesure calcule partir de lensemble des donnes de la population.Estimation : le procd par lequel on cherche dterminer la valeur dun paramtre dune

    population.Estimateur : la statistique utilise pour effectuer lestimation ; cest une variable alatoire.Valeur estime : la valeur que prend lestimateur une fois lchantillon tir ; cest une valeurde la variable alatoire que constitue lestimateur.

    I- Estimateur dune moyenne ou dune proportion

    Problmatique : Quelle statistique de lchantillon constituera le meilleur estimateur dunparamtre de la population ?Exp : on dsire connatre la grandeur moyenne de toutes les femmes ges de 18 ans ou plusvivant dans une certaine ville. Puisquil serait trop long dtudier toute la population, onprocde donc partir dun chantillon alatoire. Mais, puisque les individus de lchantillonont t choisis de faon ce quil reprsente le plus fidlement possible la population, on est

  • 5/26/2018 m06 Statistiques Ter Tsge

    42/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 42

    en droit de penser que la moyenne de lchantillon peut prendre une valeur proche de lamoyenne de la population. Mais la moyenne dun chantillon choisi alatoirement dans lapopulation rencontre-t-elle le critre dun estimateur sans biais ?

    A- Esprance mathmatique dune moyenne :Lesprance mathmatique de la moyenne dun chantillon est un estimateur sans biais de lamoyenne de la population laquelle il appartient :

    E (X) = Exp : soit la population 2,3,6,8. Considrons la variable X reprsentant la moyenne dunchantillon de taille 2 tir avec remise. Lensemble de tous les chantillons possiblesauxquels on associe la moyenne est :

    X

    2 2.03 2.56 4.0

    2

    8 5.02 2.53 3.06 4.5

    3

    8 5.52 4.03 4.56 6.0

    6

    8 7.02 5.03 5.56 7.0

    8

    8 8.0

    Do la distribution de probabilit suivante :

    X 2.0 2.5 3.0 4.0 4.5 5.0 5.5 6.0 7.0 8.0

    Fi (X) 1/16 2/16 1/16 2/16 2/16 2/16 2/16 1/16 2/16 1/16

    On a donc : E(X) = (2.0) 1/16 + (2.5) 2/16 + . + (8.0) 1/16 = 4.75De plus la moyenne de la population : = 2+3+6+8 = 4.75

    4B- Esprance mathmatique dune proportion :La proportion dindividus prsentant un caractre particulier dans un chantillon est unestimateur sans biais de la proportion de ces individus dans la population laquelle appartientlchantillon.Exp :

  • 5/26/2018 m06 Statistiques Ter Tsge

    43/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 43

    Reprenons lexemple prcdant, considrons cette fois-ci la variable alatoire P reprsentantla proportion de nombre impair dans un chantillon de taille 2 tir avec remise. Lensembledes rsultats possibles est :

    P

    2 0/23 1 /26 0/2

    2

    8 0/22 1 /23 2/26 1 /2

    3

    8 1 /2

    2 0/23 1 /26 0/2

    6

    8 0/22 0/23 1 /26 0/2

    8

    8 0/2Do la distribution de probabilit suivante :

    P 0 1 /2 1

    Fi (P) 9/16 6/16 1/16

    On a donc : E(P) = (0) 9/16 + (1/ 2) 6/16+ (1) 1/16 = 1/4De plus la proportion de nombres impairs dans la population est := 1/ 4

    Estimation ponctuelle dun paramtre :

    Lestimation ponctuelle dun paramtre consiste en lvaluation de la valeur du paramtre dela population laide dune valeur unique prise dans un chantillon. La statistique utilisecomme estimateur doit rencontrer un certain nombre de critres, on a vu celui de lestimateursans biais. Dautres caractristiques existent mais ne font pas notre objectif.Il importe davantage de connatre les rsultats qui suivent :

    Signification des termes Paramtre (population) Statistique utilise (chantillon)

    Moyenne

    Proportion

    X

    P

  • 5/26/2018 m06 Statistiques Ter Tsge

    44/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 44

    Application :Soit la population 3,7,12,16,25. Considrer tous les chantillons de taille 2 pris avec remisedans celle-ci.1. pour chacun des chantillons, calculez la valeur de la variable alatoire X2. calculez E(x)3. calculez , la moyenne de la population4. comparez les rsultats obtenus en b et c

    Elments de rponse :

    1.0.3 5.0 7.5 9.5 14.0 5.0 7.0 9.5 11.5 16.0 7.5 9.5 12.0 14.0 18.5 9.5 11.5 14.0

    16.0 20.5 14.0 16.0 18.5 20.5 25.02. 12.63. 12.64. E(x) =

    II- Variance des estimateurs

    On peut sinterroger sur les chances que la valeur estime, partir de lchantillon, gale lavaleur du paramtre de l population. Il convient donc de pouvoir faire lestimation dunparamtre tout en tant capable dvaluer les chances qu cette estimation de se raliser. Pour

    ce faire nous effectuons ce quon appelle une estimation pat intervalle de confiance dunparamtre de la population. Le problme consiste donc trouver les bornes de cet intervalle.

    La moyenne de la variable alatoire X est : E( x ) = X = et lcart -type de X est X= / n (sachant que var (x) = E(x) - [ E(x) ] )

    Si lchantillon est tir sans remise dans une population infinie ou trs grande avec n< 0.05Nou encore avec remise dan,s la population, quelle que soit la taille de celle-ci, et

    X= N-n

    n N-1

    Si lchantillon est tir sans remise dans une population finie.

    Exp : reprenons lexemple prcdant :

    X 2.0 2.5 3.0 4.0 4.5 5.0 5.5 6.0 7.0 8.0

    Fi (X) 1/16 2/16 1/16 2/16 2/16 2/16 2/16 1/16 2/16 1/16

    On sait que var (x) = E(x) - [ E(x) ]Or, on a :E(x) = (2.0) 1/16 + (2.5) 2/16 + + ( 8.0) 1/16 = 25.40

  • 5/26/2018 m06 Statistiques Ter Tsge

    45/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 45

    Do : var (x) = 25.40 (4.75)De plus = (2-4.75) + ( 3-4.75)+ ( 6-4.75) + ( 8-4.75) = 5.69

    4et /n = 5.69/2 = 2.84 o n reprsente la taille de lchantillon.

    Application :

    Un chantillon de taille n est tir, sans remise, dune population de taille 350 dont la moyenne etla variance sont respectivement 115 et 169. pour chacune des valeurs suivantes de n, valuer lavariance et lcart_ type de la variable alatoire X :

    1. 52. 153. 304. 50

    Elments de rponse :

    1. 33.5 et 5.82. 11.3 et 3.43. 5.2 et 2.34. 2.9 et 1.7

    III- Estimation par intervalle de confiance de :

    On appelle INTERVALLE DE CONFIANCE un intervalle de la forme [L1,L2] , ayant unecertaine probabilit de contenir la valeur dun paramtre.

    L1= X - z/2 x et L2= X - z/2 x

    O : z/2est la valeur de la variable z telle que P(z z /2) = 1- /2, le risque derreur et xlcart- type de la distribution dchantillonnage de X appele aussi ERREUR TYPE.

    Il convient dutiliser :z/2=2.58 si = 1%z/2=1.96 si = 5%

    z/2=1.65 si = 10%

    On appelle NIVEAU DE CONFIANCE, not 1 - , la probabilit qua lintervalle de

    confiance de contenir la valeur du paramtre.On appelle RISQUE DERREUR , not , la probabilit qua lintervalle de confiance de nepas contenir la valeur du paramtre.

    Exp :La moyenne et lcart -type du rsultat cumulatif dun chantillon de 36 tudiants duneuniversit sont 2.6 et 0.3 respectivement. Trouvons un intervalle de confiance 99% pour lamoyenne des rsultats cumulatifs de tous les tudiants de cette universit. On a donc :

    X = 2.6, z/2= z1/2%=2.58

    Et x= 0.3/ 36 = 0.05Do : L1 = 2.6 (2.58)0.05 = 2.47Et L2= 2.6 + (2.58)0.05 = 2.73

  • 5/26/2018 m06 Statistiques Ter Tsge

    46/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 46

    Donc : [2.47 ; 2..73] Avec un niveau de confiance de 99% , cest dire que l intervalle [2.47 ; 2..73]Possde 99% des chances de contenir la moyenne du rsultat cumulatif des tudiants decette universit.

    Application :Dans une rgion, on sintresse au temps moyen , inconnu , que prennent les individus dungroupe pour se rendre leur travail. A partir dun chantillon alatoire de taille 100, on aobtenu un temps moyen de 12 minutes. Construisez un intervalle de confiance 90% pour , silon sait que = 9.Elments de rponse :11.505 ; 12.495 minutes

  • 5/26/2018 m06 Statistiques Ter Tsge

    47/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 47

    Contrle continuDure : 2h

    Un professeur dEPS en charge de deux groupes de filles nayant jamais pratiqu le saut laperche dcide de les initier ce sport en utilisant deux mthodes dinitiation diffrentes. Lesperformances ralises la fin du cycle dapprentissage sont les suivantes :

    Groupe 1(mthode A) :2.20 2.35 2.40 1.15 2.35 2.00 2.55 2.05 1.85 2.852.65 2.35 1.90 2.70 2.05 1.95 2.15 2.05 2.80 2.45

    Groupe 2(mthode B) :1.80 2.00 1.45 2.05 2.00 1.652.05 1.65 1.50 1.60 2.15 2.10

    1- construire les histogrammes des deux sries de valeurs en utilisant des classes de largeur0.2m du type : [1.00-1.20[

    2- laquelle de ces deux mthodes semble donner les meilleurs rsultats ? rpondre laquestion tout dabord daprs les histogrammes puis selon que le critre est :

    moyenne la plus leve mdiane la plus leve classe modale la plus leve maximum le plus leve minimum le plus lev cart type le plus faible tendue la plus faible autres critres ?

    3- construire un nouvel histogramme, cette fois uniquement pour le groupe 1, en utilisant des

    classes de largeur 0.5. le comparer celui de la question 1. Lequel apporte linformation laplus pertinente ?

  • 5/26/2018 m06 Statistiques Ter Tsge

    48/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 48

    Module : StatistiquesGUIDE DES TRAVAUX PRATIQUES

    TP 1Objectifs viss :

  • 5/26/2018 m06 Statistiques Ter Tsge

    49/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 49

    - reprsenter graphiquement une distribution statistique- tudier la tendance centrale de cette distribution- tudier la dispersion de cette distribution- apprcier la forme de cette distributionDure du TP :2hDescription du TP :Cet exercice permet au stagiaire de matriser la reprsentation graphique dune distribution caractre quantitatif continu, de sentraner sur le calcul des paramtres de la tendancecentrale et de dispersion et galement de faire un commentaire en se basant sur la forme de lareprsentation graphique de la distribution.Droulement du TP :Dans une commune rurale, o aucune exploitation agricole natteint 123 Ha. La distributiondes 100 exploitants en fonction de la superficie se prsente comme suit :

    Superficie en Ha : xi Le pourcentage des propritaires fonciers :fi

    Moins de 55 1010 1515 2020 3030 50

    50 et plus

    15201510101218

    Total 100Questions :

    1- quelle est la population cible ?quel est le caractre tudi ?

    quel est le nombre de modalits ?2- reprsentez graphiquement la distribution tudie (simple et cumulative)3- dterminez les diffrentes caractristiques de tendance centrale4- quen est-il de la dispersion ?5- est-ce que la rpartition des terres au sein de cette commune est quitable ?

    Elments de rponse :1- population cible : les 100 exploitationscaractre tudi : la superficie ; sa nature : quantitatif continunombre de modalits : 73-

    X=28.55 HaMe = 15 HaMo= 7.5 Ha

    4- Etendue = 125 Haintervalle interquartile : [Q1;Q 3] = [7.5 ;38.33]coefficient de variation = 1.04

    5- indice de GINI : IG=0.613lindice tend vers 1 plus que vers 0, on dira que la distribution des terres dans cette communeest assez concentre donc cette distribution est non quitable.

    TP 2

  • 5/26/2018 m06 Statistiques Ter Tsge

    50/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 50

    Objectifs viss :- raliser des reprsentations graphiques pour des variables quantitatives continues.Dure du TP :1h30Description du TP :Ce TP permettra au stagiaire de matriser la lecture dun tableau reprsentant la distributiondune variable quantitative continue. Il lui permettra galement de reprsenter graphiquementce genre de variable.Droulement du TP :On considre la distribution dfinie par le tableau ci-dessus :

    Loyer mensuel en DH Nombre dappartements150-179180-209210-239240-269

    270-299300-329330-359360-389

    38

    1013

    33403530

    Total 172

    Questions :a- quelles sont les bornes infrieures et suprieures de la 1ere classe ?b- quelles sont les vraies limites de la 1ere classe ?c- lintervalle de classe utilise est identique pour chaque classe ? quelle est sa taille ?d- quel est le centre de la 1ere classe ?

    e- quels sont les vraies limites de la classe correspondant leffectif le plus lev ?f- quelles sont les bornes de la classe lintrieur de laquelle sest trouv recens un loyermensuel de 239.50 DH ?g- construisez un histogramme exprimant les donnes du tableau.h- construisez une courbe deffectifs pour les donnes du tableau.

    Elments de rponse :a- 150dh et 179dhb- 149.50dh et 179.50dhc- 179.50 149.5 = 30d- 149.5 + 30/2 = 164.50 dhe- 299.5 dh et 329.50 dhf- 240 dh et 269 dh

    TP 3

  • 5/26/2018 m06 Statistiques Ter Tsge

    51/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 51

    Objectifs viss :- calculer les paramtres de tendance centrale- interprter les paramtres de tendance centrale

    Dure du TP :1h30

    Description du TP :Cet exercice permet au stagiaire de matriser lutilisation des formules de calcul desparamtres de tendance centrale.

    Droulement du TP :

    Une agence durbanisme a effectu une tude sur la structure des familles susceptibles devenir habiter une ville nouvelle dont elle est charge dtablir le projet. Trois types de familles

    ont t dfinis selon la prsence et lactivit du conjoint. Daprs cette tude, les distributionsde frquences de ces familles selon le nombre denfants sont les suivantes :

    Chef de familleNombre denfantssans conjoint avec femme active avec femme

    inactive01234

    567

    33.339.316.66.42.5

    1.10.80.0

    16.226.626.615.69.3

    4.51.20.0

    8.416.425.220.615.3

    12.21.90.0

    Total 100.0 100.0 100.0

    Les trois types de familles considrs se repartissent en pourcentage comme ci-aprs :

    Chef de familleTotalsans conjoint avec femme active avec femme

    inactive

    100 5.8 52.9 41.2Questions :

    1- dterminez pour chaque type de famille et pour lensemble, le mode de la distribution selonle nombre denfants.2- dterminez pour chaque type de famille et pour lensemble, la mdiane de la distributionselon le nombre denfants.3- calculez pour chaque type de famille et pour lensemble, le nombre moyen denfants .

    Elments de rponse :

  • 5/26/2018 m06 Statistiques Ter Tsge

    52/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 52

    1-Chef de familleEnsemble

    sans conjoint avec femmeactive

    avec femmeinactive

    Valeur dumode 2 enfants 1 enfant Intervallemodale : 1 enfants

    2 enfants

    2- On retient pour la mdiane la valeur M pour laquelle la frquence cumule est gale .

    3-Chef de familleEnsemble

    sans conjoint avec femmeactive

    avec femmeinactive

    Nombre moyen

    denfants

    2.171 1.120 1.935 2.622

    TP 4

  • 5/26/2018 m06 Statistiques Ter Tsge

    53/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 53

    Objectifs viss :- traiter le lien entre variables caractre quantitatif- choisir la reprsentation graphique adquate pour chaque distribution statistique- interprter les reprsentations graphiques

    Dure du TP :2h30

    Description du TP :Cet exercice permet au stagiaire dtudier le lien existant entre deux variables caractrequantitatifs en se basant sur la lecture dune reprsentation graphique.

    Droulement du TP :

    Au cours de la dcennie 1990-2000, les effectifs employs au fond dune houillre et laproduction nette de charbon ont volu de faon suivante :Anne Effectifs du fond (milliers de

    personnesProduction nette de charbon

    (millions de tonnes)1990199119921993199419951996

    1997199819992000

    71.365.357.650.447.145.842.4

    38.635.932.730.8

    40.135.832.728.425.725.625.1

    24.422.421.120.7

    1- reprsentez lvolution de ces deux sries sur deux graphiques coordonnes arithmtiquesprsents lun au dessous de lautre faon mettre en vidence lexistence de covariationsventuelles dans le temps.2- quels sont les inconvnients de cette prsentation ?3- quel type de graphique permettrait dy remdier ?4- tracer le graphique de corrlation correspondant au tableau prcdant.

    5- comment interprtez-vous ce graphique ?

    TP 5

  • 5/26/2018 m06 Statistiques Ter Tsge

    54/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 54

    Objectifs viss :- construire des reprsentations graphiques adaptes aux variables qualitatives et quantitativesdiscrtes- calculer les paramtres de la tendance centrale- calculer les paramtres de dispersion

    Dure du TP :2h

    Description du TP :Ce TP permet au stagiaire de sentraner sur la reprsentation graphique des variablesqualitatives et quantitatives discrtes. Il lui permet galement de matriser le calcul desparamtres de la tendance centrale et ceux de la dispersion.

    Un sondage sur la capacit pulmonaire des individus nous a donn les rsultats suivants :Age Sexe Capacit pulmonaire (litre)541918261922182020

    1817291743301825381926

    201816192021191919302417

    FMFMFMMMF

    MMMMMMFMMFM

    MMFMMMMFMMMF

    2.944.033.756.044.926.575.285.194.08

    4.685.384.715.204.504.933.926.545.354.215.40

    6.665.143.495.825.254.896.073.826.715.936.223.86

    Questions:

  • 5/26/2018 m06 Statistiques Ter Tsge

    55/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 55

    1- Construisez une distribution deffectifs pour chacune des variables2- donner une reprsentation graphique pour chacun des cas3- donnez la mesure de tendance centrale la plus approprie, pour chacune des variables4- calculez lcart type de la distribution de la capacit pulmonaire

    Elments de rponse :3-Age : x= 23.4 ans, sexe: Mo=M, capacit pulmonaire : x= 4.98 litres4- 0.93 litres

    TP 6

  • 5/26/2018 m06 Statistiques Ter Tsge

    56/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 56

    Objectifs viss :- tracer un nuage statistique- trouver lquation de la droite dajustement linaire- faire des prvisions en se basant sur la droite dajustement linaire- tudier la corrlation entre deux variables

    Dure du TP :2h30

    Description du TP :Cet exercice permet au stagiaire de faire des prvisions en trouvant la droite dajustementlinaire par la mthode des moindre carrs. Il permet galement dtudier la corrlation entredeux variables.

    Droulement du TP :Des tudiants de 1ere anne TCE ont eu les rsultats en statistiques et en mathmatiquesfinancires (/100):x (notes destatistiques)

    66 64 69 93 80 71 87 73 79 56 47

    Y(notes demath.fin.)

    72 70 60 94 82 68 86 82 90 55 64

    Questions :

    1- tracez le nuage statistique2- ajustez la droite des moindres carrs3- quelle note de mathmatiques financires pouvez-vous prdire un tudiant de ce niveauqui a eu 75 en statistiques ?4- calculez le coefficient de corrlation ?

    Elments de rponse :2- y= 16.82+0.81x3- 77.84- 0.845

  • 5/26/2018 m06 Statistiques Ter Tsge

    57/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 57

    TP 7

    Objectifs viss :- connatre la terminologie principale des statistiques

    - tablir des tableaux statistiques- construire des reprsentations graphiques- calculer et interprter les diffrents paramtres des distributions

    Dure du TP :18h

    Description du TP :Ce TP est prsent sous forme de QCM. Il couvre presque la totalit des points traits dans cemodule. Il pourrait tre utilis comme test de connaissances la fin de chaque section.

    Droulement du TP :

    TERMINOLOGIE ET TABLEAUX STATISTIQUES1-

    Les caractres suivants sont qualitatifs quantitatifs

    - Le tour de ceinture d'une personne

    - Le code postal de l'habitation d'un foyer franais

    - La superficie d'une exploitation agricole

    - Le groupe sanguin d'un individu2-Les classes suivantes sont-elles bien dfinies?

    oui non

    oui non

    oui non

    oui non

    3- La frquence d'une classe s'obtient en divisant l'effectif de la classe par

  • 5/26/2018 m06 Statistiques Ter Tsge

    58/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 58

    L'effectif total

    Le nombre de classes

    L'amplitude de la classe

    4- Le caractre quantitatif discret x admet le tableau de distribution suivant

    valeurs 1 2 3 4 5 total

    frquences 10,5% 22,3% 30,4% 23,6% 13,2% 100%

    5- Quelle est la frquence cumule croissante pour x = 3

    67,2% 63,2% 32,8% 30,4%

    6- Pour une distribution continue, l'effectif total s'obtient en multipliant l'effectif de chaqueclasse par le centre de la classe et en ajoutant les nombres ainsi obtenus

    vrai faux

    7- Le tableau ci-dessous (notes obtenues par 40 tudiants un examen de statistique) est untableau

    12 9 7 1 13 18 12 3

    4 6 9 14 5 0 6 15

    7 10 3 5 9 5 6 9

    0 7 13 8 4 4 11 3

    10 12 6 5 8 0 1 7

    De donnes ponctuelles De distribution

    8- Les caractres quantitatifs suivants peuvent-ils tre considrs comme des variablesstatistiques continues

  • 5/26/2018 m06 Statistiques Ter Tsge

    59/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 59

    le nombre d'accidents du travail survenus dans une PME en 1an oui non

    la teneur en aluminium d'un alliage

    oui non

    9- Les tudiants de formation continue sont rpartis selon leur ge dans le tableau suivant

    ge [20 ; 25[ [25 ; 30[ [30 ; 35[ [35 ; 40[ [40 ; 45[ + de 45 totaleffectifs 38 59 47 24 12 2 182

    Quelle limite doit-on donner la dernire classe si l'on veut que toutes les classes aient lamme amplitude

    50 55 34

    Quel est le centre de la classe [30 ; 35[

    33 35 37,5 autre rponse

    Quelle est la proportion d'tudiants gs de moins de 35 ans

    53,3% 79,12% 92,31% 25,82%

    10- La frquence cumule croissante est dfinie par

    - proportion d'individus dont la valeur du caractre est infrieure x

    - proportion d'individus dont la valeur du caractre est suprieure x

    - ensemble des modalits que peut prendre le caractre

    - autre rponse

    11- On a pu regrouper les individus dune population par classes dont les centres sont lessuivants : 52, 60, 68, 76, 84, 92. Quelle est lamplitude des classes

    2 4 6 8 16

  • 5/26/2018 m06 Statistiques Ter Tsge

    60/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 60

    REPRSENTATIONS GRAPHIQUES

    1- A partir du tableau ci-dessous, 3 graphiques ont t tablis. Indiquez celui (unique) de cesgraphiques qui ne constitue pas une reprsentation correcte du phnomne

    1 2

  • 5/26/2018 m06 Statistiques Ter Tsge

    61/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 61

    3

    2- Lequel des graphiques ci-dessous correspond l'histogramme des donnes suivantes

    1 2

  • 5/26/2018 m06 Statistiques Ter Tsge

    62/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 62

    3 4

    3- Le caractre quantitatif X admet la distribution suivante:

    classes [0 ; 1[ [1 ; 2[ [2 ; 4[

    effectifs 40 30 30

    Quelle est la reprsentation graphique des frquences qui convient?

    1 2 3

    une autre reprsentation

    4- Le caractre quantitatif X admet la distribution suivante:

    classes [0 ; 1[ [1 ; 2[ [2 ; 4[

    effectifs 40 30 30

    Quelle reprsentation graphique des frquences cumules croissantes convient?

  • 5/26/2018 m06 Statistiques Ter Tsge

    63/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 63

    1 2 3

    une autre reprsentation

    5- La reprsentation graphique ci-dessous est un diagramme

    en btons

    secteurs

    bandes

    6- Un histogramme est une reprsentation graphique de la distribution des frquences d'unevariable statistique continue

    VRAI

    FAUX

    7- Dans un diagramme secteurs, la modalit n 2 du tableau ci-dessous serait reprsente parun secteur d'angle

  • 5/26/2018 m06 Statistiques Ter Tsge

    64/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 64

    modalits effectifs

    1 30

    2 15

    3 25

    4 30

    15 degrs

    54 degrs

    60 degrs

    8- Le tableau suivant donne la rpartition des mnages d'une population selon le nombre devhicules possds

    nombred'automobiles 0 1 2 3 4 et plus

    nombre demnages

    528 2463 906 156 12

    9- La reprsentation graphique qui convient le mieux est

    un diagramme en btons un histogramme une autre reprsentation

    CARACTRISTIQUES DE TENDANCE CENTRALE ET DE POSITION

    1- Quelle est la moyenne des valeurs ci-dessous

    xi ni

    20 58

    30 18840 54

    82,89

    29,87

    3030,54

    2- La mdiane d'une distribution est toujours gale au second quartile

    OUI NON

    3- Dans une srie statistique, il est possible de dterminer dix dciles

    OUI NON

  • 5/26/2018 m06 Statistiques Ter Tsge

    65/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 65

    4- On observe pendant 79 jours ouvrables, le nombre de lettres recommandes mises aucours de la journe, par le service des approvisionnements. L'volution de ces envois au coursde cette priode est fournie dans le tableau suivant. Dterminer le premier et le troisimequartile de cette srie d'expditions quotidiennes de lettres recommandes.

    rang nbrelettres

    rang nbrelettres

    rang nbrelettres

    rang nbrelettres

    rang nbrelettres

    1 1 17 6 33 7 49 8 65 11

    2 3 18 6 34 7 50 8 66 11

    3 3 19 6 35 7 51 9 67 11

    4 4 20 6 36 7 52 9 68 11

    5 4 21 6 37 7 53 9 69 11

    6 5 22 6 38 7 54 9 70 11

    7 5 23 6 39 8 55 9 71 11

    8 5 24 6 40 8 56 9 72 12

    9 5 25 7 41 8 57 9 73 12

    10 5 26 7 42 8 58 9 74 12

    11 5 27 7 43 8 59 10 75 12

    12 6 28 7 44 8 60 10 76 13

    13 6 29 7 45 8 61 10 77 13

    14 6 30 7 46 8 62 10 78 14

    15 6 31 7 47 8 63 10 79 15

    16 6 32 7 48 8 64 10

    Q1=7 Q3=12

    Q1=6 Q3=11

    Q1=7 Q3=10

    Q1=3,75 Q3=11,25

    autre rponse

    5- Cocher la nature des indicateurs numriques suivantsParamtre de

    positionParamtre dedispersion

    ni l'un ni l'autre

    effectif total

    3 dcile

    moyenne gomtrique

  • 5/26/2018 m06 Statistiques Ter Tsge

    66/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 66

    6- Soit le tableau suivant

    modalits effectifs

    employs de service 2

    manoeuvres 3

    ouvriers 12

    ouvriers spcialiss 22

    agents de matrise 15

    employs 28

    cadres 13

    cadres suprieurs ?

    Sachant que la moyenne arithmtiqueest 12,5 le nombre de cadres suprieursest

    7

    10

    5

    autre rponse

    7- Il existe 100 centiles qui partagent une srie statistique

    OUI NON

    8- On donne la srie statistique suivante : 14, 16, 12, 9, 11, 18, 7, 8, 9, 16, 7, 9, 18. Lamdiane est gale

    9 11 14 16 18 [9;18[ [11;18[autre

    rponse

    9- La moyenne gomtrique d'une srie statistique est

    La racine carre du produit des valeurs observes

    la racine cubique du produit des valeurs observes

    la racine n-ime du produit des valeurs observes

    le produit des racines n-ime des valeurs observes

    le quotient des racines n-ime des valeurs observes

    autre rponse

  • 5/26/2018 m06 Statistiques Ter Tsge

    67/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 67

    10- Quand les classes d'une srie statistique sont d'amplitudes ingales, il faut obligatoirementcorriger les effectifs ou les frquences pour calculer la mdiane

    OUI NON

    11- La moyenne harmonique d'une srie statistique est gale l'inverse de la moyennearithmtique des inverses des valeurs

    OUI NON

    12- La mdiane partage l'histogramme en deux surfaces gales

    OUI NON

    13- Soit la srie suivante

    xi ni1 202 303 154 10

    5 56 2

    1,92 2,78 357la moyenne quadratique estgale

    4,86 5,04 15

    1,87 2,15 3,57la moyenne gomtrique estgale

    6,25 autre rponse

    6,25 215 1,92la moyenne harmonique estgale

    1,87 autre rponse

    14- La rpartition des clibataires selon leur ge est fournie par le tableau suivant

    ge [15 ; 30[ [30 ; 40[ [40 ; 50[ [50 ; 60[ [60 ; 70[ [70 ; 80[ [80 ; 90[

    effectifs 4500 450 400 230 200 ? 20

    Sachant que l'ge moyen est gal 28,8 ans, la valeur manquante est

    65 97 102150 165 autre rponse

    l'ge mdian est

    20,4 22,6 24,8

    26,7 autre rponse

  • 5/26/2018 m06 Statistiques Ter Tsge

    68/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 68

    CARACTRISTIQUES DE DISPERSION

    1- Compltez le tableau suivant pour calculer la

    variance

    la variance vaut

    6,293 7,69 4341,73 59,08

    2- Calculez le coefficient de variation des donnes suivantes:

    xi ni

    70 91

    80 189

    90 70

    0,085 45,64

    0,546 6,76

    3- La synthse d'un ensemble d'observations relatives une variable quantitative peuts'effectuer par des paramtres de tendance centrale et de dispersion.L'une des quatre rponses suivantes n'a rien voir avec ce type de synthse:

    moyenneet cart-type

    frquence moyenne par unit d'amplitudeet mode

    mdianeet cart-type varianceet mode

    4- On observe sur un tronon d'autoroute, pendant 51 jours, le nombre x de dpannageseffectus au cours de la journe. Calculer l'intervalle inter-quartile des observations

  • 5/26/2018 m06 Statistiques Ter Tsge

    69/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 69

    rang

    nbredpannages

    rang nbredpannages

    rang nbredpannages

    rang nbredpannages

    rang nbredpannage

    s

    1 1 11 3 21 4 31 4 41 6

    2 1 12 3 22 4 32 4 42 6

    3 1 13 3 23 4 33 5 43 6

    4 1 14 3 24 4 34 5 44 6

    5 1 15 3 25 4 35 5 45 6

    6 2 16 3 26 4 36 5 46 6

    7 2 17 3 27 4 37 5 47 7

    8 2 18 3 28 4 38 5 48 8

    9 2 19 3 29 4 39 5 49 9

    10 3 20 4 30 4 40 5 50 10

    51 11

    L'intervalle inter-quartile vaut

    3 4 5 6 autre rponse

    5- La variance est toujours positive ou nulle

    OUI NON

    6- Une entreprise E possde 3 tablissements A, B, C. Les effectifs et les salaires moyenspour les ouvriers , les employs , et les cadres , sont donns dans le tableau suivant

    A B C E

    effectifssalaire

    moyen

    effectifssalaire

    moyen

    effectifssalaire

    moyen

    effectifssalaire

    moyen

    Ouvriers 60 10 180 8 5 10 245 8,5306

    Employs 30 20 10 16 30 25 70 21,571

    Cadres 10 100 10 90 15 100 35 97,143

    Total 100 22 200 12,5 50 46 350 20

    La variance intra-tablissements est gale 129,86 478,28 562,51

  • 5/26/2018 m06 Statistiques Ter Tsge

    70/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 70

    LA CONCENTRATION

    1- Si, pour un caractre quantitatif continu et positif, la mdiane est trs peu diffrente de lamdiale, alors l'indice de concentration de Gini est peu diffrent de

    0 0,5 1

    2- Dans un diagramme de concentration on porte gnralement en ordonnes les valeurs desfrquences cumules des valeurs globales. Comment s'crivent ces valeurs

    autre rponse

    INDICES

    1- Le chiffre d'affaires d'une entreprise a augment de 2% par an pendant 2 ans, puis adiminu de 9% par an pendant 4 ans, et a augment de 8% par an pendant 3 ans. Quelle estl'augmentation moyenne sur la priode

    1% 9% 10% autre rponse

    2- tant donn une population de 50 millions qui a cr au taux de 20% par an, quelle taitcette population il y a 12 ans

    38 486 689 39 424 659 1 555 318 5 607 832 autre rponse

    3- Une hausse de 80% suivie d'une baisse de 50% revient

    une baisse de 10% une baisse de 20% une baisse de 30%

    une hausse de 10% une hausse de 30% autre rponse

    4- Une hausse de 60% suivie d'une baisse de 40% revient

    une hausse de 20% une baisse de 10% une hausse de 10%une baisse de 20% une baisse de 4% autre rponse

  • 5/26/2018 m06 Statistiques Ter Tsge

    71/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 71

    5- Une grandeur augmente de 10% par an. Au bout de combien d'annes aura-t-elle doubl

    11 ans 11,1 ans 10 ans 7,27 ans 6,23 ans

    1 an 12,45 ans 8,27 ans autre rponse

    6- Le calcul de l'indice de Laspeyres ncessite de pondrer les indices lmentaires par descoefficients budgtaires relatifs

    la priode de base la priode courante

    7- Calculez l'indice de Laspeyres des prix de 1998 par rapport 1990 partir des donnes dutableau suivant

    ModleQuantits Prix Ventes

    1990 1998 1990 1998 1990 1998

    Produit A 50 55 18 22 900 1210

    Produit B 69 62 23 25 1587 1550

    Produit C 96 115 28 25 2688 2875

    Total 5175 5635

    108,91 100,97

    107,85 99,98

    8- Calculez l'indice de Paasche des quantits de 1998 par rapport 1990 partir des donnesdu tableau suivant

    Modle Quantits Prix Ventes

    1990 1998 1990 1998 1990 1998

    Produit A 90 99 13 16 1170 1584

    Produit B 56 50 18 20 1008 1000

    Produit C 78 94 23 21 1794 1974

    Total 3972 4558

    109,53 108,58

    104,81 105,69

  • 5/26/2018 m06 Statistiques Ter Tsge

    72/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 72

    RGRESSION LINAIRE

    1- Pour justifier un ajustement affine (y = ax + b) , on a calcul le coefficient de corrlationlinaire r. Dans les cas suivants, le rsultat est

    r = 1,22 mdiocre bon idiot

    r = -0,89 mdiocre bon idiot

    2- Quand on ajuste linairement x et y par la mthode des moindres carrs, on obtient deuxdroites de rgression. L'quation de la droite D de y par rapport x est

    3- Dans le cas d'indpendance totale, le coefficient de corrlation linaire est gal

    0 1 -1 autre rponse

    4- Une valeur leve du coefficient de corrlation linaire est signe d'une relle relationcausale, dans le cas

    du revenu national et de la consommation finale OUI NON

    du prix d'un produit et du prix d'un produit substituable OUI NONdu nombre d'abonns au tlphone et des ventes de mdicamentscontre le stress OUI NON

    des heures travailles par les tudiants pour rviser leurs examens etleurs taux de russite ces examens OUI NON

    de la taille des salaris et de leurs salaires OUI

    NON

    de la taille des salaris et de leurs poids OUI NON

    de la temprature et de l'allongement d'une barre d'acier OUI NON

  • 5/26/2018 m06 Statistiques Ter Tsge

    73/136

    Rsum de Thorie etGuide des travaux pratiques

    Statistiques

    OFPPT/DRIF 73

    5- Utiliser les calculs effectus dans le tableau ci-dessous pour calculer la covariance entreles variables x et y

    i xi yi xiyi xi yi

    1 50 7 350 2500 49

    2 60 5