40
ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2 CHI

ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Embed Size (px)

Citation preview

Page 1: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

ANALYSE DE DONNÉES APPLIQUÉE

AUX APS

Pierre MORETTO, Université Paul Sabatier, Toulouse

III.

UE 45.2 CHI

Page 2: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Analyse de données

Recueil de données

Ici ….. 207 valeurs de détentes

verticales

8-[

Analyse :

Donner un sens

40 65 69 67 56 64 78 58 58 64 39 68 54 68 53 57 38 59

78 67 69 32 61 76 42 65 51 56 63 52 68 36 61 63 57 80

60 50 67 65 55 47 66 66 54 55 60 79 50 57 45 71 44 55

44 46 77 41 76 67 48 45 69 64 58 41 69 59 71 47 63 81

70 82 52 75 60 43 65 58 62 34 65 56 72 57 36 61 71 40

59 57 68 72 49 70 67 53 60 71 44 64 57 53 61 72 51 59

84 35 46 86 70 65 50 57 69 55 58 60 47 66 46 55 58 63

70 61 74 55 52 62 37 70 39 73 56 45 64 48 59 61 62 32

60 47 56 66 40 62 51 63 61 53 62 60 34 58 66 43 56  

62 66 37 59 60 48 63 56 42 59 64 46 59 51 44 75 37  

42 73 64 45 60 63 38 64 41 57 50 64 65 60 67   49  

62 54   63 46 75 54   74 61 59   39   51      

Page 3: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Analyse de données

Définitions

Statistique: La méthode qui permet de recueillir des données, de les traiter et de les interpréter.

Statistiques: L’ensemble des données qui permettent de mener une observation

Page 4: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Histoire:

Les statistiques :Collecte de données sont très anciennes:

Statistiques vient de “status”: l’état. Recensements agricoles existent en

Chine en 2238 avt JC. Statistique:

Premiers statisticiens (1900 ), Analyse uni factorielle,

Apparition de l’informatique (1950): Analyse multifactorielle.

Dans le domaine STAPS ? (Très récent)

Page 5: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Utilité en STAPS ?

Répondre aux questions: Existe t-il une différence ? Cette différence est-elle « significative » ?

Recensement et effets de groupes; Différences entre plusieurs populations, Entraînements, Séances ou cycle, Effets de la pratique

sportive Choix d’une pratique, d’équipements etc.

Page 6: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Population (ensemble d'unités statistiquesou d'individus)

LE VOCABULAIRE STATISTIQUE

Caractères

modalités (a, b, c ...)

Qualitatif

Nomenclatureavec code

discrète (entier)

continue (valeurs infinies)

Classes

Quantitatif

Variable (nombre)

ou

Page 7: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Signification et probabilités

La différence est-elle significative ? “Objectivité” des conclusions:

Accepter une marge d’erreur grâce aux probabilités: La différence est significative à 5% (P<0,05).

(Sous entendu: j ’accepte un risque de 5% de me tromper en affirmant que la différence est

significative)

Page 8: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

L ’approche scientifique

Étapes de la démarche: Identifier la problématique, Organiser et choisir les variables, les tests etc. Protocole (Organisation …populations) Recueil des données (Fc, VO2 etc.) Analyse (Statistique) et présentation des

résultats Discussion Conclusion (Limites et portées).

Page 9: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Formulation des hypothèses Formulation des hypothèses en termes quantitatifs

La

Sta

tist

iqu

e

La démarche scientifiquegénérale

La démarche des méthodes quantitatives

Choix des méthodes

Observation

Organisation et traitement des données

Analyse et interprétation des résultats

Choix des méthodes, des variables et de la façon de les

mesurer

Collecte des données

Traitement des données

Analyse statistique des données

Interprétation statistique des résultats de l'analyse

Interprétation qualitative statistique des résultats en fonction

des hypothèses de départ

Page 10: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

La Statistique

La StatistiqueDescriptive

L'Inférence Statistique

L'estimation

Les tests d'hypothèses

Les mesures detendance centrale

(mode, médiane, moyenne)

Les mesures deposition

(quartiles, quintiles,centiles)

Les mesures dedispersion

(étendue, variance, écart-type)

Les mesuresD’association (co-occurence, co-variation)

Page 11: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

STATISTIQUES DESCRIPTIVES

Page 12: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Variables mesurables

Page 13: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Variables

Variable nominale Variable ordinale Variable d’intervalle Variable numérique

(Niveaux de mesure)

Page 14: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

… Variable nominale

Étiquette, Identifier un sujet (un groupe).

N° de maillots, Catégories socio-professionnelles, Nationalités, Identification de comportements

(motivés, agressifs)

Page 15: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

… Variable ordinale

Étiquette permettant une première classification.

Elle possède une échelle, mais pas d ’origine ni d ’unité.

Elle ne permet pas de quantifier la différence. Degrés de participation: Inoccupé, solitaire,

observateur, parallèle, associatif et coopératif.

Page 16: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

… Variables d ’intervalles

Situer sur une échelle, mais l ’origine et l ’unité sont arbitraires.

Il est possible d ’opérer des transferts d ’une variable d ’intervalle à l ’autre.

Échelles des températures: C°, K°

Page 17: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

… Variable numérique

Structure optimum de l ’échelle et de l ’origine qui permet toutes les opérations arithmétiques.

Performance sur 100 m etc.

Page 18: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

L’analyse statistique …..

Compare des modèles mathématiques (références)

À l’évolution des données mesurées (variables expérimentales)

Page 19: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Modèle mathématique de référence

Le modèle mathématique de référence … le hasard

…Les variables aléatoires

Page 20: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

… Variable aléatoire

Elle est due au « hasard ». Elle est liée à la notion de probabilité.

Probabilité que l ’événement apparaisse Pr(A). Pr(A) = Nbre de cas favorables / Nbre de cas

possibles: Ex: Au dé, Pr(6)=1/6

Utilité dans la méthode statistique: La différence observée est-elle liée au hasard

ou pas ?

Page 21: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Probabilité que l ’événement ne puisse pas être observé: Pr(ä)=1-Pr(a);

Au dé: Pr(6)=1-1/6=5/6

Probabilité complémentaire (contraire)

Page 22: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

La probabilité d ’observer 2 évènements en même temps : Pr(A et B) = Pr(A) x Pr(A/B)

Avec Pr(A/B): Probabilité d ’observer B lorsque A et déjà sorti: Sur 1 dé: Pr(A/B)=Pr(1/6)=0

D ’où Pr(1 et 6)= Pr(1) x Pr(1/6)= 1/6 x 0 = 0

Probabilité composée

Page 23: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Probabilité d ’observer les évènements A ou B Pr(A ou B) = Pr(A) + Pr(B)Ex: Pr(1 ou 6) = Pr(1) + Pr(6) = 1/6 + 1/6 = 2/6

Probabilité d ’observer les évènements A ou B strictement: Pr(A ou B) = Pr(A) + Pr(B) - Pr(A et B)Ex 1 dé: Pr(1 ou 6) = Pr(1) + Pr(6) - Pr(1 et 6)

= 1/6 + 1/6 - 0 = 2/6Ex 2 dés: Pr(1 ou 6) = Pr(1) + Pr(6) - Pr(1 et 6)= 1/6 + 1/6 - (1/6 x 1/6) = 2/6-1/36 = 11/36

Probabilité totale

Page 24: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Si A et B sont indépendants; la probabilité de A n ’est pas affectée par la probabilité de B : Pr(A/B)=Pr(A)=Pr(B).

Si plusieurs évènements sont indépendants: Pr(A et B et C)= Pr(A) x Pr(B) x Pr(C)

Notion d’Indépendance

Page 25: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

VARIABLES (ASPECTS D ’UNE VARIABLE)

Variable continue

Variable discrète

Variable indépendante

Variable dépendante

Variable parasite

Variable neutralisée

Variable intermédiaire

Indicateur

Variable opérationnelle

Page 26: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

… Variable continue

Il existe une continuité de l ’échelle de sorte qu ’une valeur intermédiaire garde un sens.

Ex: entre 1 et 2 m; 1,5m Par contre entre les maillots 1 et 2, le maillot

1,5 n ’a aucun sens.

Page 27: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

… Variable discrète

Varie de façon progressive mais par bonds:

Ex: 1, 2,…10 buts ... mais 1,5 but ne veut rien dire

Page 28: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

… Variables indépendantes

V. I Provoquée: L ’expérimentateur manipule pour observer

l ’effet sur les variables dépendantes Ex: Augmenter la vitesse de course pour voir

effet sur VO2. Ex: Injection Acide Botulinique pour diminuer

la spasticité V. I. Invoquée: l ’expérimentateur peut

observer les effets de la variable mais ne peut l ’influencer: Effet de l ’âge, implantation géographique de l’AS.

Page 29: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

… Variable dépendante

La variable qui varie en fonction de la variable indépendante.

C ’est ce lien de dépendance qui sera comparer au effet du hasard (distribution aléatoire).

Page 30: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

… Variable parasite

Variable indésirable susceptible de perturber une variable dépendante. Ex: Étude de l ’influence de l ’âge sur la

performance en sprint: Variables parasites:

La croissance osseuse; Les tendinites plus fréquente sur système musculo-

squelettique immature;

Page 31: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

… Variable neutralisée

Variable parasite dont les effets ont été annulés par précautions expérimentales.

Groupe placebo

Normalisation Vitesse de sprint rapportée à la longueur

segmentaire.

Page 32: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

MÉTHODOLOGIE EXPÉRIMENTALE

(CONCEPTS DE BASE)

Groupes et tâches expérimentalesConcepts relatifs à la mesure

Page 33: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Échantillonnage

Décrire une population (Échantillon) Population: « Ensemble des individus qui

relève d ’une définition donnée ».Ex: La population française Échantillon: « Une fraction de la

population »Ex: Les étudiants de la FSSEP

Représentativité de l ’échantillon

Page 34: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

… Groupes

Groupe expérimental Groupe contrôle (ou

témoin) Groupe placebo Groupe appariés Groupes indépendants

Page 35: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

… Tâches

Simple aveugle Le sujet n ’est pas au courant de l ’intérêt

de l ’étude.

Double aveugle Le sujet et l ’expérimentateur ne sont pas

au courant ….. Double tâche

Tâche 1 + 2: Dribble + progression.

Page 36: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

… Méthodes

Méthode longitudinale Étudier les effets dans le temps en

observant un même groupe. Ex: effet de l ’entraînement de 1998 à 2001

Méthode transversale Étudier l ’effet du temps en comparant des

groupes d ’âges différents. Ex: Comparer les enfants de 10, 11, …15

ansAttention

Page 37: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Concepts relatifs à la mesure

Mesurer:Établir une correspondance entre les

éléments évalués et les résultats qui doivent permettre la distinction.

Exigences de la mesure: Validité Fidélité Sensibilité

Page 38: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Validité

Validité L ’instrument de mesure permet-il de

mesurer ce pour quoi il a été conçu ? Ex: Un mètre peut mesurer une distance …

mais le nombre de fautes sur un match permet-il de mesurer l’agressivité des joueurs ?

Page 39: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Fidélité

Un instrument de mesure est dit fidèle lorsqu’il fournit des résultats identiques dans les mêmes conditions .

Page 40: ANALYSE DE DONNÉES APPLIQUÉE AUX APS Pierre MORETTO, Université Paul Sabatier, Toulouse III. UE 45.2CHI

Sensibilité

Fait référence à la finesse de discrimination d ’un instrument de mesure (épreuve, tests, grille) permettant de distinguer les réponses. Ex:

1) Nbre de passes 2) Nbre de partenaires différents concernés par ces

passes Atteste du jeu collectif ???... 3) Sondage