Vincent GODARD

Département de Géographie

Université de Paris 8


V.1.3 - Dernière mise à jour : 16/12/2004

Fiche Mémo n°3.4. du cours d'enquête :

Comparaison de deux échantillons

 

Identiques ou différents ?

Est-ce significatif ou le fait du hasard ?

Pourquoi comparer les résultats obtenues sur 2 échantillons ?

En général, pour confirmer une évolution

- Si les différences ne sont pas significatives entre les 2 échantillons

Alors les différences constatées sont dues à

une fluctuation aléatoire de l'échantillon

- Si les différences sont significatives

Alors les différences constatées sont dues à

des populations mères différentes

- Il est possible de comparer 2 échantillons de nombreuses façons

Les plus usuelles en géographie

- comparaisons des fréquences

- comparaisons des moyennes

 

1. Comparaison de 2 fréquences

En pratique, en fonction du risque d'erreur choisi, on évalue le résultat du test suivant :

Test de l'écart réduit (C.f. SCHWARTZ 1991, p.58)

équation n°1 - fm34

Avec :

l'écart-type théorique commun des 2 échantillons Ech1 et Ech2

p estimation la plus précise de la proportion théorique recherchée

pt s'obtient par :

équation n°2 - fm34

avec :

Ef1 et Ef2 effectif du thème recherché pour chacun des échantillons

On recherche dans la table de l'écart-réduit pour quel risque d'erreur ,

p1 et p2 sont différents de manière significative

- On dira que l'écart entre les deux proportions est significatif quand, pour un risque

= 0,05 alors > ou = 1,96

ou

= 0,01 alors > ou = 2,58

Note :

Il faut que

m > 30

m * p > 5 et m * q > 5

p et q soient calculés et non observés

Exemple :

- Reprendre l'exemple de Volx 1960 et 1990

Ef1 = bâti60 = 98 pts (7,66%)

Ef2 = bâti90 = 96 (13,33%)

non_bâti60 = 1 182

non_bâti90 = 624

m60 = 1 280

m90 = 720

p = 0,097

q = 1 - p = 1 - 0,097 = 0,903

- Rechercher dans la table de l'écart-réduit (c.f. Table n°4 ) la valeur du risque pour = 4,12

Avec = 4,12, la différence est significative avec 1 risque < à 1/10 000

c'est + qu'une fluctuation liée à l'échantillonnage

On peut dire que l'urbanisation s'est développée entre 1960 et 1990

avec 1 risque d'erreur infime de se tromper

 

2. Comparaison de 2 moyennes

- De la même manière on peut comparer 2 moyennes d'échantillon

La formule est la suivante :

équation n°3 - fm34

Si la différence n'est pas significative

c'est que les 2 échantillons ont la même moyenne

la différence est une fluctuation aléatoire

- On peut également tester la valeur de sur 2 strates

Cela revient à évaluer la qualité de la variable de contrôle

Exemple :

Tester les chefs d'entreprise (c.f. exemple des strates fm3.3.)

On adapte la formule qui devient :

équation n°4 - fm34

= 10,31

La recherche dans la table de l'écart réduit la valeur du risque pour = 10,31

indique que la différence entre les 2 strates est hautement significative ( ± 0)

 

 

3. Test de compréhension

Communiquez-moi par courrier électronique les réponses aux questions suivantes

Question n°3.4.1. Un écart-réduit calculé inférieur à celui lu dans la table pour un seuil donné indique que le résultat est :

a) significatif

b) dû au hasard

Question n°3.4.2. La significativité du test de l'écart-réduit est-elle fonction de :

a) l'écart entre les deux proportions p1 et p2 (les deux moyennes)

b) la taille des échantillons m1 et m2

Précisez à la rubrique objet :

EC enquête

puis dans le corps du message vos

n° d'étudiant, nom et prénom

puis vos

réponses

vgodard@univ-paris8.fr

 

 

Retour au début de la fiche Mémo

 

Fiche Mémo suivante

 

NB : les mots suivis de "*" font partie du vocabulaire statistique, donc leur définition doit être connue. Faites-vous un glossaire.