V.1.3 - Dernière mise à jour : 16/12/2004
Est-ce significatif ou le fait du hasard ?
Pourquoi comparer les résultats obtenues sur 2 échantillons ?
En général, pour confirmer une évolution
- Si les différences ne sont pas significatives entre les 2 échantillons
Alors les différences constatées sont dues à
une fluctuation aléatoire de l'échantillon
- Si les différences sont significatives
Alors les différences constatées sont dues à
des populations mères différentes
- Il est possible de comparer 2 échantillons de nombreuses façons
Les plus usuelles en géographie
- comparaisons des fréquences
- comparaisons des moyennes
En pratique, en fonction du risque d'erreur choisi, on évalue le résultat du test suivant :
Test de l'écart réduit (C.f. SCHWARTZ 1991, p.58)
équation n°1 - fm34
Avec :
l'écart-type théorique commun des 2 échantillons Ech1 et Ech2
p estimation la plus précise de la proportion théorique recherchée
pt s'obtient par :
équation n°2 - fm34
avec :
Ef1 et Ef2 effectif du thème recherché pour chacun des échantillons
On recherche dans la table de
l'écart-réduit pour quel
risque d'erreur ,
p1 et p2 sont différents de manière significative
- On dira que l'écart entre les deux proportions est significatif quand, pour un risque
= 0,05 alors
> ou = 1,96
ou
= 0,01 alors
> ou = 2,58
Note :
Il faut que
m > 30
m * p > 5 et m * q > 5
p et q soient calculés et non observés
Exemple :
- Reprendre l'exemple de Volx 1960 et 1990
Ef1 = bâti60 = 98 pts (7,66%)
Ef2 = bâti90 = 96 (13,33%)
non_bâti60 = 1 182
non_bâti90 = 624
m60 = 1 280
m90 = 720
p = 0,097
q = 1 - p = 1 - 0,097 = 0,903
- Rechercher dans la table de l'écart-réduit (c.f. Table n°4 ) la valeur du risque pour
= 4,12
Avec
= 4,12, la différence est significative avec 1 risque
< à 1/10 000
c'est + qu'une fluctuation liée à l'échantillonnage
On peut dire que l'urbanisation s'est développée entre 1960 et 1990
avec 1 risque d'erreur infime de se tromper
- De la même manière on peut comparer 2 moyennes d'échantillon
La formule est la suivante :
équation n°3 - fm34
Si la différence n'est pas significative
c'est que les 2 échantillons ont la même moyenne
la différence est une fluctuation aléatoire
- On peut également tester la valeur de
sur 2 strates
Cela revient à évaluer la qualité de la variable de contrôle
Exemple :
Tester les chefs d'entreprise (c.f. exemple des strates fm3.3.)
On adapte la formule qui devient :
équation n°4 - fm34
= 10,31
La recherche dans la table de l'écart réduit la valeur du risque pour
= 10,31
indique que la différence entre les 2 strates est hautement significative (
± 0)
Communiquez-moi par courrier électronique les réponses aux questions suivantes Question n°3.4.1.
Un écart-réduit calculé
inférieur à celui lu dans la table pour un
seuil
Question n°3.4.2. La significativité du test de l'écart-réduit est-elle fonction de :
|
NB : les mots suivis de "*" font partie du vocabulaire statistique, donc leur définition doit être connue. Faites-vous un glossaire.