37 0 337KB
Université de Picardie Jules Verne UFR des Sciences Licence mention Mathématiques - Semestre 3 Formulaire de Statistique Inférentielle 1) Estimateurs Paramètre
Estimateur 1 n
X
2
n
S 2c
n
1
Statistique et sa loi
n
Xi
X
T
1 n
n
X 2i
X
2
n
Y2
i 1
Student à n
:
Sc n
i 1
S 2 , avec S 2
2016-2017
1 d.d.l.
si échantillon gaussien Khi deux à n
1 S2 : c 2
1 d.d.l.
si échantillon gaussien
n
Xi p
i 1
F
F p p1 p n
U
n
: Normale N 0; 1 (approx.) si np 10 et n 1 p 10
2) Intervalles de confiance au niveau 1 Paramètre
Intervalle de confiance i
2
i
p
ip
sc t , x n
x n
2
sc t n
t tel que P t
1 s2 , n 1 s2 c c a b
f1 f u , f n 1
f
Valeurs tabulées T
t
1
P Y2
a
1
a et b tels que
f1 f u n 1
PY
u tel que P u
2
b
U
2 2
u
1
3) Tests de conformité au risque H0
H1
Statistique de test 0
0
T
0
2
2 0
2
2 0
2
2 0
2
p p
p0
p
p0
t tel que P T t tel que P T
T
t
t
t
Y
2
n 2 0
1 S2 c
1
b tel que P Y 2 a tel que P Y 2
U
F
p0 p0 1 p0 n
u tel que P u
, i.e. t
, i.e. t Y2
b a
1
1
a et b tels que P a
p0 p0
0
Sc n
2 0
p
t tel que P t
X
0
Valeur(s) test(s)
t2 b
U
b2
, i.e. a u
t2
2
1
, i.e. b 1
t2
a2
1
u tel que P U
u
1
, i.e. u
u2
u tel que P U
u
1
, i.e. u
u2
Pour un intervalle de confiance de et/ou un test de conformité sur avec un grand échantillon (quelconque), on peut approcher la loi de Student par la loi Normale N 0; 1 , et remplacer t , t et t par u , u et u . 1
4) Tests d’homogénéité au risque H0
H1
Statistique de test et sa loi sous l’hypothèse H 0
Valeur(s) test(s) f tel que
1
2
1
PF
S 2c,1 Snédécor à n 1 1, n 2 1 d.d.l. : 2 S c,2 si échantillons indépendants gaussiens
F
2
f
2 en travaillant avec f
1 1
2
1
u
2 2
1
2
1
2
X1 S 2c,1 n1
U
X2 S 2c,2 n2
Normale N 0; 1 (approx.)
:
Student à n 1 1
2
1 1
X1
T
2
s c,1,2
2
X2
1 n1
:
1 n2
1
1
p1
2
2
p2
1
n2
u
2 d.d.l.
t
(approx.) si petits échantillons indép. gaussiens et si avec s 2c,1,2
1
u
si grands échantillons indépendants
1
t
2
t
n 1 1 s 2c,1 n 2 1 s 2c,2 n1 n2 2
u
2 2
1
2
1
2
1
2
1
2
p1
p2
p1
p2
p1
p2
D , où D S c,d n
U
X1
X2 :
u
si grands échantillons appariés
X1
u
1 d.d.l.
t
X 2 : si petits échantillons
t
Student à n
D , où D S c,d n
T
Normale N 0; 1 (approx.)
t
appariés gaussiens Normale N 0; 1 (approx.)
U
1 n1
F1
F2
1 n2
f 1,2 1
:
si n 1 f 1
f 1,2
5, n 1 1
f1
u
5,
u
n2f2
5, n 2 1 f 2 5, n1f1 n2f2 avec f 1,2 n1 n2
u
5) Test d’ajustement à une loi théorique à r modalités au risque Hypothèse H 0 : le caractère suit la loi théorique définie par les probabilités p i . Hypothèse H 1 : H 0 . r N i np i 2 Statistique de test : D . np i i 1
Loi de D sous l’hypothèse H 0 : khi deux à r Valeur test : b tel que P D b .
1
k d.d.l.
6) Test d’indépendance entre deux caractères à r et s modalités au risque Hypothèse H 0 : les deux caractères sont indépendants. Hypothèse H 1 : H 0 . r
s
Statistique de test : D
N i,j
np i,j np i,j
2
, avec np i,j
n i, n ,j n , n i,
i 1 j 1
Loi de D sous l’hypothèse H 0 : khi deux à r Valeur test : b tel que P D b .
s
j 1
1 s
1 d.d.l. 2
r
n i,j et n
n i,j .
,j i 1
1
7) Régression linéaire simple On considère deux variables quantitative X et Y et le modèle de régression Y X , où cov X, Y normale N 0; . On désigne par le coefficient de corrélation linéaire entre X et Y. X Y
suit la loi
Droite des moindres carrés de y en x. cov x, y , b y ax , s 2x cov x, y et coefficient de corrélation linéaire r entre x et y avec :et r sxsy n n n n n 1 1 1 1 1 2 2 2 2 2 2 où x x , y y , s x x , s y y et cov x, y xiyi xy. i i x y i i n n n n n i 1 i 1 i 1 i 1 i 1 Effectuant plusieurs expériences, et ainsi plusieurs échantillonnages, a, b et r apparaissent comme les valeurs observées des variables aléatoires A, B et R. 2 1 . Des estimations ponctuelles de , , 2 et sont On a alors E A ,EB et E R 2n 1 2 n 1 r 2 s 2 et r (ou plus précisément r r 1 r ). alors respectivement a, b, s 2R y n 2 2n 3 Droite d’équation y
ax
b, avec a
Intervalle de confiance et tests pour un coefficient de régression linéaire La situation est celle décrite dans le paragraphe 1. 2 s 2R . La variable aléatoire T La variance de A est égale à 2 , et peut être estimée par s 2A ns x ns 2x de Student à n 2 degrés de liberté. On détermine alors le réel t 1 tel que P t 1 T t 1 1 en déduit un intervalle de confiance de au niveau 1 1 : i a sAt 1 , a sAt 1 .
A
s A suit la loi 1 (table 3). On
Test (bilatéral) de H 0 : 0 contre H 1 : 0. a 0 On calcule t et on décide que : sA - si t t 1 , t 1 , alors on ne peut rejeter H 0 ; - si t t 1 , t 1 , alors on rejette H 0 avec une probabilité 1 de se tromper. Cas de . On peut mener une étude analogue pour en utilisant le fait que la variance de B est égale à B s 2R n 2 1 x 2 , et peut être estimée par s 2 s 2 1 x2 2 x i , et que la variable aléatoire T B R 2 2 2 2 n n sB ns x ns x n sx i 1 suit la loi de Student à n 2 degrés de liberté. Prévision. L’ajustement affine peut servir à prévoir la valeur attendue pour Y quand l’expérimentateur fixe X x 0 . L’estimation ponctuelle de cette valeur est y 0 ax 0 b, et un intervalle de confiance de cette valeur au x0 x 2 x0 x 2 1 1 2 2 niveau 1 : i y t s 1 , y t s 1 . 1 y0 0 0 R R 1 1 n n ns 2x ns 2x Intervalle de confiance et tests pour un coefficient de corrélation 1 ln 1 arg th . Soit le nombre défini par 2 1 1 ln 1 Soit Z la variable aléatoire qui au cours de chaque échantillonnage prend la valeur z 2 1 Lorsque n est assez grand (n 20 en pratique), un intervalle de confiance de au niveau 1 : u u , z z1, z2 . n 3 n 3 D’où un intervalle de confiance de au niveau 1 :i r1, r2 thz 1 , thz 2 . Test de H 0 : 0 contre H 1 : 0. R n 2 Sous l’hypothèse H 0 , T suit la loi de Student à n 2 degrés de liberté. On calcule t 1 R2 - si t t , t , alors on ne peut rejeter H 0 ; - si t t , t , alors on rejette H 0 avec une probabilité de se tromper. i
r r
arg thr.
r n
2
1
r2
z
3
:
4
5
6
7
8