close

Se connecter

Se connecter avec OpenID

B. Bottollier - ISARA 1 MODULE 3 : CARRE

IntégréTéléchargement
MODULE 3 : CARRE LATIN
Normalité des résidus
On devra vérifier la normalité des résidus (histogramme et tests sur les
coefficients de forme). On pourra également rechercher l’existence de valeurs
aberrantes.
Pour cela il faut établir la liste des résidus.
Le modèle associé au carré latin est :
ŷijk = µ + α i + β j + γ k
µ:=
∑y
ijk
N
α i = ( y - µ)
i..
β j = ( y - µ)
. j.
γ k = ( y - µ)
..k
eijk = yijk − yˆijk
yijk : réponse observée pour l’essai AiBjCk
ŷijk = µ + ( y - µ) + ( y - µ) + ( y - µ)
i..
. j.
..k
eijk = yijk − µ - ( y - µ) - ( y - µ) - ( y - µ)
i..
. j.
..k
eijk = yijk + 2 µ - y - y - y
i..
. j.
..k
On peut calculer le résidu eijk associé à chaque yijk :
eijk = yijk + 2 µ - y - y - y
i..
. j.
..k
Exemple :
3 facteurs A, B et C à 4 variantes (p = 4), disposé en carré latin 4 x 4
Facteurs
Variantes
A
Pente (i)
1 2 3 4
B Gradient de fertilité (j) 1 2 3 4
C
Dose d’azote (k)
N1 N2 N3 N4
Réponse = rendement
B. Bottollier - ISARA
1
N1
l4
c1
N3
l3
c1
N2
l2
c1
N4
l1
c1
N3
l4
c4
N1
l3
c4
N4
l2
c4
N2
l1
c4
COLONNE
(j)
N (k)
yijk
eijk
1
3
1
8
1,375
2
2
1
7
0,375
3
4
1
5
-0,625
4
1
1
8
-1,125
1
4
2
11
0,375
2
1
2
14
0,625
3
2
2
12
-0,625
4
3
2
14
-0,375
1
2
3
16
-0,875
2
3
3
17
-0,875
3
1
3
20
1,375
4
4
3
18
0,375
1
1
4
22
-0,875
2
4
4
21
-0,125
3
3
4
23
-0,125
4
2
4
25
1,125
Des traitements y
..k
Générale µ
131
N2
l4
c3
N4
l3
c3
N3
l2
c3
N1
l1
c3
LIGNE (i)
moyenne
Des lignes y
i..
Des colonnes y
. j.
e
N4
l4
c2
N2
l3
c2
N1
l2
c2
N3
l1
c2
1
14.25
2
14.75
3
15
4
16.25
16
15
15.5
13.75
7
12.75
17.75
22.75
15.0625
= 8 + 2*15.0625 – 14.25 – 15.5 – 7 = 1.375
B. Bottollier - ISARA
2
VERIFICATION
DE LA NORMALITE
:
On groupe la série en classes et on représente l’histogramme.
lim sup eijk
nijk
n(eijk)
-1,12
1
6
-0,52
5
5
0,08
3
4
0,68
4
3
1,28
1
2
1,88
2
1
total
16
0
résidus
5
4
3
2
1
-1,42
1
-0,82
-0,22
0,38
0,98
1,58
centre des classes
Allure que l’on peut considérer symétrique et en cloche comme vont le prouver
les analyses suivantes.
carreN<read.table("CLexemplecours.csv",
header=TRUE, dec=",",sep=";")
factligne<as.factor(carreN$Pente)
factcolonne<as.factor(carreN$Gradient)
factN<-as.factor(carreN$Azote)
Rdt<-(carreN$Rendement)
lmcarreN<lm(Rdt~factligne+factcolonne+fact
N)
residuscarreN<-lmcarreN$residuals
> shapiro.test(residuscarreN)
Shapiro-Wilk normality
test
data: residuscarreN
W = 0.9197, p-value = 0.1669
H0 L(e) ~N (0 ; 0.8317)
H1 L(e) ≠ N (0 ; 0.8317)
Si on rejette H0, hypothèse de la normalité, on a 16,7% de risque d’erreur. On
conserve l’hypothèse de normalité des résidus.
Les points sont bien alignés sur le modèle de la droite de Henry.
Compléments : Si on veut comparer les coefficients à la valeur 0 pour la symétrie
et à 3 en ce qui concerne l’aplatissement. Cette comparaison est subjective, il est
préférable de disposer d’un test, c’est ce que nous propose le logiciel
« Statbox » :
B. Bottollier - ISARA
3
INDICES DE NORMALITE (coefficients de K.PEARSON)
SYMETRIE
(valeur idéale théorique = 0) : BETA 1 = .13 PROBA : .5181
APLATISSEMENT (valeur idéale théorique = 3) : BETA 2 = 1.88 PROBA :
.30455
On a 51.81% de risque de se tromper en rejetant l’hypothèse de symétrie des
résidus. Ce risque est trop fort, on n’a pas mis en évidence que la distribution
n’était pas symétrique.
On a 30.46% de risque de se tromper en rejetant l’hypothèse de mésocurtie des
résidus. Ce risque est trop fort, on n’a pas mis en évidence que la distribution
n’était pas mésocurtique.
On conserve l’hypothèse de normalité des résidus.
VALEURS
ABERRANTES
:
On va calculer le rapport entre eijk et
∑ e²ijk/(N−1) , si la valeur absolue du
i,j,k
rapport est supérieure à 2 on considèrera que yijk est une valeur « out ».
Somme des carrés des résidus = 10.375
Ecart-type estimé des résidus = (10.375 / 15)1/2 = (0.692)1/2 = 0.832
eijk
1,38 0,38 -0,63 -1,13 0,38 0,63 -0,63 -0,38 -0,88 -0,88 1,38 0,38 -0,88 -0,13 -0,13 1,13
eijk/σ(n-1) 1,65 0,45 -0,75 -1,35 0,45 0,75 -0,75 -0,45 -1,05 -1,05 1,65 0,45 -1,05 -0,15 -0,15 1,35
Il n’y a pas de données « out ».
Questions
1°) Quelles sont, d’après vous les hypothèses, nulle et alternative, soumises aux
tests sur les coefficients de forme ?
B. Bottollier - ISARA
4
2°) Quelle autre méthode connaissez-vous qui permet de vérifier la normalité
d’une distribution de résidus groupés en classes ?
3°) Exercice Vaches : On soumet 4 vaches multipares de même race (Holstein) à
des stades de lactation comparables (123+/-30 j), à 4 traitements (0, 2, 4 et 6
g/j CLA). Chaque traitement s’étale sur une période de 5 jours suivie de 7 jours
sans traitement. La durée qui couvre l’expérimentation est de 4 fois 12jours.
Facteurs
Variantes
V
Vache
V1
V2
V3
V4
P
Période
P1
P2
P3
P4
T
Traitement
T1
T2
T3
T4
La réponse étudiée yijk, est le glycérol sanguin en µM que l’on suppose suivre une
loi normale. Analyser la normalité des résidus et les résultats suivants :
p-value β1 = 0.65, p-value β2 = 0.31
Le dispositif expérimental utilisé et les résultats obtenus sont :
V4
V3
V2
V1
P1
T3
T2
T1
T4
P2
T1
T4
T3
T2
P3
T2
T1
T4
T3
Traitement Vache Période yijk
1
1
4
956
1
2
1
779
1
3
3
813
1
4
2
774
2
1
2
1235
2
2
4
1107
2
3
1
1191
2
4
3
922
3
1
3
941
3
2
2
1150
3
3
4
1111
3
4
1
1080
4
1
1
1377
4
2
3
1764
4
3
2
1417
4
4
4
1585
B. Bottollier - ISARA
5
P4
T4
T3
T2
T1
Auteur
Document
Catégorie
Uncategorized
Affichages
0
Taille du fichier
83 KB
Étiquettes
1/--Pages
signaler