close

Se connecter

Se connecter avec OpenID

Chapitre 3 - Statistiques

IntégréTéléchargement
CHAPITRE 3 - STATISTIQUES
On considère les notes d’une classe à un devoir :
11,5 11,5 15,5 11,5 13,5
20
16,5
17
18
15
7
16,5
9,5
7
17
13,5 15,5 14,5 16,5
20
17
Vocabulaire, moyenne et fréquences :
• Cette liste est une série statistique, constituée de données.
• La population est l’ensemble des individus (ici les élèves de la classe).
• L’effectif total N est l’effectif de la population (ici N=22).
• Le caractère étudié est le type des données (ici il s’agit de la note obtenue).
Le caractère peut être quantitatif (données numériques comme ici) ou qualitatif sinon.
• La moyenne d’une série est égale au quotient de la somme des valeurs par l’effectif
total : x = Somme des valeurs ( ici x = 14, 36 )
Effectif total
• L’étendue d’une série est la différence entre la plus grande et la plus petite donnée : e = max− min
• Les valeurs modales d’une série sont les valeur de la série de plus grand effectif : ici 11,5 ; 16,5 ; 17
Remarque : Pour poursuivre l’étude statistique, il est intéressant de regrouper dans un
tableau les données de valeur et de classer ces valeurs par ordre croissant. Ce qui donne :
Notes (valeurs)
7
9,5
11,5
12
13,5
14,5
15
15,5
16,5
17
18
20
Effectifs
2
1
3
1
2
1
1
2
3
3
1
2
• Le diagramme en bâtons est la représentation graphique de ce tableau.
4
Effectifs
12
3
2
1
0
0
1
2
3
4
5
6
7
8
9
10 11
12 13 14 15 16 17 18 19 20
Notes
Remarque : Un tel tableau permet aussi de calculer plus rapidement la moyenne :
x=
Somme des (valeurs x effectifs)
Effectif total
( ici x = 7 × 2 + 9,5 × 1+ ...+ 20 × 2 = 14, 36 ).
22
• La fréquence d’une valeur est la proportion du nombre de données ayant cette valeur
sur le nombre total de données : f (xi ) = Effectif de la valeur
Effectif total
C’est un nombre entre 0 et 1, parfois notée en %. La somme des fréquences est 1 (100%).
Ici l’effectif de la note 7 est égal à 2. Sa fréquence est alors 2 / 22 soit 9,1%.
Il est aussi utile de cumuler les fréquences des différents valeurs :
Notes (valeurs)
7
9,5
11,5
12
13,5
14,5
15
15,5
16,5
17
18
20
Fréquences (%)
9,1
4,5
13,6
4,5
9,1
4,5
4,5
9,1
13,6
13,6
4,5
9,1
Fréquences cumulées (%)
9,1
13,6
27,3
31,8
40,9
45,5
50
59,1
72,7
86,4
90,9
100
• Le polygone des fréquence cumulées est alors le diagramme suivant :
Ce diagramme permet de lire
graphiquement les valeurs des
paramètres statistiques de dispersion de
la série : médiane, quartiles, déciles.
Les points placés sont reliés par des
segments de droite.
Indicateurs de dispersion
• La médiane Me est la valeur de la série pour laquelle 50% des données sont situées en
dessous et 50% sont situées au-dessus :
- Si l’effectif total N est impair, la médiane est la donnée centrale ( N + 1 ème donnée).
2
- Si l’effectif total N est pair, la médiane est la médiane est la moyenne
des deux données
N
N
centrales ( la moyenne des
et 2 + 1 èmes données).
2
• Le premier quartile Q1 est la valeur de la série pour laquelle au moins 25% des
données sont situées au dessous. C’est la r ième donnée où r est l’arrondi supérieur de
• Le troisième quartile Q3 est la valeur de la série pour laquelle au moins 75% des
données sont situées au dessous. C’est la r ième donnée où r est l’arrondi supérieur de
N
4
3N
4
• L’intervalle inter-quartiles est l’intervalle [Q1;Q3] et l’écart inter-quartiles est égal à Q3 − Q1.
Note : L’intervalle inter-quartiles contient au moins 50% des données de la série.
Dans notre exemple, la médiane est la moyenne entre la 11ème et la 12ème valeur.
Le premier quartile est la 6ème valeur et le troisième quartile 17ème valeur.
Il est aussi utile de cumuler les effectifs des différents valeurs :
Notes (valeurs)
7
9,5
11,5
12
13,5
14,5
15
15,5
16,5
17
18
20
Effectifs
2
1
3
1
2
1
1
2
3
3
1
2
Effectifs cumulés
2
3
6
7
9
10
11
13
16
19
20
22
On lit sur ce tableau (ou sur le polygone des fréquences) : Me=15,25, Q1=11,5, Q3=17.
Remarque : Il est indispensable que la série soit ordonnée par ordre croissant.
• Le diagramme en boîte d’une série est une représentation graphique de la dispersion
de cette série (min, Q1, Me, Q3, max) :
min
Q1
Me
4 - Quel est le minimum ? Quel est le maximum ?
Q3
max
Remarque : Au moins 50% des données sont dans la boîte (intervalle inter-quartiles).
De même 50% des données sont à l’extérieur de la boîte, quelque part entre min et max.
La longueur de la boîte est l’écart inter-quartiles, la longueur totale est l’étendue.
• Le variance V d’une série est la moyenne des carrés des écarts à la moyenne. Elle
mesure donc les écarts des données par rapport à la moyenne et elle est d’autant plus
grande que les valeurs sont dispersées. Elle est très sensible aux valeurs extrêmes.
⎧ x1 , x2 ,..., xk sont les différentes valeurs.
2
2
2
x1 − x ) × n1 + ( x2 − x ) × n2 + ...+ ( xk − x ) × nk
(
où ⎪⎨n1,n2 ,...,nk sont les effectifs de chaque valeur.
V=
N
⎪
est la moyenne de la série.
⎩x
( Ici cela donne
V=
(7 − 14, 36)2 × 2 + (9,5 − 14, 36)2 × 1+ ...+ (20 − 14, 36)2 × 2
= 12,64
22
)
• L’écart-type σ d’une série statistique est la racine carrée de la variance : σ = V ( ici σ = 3,56 )
Regroupement par classes de valeurs.
Il est intéressant de regrouper les valeurs dans différentes classes que l’on choisit.
Classes de notes
Effectifs des classes
[ 0;10[
[10;15[
[15;18[
[18;20 ]
3
7
9
3
• L’histogramme d’une série statistique est la
représentation graphique de ce tableau, chaque
rectangle représente une classe de valeurs et sa
hauteur est égale à l’effectif de la classe :
10
Effectifs
5
7
9
3
0
[ 0;10[
3
[10;15[
[15;18[
Remarque : On parle alors d’étendue de chaque classe, de classe médiane (au lieu de
médiane), de classe modale (au lieu de valeurs modales).
Parfois, la série est donnée directement comme ceci et on ne connaît pas la liste précise
des données : certains paramètres ne peuvent alors pas être déterminés.
On calcule la moyenne de la série en prenant les valeurs centrales de chaque classe (elle
est souvent différente de la moyenne calculée de manière exacte avec toutes les valeurs).
[18;20 ]
• Le diagramme circulaire (dit « camembert ») est une autre représentation graphique
de ce regroupement par classes de valeurs. Chaque classe est représentée par une part
dont la taille est proportionnelle à l’effectif ou la fréquence.
On le trace à l’aide du tableau suivant :
Classes de notes
[ 0;10[
[10;15[ [15;18[ [18;20 ]
Total
Effectifs des classes
3
7
9
3
22
Fréquences ( en % )
13,6
31,8
40,9
13,6
100
115° de valeurs.
147°
49°
classes
360
Angles Regroupement
( en ° )
49°
par
0 - 10
10 - 15
15 - 18
× 3,6
C’est un tableau de proportionnalité, la
totalité du diagramme circulaire (360°)
représentant la somme des fréquences
(100%), on détermine ainsi le
coefficient de proportionnalité puis
l’angle de chaque part.
18 - 20
14 % 14 %
41 %
32 %
Utilisation d’un tableur.
L’utilisation d’un tableur (Excel, Open Office Calc, Numbers..) permet la création d’une
feuille de calcul automatisée, faisant apparaître les paramètres statistiques et les
différentes représentations graphiques. Ci-dessous, un exemple sur Excel / Open Office
Utilisation de la calculatrice (cf. annexe).
Le mode Statistiques de la calculatrice (TI, Casio) permet d’entrer d’entrer des listes de
valeurs ( liste simple : L1, ou double liste : valeurs en L1 et effectifs en L2).
Il est alors possible dans ces deux cas, de faire afficher tous les paramètres statistiques
ainsi que les différents diagrammes ( en bâtons, en boîte etc..) .
Attention : sur le tableur et sur la calculatrice, les valeurs des quartiles sont différentes
des valeurs des quartiles lorsqu’on les calcule avec la méthode traditionnelle.
Auteur
Документ
Catégorie
Без категории
Affichages
2
Taille du fichier
472 Кб
Étiquettes
1/--Pages
signaler