TD de Statistique: Master Des Sciences Physiques Et Chiniques [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

UNIVERSITE MARIEN NGOUABI

Travail * Progès * Humanité Année académique 2020 - 2021

FACULTE DES SCIENCES ET TECHNIQUES

TD de Statistique Master des Sciences Physiques et Chiniques Exercice 1. La consommation de crèmes glacées par individus a été mesurée pendant 30 périodes. L’objectif est déterminé si la consommation Y dépend de la température X. On sait en outre que n n X X yi = 10783 xi = 1473 i=1 n X

yi2

i=1 n X

= 4001293

i=1

x2i

= 80145

i=1

n X

xi yi = 553747.

i=1

Confirmer ou infimer la dépend de la variable X par rapport à Y par un test. Exercice 2. Neuf étudiants émettent un avis pédagogique vis-à-vis d’un professeur selon une échelle d’appréciation de 1 à 20. On relève par ailleurs la note obtenue par ces étudiants l’année précédente auprès du professeur. Avis 5 Résultat 8

7 16 11 10

6 12 13 9

14 10 17 7

9 15

8 16

Est-ce que l’avis dépend de la note ? Exercice 3. On mesure le poids Y et la taille X de 20 individus. yi 60 61 64 67 68 69 70 70 72 73

xi 155 162 157 170 164 162 169 170 178 173

yi 75 76 78 80 85 90 96 96 98 101

xi 180 175 173 175 179 175 180 185 189 187

Confirmer ou infimer la corrélation des variables X et Y par un test. Exercice 4. On s’intéresse à une éventuelle relation entre le sexe de 200 personnes et la couleur des yeux. Les données sont représentées dans le tableau de contingence. Bleu Homme 10 Femme 20 Total 30

Vert 50 60 110

Marron 20 40 60

Total 80 120 200

Conclure à l’aide du test d’indépendance de khi-deux du lien entre le sexe et la couleur des yeux.

2 Exercice 5. Dans une école, trois groupes de professeurs ont mis au point trois méthodes différentes d’enseignement des statistiques, qu’on a appliqué à trois échantillons d’étudiants ayant sensiblement le même niveau initial. A l’examen les résultats furent les suivants : Admis Méthode 1 51 Méthode 2 38 Méthode 3 86

Ajournés 29 12 34

Peut-on affirmer que l’une des trois méthodes est plus efficace que les autres en termes de réussite à l’examen ? (Effectuer un test d’homogénéité). Exercice 6. On a compté pour 50 commandes d’un service d’une entreprise le poids (en kg) des colis reçus. On a obtenu les résultats suivants (présentés par ordre croissant) : 70 77 80 82 85

71 77 80 82 85

72 78 80 82 86

73 78 80 82 86

74 79 81 82 87

74 79 81 83 87

75 79 81 83 88

76 79 81 84 89

76 80 81 84 90

77 80 81 84 93

1. Calculer le mode, la médiane, la moyenne et l’écart-type. 2. Donner un intervalle d’estimation à 95% de la moyenne des colis reçus par l’entreprise. 3. Tester si la moyenne des colis est égale à 80. Exercice 7. On effectue un grand nombre d’analyses de la concentration des nitrates dans une eau destinée à la consommation, dans le but de vérifier la normalité des mesures et pour connaître une valeur précise de l’écart-type. Le tableau ci-dessous donne les valeurs trouvées ainsi que leurs effectifs. Nitrates (mg/l) Effectifs Nitrates (mg/l) Effectifs

9.5 1 10.3 7

9.6 2 10.4 5

9.8 2 10.5 2

9.9 4 10.6 4

10.0 10.1 10.2 2 9 6 10.7 10.8 11.0 1 2 1

1. Calculer les paramètres statistiques et le coefficient de variation de cette série de mesures. 2. Comparer l’écart maximum (xi − m) à l’écart-type s. 3. A première vue, cette série comporte-t-elle des valeurs aberrantes ? 4. Déterminer les intervalles de confiance bilatéraux symétriques sur la moyenne et sur la variance avec les seuils de confiance de 95% et de 99%. 5. Tester l’hypothése : La concentration des nitrates est inférieure à 10,5 mg/l. 6. Tester l’hypothèse : La concentration des nitrates est au plus égale à 10,5 mg/l. Exercice 8. Dans un centre avicole, des études antérieures ont montré que la masse d’un œuf choisi au hasard peut être considérée comme la réalisation d’une variable aléatoire normale X, de moyenne µ et de variance σ. On admet que les masses des œufs sont indépendantes les unes des autres. On prend un échantillon de n = 36 œufs que l’on pèse. Les mesures sont données (par ordre croissant) dans le tableau suivant :

3 50.34 51.51 52.22

52.62 53.28 53.32

53.79 54.63 54.78

54.99 55.12 55.28

55.82 55.95 57.18

57.67 58.10 60.58

51.41 52.07 52.38

53.13 53.30 53.39

53.89 54.76 54.93

55.04 55.24 55.56

55.91 57.05 57.31

57.99 59.30 63.15

1. Calculer la moyenne empirique et l’écart-type empirique de cette série statistique. Déterminer la boite à pattes et s’il y a des valeurs aberrantes, réaliser le test de Dixon. 2. Donner une estimation des paramètres µ et σ. 3. Donner un intervalle de confiance au niveau 95%, puis 98%, de la masse moyenne µ d’un œuf. 4. Tester si la moyenne de cette variable est égale à 56. Exercice 9. Dans une agence de location de voitures, le patron veut savoir quelles sont les voitures qui n’ont roulé qu’en ville pour les revendre immédiatement. Pour cela, il y a dans chaque voiture une boîte noire qui enregistre le nombre d’heures pendant lesquelles la voiture est restée au point mort, au premier rapport, au deuxième rapport, . . . , au cinquième rapport. On sait qu’une voiture qui ne roule qu’en ville passe en moyenne 10% de son temps au point mort, 5% en première, 30% en seconde, 30% en troisième, 20% en quatrième, et 5% en cinquième. On décide de faire un test du χ2 pour savoir si une voiture n’a roulé qu’en ville ou non. 1. Sur une première voiture, on constate sur 2000 heures de conduite : 210 h au point mort, 94 h en première, 564 h en seconde, 630 h en troisième, 390 h en quatrième, et 112 h en cinquième. Cette voiture n’a-t-elle fait que rester en ville ? 2. Avec une autre voiture, on obtient les données suivantes : 220 h au point mort, 80 h en première, 340 h en seconde, 600 h en troisième, 480 h en quatrième et 280 h en cinquième. Exercice 10. On utilise une nouvelle variété de pommes de terre dans une exploitation agricole. Le rendement de l’ancienne variété était de 41.5 tonnes à l’ha. La nouvelle est cultivée sur 100 ha, avec un rendement moyen de 45 tonnes à l’ha et un écart-type de 11.25. Faut-il, au vu de ce rendement, favoriser la culture de la nouvelle variété ? Exercice 11. Deux méthodes de dosage de l’azote ont éé répétées, à partir d’un même échantillon, 25 fois avec la méthode A, 30 fois avec la méthode B. Les résultats sont rassemblés dans les tableaux ci-dessous. Méthode A xi (en g) ni 37 1 39 2 40 2 41 4 42 7 43 4 44 2 46 2 47 1 Total 25

Méthode B xi (en g) ni 39 2 40 1 41 6 42 9 43 8 44 3 45 1 Total 30

1. Les méthodes sont-elles exactes ? (Tester l’égalité des valeurs moyennes obtenues par les deux méthodes). 2. Les deux méthodes ont-elles la même précision ? (Comparer les variances des échantillons traités avec les deux méthodes).

4 Exercice 12. En Argentine, une expérimentation a été menée en 2009 dans le but de résoudre des problèmes liés à l’intensification de l’agriculture et particulièrement à une nouvelle méthode d’engraissement des bovins. La race traditionnelle A.Angus n’étant pas adaptée à ce système d’élevage, un croisement : A.Angus x Charolaise a été créé. L’objectif est d’obtenir des animaux mieux adaptés à ces nouvelles pratiques tout en maintenant une homogénéité comparable à celle de race traditionnelle. Le caractère étudié est le GMQ (Gain Moyen Quotidien) exprimé en kg. Les résultats observés sur deux lots (ici au sens "échantillons") sont les suivants : • pour le lot 1 : race pure, taille de l’échantillon 16, variance 0.26 ; • pour le lot 2 : race croisée, taille de l’échantillon 21, variance 0.37. Peut-on considérer que le GMQ du croisement A.Angus x Charolaise donne des résultats aussi homogènes que celui de la race pure ? (on prendra un seuil de risque de 0.05). Exercice 13. Dans un élevage de canards prêts à gaver, une expérimentation relative à l’alimentation a été menée. Ces canards sont traditionnellement nourris au maïs grain complémenté avec du soja, du colza et du tournesol. Pour des raisons économiques, l’expérience consiste à remplacer le soja par des drèches de maïs (le soja est importé du Brésil alors que le maïs est cultivé sur place). On définit ainsi deux types d’alimentation : • Type A : alimentation traditionnelle : soja, colza, tournesol ; • Type B : colza, tournesol, le soja a été remplacé par des drèches de maïs. Le problème est de savoir si l’alimentation de type B ne va pas provoquer une plus grande dispersion du poids des canards. Le caractère étudié est donc le poids des canards exprimé en grammes. Les résultats sont donnés ci-dessous : • échantillon 1 extrait de la population des canards dont l’alimentation est de Type A : taille 50, variance non corrégée s2A = 105623 ; • échantillon 2 extrait de la population des canards dont l’alimentation est de Type B : taille 50, variance non corrigée s2B = 129600.. Exercice 14. Dans une étude en biologie, on mesure la longueur des spécimens mâles et femelles de poissons adultes appartenant à la même espèce. On obtient les résultats suivants (longueurs en mm) : mâles femelles

120 110

107 111

110 107

116 108

114 110

111 105

113 107

117 106

114 111

112 111

Peut-on affirmer que la taille des individus diffère entre les deux sexes de cette espèce ? (On supposera que les tailles dans les deux populations sont distribuées selon des lois normales). On n’oubliera pas de tester tout d’abord l’hypothèse d’homoscédasticité (égalité des variances). On prendra α = 5%. Exercice 15. Le mouvement propre d’un compteur est le résultat obtenu en l’absence de toute source radioactive (Bruit de fond dû aux rayons cosmiques et à la radioactivité ambiante.). On effectue des mesures répétées du mouvement propre toutes les 30 secondes et l’on obtient la série : Nombre d’impulsions : 3 6 7 5 2 9 0 1 5 2 6 5 3 4 2 4 5 7 1 3 1 4 1 2 2 3 4 4. 1. Calculer la moyenne, l’écart-type, la médiane et le mode de cette série statistique.‘ 2. Tracer sur le même graphique le diagramme des effectifs ainsi que les effectifs théoriques en admettant que les valeurs sont distribuées suivant une loi de Poisson. 3. Montrer, à l’aide d’un test adéquat, que ces mesures se distribuent suivant une loi de Poisson. (Les tests sont à effectuer au seuil de confiance de 95%)

5 Exercice 16. Avec un traitement classique, les patients d’une forme de cancer survivent à 5 ans au taux de 30%. Une nouvelle molécule anticancéreuse est administrée à un échantillon aléatoire de 100 patients de la même forme de cancer et 40 ont survécu à 5ans après la mise sous traitement. La nouvelle molécule est-elle meilleure au traitement classique (toutes choses étant égales par ailleurs) ? Exercice 17. Dans un échantillon de 5000 femmes âgées de 45-55 ans et dont les mères ont eu un cancer du sein, 200 femmes ont présenté elles aussi un cancer de sein. Le taux de pre?valence du cancer du sein dans la population générale des femmes de 50-54 ans est de 2%. 1. Quel est l’intervalle de confiance à 95% pour le taux de prévalence du cancer du sein dans la population des femmes de 45- 55ans dont les mères ont un antécédent de cancer du sein ? 2. Le résultat de l’échantillon est-il compatible avec le taux de prévalence dans la population au seuil de 5% ? Exercice 18. Soit une étude des effets des CO sur les maladies cardiovasculaires (MCV) des femmes de 40-44 ans : soit n1 = 5000 utilisatrices dont 13 cas de MCV en 3 ans et n2 = 10000 non CO dont 7 cas de MCV dans la même période. La proportion de MCV dans la population des utilisatrices de CO diffère-t-elle de celle de la population des non utilisatrices au seuil de 5% ? Exercice 19. Une machine produit des tiges métalliques dont la longueur nominale, égale à 8.30 cm est supposée suivre une loi normale. Sur la base d’un échantillon aléatoire de taille N = 20, on veut tester si la machine est bien réglée. La moyenne et l’écart-type des longueurs mesurées sur l’échantillon sont respectivement de 8.57 cm et 0.6 cm. Que peut-on en conclure pour un seuil de signification α de 5%, 1%, 0.1% ? Exercice 20. On suppose que le poids d’un nouveau né est une variable normale d’écart-type égal à 0, 5kg. Le poids moyen des 49 enfants nés au mois de janvier 2004 dans l’hôpital de CharlevilleMézières a été de 3, 6kg. 1. Déterminer un intervalle de confiance à 95% pour le poids moyen d’un nouveau né dans cet hôpital. 2. Quel serait le niveau de confiance d’un intervalle de longueur 0, 1kg centré en 3,6 pour ce poids moyen ? Exercice 21. On veut étudier la proportion p de gens qui vont au cinéma chaque mois. On prend donc un échantillon de taille n = 100. Soit N le nombre de personnes dans l’échantillon qui vont au cinéma mensuellement. 1. Quelle est la loi de N ? Par quelle loi peut-on l’approcher et pourquoi ? En déduire une N approximation de la loi de F = . n 2. On observe une proportion f de gens qui vont chaque mois au cinéma. Donner la forme d’un intervalle de confiance pour p, de niveau de confiance 1 − α. 3. Applications numériques : f = 0, 1 ; 1 − α = 90%, 95%, 98%. Exercice 22. Un appareil de télécommunications reçoit un signal stocké à chaque (petite) unité de temps dans une suite de variables (Xn ). Cet appareil doit détecter un signal effectif, en le différenciant d’un bruit. On suppose que le bruit est une suite de variables indépendantes de loi normale de moyenne nulle et de variance 1. Pour un signal, la moyenne n’est pas nulle. Aujourd’hui on a observé une suite de 40 variables (x1 , . . . , x40 ), supposées indépendantes, de variance 1. La moyenne empirique vaut 0,6. S’agit-il de bruit ? Construire un test pour répondre à cette question.

6 Exercice 23. Une chaîne d’agences immobilières cherche à vérifier que le nombre de biens vendus par agent par mois suit une loi de Poisson de paramètre λ = 1, 5. 1. On observe 52 agents pendant un mois dans la moitié nord de la France. On trouve la répartition suivante : 18 agents n’ont rien vendu, 18 agents ont vendu 1 bien, 8 agents ont vendu 2 biens, 5 agents ont vendu 3 biens, 2 agents ont vendus 4 biens, et un agent a vendu 5 biens. Avec un test du χ2 , chercher s’il s’agit bien de la loi de Poisson attendue. 2. Répondre à la même question avec les 52 agents dans la moitié sud de la France : 19 agents n’ont rien vendu, 20 agents ont vendu un bien, 7 agents 2 biens, 5 agents 3 biens et 1 agent 6 biens. Exercice 24. On mesure la taille du lobe frontal de 30 crabes Leptograpsus variegatus. Voici les 30 longueurs obtenues 12.6

12.0

11.7

18

20.9 9.1

14.2 15

16.2

15.2

15.3

15.1

10.4

14.7

22.1

13.3

19.8

21.7

15

15.4

12.8 16.7

20

11.8

20.6

15.6

17.1

7.2

21.3 12.6

Est-ce que cette variable suit une loi normale ? Exercice 25. Tester l’adéquation à la loi normale N (5, 2) de l’échantillon suivant 4.42

6.17

5.74

3.39

4.65

3.91

6.52

5.31

7.49

5.06

4.87

3.03

5.46

3.63

6.82

6.27

5.19

4.67

7.38

4.49

6.37

4.23

4.90

4.70

6.45

4.79

6.77

4.28

4.31

5.19

Exercice 26. Une machine est réglée pour fabriquer des plaques de chocolats d’un poids moyen de 250g. Soucieux de ce problème, le service de contrôle de qualité demande une vérification de la machine. Le poids de 10 plaques de chocolats est observé. On obtient les mesures suivantes qui vous sont immédiatement transmises : poids observés : 256 245 253 250 295 251 248 247 252 249. Quelle est votre conclusion ? Exercice 27. Une société de vente à distance demande à l’un de ses ingénieurs marketing de modéliser le nombre d’appels téléphoniques par heure reçus sur le standard dédié aux commandes, dans le but d’optimiser la taille de celui-ci. Les nombres d’appels, relevés sur une période de 53 heures, ont été les suivants : Nombre d’appels xi Occurence Ni

0 1

1 4

2 7

3 11

4 10

5 9

6 5

7 3

8 2

9 et plus 1

1. Estimer la moyenne et la variance du nombre d’appels. Quelle type de loi semble le mieux décrire ce nombre d’appel ? 2. Tester l’ajustement à cette loi au risque 5%.