ANNALES 1999 À 2007 [PDF]

  • Author / Uploaded
  • Mmr
  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

ANNALES Janvier 1999 à Septembre 2007

1

Partiel de Janvier 1999 QUESTION de COURS : 3 Points Démontrez que la moyenne de l'échantillon d'une loi normale est l'estimateur du maximum de vraisemblance de l'espérance mathématique m.

EXERCICE 1 : 5 Points Au cours d'une enquête sur les mœurs des français on a demandé, individuellement à chaque homme interrogé, combien de fois par an il offrait des fleurs à sa compagne. On a recueilli les résultats suivants en fonction de l'âge des individus : Nb de fois…\ Age ]18 - 25] ]25 -50] > 50 Total [0 - 2] 23 54 16 93 >3 22 21 14 57 Total 45 75 30 150 Peut-on en déduire, avec un risque de 1ère espèce de 5 %, que l'âge de l'individu a une influence sur le nombre annuel de bouquets offerts ?

EXERCICE 2 : 7 Points Soit X le nombre des accidents qui se produit par mois, en scooter des mers, sur une plage déterminée. Nous supposons que X est une variable aléatoire suivant une loi de poisson de paramètre θ. La municipalité inquiète, décide de relever durant 5 mois le nombre d'accidents sur cette plage. Si ce total dépasse la valeur k, la municipalité décidera d'interdire l'usage des scooters (θ=3), sinon elle les tolèrera (θ=1). 1. On choisit k=9 Définissez entièrement le problème de test ainsi posé ainsi que la règle de décision adoptée. Quels sont les deux risques associés à cette règle de décision ? 2.

Nous retenons comme hypothèse de base, la situation jugée "acceptable". Donnez l'interprétation de ce choix. Quelle est la valeur critique k1 correspondant à un risque de 1ère espèce α1=0.014 ? Quelle est la puissance de ce test ?

3.

Nous retenons désormais l'autre hypothèse comme hypothèse de base. Donnez l'interprétation de ce choix. Quelle est la valeur critique k2 correspondant à un risque de 1ère expèce α2=0.018 ? Quelle est la puissance de ce test ?

4.

Nous avons dénombré un total de 8 accidents sur 5 mois sur cette plage. Quelles décision prendra la municipalité dans chacun des cas 2 et 3 ?

5.

Représentez graphiquement α1 et α2.

EXERCICE 3 : 5 Points La durée d'une communication téléphonique peut être représentée par une variable aléatoire D. On admet que la loi de probabilité de D est la loi uniforme sur [0, θ], et nous cherchons à estimer θ. Nous observons alors les durées de n communications. 1.

Calculez l'espérance mathématique de D. En déduire la justification, comme estimateur de θ, de :

Cet estimateur est-il sans biais ? convergent ? 2. Trouvez l'estimateur --- du maximum de vraisemblance de θ. Quelles est sa loi ? Est-il sans biais ? convergent ? Soit --l'estimateur sans biais proportionnel à Comparez ----

2

3. Calculez la quantité d'information relative à θ et concluez.

Partiel de Septembre 1999 QUESTION de COURS : 5 Points "Estimation par intervalle de confiance de la différence des espérances de deux lois normales" EXERCICE 1 : 5 Points On suppose que la distribution des salaires mensuels de l'ensemble des étudiants en stage suit une distribution log-normale, c'est-à-dire si X désigne le salaire mensuel : avec U : variable normale centrée réduite m et σ : constantes, et σ strictement positive.

X = e m + σU

1.

Calculez les deux paramètres de cette loi, sachant que : - le salaire médian est de 6 881,68 FF brut mensuel - 3 % des étudiants gagnent plus de 10 000 FF brut mensuel 2. Déterminez la moyenne et l'écart-type de la distribution de X.

EXERCICE 2 : 5 Points 1. Testez au seuil de 5 % l'hypothèse de base suivante "le taux de réussite au permis de conduire, des personnes de sexe masculin, est de 50 %". On dispose d'un échantillon de 429 440 individus sur lequel on a dénombré 221 023 personnes de sexe masculin et 208 417 personnes de sexe féminin. 2. Etudiez la puissance du test 3. Calculez cette puissance pour p = 0,505 4. Construisez alors un test unilatéral.

EXERCICE 3 : 10 Points Afin de déterminer la santé financière d'une banque on détermine son ratio de liquidité X. Dans le secteur des banques d'affaires, on admet que ce rapport est une variable aléatoire X qui suit une loi normale N ( m1 , σ1 ) . On observe un échantillon de 10 banques de ce secteur et on trouve 10

∑ (x x = 6,1% et s1 =

− x)

i

2

1

= 0,3 %

9

Dans le secteur des banques commerciales, on admet que ce rapport est une variable aléatoire Y qui suit une loi normale N ( m 2 , σ 2 ) On observe un échantillon de 20 banques de ce secteur et on trouve 20

∑ (y y = 6,6% et s 2 =

1.

Testez au seuil

i

− y)

1

19

2

= 0,45 %

H : m 1 = m 2 α:  K : σ1 p σ 2

α = 0,05 ? 2. Comparez le test précédent à celui de H contre K lorsque m1 et m 2 sont supposés connus et respectivement égaux à 6,1 % et 6,6 %, pour un même risque α = 0,05 . A quelle décision conduisent les observations réalisées pour un risque

3.

On suppose que les variances sont inconnues mais égales.

3

Testez au seuil 4.

H a : m 1 = m 2 β: K a : m 1 ≠ m 2

Comparez les régions critiques obtenues pour

α = 0,001 α = 0,01 α = 0,05 Concluez.

Partiel de Janvier 2000 QUESTION de COURS :

4 Points

Similitudes et différences entre la méthode de Bayes et la méthode de Neyman-Pearson. (minimum : 1 page / maximum : 2 pages) EXERCICE 1 : 5 Points Le gouvernement cherche à réduire le chômage des jeunes diplômés. Il se propose d'attribuer au niveau national une aide financière pour la création de start-up sur le marché du web. Avant de lancer ce programme le Ministère de l'Economie et des Finances détermine un échantillon représentatif. Il cherche à savoir si le Ministère de l'emploi peut atteindre son objectif.

jeunes aidés jeunes non aidés

1. 2.

avec aide 18 22 n1 = 40

sans aide 18 42 n2 = 60

Peut-on considérer que cette politique est efficace pour un risque de 1ère espèce de 10 %, de 3 % ? Si maintenant n1 = 40 k et n2 = 60 k, et si la différence des fréquences observée est la même, à partir de quelle taille globale de l'échantillon pourra-t-on considérer la politique comme efficace avec un risque de 3 %?

EXERCICE 2 : 4 Points Dans un grand magasin, sur un échantillon de 300 boîtes de jeux de construction pour enfants, on a dénombré 60 boîtes destinées aux 0-2 ans. Démontrez quelle est l'estimation du maximum de vraisemblance de la proportion de jeux de constructions destinés aux jeunes enfants et les propriétés de l'estimateur correspondant ?

EXERCICE 3 : 7 Points Un commissaire aux comptes doit certifier si les comptes annuels d'une entreprise sont sincères et représentent une image fidèle de la situation de l'entreprise. L'accord entre le commissaire aux comptes et son client stipule que si la proportion des redressements ne satisfaisant pas aux normes convenues est p = 0,05, le commissaire aux comptes certifiera les comptes annuels. Si cette proportion est p = 0,10 le client devra corriger ses états financiers. Afin de déterminer la décision à prendre, on procède à l'examen de n justificatifs. 1. Formalisez le problème ainsi posé. 2. Quelle est l'hypothèse de base du commissaire aux comptes ? Justifiez la. 2.1. Quelle est la région critique du test de puissance maximale correspondant à un risque de 1ère espèce α. 2.2. Application numérique : α = 0,10 et n = 100. 2.3. Si le commissaire aux comptes observe 7 mauvais justificatifs dans cet échantillon, quelle décision doit-il prendre ? 3. . Quelle est l'hypothèse de base du client? Justifiez la. 3.1. Quelle est alors son erreur de 1ère espèce ?

4

3.2. Quelle est la région critique du test le plus puissant correspondant à un risque de 1ère espèce de 10 %, pour un échantillon de taille 100 ? 3.3. Si le client observe 7 mauvais justificatifs dans cet échantillon, quelle décision doit-il prendre ? 4. Comparez les décisions du commissaire aux comptes et de son client (au vu de l'échantillon). A partir de quelle valeur de n, leurs règles de décision seront-elles compatibles ?

Partiel de Septembre 2000 QUESTION de COURS : Comment peut-on comparer deux estimateurs sans biais ?

2 Points

EXERCICE 1 : 5 Points On considère le nombre d'accidents domestiques qui se produisent chaque mois dans une ville donnée. L'observation se prolonge pendant 23 mois et fourni la répartition suivante (Observations / nb de mois pendant lesquels les accidents ont eu lieu) : Observation 0 1 2 3 4 5 6 7 nb de mois 1 2 5 8 3 2 0 2 1. 2.

Après avoir calculé la moyenne de l'échantillon, vous tracerez l'histogramme de cette distribution. Avec un risque de première espèce de 10 %, l'ajustement à une loi de Poisson de paramètre λ=3 est-il acceptable ?

EXERCICE 2 : 10 Points Soit X, une variable aléatoire suivant une loi normale N(m,σ). On dispose de 40 observations. On suppose m connue et égale à 2. 1. On pose Ho : σ =1 H1 : σ >1 a. Si on fixe un seuil α, existe-t-il un test Ho contre H1 qui soit u.p.p. parmi les tests de seuil α ? b. Déterminez la région critique de ce test pour α=0,05 ?et la puissance de ce test pour σ =1,5. 2. On pose Ho : σ =1 H2 : σ ≠1 a. Si on fixe un seuil α, existe-t-il un test Ho contre H2 qui soit u.p.p. parmi les tests de seuil α ? b. Déterminez le test dont la région critique est définie comme réunion de celles qui seraient obtenues pour tester σ =1 contre σ >1 et pour tester σ =1 contre σ m0. On dispose d’un n-échantillon (X1, X2, …Xn). Quelle doit être la taille minimum N de l’échantillon pour que le test de l’hypothèse H0 « m=m0 » contre H1 « m>m0 » de niveau 5% soit de puissance au moins 99 % en m1>m0 ? (on expérimentera N en fonction de m1 et m0). Application numérique : m0=6 cm, m1=6,01 cm.

24

Question 5 : On cherche à tester si la couleur des voitures et le volume du coffre sont deux caractères indépendants ou non. Une enquête menée sur 6 684 ventes de véhicules automobiles a donné les résultats consignés dans le tableau ci-après. Testez cette indépendance au seuil de 5 %. Couleur \ Volume petit moyen grand Couleur claire 1768 807 189 Couleur foncée 946 1387 746 Couleur vive 115 438 288

Barème : Q1 : 2+2,25 / Q2 : 5 / Q3 : 1 / Q4 : 4 / Q5 : 6

Partiel du 19 Janvier 2007 Un jeu concours, organisé par une même marque de Céréales, reçoit des réponses sur 10 mois. Ces réponses correspondent à des bulletins découpés sur deux gammes différentes : les « Chocomiam », et les « Fraisymiam ». La marque cherche à déterminer si l’opération promotionnelle intéresse davantage les clients de l’une de ses deux gammes. Semaine i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

Chocomiam Fraisymiam 350 522 264 394 342 510 134 200 235 351 632 351 237 353 128 192 367 547 378 564 216 322 326 487 328 467 318 474 127 190 376 571 239 345 302 461 507 781 421 253 356 531

9.

Décrivez les séries (taille de la population, taille de l’échantillon, min, max, moyennes, médianes, variances, intervalles interquartiles)

10.

Peut-on considérer les « Chocomiam » comme des réalisations d'une variable aléatoire normale X ? Justifiez votre réponse.

11.

Si on appelle m et σ², la moyenne et la variance de X, donnez les estimateurs de ces paramètres; et leurs propriétés ? En déduire leurs estimations.

25

12.

Construisez pour chacune des séries les intervalles de confiance IC(m) et IC(σ²) à 90% et à risques symétriques de m et σ². Entre quelles limites devrait se situer la taille d'un échantillon pour que la précision relative sur m soit de l’ordre de 1 % ?

13.

Peut-on considérer que les deux gammes fournissent des résultats équivalents ? Justifiez votre comparaison.

14.

Définissez puis déterminez les risques de 1ère espèce et seconde espèces, pour chacune des séries, ainsi que le seuil et la puissance du test que vous représenterez graphiquement.

15.

Complétez chaque série par 5 données cohérentes en utilisant la méthode de simulation des nombres au hasard.

16.

Commentez vos résultats et concluez.

Barème : Question 1 Question 2 Question 3 Question 4 Question 5 Question 6 Question 7 Question 8

3 points 3 points 1 point 4 points 4 points 2 points 3 points 1 point

21 points

26

Partiel de Septembre 2007

Le directeur qualité d’une usine produisant des écrans plasma, souhaite déterminer si le nouveau composant intégré dans ses écrans augmente significativement leur durée de vie.

i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

di (heures) 25 000 32 000 35 000 22 000 18 000 39 000 27 500 26 500 31 500 28 000 24 000 35 000 41 000 27 500 25 000

16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

30 000 30 000 28 000 29 000 34 000 37 500 24 500 26 500 34 000 27 000 29 000 36 000 30 500 24 000 29 000

27

28 7. Décrivez la série ainsi obtenue en en précisant les principales caractéristiques (taille population, taille échantillon, min, max, moyenne, variance empirique). 8. Soit la proportion d’écrans : - p 0 , dont la durée de vie est au moins de 29 000 heures. - p1 , dont la durée de vie est au plus de 22 000 heures. 8.1. Précisez les échantillons. 8.2. Donnez les estimations correspondantes. 8.3. Proposez un intervalle de confiance à risques symétriques pour chacun des paramètres, en supposant que le directeur qualité tolère un risque de 10 %. Commentez les résultats ainsi obtenus. Donnez un intervalle du nombre d’écrans ayant une durée de vie d'au moins 29 000 heures. 9. Supposons que D est une variable aléatoire représentant la durée de vie des écrans, dont les d i sont les réalisations. 9.1. Calculez les estimations usuelles pour chacun de ces deux paramètres. Justifiez vos réponses afin d'expliquer toutes les formules utilisées. On notera :

E ( D) = m Var (D) = σ 2 3.2.Dans la mesure où l’on ne connaît pas la loi suivit par D, proposez une autre estimation de E(D). 3.3.Peut-on considérer que D suit une loi normale ? Justifiez votre réponse.

10.Le directeur qualité ne peut attendre les résultats et décide de commercialiser les écrans. Il s'intéresse désormais à la variabilité du rendement potentiel du produit. Le rendement est une variable aléatoire qui suit une loi normale d'espérance m=25 000 et d'écart-type σ = 5500 . 10.1. Formalisez le problème pour justifier votre réponse 10.2. Ces produits sont-ils rentables si le risque toléré est de 10 % ? Justifiez votre réponse en utilisant la Théorie des Tests (étudiez la dispersion de ces produits). 11.Peut-on commercialiser les écrans d'après les résultats précédemment obtenus ? 11.1. Formalisez le problème pour justifier votre réponse 11.2. Définissez le risque de 1ère espèce ? le risque de 2nd espèce ? 12.Qu'en concluez-vous ?

NB.1. Les cinq premières parties sont indépendantes les unes des autres. NB.2. Le nombre total d’écrans plasma produits est de 300.

Gaultier-Gaillard

Statistiques

Paris I