34 0 75MB
Indice
Introduzione 1. Statistica descrittiva
I.I Introduzione 1.2 Tipi - >(x; -- a) 2 11 L.....J i=l
it-
è minima, allora derivando rispetto ad a e imponendo che l a derivata sia nulla, si trova 2 tJ O = - - "'(x; - a) = -2(x - a) I! L.., i=}
da cui si ricava facilmente che a = .i: è il punto di minimo cercato.
Esempio 1.3 La Tabellal .6 rip011a 100 misurazioni della velocità della luce nell'aria, effettuate da A.A.Michelson nel I 879 (fonte: S .M. Stigler, The Annals of Statisties 5, 1055-I098, 1977). I dari si devono intendere, in km/s, 299000 più il valore indicato. La media di questi valori è i = 852.4 e la deviazione standard v = 78 . 6. La domanda naturale ora è la seguente: cosa sì può dire della velocità della luce nell'aria? Che informazioni si possono ricavare da questi dati? Si tratta di una questione di statistica inferenziale a cui daremo una risposta nel capitolo 5 (vedi l ' Esempio 5 . 1 9). 850 740 900 1 070 930 850 950 980 980 880 1000 980 930 650 760 810 1 000 1000 960 960 960 940 960 830 790 810
940 880 800 880 880 830
890 810 8 1 0 910 920 890
820 800 770 860 880 720
880 880 880 880 9IO 850
890 840 780 870 870 810
860 no 720 870 &,IQ 840
850 800
620 850
760 840
880 900 840 790 760 800
860 970 950 840 840 840 740 750 760 850 850 780
810 820 850 800 810 870 'fabclla L6 100 misurazioni della velocità della luce nell'aria (Michelson, 1879) . 810 760 8 1 0 740 810 940
790 950
8
Capitolo 1 Statistica descrittiva
1.6 Mediana, quantili
Dato un campione x1 , • , • , Xn si possono definire altri indici di centralità e di dispersione alternativi a media e varianza, che possono presentare dei vantaggi ed essere più appropriate in determinate situazioni. Indichiamo con X( t), . . ,, X(n) i dati del campione ordinati in maniera crescente: xm :s xm :s . . , :s X(n) . Si chiama [m�d{izìi{],] il più piccolo di questi valori che lasci alla sua destra almeno metà delle osservazioni. In particolare se n = 2k + I è dispari, allora la mediana è x(k+t) - Se invece n = 2k è un numero pari, allora la mediana è il valore X(tJ ; se n = 2k, talvolta si definisce come mediana,ìl punto medio tra x(k) e x(k+!J, cioè i (X(kl + X(k+I) ) . Media e mediana, che sono entrambe misure di centralità, non sono i n generale uguali, anche se dì solito non sono lontane l'una dall'altra. La mediana è più complicata da m aneggiare della media: ad esempio non c'è una formula semplice per il calcolo della mediana della riunione di due campioni , come abbiamo visto per la media nella formula ( 1.4). D'altra parte essa presenta alcuni vantaggi. È ad esempio poco sensibile a errori nei dati (cioè, nel gergo detla statistica, è robusta). I veri dati con i quali lo sperimentatore si trova a lavorare sono infatti inevitabilmente contaminati da errori di misurazione, di campionamento (quando si studiano gli individui di una certa specie può capitare di prendere in considerazione, per errore, individui dì una specie simile) o anche di trascrizione (uno zero di troppo, una virgola spostata. . . ), che spesso producono valori molto più grandi o più piccoli degli altri. È facile rendersi conto che l 'influenza di questi errori, da considerarsi inevitabili, è molto maggiore sulla media che sulla mediana (vedi il commento alla Figura 1.7).
i
--- �--�- � - --....C,,� •---�-•-·--·--•-- ------- ---
lc;,
Figur.1 1.7 La mediana è data dal valore di X(5) c\l è diversa dalla media. Se poi facessimo cr - x0 >; si tratta di un indice di dispersione, che ha il vantaggio di essere facile da calcolare. È però un indice grossolano, molto sensibile agli errori nei dati descritti precedentemente. _ ________ _ , .- --- ____ Un indice di dispersione più efficiente è invece l'ampiez7�, dell';.i11te,:vallo i11terquarti/e , che
ora vediamo. Se O < a < I ,si cl1iama Q U A N T I L E di ordine a il nume�o q0 =-X(i) dove i = o:(:i + I) se a(11 + 1) è intero; altrimenti, cioè se av,+ l) non è intero, si sceglierà i uguale al numero intero immediatamente più piccolo oppure più grande di 0:(11 + I) (a seconda dei testi le definizioni possono variare), cio� i = la(11 + l )J , oppure i = La(11 + l)J + l , dove l J
1. 7 Correlazione e regressione
9
tra X la(n+ I JJ e Xta(n+IJJ l , calcolato in maniera opportuna. Grosso modo q" è un numero che ha alla sua sinistra an +elementi del campione (�___Q_l!ll_qtJe (1 - a)n alla sua destra). In questo senso la_ mediana � il quanti�e q1 12. Si chiamano �à� i quantili q 114 , q214 (cioè la mediana) e q3i4 · L'intervallo mterquarule [ql /4• q314J contiene al suo interno dunque metà delle osservazioni. L'ampiezza qJ/4 - ql/4 dell'intervallo interquartile è una misura della dispersione che non ha i difetti che avevamo riscontrato per il range . A partire dalla mediana e dai quantili è possibile costruire un grafico che dà un'idea abbas tanza i mmediata del valore di centralità e della dispersione del campione, ed permette anche di confrontare più campioni tra di loro. Esso è presentato nella Figura 1.8: per ogni campione viene costruita una scatola le cui estremità inferiori e superiori sono rispettivamente il primo e il terzo quartile. All 'intcmo della scatola è tracciata una linea in corrispondenza della mediana; al di fuori' della scatola vengono tracciali due segmenti rispettivamente tra il primo quartile ed il più piccolo valore delle osservazioni ed il terzo quartile ed il valore più grande . La distanza tra le estremità di �ll�ti-�� menti è dunque il range. Nella letteratura anglosassone questo tipo di grafici si chiama i boxplot !. Esempio 1.4 Le misurazioni della velocità della luce riportate nell 'Esempio 1 .3 in realtà si riferiscono a 5 gruppi
O, O, allora
e, derivando,
G(t)
= P(aX + h .:5 t)
= P(X :5 1·;/ )
= Fx ( ':b )
g(t) = G' (t) = � f('-/) .
Se invece a < O, bisogna stare attenti al cambio di verso nella disuguaglianza:
e quindi
G(t) "' l'(aX + b :5 t) = P(X ?: ';b ) = I - Fx(!.'f!-!) g(t) = G'(t) = -� f( r-1, ,, ) .
a Mettendo insieme i due casi si ha, qualnnque sia il segno di a,
4.10)
4.2 Calcolo di leggi
81
In particolare, se scegliamo a = - 1 e b = O, troviamo che -X ha densità g (t) = J(-t) . Dunque se la densità J è una funzione pari, le due v.a. X e -X hanno la stessa densità. Si dice in questo caso che X è Gr;;J;;�fri;;':.
La nozione d'indipendenza di v.a., che abbiamo visto per le v.a. discrete nella Definizione 3.19, si può dare anche per il caso generale (cioè per v.a. non necessariamente discrete). In generale vale la definizione seguente, che si potrebbe d imostrare che implica la Definizione 3.19 se le v.a. sono discrete.
\ t e Y > t . Dunque, per t > O, 1 - Fw(t) = P( W > t) = P(min(X, Y} > t ) = P ( X > t , Y > 1) = P(X > r)P(Y > t ) = e -i,e- 1"
da cui, pc. r > O, Fw (t) = I - c·--Arc -w = I - c··().+µ )r. Dcrivaudo troviamo che la densità di W è, sempre per 1 > O, (À + µ) e-P-+1•l' : W è anch 'essa cspone117jaJe, ma di parametro )._ + µ .
J
82
Capitolo 4 Modelli continui
*4.3 Densità congiunte
Come nel caso discreto è opportuno studiare delle v.a. multidimensionali. Supponiamo ad esem' pio di considerare due dispositivi indipendenti aventi tempi di rottura esponenziali di parametri >,_ e J.L rispettivamente. Qual è la probabilità che il primo si rompa prima del secondo? A quest; l '. domanda sarà facile rispondere con le nozioni di questo paragrafo. Sia (Q, .11., P) uno spazio di probabilità e Z ; Q -,. JR"' un'applicazione. Ricordiamo (Definì.: zione 3.15) che Z è una v.a. m-dimensionale se le sue componenti Z1 , . . . , Zm sono delle v.a: (reali). Per semplicità nel seguito supporremo m = 2 e indicheremo con ?[. Y le componenti dellà v.a. bidìmension�le Z = (X, Y) . Diremo che X e Y hanno \de,j�itp!'�qfz� f. f ; �2 -.- R, se f è integrabile, positiva e tale che, per A e IR.2 (4 . 1 1)
P((X, Y) e: A) = P(Z E A) cc
Scegliendo A = JP..2 si vede subito che deve essere (4. 12)
f
]p,.2
i
f(u, v) du dv .
J(z) clz = I .
Osservazione 4.S Se le v.a. X e Y sono discrete, abbiamo visto nel capitolo 2 che l'insieme
((X, Y) E A} e Q è un evento, qualunque sia il sottoinsieme A e JR . Se X e Y non sono discrete I ciò non è più vero in generale e si conoscono esempi di sottoinsiemi A e iR tali che {(X, Y) E A} ; 2
non è un evento (e tali quindi che non si può calcolare la probabilità P((X, Y) E A)). Dctcrminare qualì siano i sottoinsiemi A e lft2 tali che { (X, Y) E A) sia un eventoè un problema che va al dì là degli scopi di questo testo. Si può però dimostrare che perché ciò sia vero basta che A sia un sottoinsieme di JR2 abbastanza regolare. In particolare {(X, Y) E A} è un evento se A è uno dei sottoinsiemi di 11{2 che s'incontrano nei corsi sugli integrali multipli. Una questione simile si presenta quando, data una funzione ip ; H.2 -> JR, si considera l'applicazione Y) = À/L
1 0
+00 dx
1+00 .t
e-À. O e definita arbitrariamente (= O ad esempio) se fy (y) = O. Analogamente, scambiando i ruoli di X e Y , si definisce la densità condizionale di Y dato X = x. Come conseguenza della (4.13) si vede subito che se jy (y) > O allora
1
00
fxp· (x lY) dx = r f (y) -= + _
dunque x ➔ fxtY (x)y) è una densità.
1
/
f (x, y) dx :c l
4.3 Densità congiunte
89
Intuitivamente fx1r( ·IY) è la densità di X quando si viene a sapere che Y ha preso il valore y. Se X e Y sono indipendenti, allora per la (4.16) fx 1r (x!y) = fx(x) e dunque la conoscenza del valore assunto da Y non modifica la previsione del valore assunto da X, in accordo con il significato intuitivo della nozione di indipendenza. Esempio 4.19 Se X e Y sono uniformi sul cerchio come nell'Esempio 4.lO e -1 ::: y :e: l allora altrimenti
ovvero la legge condizionale di X dato Y = y è la distribuzione uniforme su [-�.
/I=:v2' i.
La (4.20) permette di calcolare l a densiià condizionale a partire dalla densità congiunta ma anche, viceversa, di calcolare la densità congiunta qualora i dati del problema forniscano la densità di Y e la densità condizionale di X dato Y, poiché evidentemente f(x, y) = fx1Y (x)y) fy ( y) .
Esempio 420 Il tempo di vita di un componente elettronico dipende dalla concentrazione di silicio nel materiale di cui è fatto; più precisamente esso ha legge esponenziale di parametro À, dove .l. è appunto il valore di tale concentrazione. Una macchina produce questi componenti, ma nel processo produttivo non è possibile controllare la concentrazione di silicio che pertanto si può considerare una variabile aleatoria, che indicheremo con A, uniformemente distribuita su [O, l ] . Indichiamo con Y i l tempo d i vita del componente prodotto. Qual è la legge d i Y? I dati del problema permettono di affermare che se y ::: O altrimenti .
Tenendo conto che A è uniforme su [O, 1], la densità congiunta f dì A e Y vale dunque _ j(À, y) = { >-- e-) y se � ::: O, _ O :::: >-- :: l O altnmenl! ,
Il calcolo della densità di Y si riduce ora a quello della seconda marginale di f, che si fa facilmente usando la (4. 1 4). Il calcolo numerico dà, con una integrazione per parti, fy (y) =
t
lo
À e-1->' dÀ = � ( 1 - y e-Y - e-Y)
per y > O, mentre Jy(_y) = O per _y :'.': O.
Y
Come nel caso discreto, spesso si deve calcolare la densità della sonuna di v.a.
90
Capitolo 4 Modelfl còntlnui
:Consideriamo il vettore Z = (X, Y) e la �nzione ,j, �x, y) _=_x + y. La regione I& dèhpianq:dei,punti"(x, y) tali che q', (x, Y! = x + y :'.S t non e altro c he 1! sem1pian A che • trova � � fsinistiadella:retta x + y = t (ombreggiato nella FJgura 4.8). Dunque la f.r. G di X + Y e •�i(t)
oo
= P(X + Y s t) = P((X, Y) E A) = fJ f(x, y) dx dy ""' 1-: ,\
x
dx 1-: f(x, y) dy .
x -t- y = t ✓
Ma, con il cambio di variabile z = y + x, 11-X _
00
f (x, y) dy =
1'
_00
f(x, z - x) dz
(in questo integrale la variabile d'integrazione è y mentre .x è una costante). Riprendendo il calcolo e cambiando l 'ordine d'integrazione G (r) =
l 1/-x + -+oo oo =
dx
-=
f (x , y ) dy =
1' 1 "" -oo
dz
dx -oo 1'-oo f(x, z - x) dz = 1+00
f(x, z - x) dx =
che esprime appunto il fatto che g è la densità di X + Y . -CX)
1'
-cc
g(z)dz
Esempio 4.22 Siano X , Y indipendenti e csponenziali di parametro ).. _ Qual è l a densità d i X +Y? Poiché X e Y sono indipendenti, la loro densità congiunta è f(x, y) "" fx (x) fy (y). Dunque per il Teorema 4.21 la densità g della loro somma è g (y) =
f
fx (x ) fy (y - x) dx .
Osservi�mo che fx (x) = O per x :'.S O e anche che fy (y - x ) = O a meno che non sia y - x > O ovvcro x < y . Dunque nell'integrale precedente l'integrando è diversoda zcro solo se O < x < y . Per questi valori di x e y inoltre si ha fx (x)J.,. (y - x) "" À2 e-J.xc-!.(y-x) = À2 e-J.y . Dunque
Il problema del calcolo della densità della somma di due v.a. è una questione che si presenta
4.4 Leggi normali
91
calcolo di un integrale che non sempre si riesce a fare. Vedremo più tardi altri metodi che, talvolta, possono portare al risultato più rapidamente.
4.4 Leggi normali
Si può dimostrare che la funzione (4.21)
f (x) = __I___ e-x /2
./2ir è una densità di probabilità (cioè che il suo integrale da -oo a +oo è uguale a I). Essa è il prototipo di una classe importante di distribuzioni. Se X è una v.a. di densità f e O , allora sappiamo, grazie all'Esempio 4.5, che l a v.a . ha densità (4.22)
2
2 I V - µ, l (y - µ,) g ( y) = iai 1 ( � ) = JTii e-1 /2 è una funzione pari, per l 'Esempio 4.5 con a = - 1 e b = O, si vede che e X ~ N(O, 1 ) , allora le due v.a. X e -X hanno la stessa legge e dunque la legge N (0, 1) è immetrica. Da questa proprielil si ricava la relazione
4.2 3)
${x) = P(X :::: x)
= P(-X :::: x) = P(X � -x) = l -- P(X :,: -x) = I - (-x) .
Esempio 4.23 Quanto vale la probabilit11 (- 1.05}
= P(X :::: - 1 .05} per una v.a. N (0, ])? Quanto vale i l quantile di ordine 90% di una v.a. N (O, l)? Uno sguardo alla tavola a p. a-1 mostra che essa riporta i valori di (t) solo per valori positivi i t. La quantità P(X ::::: 1 .05) vale 0.853 14 (all'incrocio tra la riga che comincia con il valore 1 .0 la colonna che porta in alto il valore .05). Dunque, grazie alla (4.23), otteniamo (-1 .05) = - (1 .05) = 0. 147 . Invece il quantile di ordine a = 0.9 è qnel valore di t tale che (I) = 0.9. Cerc�ndo sulla tavola trova che ( 1.28) = 0.899, mentre (1 .29) = 0.90 1 . Dunque il quantile cercato è compreso a 1 .28 e 1.29. Con un software adatto si troverebbe subito il valore 1 .281 5 .
a (4.23) permelte di ricavare alcune relazioni molto utili per i quantili. Indichiamo con t/>a il uantile di ordine a della N(0, 1 ) . Ricordando che il numero O,
r(l)
=
1+oo
e--' dx = l
(4.27)
Da (4.26) e (4.27) si ha facilmente, per ogni intero positivo 11, f (ll) = (ll - 1) ! .
Se a > 0 e À > O , chiameremo [deiisità GÌllimici) di paramelri a e À (oppure diremo che è r (cr, À)) la densità "' -- x"-l e-/.x x > O f(x) = '(a) · � altrimenti . Osserviamo che per a = I ritroviamo le densità esponenziali.
{ À
Figura 4.13 Grafico di densità Gammn per ).. = 2 e diversi valori di a.
Osservazione 4.24 Se una densità g è della forma
se x > O altrimenti
dove e è una costante positiva, allora g è necessariamente una densità f(a, À) e e = J...a/ f (a). Infatti, poiché g è una densità, con il cambio di variabile Àx = y, e dunque e = Àa / f(a).
Esempio 4.25 Sia X una v.a. N(O, a 2); allora (Esempio 4.4) X2 ha densità per y > O mentre g(y) = O per y � O. Poiché g è una densità (è la densità di X2 ), per l'Osservazione 4.24 g è r(½, �) ed inoltre scopriamo che l'( ! ) = ✓ii.
Una proprietà importame è la seguente.
f � l i 1 f t � � ; f 1 � � ; 5 �; � � , � �!i
' l·.· ����� '.;
'.'.: , : •� · :: ," '' (
Mdli � (La dimostrazione fa uso di no:lioni .introdotte nel paragrafo 4.3; vedi l ' Esempio 4.46 per una dimostrazione diversa) Cominciamo con il caso m = 2 e indichiamo con / , h le densità f'(a1 , À) e f(a2, À) rispettivamente. Per la Proposizione 4.21 la densità g di Xi g (y) =
l
cc f1 (x) h (y - x) dx .
+oo
1
+ x2 è
4.5 Leggi Gamma
95
Tenendo conto che sia fi che fz sono nulk per valori negativi della variabile, l'inregrando si annulla al di fuori dell'intervallo [O, y] e
Con il cambio dì variabile x = ty si trova
Quindi per l'Osservazione 4.24 g è una densità f (c, 1 + a2 , À) e per di più vale la relazione
(4.28)
per ogni a 1 > O, a2 > O. Abbiamo quindi completato la dimostrazione nel caso m = 2. Se m = 3, basta osservare che X 1 + X2 e X3 sono indipendenti per l'osservazione successiva alla Proposizione 4.18. Applicando due volte il risultato sulla somma di due v.a. si ha e iterando questo ragionamento si ha la tesi.
Non ci sono formule semplici per la funzione di ripartizione delle leggi Gamma, a meno che a non sia un numero incero. Infatti esiste una relazione di ricorrenza tra le funi.ioni di ripartizione: indichiamo con Fa la f.r. di una v.a. f(a, ),) , si ha allora, per x > O,
che per a = m intero diviene (4.29)
r",., (X ) = -
(ì.xr~ t e ÀX + l' 'm- t (X) • (lii _ l ) !
Poiché sappia1110 già che per 111 = J , cioè le leggi esponenziali, (4.30)
96
Capitolo 4 Modelli continui
terando la (4.29) otteniamo
4.3 1)
m- 1 Àx . = - (Àx) F,,, (x) e - + Fm__ 1 (x) = (m - l ) !
ÀX m - 1 ' m- 1 ()..x ) m-2 _ . _ -( ) c >-x c > x + Fm -2 (x) = . . . = J - e->-x L (Àx) · - (m - l ) ! � (m - 2) ! k=O
Esempio 4.2.7 Una lampada ha un tempo di vita che segue una legge re i4 ) . Appena si guasta iene sost1tu1ta con un'altra. Qual è la probabilità che IO lampade non siano sufficiellli per un nno (= 365 giorni)? Supponendo i tempi di vira delle IO lampade indipendenti, il tempo di guasto della decima ampada si rappresenta con una v.a. Z ~ r{5, ,k ) . II valore richiesto dunque non è altro che (Z .S: 365), cioè il valore della f.r. F di Z calcolata in x = 365. Con uno dei software indicati opra si ottiene F(365) = 0.55.
i,
e leggi Gamma quando il parametro cx è intero si chiamano anche i leggi di Erl;;;g,_ Si chiama nvece legge del [�,;�;�J;:;;i�j con n gradi di libertà e si indica co� �2 (11) una legge re 2, il �r l 'Esempio 4.25 e la Proposizione 4.26, r(,:, è la densità di una v.a. Y della forma y = Xj + . . . + X� dove X 1 , . . . , Xn sono v.à. i ndipendenti e N(O, I ) .
!)
.6 Il Processo d i Poisson, processi di arrivi
elle applicazioni 1alvoltaoccorre rnodellizzare un processo di arrivi. Esempi di queste situazioni ono gli arrivi di telefonate a un centralino, l'arrivo di nuovi clienti in una fila d'attesa, di veicoli un incrocio, il prodursi di guasti in apparecchiature. . . Un approccio per modellizzare queste situazioni consiste nel considerare una succc�sione di a. S1. S2 . . . a valori ':: O, che rappresentano i tempi che intercorrono tra due arrivi successivi li "intertcrnpi"). Dunque il primo arrivo avviene al tc"n-tpo S 1 , il secondo al tempo S1 + S2 e così a. Il tempo dello n-esimo arrivo è dunque T,, = S 1 + . . . + Sn . Lo studio di questi processi ha to luogo ad una teoria molto avanzata che va al di là delle possibilità di qucsl_i agpu nti, possiamo rò vedere _una proprietà impo�ante di un partic�l �e proces �o di arrivi, il_ [Er��e.i-.fo' d{Poissa.fi} c Questo s1 presenta quando st suppone che gli 111tcrtemp1 s1 , s2 . . . s1anoìrul 1pcndenti Oi nsità esponenziale di parametro À > O fissato. Sappiamo allora, per la Proposizione 4.26, che - f(k, À). Qual è la probabilità che, per un processo di Poisson, nell'intervallo di tempo [O, t] vi siano attamente k arrivi ? Se indichiamo con N, i! numero di arrivi nell' intervallo di tempo [O, t], dobbiamo calcolare probabilità P(N, "' k) , ovvero la densità (discreta) di N, . Poiché 1� è il tempo dello ,,-esimo rivo, un attimo di riflessione mostra che
{N1 _s; k} = {Tk I > t) . + fatti, dire che N, S k equivale a dire che il (k + i)-esimo arrivo ha avuto luogo dopo il tempo Poiché Tk ~ f(k, ).) , la sua f.r. Fk è quindi data da (4.31) e dunque
P(N, .S: k) = P(Tk I >
t)
= I - l�+I (t) = e ~J.r
L (�? k
4.6 Il Processo di Poisson, processi di arrivi
97
Riconosciamo a destra la funzione di ripartizione di una legge di Poisson di parametro J..t . Dunque N, è di Poisson di parametro Àt e P(N, = k) = e-À,.
Q{f-
Il processo di Poisson è l'esempio più importante di processo di arrivi e costituisce un modello soddisfacente in molte situazioni applicative. Tuttavia il fatto che gli intertempi siano modelliaali da v.a. esponenziali l o rende poco adatto, ad esempio, nei problemi di affidabilità, in cui gli "arrivi" sono i guasti di apparecchiature. In questi casi, se usassimo la legge esponenziale per modellizzare il tempo di vita, la proprietà di assenza di memoria affermerebbe che la probabilità di guasto in un intervallo ]t, t +h] di un'apparecchiatura che è stata in funzione nell'intervallo [O, t}. non dipende da quanto sia grande t , cioè non dipende da quanto tempo l'apparecchiatura sia stata in servizio. Spesso invece è ragionevole supporre che ci sia un effetto di usura e dunque che la probabilità di' guasto in un intervallo ]t, r +h], di ampiezza h fissata, aumenti al crescere del tempo r, trascorso dal momento della messa in servizio. In questi casi, quale densità è ragionevole attribuire agli intertempi Sk '! Supponiamo che Sk abbia una densità continua f e chiamiamo F la sua f.r. Osserviamo che l a probabilità che un'apparecchiatura s i guasti nell 'intervallo d i tempo ]1, t + h] sapendo che è staia in funzione nel periodo [O, t} è data da P(Sk :e: t + h I Sk > t) =
l'(t -< S - < t --t- h) P(S: � t)
=
1,-;./,
l I _ F(I) '
Se h è piccolo e f è continua, questa probabilitii è dell'ordine di
j (s) ds .
h f(t) "f=""F(t)
Poniamo allora (4.32)
r(l) =
_fl!l_ 1 - F(t)
La funzione ,- si chiama il ftasso istantaneo di guasto i ( i11stantaneousjail11re-��t� ;, i.f.r. in in glese) della densità f. Vol�nèlo moclclhzzare 1!"temp� d1 v1taO
98
Capitolo 4 Modelli continui
e F(t) = O per I ::o O. Facendo il quoziente, si vede subito che la densìtà / ha proprìo i.f.r. uguale a r. Non è difficile di mostrare anzi che questa densità è l'unica avente i.f.r. r. In particolare le densità esponenzi ali sono le uniche ad avere i.fa. costante.
Esempio 4.28 Per À, f3 > O fasati, consideriamo la funzione r : R+ ...... JR+ r(t)
=
"iiÀ r - I /J
Qual è l a densità f avente r come i .f.r.? Si ha facilmente J; r(s) ds = À 1P e, come abbiamo vìsto,
(4.33)
1>0
e / (1) = O per t :,: O. La f.r. è invece F(t) = 1 - e-M" per t > O. La densità definita dalla (4.33) si chiama di [@j_pÈf] di parametri À e /3. Si vede subito che, se /J > 1 , lo i.f.r. è crescente (per f3 = I ritroviamo le leggi esponenziali) e quindi si tratta di densità adatte a model!izzare fenomeni di usura. Per f3 < 1 invece lo i.f.r. è decrescente in I; pensando all 'esempio dei guasti, l 'apparecchiatura diventerebbe sempre più affidabile al passar del tempo. È meno immediato i mmaginare una situazione di questo genere, ma, pensandoci bene, nella realtà un apparecchio appena messo in servizio può nascondere dei difetti di produzione che si manifestano nei primi tempi di servizio; è quindi ragionevole pensare che un apparecchio che ha superato senza inconvenienti il primo periodo di funzionamento debba essere considerato più affidabile di uno nuovo di fabbrica. Le leggi d i Weibull sono l'oggetto degli Esercizi 4.12 e 4.46.
A voler essere realistici, per modellizzare il tempo di vita di un 'apparecchiatura, Io i .f.r. dovrebbe avere un andamento come quello della Figura 4.14: decrescente per t piccolo, crescente per t grande e senza grandi variazioni per valori di I intermedi.
I
Figura 4.14
4.7 Speranza matematica, momenti
In questo paragrafo definiremo la speranza matematica delle v.a. assolutamente continue. Sia X una v.a. òi densità (continua) J. Si dice che X ha speranza matematica finita se e solo se
1
co lxlf(x) dx < +oo . -+00
4.7 Speranza matematica, mo01_enti__�
Se X ha speranza matematica finita si ch iama fillf�I!�a;effjifi(!)i. p'i�çp_,j di X la quantità . (4.34)
E[XJ =
1
oc xf(x) dx . -+00
In altre parole la speranza matematica è data dalla (4.34), a condizione che_l'integrale converga assolutamente. Il significato intuitivo della speranza matematica come media dei valori assunti da X è abbastanza evidente anche nella (4.34). La speranza matematica delle v.a. assolutamente contìnue gode delle stesse proprietà che abbiamo visto per le v.a. discrete. Non ne daremo la dimostrazione.che pure non è particolarmente complicata e consiste nell'approssimare le v.a. a�solutamente continue che stiamo considerando con delle v.a. discrete, alle quali si appl i cano i risultati citati.
Esempi 431 a) (Distribuzione uniforme su [O, 1)) Una v.a. X uniforme su [O, l] ha una densità f che vale I su [O, l ] e O fuori di [O, l]. Dunque E[X] =
1
o
1
1
x dx = - ·
2
b) (Leggi nonnali) Calcoliamo la speranza matematica di una v.a. X di legge normale N (µ., a2) . 2 Trattiamo prima i l caso X ~ N(O, 1 ) . Poiché x ➔ x e -• /2 è una funzione dispari (tralasciamo, qui come negli esempi che seguono, la verifica che gli integrali convergono assolu tamente). Se invece Y ~ N(µ., a 2 ) allora, poiché Y = a X + µ, dove X ~ N (O, I ) , E{Y] = aE[X] + µ. = µ. .
00
Capilo/o 4 Modelli continui
:J!e,fftCc:l_i .densità fx è. jy. rispettivàmcnte: Se esse hanrìò'. :iÌ-:;furb'prodottò XY ha speianzil 'm• atenìJÙcà finii� e [J •
,,,i;:f/?;\?t•�>,;,• �:-�::; .•�• :•.�:')� ,• .: '. �r�YJ::;: E�x;J �rp :::
•
V•. :�
:-,,,:i
Teorema 433, molco simile a l Teorema 3.3 1 che avevamo visto nel caso discreto, è anch'esso olto utile: supponiamo di dover calcolare la speranza matematica di una v.a. Y = (X), che è na funzione di una v.a X di cui conosciamo la densità fx - Se applicassimo la definizione (4.34) ovremmo prima calcolare la densità, Jr , di Y e poi l'integrale f tfy(t) dt .
Teorema 4.33 ci dice che si ottiene lo stesso risultato facendo l'integrale
parmiandoci quindi il calcolo di fy .
j
if> (x)fx (x) dx
empio 4.34 Supponiamo che X sia uniforme su [O, I]. Quanto valgono E[sin(2rr X)] e E[ex]? Usando il Teorema 4.33 si trova subito I E[sin(h X)J = sin(2rrx) dx = O
lo I E[e ] = fu e dx = e - l . x
-
,._,C(I E(X 1 ) , sempre in probabilità. Quindi, ricomponendo il binomio,
-¾
t
(';) E(X})(-E(X i))"' -k = t ( X; - X,.)'" �"' " ; �1 k=O
= E[f, (';) x}(-E(X i ))'"-t] == E[ (X 1 - E(X 1 ))"') . k=O
112
Capitolo 5 Convergenza e approssimazione
Dunqùc, se x1 ha momento di ordine 2m finito, le v.a. definite nella (5.3) convergono in pro babilità, ·per ,r -> oo, al momento centrato di ordine m. Quindi la Legge dei Grandi Numeri afferma che, nelle condizioni che abbiamo detto, i momenti centrati delle osservazioni sono una approssimazione dei momenti centrati della legge delle osservazioni. Osserviamo comunque che, qui come nel!'Esempio 5 .3 e nel successivo Esempio 5.5, usiamo, d�ndole per scontate, alcune intuitive proprietà della convergenza in probabilità che andrebbero però dimostrate. In particolare che, se (Xn )11 e (Y.) 11 sono successioni di v.a. convergenti in pro babilità alle costanti x e y rispettivamente, allora (Xn +Y,.),, e (Xn Yn )n convergono, i n probabilità, a x + y e xy rispettivamente.
Esempio 55 (Convergenza di skewness e kurtosi) Sia (X,. ). una successione di v.a. indipendenti e aventi la stessa legge. Supponiamo inoltre che E(Xf) < +co. Allora, grazie all'esempio precedente, se consideriamo l' indice di skewness di X 1 , • . . , X. ,
(5.4)
Yl, n
3 = I (X; - X.) = ( 1 ¼ L; n - , ) 3(2 ,i Li=! (X; - X,.)-
esso converge in probabilità, per 11 ---,. oo, a
E[(X1 - E(X 1 )) 3 ] E[(X 1 - E(X 1 )) 2]3/2
5.5)
, in maniera simile, per l'indice di kurtosi, Y2,n
¾ I:;'= 1 (X; - X,.) 4
= 1
( ,. I:;'= I (X;
- Xn) 2)2
-
3
p -> n -H>O
E[(X 1 - E(X 1 ))4] E[(X1 - E(X 1 )) 2] 2
3.
Quindi skewness e kurtosi delle osservazioni sono stime della skewness e deJla kurto5i della loro distribuzione (definite rispettivamente negli Esercizi 4 . 1 3 e 4.45).
Supponiamo di osservare delle quantifa X t , . . . , X,. , che si possono considerare indipendenti cd aventi la stessa densità. Sì può dire che questa densità sia gaussiana? Una prima verifica i può fare calcolando l ' indice di skewncss (5.4). Osserviamo che, se X 1 ~ N(µ., a 2) , allora X1 - E(X 1 ) ~ N(O, a 2) e si può scrivere X 1 - E(X i ) ~ aZ, con Z ~ N (O, 1). Dunque E[(X 1 - E(X 1 ) )3 ] = a3 E(Z3 ) = O e la quantità in (5.5) è uguale a O (vedi anche l'Esercizio 4.13). Se 11 è grande, l'indice di skewncss (5.4) del campione deve quindi essere vicino a O. Una seconda verifica si fa considerando l'indice di kurtosi: con le stesse notazioni di poco fa, E[(X 1 - E(X 1 ))4] = a4E(Z4 ) = 3a 4 (vedi la (4.37)). Dunque, se Xi ~ N (µ., a 2) , E[(X 1 -- E(X1))4] _ 3 = 3a 4 _ 3 = O a4 E[(X 1 - E(X 1 ))2)2
, se le osservai ioni X t , . . . , X,, provengono da una distribuzione gaussiana. per n grande l'indice i kurtosi del campione deve essere vicino a O. Queste considerazioni hanno finora un valore solo esplorativo (non sappiamo precisare cosa ignifichi "vicino"). Ritroveremo comunque il problema di vedere se le osservazioni seguono una istribuzione gaussiana negli Esempi 5.7 e 5.8.
I·
5.1 La Legge dei Grandi Numeri: applicazioni
113
Esempio 5.6 (Convergenza degli istogrammi) Consideriamo una successione X 1 , X 2 - . . d i v.a. i ndipendenti e aventi la stessa densità continua f . Fissiamo un intervallo limitato [a, b] , che suddividiamo in sottointervalli Ii , . . . , h. Per ogni h = 1 , .. . , k poniamo Z;, = n1 � L., l 1. (Xi ) . i=l
:[;'= 1 I 1• (Xi ) è il numero di volte che X; E Ih , i = 1, . . . , 11, e zt> è dunque la proporzione delle prime ,r osservazioni X 1 , . . . , X. i cui valori si trovano nel!' intervallo /h , Si è soliti visualizzare le v.a. ztl, . . . , zt> costruendo al di sopra dell'intervallo /1, un rettangolo di arca proporzionale a zt>; se gli intervalli /1, sono di uguale ampiezza ciò significa naturalmente che le altezze dei relt�ngoli sono proporzionali a Zi''). La figura che ne risultasi chiamafù1Jg}�-;;;;;�ì, che abbiamo già incontralo nel paragrafo 1 .4: si tratta di un metodo molto usato per claréunade.fcrizione visiva di come sono ripa1titi i valori di X 1 , . . . , X,, .
2 O Figura 5.1 Istogramma di 200 osservazioni ìndipendcnci di legge r(3, l), a confronto con la relativa densilà.
------ --- ------- - -�- - -� ---Figura 5.2 Istogramma di 4096 valori simulati con il metodo di Box-Muller (vedi p. 105) a confronto con la densità N (O, I) . Per 11
- >
cx, la Legge dei Grandi Numeri afferma che
zt)
i
11-+co
E[ t ,. (X; ) ) � P(X;
E
I,, ) =-= J J(x) dx _ f1t
Se gl'intcrvalli li, sono abbastanza piccoli, in modo che la variazione di f su l;, sia piccola, allora i rettangoli dell'istogramma tenderanno ad avere altezze proporzionali ai corrispondenti valori di
·e:dèlle informazioni sull'andamento di f. 'fog;-ammi confrontati con le relative densità.
\iÌi) Siano X 1 , . . . , Xn delle v.a. indipendenti , aventi tutte la crè'ia"; poco importa). Indichiamo con F la loro f.r. Se poniamo vede subito che E( l ,1, (X 1 )) = P(X 1 ::': t) = F(t) . I n "' 1 A, (Xk) n-)-OO � E ( l A, (X 1 )) = F(t) . 1l- L.,,
· Indichiamo con F,, (t) il termine a sinistra nella (5.6), cioè k=I
- . � 1 F,,(t) = Ii L I A, (X.) = ;, x numero di indici k tali che X; ::: t . ,
F,, � una fu,�zionc di t eh� si chiama la !JJ/!.!_if..o_:�:_1i ripqrtizion;· �,�pi;;;;;;. Un altro modo, per _ _ certi v�r�1 più sempl '.ce, �1 v_c?ere la stessa cosa è ìl segue111e--:-friiiicliiam-o con X { !) , . . . , X(nl i < numen Xl , - . - , Xn nordmal! rn senso crescente: X (I) sarà quindi il valore più piccolo e X (Il X(2) ::: . . . ::: X(n) · Allora è chiaro che k�I
l\ (t) = � .
mentre FnU) = O per t < x{I ) e Fn (t) = 1 per X(n) ::: t . Infaui s e x(k) ::': t < x(k+ I), c i ò vuol dire che v1 sono esattamente k i ndici i tali che X; :': t e dunque 1 11 k - "' lA 1 (Xk) = Tl L,__;
n
k=I
S �Uolin�iamo comunque che, per ogni valore di t, f.,, (t) è una quantità aleatoria, perché dipende dai valon :: 1 , . • . , Xn - Dunque la (5.G) non fa che affermare che, per ogni t fissato, la f.r. empirica co11verge m probabilit?i alla f.r. F.
�-
_ f;,--�------,
--�·�_ ,. . -: · ·
- ;· · ·r·- - -�
- - - ���-- .
-j·--+-------1..-t---t------+---+--X(J)
Figura 53 Escmpio di funzione di ri artizione cmpirica per un campione di rango 7 di una legge _ _ d1pnpart,z10 _ N(O, 1), a contronto con la funzione nc teonca (a puntini). X(I) X(2)
X(4)
X(SJ
X(6)
X(1)
. 1_L_a__e 5_ -- - ---- -------�--_ L ....cgc..cgc...e_dei Grandi Numeri: applicazioni
115
Queste osservazioni hanno delleconseguen,e pratiche inleressanti. Talvolta, in presen,a di dati sperimentali X 1 , . . . , X. , ha un interesse di stabilire se essi seguano una distribuzione assegnata, N(O, 1) ad esempio. Se così fosse, per II abbastanza grande, per la Legge dei Grandi Numeri, la differenza tra la f.r. empirica f,"';, e F deve risultare piccola. Se F = ( è al solito la f.r. della densità N(O, !)), poiché sappiamo che F,, assume il valore f nel punto X(i) , ciò vuol dire che i numeri � e (XciJ ) devono essere vicini. Applicando la funzione (X(i) ), otteniamo che anche i due valori e
devono trovarsi vicini tra loro. Il punto - 1 (f) è i l numero in cui la f.r. prende il valore h e dunque non è altro che il quantile 365). Usando le tavole della legge normale e la {5 .8)
lt;
P(X 1 + . . + X40 > 365) = l - P(X 1 + . . . + X40 :,: 365) 1'S
__.;:.--- r- --.. (·\
/'- . - · - ....
,,, ..
�tJ3 -
,
· ··''�-.,.
Figura 5.9 Andamento della densità di s,; per vari valori di n, quando le v.a. X; sono indipendenti e uniformi su {-� , ½J. Per n = 2 si trova il classico grafico "a casetta", vedi anche l'&ercizio 4.24. Gli altri grafici sono per n = 3 (a trattini), 11 = 6 (trattini e puntini) e n = 12 (tratto pieno). Si vede che al crescere di II il grafico assomiglia sempre di più a quello di una N(O. !). Il grafico di quest'ultima non viene tracciato perché sarebbe indistinguibile da quello per 11 = 12. Da notare che il Teorema 5.12 g_ar:mtisce_ la conve:genza d_ellc funzioni di ripartizione e non quella delle densità: per quest'ultimo nsultato c, sono alto teoremi che non affrontiamo ma che valgono, ad esempio, per le densità uniformi su [ ½] di ques10 esempio.
-½,
· "" I -
28), dove le X; sono indipendenti e B ( I , ½)- Sempre sando l'approssimazione normale (5.8), P(X 1 + . . . + Xso > 28) = I - P(X 1 + . . . + X50 :': 28) "" 28 - 50 - 0.5 "" l - ( ---- ) = I - (0.85) = 0.2 . .Jso . o.5
e avessimo calcolato numericamente la f.r. della densità B(50, ½l, avremmo ottenuto come sultato 0.16. Osserviamo però che, poiché le X; assumono valori interi , P(X 1 + . . . + Xso > 28)
l 'approssimazione normale darebbe ora
= P(X 1 + . . . + Xso > 28.5)
P(X1 + . . . + Xso > 28.5) = I - P(X 1 + . . . + X50 :'.:' 28.5) "" 28.5 - 50 · 0.5 e:;: I -· ( --=--- ) = I - (0.99) = 0.1 6 . .Jso . o.5
generai � cu � v.a. a valori interi si ottiene una migliore appros�jmazione scri�cn,,➔oo a2 in probabilità, anche s; -> n➔oo a 1 in probabilità. .2) = E(s,,
Torniamo al calcolo degli interval li di fiducia per la media. L'idea come abbiamo visto è semplice: sostituire nella (5.10) alla quantità sconosciuta a con la sua stima s11 • Si può dimostrare che, se (Xn) n è una successione di v.a. indipendenti di legge N(µ, o-2), allora la v.a. (5 . 14)
I- -,,11
- 11. x,.- s,.
seoue una leooe che si chiama i t tli Student ! con n - I gradi di libertà e si indica con il simbolo �(� - I ) . No�è difficile dare un�dcÌìnÌzio�;·rigorosa di queste leggi e anche calcolarne la densità: si chiama densità di Student con II gradi di libertà quella di una v.a. T definita da
X T = - 01 ./Y
dove X e Y sono indipendenti , X -· N (O. I) e Y ~ x 2 (11) . L1 densità cli una v.a. di Student si pub calcolare con i metodi che abbiamo visto nel Capitolo 3 (anz.i questo è l'oggetto dell'Es"rcizio 4.62, per cui la densità si può vedere a p. e-45). Per i nostri scopi, però, non serve di conoscere la densità ma è piuttosto necessario disporre dei quantili , che indicheremo tc,(11) . Questi sono riportati su tavole (vedi a p. a-2). Uno sguardo a queste ultime mostra che i valori dei quantili si
-3
-2
Figura 5.11 Confronto tra densità N(O, I) (puntini), t(9) (lr:ittini) e t(I) (tratto pieno). D a notare -1
che le densità di Student decrescono all'infinito più lentamente.
vicinano per Il grande a quelli corrispondenti della legge N (O. I) e anzi, per valori di 11 supèriori 1 20, si usano i quantili della N(0, I) al posto di quelli delle leggi di Student. Ciò è suggerito che dalla Figura 5 . I I dove si vede che l'andamento della densità 1 (11) è anch'esso a campana che al crescere di n si avvicina a quello della N (O, l ) . È facile mostrare che l a densità della legge d i Student è una funzione pari (si vede anche dalla gura) . Quindi, ripetendo gli stessi argomenti che hanno portato alla (4.23), si trova che la f.r. G una legge t (n) soddisfa alla relazione G(x) = I - G(-x) .
d iamo come si può utilizzare il fatto che la v.a. definita nella (5.1 4) segue una legge di Studcnt r determinare un intervallo di fiducia per la media. Supponiamo che le osservazioni X 1 , X2, . . . no indipendenti e seguano tutte una legge N(µ, a 2 ). Allora, ripetendo passo a passo i calcoli lla (5.9) e indicando stavolta con Z una v.a. di legge 1 (11 - l), 1 5)
P(IX/1 - /li .'.5 8) = P(l../ii xli - µ I .'.5
= P(--f;;../ii .'.5 Z .'.5
#;../ii) =
i.fii) ""' P(I Z I .'.5 t.fii ) =
P(Z :::= f; -./n) - P(Z .'.5 - -f;; ./ii) =
Sn
S,1
= G(t./ii) - G (-f;./ii ) = 2 G(f;./ii ) - I .
egliendo 8 = � t 1 _,,12 (11 - l ) si ha G( ;;� �lii) = G(t 1 -a;2(11 - 1 )) = 1 - � e dunque P(IX11 - µ/ .'.5 7,z t1 -a12 (11 -
0) = 2( 1 - 1 ) - 1 = 1 - a .
petendo il ragionamento che ha portato all' intervallo (5. 10), si ha I X,, - /.li .'.5 -}, 1 1 _,,12(11 - I ) e solo s e 1 6)
s,, . s,, µ E [ X,, - r.; t 1-a;2(11 - ! ) , X,, + e '1 -a12(11 ·- 1 ) vu vn
1·
altre parole, nell'intervallo d i fiducia (5. IO) s i può sostituire v con s,, , a condizione d i sostituire uantil i della legge N(O, 1) con quelli della legge d i Studcnt. Il risultato ottenuto è esatto se le . X 1 , X2, . . . sono normali. Si utilizza nella pratica anche senzaquesta ipotesi sc11 è abbastanza ande.
5.4 Problemi di stima
1 25
Esempio 5.17 Calcoliamo l'intervallo (5 . 1 6) per i dati dell'Esempio 5.16 e confrontiamolo con quello ottenuto nella (5. 1 1). Si ha n_ -� � n_ a2 = _ s2 = _ ( Il Il -- l " Il - l Il L.., '
xz - x�) .
i=l
Poiché tra le osservazioni ce ne sono 43 che prendono il valore I e 57 che prendono ìl valore O, 2
S11
=
100 �2 ) = 0.247 (0.43 - 0.4-' 99
e quindi s,, = ✓0.247 = 0.497. Si tratta di 100 osservazioni: le tavole non forniscono i quantili delle leggi r (99) . Dalle tavole, però, si vede che i quantili variano poco al variare di 11, quando 11 è grande. Usiamo allora il quantile per 11 = IOQ e con questa approssimazione si trova 1_975(99) = 1 .98. Si trova 1 .98, 0.43 + � 1 .98] = [0.33 ] ' 0.528] [0.43 -
91tJ1
che è un intervallo molto simile a quello ottenuto nella (5.1 I). Se il vero valore incognito p è però molto piccolo (vicino a O) o molto grande (vicino a I) l'intervallo (5. 1 6) può risultare molto più piccolo, come mostra l'esempio seguente.
Esempio 5.18 Una fabbrica vuole controllare la qualità dei pezzi prodotti. Per questo ne vengono scelti a caso 1 000 e ispezionati; 27 risultano difettosi. Che cosa si può dire della proporzione di pezzi difettosi? Se si usa l 'intervallo di fiducia (5. 10), maggiorando il valore sconosciuto di a 2 con ¼ come nell'Esempio 5 . 1 6, si ottiene l ' intervallo [0.027 -
..J..� 0.027 + � ] = [-0.004, 0.059] . 2✓1000 2✓1000 '
Calcoliamo invece l'intervallo (5.16). Nel campione ci sono 27 valori uguali a I e 973 uguali a O. Dunque 1 000 2 _ .., 1 ,ooo 1000 -s-, - ----" X, 2. - O •0272) = -- (0.027 - 0.027 ) --- 0.0,.6 999 ,: - 999 ( JOOO L.., I i=l
e quindi s,, = ✓0.026 = 0. 1 62. Come abbiamo detto, i quantili della legge di Student per 11 = 999 si approssimano con quelli della N(0, I ) . Si ottiene quindi l 'intervallo di fiducia .9 . 0 62 0 62 . [0.027 - ! % - - � , 0.027 + 1 G · 1 ] = [0.0 17, 0.037] ./IOOO . ./Iooo
che è molto più stretto.
Esempio 5.19 Riprendiamo i dati dell'Esempio 1 .3 a p. 7 (le mìsurazoni della velocità della luce j di Michelson). Che stima se ne può ottenere della velocìlà della luce?
26
Capi tolo 5 Con11e rg enza e app_r_ m_a_ io o_ _n_e_____ z_ ss _i_
_______ _ ______
La media dei valori è .i = 852.4 e la deviazione standard s = 79.0. Abbiamo già visto nei lcoli dell 'Esempio 5 .17 che 1_975 (99) = 1.98. Dunque l'intervallo di fiducia di livello 95% è [852.4 - 1 .98
.17)
'.ffi, 852.4 - 1 .98 ifi] = [836.72, 868.08} .
eul!ime misurazioni della velocità della luce (Evanson eta!., 1 973)dannoil valore 299 792, 4574, atto fino alla terza cifra dopo la virgola. Questo valore non si trova nell'intervallo di fiducia .17) ed è abbastanza evidente che le misurazioni di Michelson sovrastimavano sistematicamente.
prossimo esempio propone un altro classico tipo di problemi di statis_ùca.
sempio 5.20 Il partito A è convinto di avere la maggioranza e commissiona un sondaggio. Su 00 individui intervistati 853 si dichiarano a favore di A. Cosa se ne può dedurre? Il problema naturalmente sta nel fatto che A ha certamente la maggioranza nel campione, dato e 853/ 1600 = 53.3%. Ma cosa si può dire dell'intero corpo elettorale? Si può dire che A ha la aggioranza anche. tra tutti gli elettori? Oppure la scelta degli individui che fomiano il campione emplicemente stata "fortunata"? Un modo di procedere è il seguente: supponiamo che A abbia una percentuale inferiore al 50% a tutti gli elettori, quale sarebbe la probabilità di scegliere un campione di 1600 individui nel ale A ha una percentuale 2: 53.3%? Indichiamo con X la v.a. "numero d'individui favorevoli A nel campione". Se la reale proponione di A tra tutti gli elettori è p , 0 :s p :s ! , e gli individui l campione sono stati scelti in maniera indipendente, allora X avrebbe una legge B(1600, p) . indichiamo con Fp la f.r. di questa distribuzione, avremmo P(X ::-: 853) = J - P(X :5 852)
= I - Fp (852) .
fosse p == ½ (cioè se A avesse solo il 50% degli elettori), allora, usando l'approssimazione rmale con la correzione di continuità, avremmo F1 (852) ~ 17
Cl)( 852·5 - np ) = (852 · 5 - ,800 ) = (2.625) = 0.99 56 Jnp(l - p)
40 - 2
nque se A avesse sulo il 50% degli elettori , la probabilità di avere almeno 853 elettori favorevoli l campione sarebbe 1 - 0.9956 = 0.0044 = 0.44'ìo, da considerarsi molto bassa. Il pmtito A ò stare tranquillo. Possiamo verificare la bontà dell'approssimazione normale in questo caso calcolando il vero lore della f.r. di una legge B(l600, ½) usando un software appropriato li risultato è F1 12 (852) = . 9956: l'approssimazione normale qui è particolannente buona.
esempio precedente è tipico: si fa un'ipotesi (p :: � nelt'Esempio 5 .20) e si vuole vedere se i ti permettono di respingerla.
empio 5 .21 Si sospl,lta che un dado sia truccato, in modo da dare il risultalo uno con prohabilità ù grande di Il dado viene lanciato 900 volte e si ottiene uno 165 volte. Cosa si può concludere? Come nell'Esempio 5 .20, se i l dado fosse equilibrato si avrebbe uno con probabiliti1 i; ad ogni ncio e il numero, X, dì uni ottenuti in 900 lanci dovrebbe dunque essere una v.a. di legge 900, -t;)- La media di questa v.a. è 900 - ¼ = 1 50, dunque effettivamente il numero di uni
t·
osservato è un po' più grande della media. Si tratta di una differenza sig�� probabilità che una v.a. di legge B(900, ¼) prenda valori 2: 165? ,,· ;:ì '� . . __ Se usiamo l'approssimazione normale con la correzione di continuità, allom:irico una v.a. B ( l , !) ha varianza ! � = fii , , .; ,:·.·/
(k 150, --� ) • 30 -6-
-�-
k - ½ - 150 > 0.99 . (--=-e=-- ) 5./5
Poiché (vedi le tavole) si ha (x) ::: 0.99 per x 2: 2.33 (all'incirca) deve dunque essere k - l - 1 50
s./5
ovvero k - 5: - 1 50 ::: 5./5 • 2.33 e dunque
.33 ?:: 2
l k 2: 5./5 . 2.33 + ?. + 1 50 = l 76.55 .
Dunque occon-ono almeno 177 uni nei 900 lanci per poter essere sicuri che il dado è truc_cato �o� questo livello di certezza. Naturalmente la scelta ckll' ! % è arbitraria e, a seconda delle s1tuaz1om si possono scegliere livelli diversi.
L'esempio precedente illustra (senza troppo preoccuparsi di dare defmizio�i precise) !l modo con cui in generale si affronta un problema di test in statistica: si dctenmna una regione (la
n�Ìemc: di possibili valori delle osservazioni, che risulta òi proba ét§sa'fò' ilumero a se l'ipotesi fosse vera e si stabilisce di respingere ·nÒJ\•alori proprio nella regione di rigetto. Nell'Esempio 5.21 ad esempio · . . . + x900 2: 1 77 è una regione di rigetto di livello cz = 0.01 per
mpio"'CS2� Riprendiamo i dati di A. Geissler (Esempi 1.2 a p.5 e 3 .46 a p . 64) e consideriamo ffijté;i che gli esiti di nascite diverse siano indipendenti e diano luogo ad un maschio con proba tà 0.517. Ricordiamo che dalle valutazioni qualitative che avevamo fatto eravamo propensi a nere che questa ipotesi non fosse vera. Come si può costruire una regione di rigetto di qu_esta esi di l ivello O.O!? Possiamo ragionare così: se l'ipotesi fosse vera, il numero di figli maschi in una famiglia, Y, uirebbe una distribuzione B(IO, 0.5 17) . La probabilità che una v.a. con questa legge assuma lori O oppure 1 è P(Y = O) + P(Y = I) = (I - 0.SJ 7) 10 + 10 - 0.S 1 7 . ( I - 0.5 17)9 = 0.008 := p
a somma di /Jo e di p 1 , vedi la tabella dell'Esempio 3.46). Se l'ipotesi fosse vera, il numero amiglie aventi O oppure l figlio maschio si modellizzerebbe dunque come la somma S = + . . . + X26 soo di 26 500 v.a. indipendenti tutte di legge binomiale B(lO, p) (p = 0.008 come cato sopra). Fissiamo un livello a = O.O l e cerchiamo un numero k tale che
8)
P(S ::: k) ::: a
biliamo quindi di rigettare l'ipotesi se nel campione si osserva un numero di famiglie con al un figlio maschio che è superiore a k. Osserviamo che nel campione si sono osservaci No = 35 1 = 239 famiglie rispettivamente con nessun oppure un solo figlio maschio, che fa un totale 74 famiglie con al piì, un maschio. Dobbiamo dunque determinare il valore di k a partire dal e vale la (5.l 8) e potremo respingere l'ipotesi se questo numero k risulterà più piccolo di 274. erviamo che 11p = 26 500 x 0.008 = 2 1 2 , cioè un numero ben più grande di 5: la regolctta per plicazione dell'approssimazione normale è soddisfatta. Come già visto altre volte abbiamo P(S � k)
= 1 - P( S � k - 1) "" 1 - (
ché questa quantith sia ::: 0.01 dovrà essere
k - �- - 26500 . p
J26500 - p(l - p)
k - ½ - 26500 · p
q, ( -;======== ) > - 0.99 . J26500 · p(I - p)
)•
uantile di online 0 .99 della legge N(O, l) è 2.33 e dunque dobbiamo dunque risolvere
dà immediatamcntè
k - k" - 26500 · p > 2.33 /26500 · p ( I - p) -
k ::: ½ + 2.33 /26500 · p(l - p) + 26S00 · p = 248.78 .
)f{;
·J
·J
J. i]
·� 1�
5.4 Problemi di stima
1 29
Dunque possiamo rigeuare l'ipotesi, dato che le famiglie con al più un figlio maschio sono 274 . La scelta del livello a = O.O 1 è comunque arbitraria. Cosa sarebbe successo se avessimo scelto un livello a = 0.001 ? Calcoliamo quanto vale la probabilità P(S 2: 274) nell'ipotesi che S abbia legge 8(1 0, 0.517): P(S 'è: 274) = 1 - P(S � 273) "" I -
273 · 5 - 26500 . p 4>( J26500 ) = l - (4.06) . · p(l p)) -
Si tratta di una probabilità molto piccola che non si trova neanche sulle tavole. Un software adeguato dà comunque 1 - c!> (4.06) = 0.0000246. Possiamo dunque respingere l'ipotesi che le nascite fossero indipendenti anche a un livello a = 0.001 o addirittura 0.000 1 .
l
Tracce
Esercizi per il Capitolo 1 L'esecuzione degli esercizi di statistica descrittiva richiede dei calcoli numerici in genere di scarso interesse (! 'interesse risiede nell ' interpretazione dei risultati). L'uso di un software appropriato è quindi naturale, in modo da evitare di perdere tempo con il calcolo numerico e di concentrare l'attenzione sull'analisi dei risultati. È facile trovare in rete dei software adatti, anche gratuiti (vedi le indicazioni a p.42). I dati degli esercizi si trovano nel sito www . ateneonline . i t/pbaldi doveso110 in formato lesto , in modo che non è necessario inserirli a mano nel computer, operazione che si può invece fare facilmente usando i comandi di in pur/output de! software. Nel silo indicato sopra si trova anche una sessione tipo della loro risoluzione usando uno di questi software: scilab. Si tratta di un software gratuito, facilmente reperibile in rete (vedi sempre a p . 42) .
1 Consideriamo le misurazioni della percentuale di grassi nel latte di 1 20 vacche (come indicato sopra i dati numericì si scaricano dal sito www . ateneonline . it/pbaldi) . Calcolare le usuali grandezze statistiche: media e mediana, varianza, ampiezza dell'intervallo interquartile, range.
2 Nel sito sono riportate le misurazioni della lunghezza (in cm) di conchiglie prese in un giacimento in Spagna. a) Calcolare media, mediana e varianza. Calcolare il range e l 'ampiez;,;a clcl l'intervallo io lerquartilc. L'istogramma mostra qualcosa d ' interessante? b) È stato poi determinato che le ultime 8 misurazioni in realtà riguardavano conchiglie di un'altra famiglia. Calcolare le stesse statistiche per il campione senza queste ullirne misurazioni . Confrontare l a variazione della media con quella della mediana e quella d e l range c o n quella del l ' intervallo interquarlilc. Disegnare l'istogramma elci dati, tolti gli ultimi 8. Cosa si osserv�?
3 Nel sito sono riportate le misure della densità della Terra, effettuale da H. C.1vendish nel 1798 . Il valore riportato è in termini di mullipli della densitil dell'acqua. Il valore accettato oggigiorno per la densità della Terra è 5.517 volte quella dell'acqua. a) Qual è la media delle osservazioni di Cavcndish? E la mediana? b) Ci si è accorti in seguilo che il set!imo valore riportato, 5.88, era in realtà 4.SS. Quanto valgono ora media e mediana? e) Calcolare, per i dati corretti con 4.88 al posto cli 5.88, la skewncss e disegnare l ' istogramma .
e-4
t:eserciziario
(Questi dati vengono ripresi nell'Esercizio 5.26) .
Nel sito sono riportati i valori della concentrazione di ozono e dell'irraggiamento solare osservati in 1 1 J giorni consecutivi da una stazione di rilevamento. a) Quanto vale la media delle concentrazioni di ozono osservate? Calcolare l' indice di skewness per il carattere ozono e disegnare l 'istogramma. Quanto vale la mediana? b) Rispondere alle stesse domande per le misurazioni dell'irraggiamento solare. c) Calcolare la covarianza tra le due variabili e il coefficiente di correlazione. Determinare la retta di regressione della concentrazione di ozono rispetto al l' intensità d'irraggiamento. d) È ragionevole supporre che la concentrazione di ozono in un dato giorno sia correlata con quella del giorno precedente. Come pensate di mettere in evidenza questo fatto?
Nel sito sono riportati, per 43 stati degli Stati Uniti e per il District of Columbia (Washington), il numero, X, di sigarette vendute all 'anno (in centinaia per abitante) e il numero, Y , di decessi per cancro del polmone per JOO mila abitanti nel 1 960. a) Che tipo di valore della covarianza tra le variabili X e Y vi aspettate? Quanto vale il coefficiente di correlazione trn questi due caratteri? Ritenete che i dati confermino l 'esistenza di una dipendenza tra i due caratteri? b) Calcolare la retta di regressione di Y rispetto a X e disegnare il grafico dei dati sul piano. Quale degli stati presenta valori che si discostano dagli altri?
Nel sito sono riportate le osservazioni rispettivamente del l'età, X, e dello stipendio, Y, di 59 amministratori delegati di piccole aziende, riportati dal Forhes Magazine nel 1993. a) Quanto vale la media degli stipendi del campione? Calcolare l'indice di skewness e dise gnare l 'istogramma. Quanto vale la mediana? Cosa ritenete più opportuno usare come indice di centralità per gli stipendi, la media o la mediana? b) Che tipo di valore vi aspettate per la covarianza delle due variabili ,stipendio ed età? Calcolare la covarianza, il coefficiente di correlazione e la retta di regressione.
Nel sito sono riportate le misurazioni delle portate medie, in metri cubi al secondo, del fiume Fraser (British Columbia, Canada) nei mesi di marzo che vanno dal 1913 al 199 1 . a ) Calcolare media e varianza. I dati si dispongono i n maniera simmetrica rispetto alla media? Cosa si può dire della kurtosi? b) Sarebbe interessante valutare se, tenden,:ialmente, il flusso medio è andato aumentando 0 diminuendo nel tempo. Come pensate di fare?
Nel sito sono riportate le variazioni in percentuale di una azione quotata in borsa in 48 giorni lavorativi consecutivi . Di quanto è aumentato, in percentuale, il valore dell'azione alla fine dei 48 giorni? Quanto è stato l ' aumento medio?
Nel sito sono riportate le misurazioni del peso (in once) di un campione di neonati maschi. I dati sono stati raggruppati per classi: Zk e Nk indicano rispettivamente il centro e l 'effettivo della classe k-esima. a) Quanti sono gli individui del campione? b) Quanto valgono media e varianza? Se ora i dati venissero trasformati in grammi (una oncia=28.349 granuni) come si trasformerebbero questi valori? c) Cosa si può dire della mediaua e dei quartili? d) Sapreste ricavare nna formula per calcolare skewness e kurtosi con i dati in questa forma?
l
Tracce
e-5
.IO Nel sito sono riportate le temperature in gradi Fahrenheit, Y, osservate per 60 giorni consecutivi in un paese dell'Oklahoma e le previsioni fatte il giorno prima da due stazioni meteorologiche, X 1 e X2 . Calcolare la covarianza di Y e X 1 e di Y e X2 e i relativi coefficienti di correlazione. Quale delle due stazioni è da considerarsi più accurata, secondo voi?
Esercizi per il Capitolo 2
2.1 Nella lotteria di Oslo vengono venduti I milione di biglietti. Al momento dell'estrazione da ognuna di sei urne, contenenti ciascuna dieci palline numerate da O a 9, vengono estratte le cifre del biglietto vincente, partendo da quella di sinistra. a) Costruire uno spazio di probabilità (Q , sl, P) adeguato a descrivere questa situazione. In "Un biglietto della lotteria" di J.Verne il biglietto di Olc Kamp ha il numero 009672; qual è la probabilità che venga estratto'! b) Nel romanzo, J .Verne discute quale sia la probabilità che Ole Karnp ha di vincere dopo che dalle prime quattro urne sono stati estratti i numeri 0096. Indichiamo con A l'evento "le prime quattro urne hanno dato i numeri 0096". Descrivere la probabiliH1 condizionale P( l A ) . E se A fosse l'evento "le prime cinque urne hanno dato i uumeri 00967'"1
2.2 Da un 'urna contenente 4 palline bianche e 3 nere si eseguono due estrazioni con rimpiazzo {cioè la pallina estratta viene subito rimessa nell'urna). a) Calcolare la probabilità che le due palline estratte siano del medesimo colore. b) Calcolare la probabilità che almeno una delle due palline estratte sia nera. 23 Due numeri vengono estratti, senza reimbussolamento, da un'urna contenente sei palline numerate da 1 a 6. Qual è la probabilità che i due numeri estratti siano consecutivi?
2.4 a) Due amici si trovano entrambi in coda a uno sportello, insieme ad altre 11 - 2 persone. Qual è la probabilità che essi siano separati esattamente da k persone (n ?.: k + 2)? b) Due palline vengono estratte da un'urna che ne contiene n numerate da l a n. Quai è la probabilità che i due numeri differisca.no di k (n ?.: k + I )?
2.5 I componenti prodotti da una certa ditta possono presentare due tipi di difetti, con percentuali del 3% e 7% rispettivamente. I due tipi di difeuosità si possono produrre in momenti diversi della produzione per cui si può assumere che le presenze dell'uno o del l'altro siano indipendenti tra loro. a) Qual è la probabilità che un componente presenti entrambi i difetti? b) Qual è la probabilità che un componente sia difettoso (cioè che presenti almeno uno dei due difetti)? e) Qual è la probabilità che il componente presenti il difetto I, sapendo che esso è difettoso? d) Qual è la probabilità che esso presenti uno solo dei due difetti s;ipendo che esso è difettoso?
2.6 Un 'urna contiene due ca11e: una di esse ha entrambi i lati neri mentre l'altra ha un lato nero e uno bianco. Una carta viene estratta e se ne guarda uno solo dei lati: è nero. Qual è la probabilità che anche il secondo lato sia nero?
2.7 Volendo impedire telefonate interurbane ai suoi dipendenti, un capoufficio decide di mettere un lucchetto sui dischi dei telefoni (quelli di una volta. . . ); decide però di metterlo sul 9, in 111anicra da impedire solo che venga formato lo O. In questo modo è possibile effettuare telefonate urbane, anche se naturalmente può succedere che un numero urbano contenga uno O, nel qual caso non è
6
Ceserciziario
ossibile comporlo . Considerando dei numeri di otto cifre (ùi cui la prima è diversa da O), qual è probabilità che un numero possa effettivamente essere chiamato?
n dado viene lancialo 3 volte. a) Qual è la p robabilità p di ottenere 6 almeno una volta? b) Quante volte deve essere lanciato il dado perché la probabilità di o!lcnert! 6 almeno una volta a maggiore o uguale al 90%?
na dipendente di una società di Gainesville, Florida. accusò nel 1 976 i suoi datori di lavoro stenendo d i avere subito ingiuste discriminazioni sulla base del sesso nel corso della sua carriera. a commissione , composta da 5 donne e 3 uomini, le diede ragione: infatti le 5 donne votarono favore mentre i 3 uomini si dich iararono contrari. A questo punto la società fece ricorso sostenendo che l'esito del giudizio precedente era dovuto clusivamente alla composizione della commissione. Qual è la probabilità che, in caso di ripartizione casuale, per una votazione 5 a 3 i voti si ddividano come è avvenuto (le 5 donne a favore ed i 3 uomini contro)? Cosa avreste deciso se ste stato il giudice? E se i 5 voti a favore della parte lesa fossero stati dati da quattro donne e un uomo?
2. 1
2.1
2 .1
n giocatore di poker riceve all 'inizio del gioco cinque carte da un normale mazzo di 52. a) Qual è la probabilità che riceva almeno 2 assi? b) Qual è la probabilità che riceva cinque carte dello stesso seme? c) Qual è la probabilità che riceva un poker servito?
n giocatore gioca al lotto i numeri 1 , 2, 3. Per aiutare la fortuna nottetempo egli fa in modo di giungere ali' urna tre palline supplementari con i numeri l, 2, 3 (quindi ora vi sono nel! 'urna 93 lline). Qual è la probabilità che il trucco venga scoperto {cioè che vengano cstr::nte :ilmeno due palline n numeri uguali)? (Continua nell'Esercizio 3 .25)
e urne numerate I , 2, 3 sono inizialmente vuote. Esse vengono poi riempite con n palline che ngono messe, una dopo l'altra, i n una delle urne, scelta a caso ogni volta. a) Qual è la probabilità che l'urna I rimanga vuota? b) Qual è la probabilità che le urne J e 2 rimangano vuote'! e) Qual è la probabil ità che una delle u rne rimm1ga vuota?
eci urne contengono tutte 4 palline rosse (R) e un numero variabile di palline bianche (B). Più ecisamente l 'urna i-esima contiene 4 palline R e i palline B. Un'urna viene scelta a caso e da sa vengono estratte due palline. a) Qual è la probabilità che le due palline siano una B e una R? b) Supponiamo che l 'estrazione abbia dato come risultato una pallina B e una R. Qual è la obabilità p; che l' urna prescelta sia la i -esima? Qual è l'urna più probabile ? e) Supponiamo invece che vi siano 2 urne contenenti 4 palline R e 10 B (le urne sono quindi ). Se l'estrazione ha dato come risultato una pallina B ed una R, qual è ora la probabilità che rna prescelta sia di tipo i (cioè contenga i palline B)? Qual è ora il valori:'
(-l .732) = 0.917. b) s:: (0. l 73) - (-0. 1 73) = 0 . 1 37 .
5.8 a ) E(X) = 1 50, P ( X � J 80) "" I (2.63) = 0.0044. b) "" ! - {0.81 6) = 0.21 . b) l - (0.608) = 0.27 1 .
5.37 a) (0.572, 0.768], maggiorando a 2 con ¼, [0.577, 0.763) stimando la varianza dai dati. bl) Sì, ai livelli usuali. b2) # maschiè: 59. e) Il � 2401. 5.38 al) 1 -