Introduzione Alla Probabilità - Paolo Baldi [PDF]

Indice Introduzione 1. Statistica descrittiva I.I Introduzione 1.2 Tipi - >(x; -- a) 2 11 L.....J i=l it- è minima,

34 0 75MB

Report DMCA / Copyright

DOWNLOAD PDF FILE

Introduzione Alla Probabilità - Paolo Baldi [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

Indice

Introduzione 1. Statistica descrittiva

I.I Introduzione 1.2 Tipi - >(x; -- a) 2 11 L.....J i=l

it-

è minima, allora derivando rispetto ad a e imponendo che l a derivata sia nulla, si trova 2 tJ O = - - "'(x; - a) = -2(x - a) I! L.., i=}

da cui si ricava facilmente che a = .i: è il punto di minimo cercato.

Esempio 1.3 La Tabellal .6 rip011a 100 misurazioni della velocità della luce nell'aria, effettuate da A.A.Michelson nel I 879 (fonte: S .M. Stigler, The Annals of Statisties 5, 1055-I098, 1977). I dari si devono intendere, in km/s, 299000 più il valore indicato. La media di questi valori è i = 852.4 e la deviazione standard v = 78 . 6. La domanda naturale ora è la seguente: cosa sì può dire della velocità della luce nell'aria? Che informazioni si possono ricavare da questi dati? Si tratta di una questione di statistica inferenziale a cui daremo una risposta nel capitolo 5 (vedi l ' Esempio 5 . 1 9). 850 740 900 1 070 930 850 950 980 980 880 1000 980 930 650 760 810 1 000 1000 960 960 960 940 960 830 790 810

940 880 800 880 880 830

890 810 8 1 0 910 920 890

820 800 770 860 880 720

880 880 880 880 9IO 850

890 840 780 870 870 810

860 no 720 870 &,IQ 840

850 800

620 850

760 840

880 900 840 790 760 800

860 970 950 840 840 840 740 750 760 850 850 780

810 820 850 800 810 870 'fabclla L6 100 misurazioni della velocità della luce nell'aria (Michelson, 1879) . 810 760 8 1 0 740 810 940

790 950

8

Capitolo 1 Statistica descrittiva

1.6 Mediana, quantili

Dato un campione x1 , • , • , Xn si possono definire altri indici di centralità e di dispersione alternativi a media e varianza, che possono presentare dei vantaggi ed essere più appropriate in determinate situazioni. Indichiamo con X( t), . . ,, X(n) i dati del campione ordinati in maniera crescente: xm :s xm :s . . , :s X(n) . Si chiama [m�d{izìi{],] il più piccolo di questi valori che lasci alla sua destra almeno metà delle osservazioni. In particolare se n = 2k + I è dispari, allora la mediana è x(k+t) - Se invece n = 2k è un numero pari, allora la mediana è il valore X(tJ ; se n = 2k, talvolta si definisce come mediana,ìl punto medio tra x(k) e x(k+!J, cioè i (X(kl + X(k+I) ) . Media e mediana, che sono entrambe misure di centralità, non sono i n generale uguali, anche se dì solito non sono lontane l'una dall'altra. La mediana è più complicata da m aneggiare della media: ad esempio non c'è una formula semplice per il calcolo della mediana della riunione di due campioni , come abbiamo visto per la media nella formula ( 1.4). D'altra parte essa presenta alcuni vantaggi. È ad esempio poco sensibile a errori nei dati (cioè, nel gergo detla statistica, è robusta). I veri dati con i quali lo sperimentatore si trova a lavorare sono infatti inevitabilmente contaminati da errori di misurazione, di campionamento (quando si studiano gli individui di una certa specie può capitare di prendere in considerazione, per errore, individui dì una specie simile) o anche di trascrizione (uno zero di troppo, una virgola spostata. . . ), che spesso producono valori molto più grandi o più piccoli degli altri. È facile rendersi conto che l 'influenza di questi errori, da considerarsi inevitabili, è molto maggiore sulla media che sulla mediana (vedi il commento alla Figura 1.7).

i

--- �--�- � - --....C,,� •---�-•-·--·--•-- ------- ---

lc;,

Figur.1 1.7 La mediana è data dal valore di X(5) c\l è diversa dalla media. Se poi facessimo cr - x0 >; si tratta di un indice di dispersione, che ha il vantaggio di essere facile da calcolare. È però un indice grossolano, molto sensibile agli errori nei dati descritti precedentemente. _ ________ _ , .- --- ____ Un indice di dispersione più efficiente è invece l'ampiez7�, dell';.i11te,:vallo i11terquarti/e , che

ora vediamo. Se O < a < I ,si cl1iama Q U A N T I L E di ordine a il nume�o q0 =-X(i) dove i = o:(:i + I) se a(11 + 1) è intero; altrimenti, cioè se av,+ l) non è intero, si sceglierà i uguale al numero intero immediatamente più piccolo oppure più grande di 0:(11 + I) (a seconda dei testi le definizioni possono variare), cio� i = la(11 + l )J , oppure i = La(11 + l)J + l , dove l J

1. 7 Correlazione e regressione

9

tra X la(n+ I JJ e Xta(n+IJJ l , calcolato in maniera opportuna. Grosso modo q" è un numero che ha alla sua sinistra an +elementi del campione (�___Q_l!ll_qtJe (1 - a)n alla sua destra). In questo senso la_ mediana � il quanti�e q1 12. Si chiamano �à� i quantili q 114 , q214 (cioè la mediana) e q3i4 · L'intervallo mterquarule [ql /4• q314J contiene al suo interno dunque metà delle osservazioni. L'ampiezza qJ/4 - ql/4 dell'intervallo interquartile è una misura della dispersione che non ha i difetti che avevamo riscontrato per il range . A partire dalla mediana e dai quantili è possibile costruire un grafico che dà un'idea abbas­ tanza i mmediata del valore di centralità e della dispersione del campione, ed permette anche di confrontare più campioni tra di loro. Esso è presentato nella Figura 1.8: per ogni campione viene costruita una scatola le cui estremità inferiori e superiori sono rispettivamente il primo e il terzo quartile. All 'intcmo della scatola è tracciata una linea in corrispondenza della mediana; al di fuori' della scatola vengono tracciali due segmenti rispettivamente tra il primo quartile ed il più piccolo valore delle osservazioni ed il terzo quartile ed il valore più grande . La distanza tra le estremità di �ll�ti-�� menti è dunque il range. Nella letteratura anglosassone questo tipo di grafici si chiama i boxplot !. Esempio 1.4 Le misurazioni della velocità della luce riportate nell 'Esempio 1 .3 in realtà si riferiscono a 5 gruppi

  • O ed i valori di y; per uno stesso numero b > O, il coefficiente di correlazione non cambia. Infatti a.,y risulterebbe moltiplicato per ab, a, per u e uy per b .

    1.8 Altre medie

    Esempio 1.5 In una popolazione di batteri si osservano aumenti degli effettivi del 100 . Pi% 100 · Pi% 100 - Pn %

    il primo giorno il secondo giorno

    1'11-esimo giorno .

    Qual è l'aumento medio? Dovrebbe essere l 'aumento p tale che, se ogni giorno vi fosse stato un aumento sempre pari a p, allora l'aumento totale sarebbe stato quello osservato. Orn se il numero di batteri inizialmente era N, esso diventa (I + p1 ) N dopo il primo giorno, (1 + pi)(! + P2)N dopo il secondo e così via. Dunque, dopo II giorni il numero di bal!eri è ( 1 + p 1 ) • • • ( l + p,,)N; se invece l'aumento fosse stato costantemente pari a p ogni giorno, dopo n giorni i balteri presenti sarebbero stati (l + p)" N. p deve dunque essere tale che N(l + p) n = N(l + P 1 ) . . . (I + Pn ) e cioè l + /J = ((! + P I ) . . . ( l

    + /ln )) l/n .

    Dati dei numeri q1 , . . . , q,, , tutti > O, si chiama fmeditì ge�irietri�a� di q1 , . . . , q,, il numero (

    Esempio 1.6 11 macchine producono un servizio impiegando dei tempi T1 , • • • , 1;, rispettivamente. Qual è il tempo medio di produzione?

    14

    Capitolo 1 __S..!_atistica descrittiva

    Si tratta cli quel tempo T tale che, se tutte le macchine avessero un tempo cli produzione pari a T, allora la produttività sarebbe la stessa. Il numero di servizi prodotti dalle n macchine nell'unità di tempo è l/T1 + . . . + 1 / T,, mentre 11 macchine tulle di tempo T ne produrrebbero 11/T. Deve dunque essere J� = + . . . + }� ovvero

    'ti

    T= I( I

    , I

    ,; ri- + - - - --r r,;)

    Si chiama (metlia ar,_1! O (e dunque J- 1 (y) = �). Abbiamo già osservato che la media armonica è l'inverso della media aritmetica degli inversi. • La media geometrica si ottiene scegliendo f (x) = logx, x > O (e dl!nque 1- 1 (y) := cl"). • La media quadratica appare per f(.x) = .x 2 , x > O (e dunque J- 1 (y) = .jf). È quindi possibile costniire altre medie, scegliendo opportunamente 13 funzione I. Questa costruzione delle medie diverse dalla media aritmetica ha però un aspetto più profondo: talvolta, i n presenza di un campione .x 1 , . . . , x,, è più opportuno operare la trasformazione J

    ½,

    _b

    1 .9 Momenti, indici di forma e di simmetria

    15

    e passare a considerare il campione trasformato f(x 1 ) , • • • , j(x,,), su cui si effettuerà l'analisi statistica. Una volta fatta l ' elaborazione statistica, i risultati verranno trasportati al campione d'origine tramite la trasfonnazione inversa 1- 1 • Nel caso dell'Esempio 1 .6 ciò avrebbe significato passare a considerare le quantità ij, . . . , Tenendo conto che gli inversi dei tempi sono l e velocità, ciò significherebbe che in questo caso è piì1 opportuno studiare i valori delle velocità. In effetti spesso una buona elaborazione statistica inizia con una buona trasformazione dei dati (per poi usare sui dati trasformati la media aritmetica).

    i;·

    È utile menzionare che la media aritmetica è sempre più grande della media geometrica, che è . sempre più grande della media armonica.

    1 .9 Momenti, indici di forma e di simmetria Si chiama :_,,_ _•(!mento centrato ' di ordine k il numero µ.k

    " (.t;. - .X' )k • = -I L 11

    j::,-:J

    Naturalmente µk > O se k è pari mentre può anche essere µk < O per k dispari. Per k pari µ.k è un indice di dispersione mentre per k dispari può essere un indice di simmetria, come preciseremo tra breve. Osserviamo che /.l2 non è altro che la varianza . Sì chiama indice di ;f;;;;;;;;-j la quantità

    l'2 è un indice di forma indipendente da trasfonnazioni di scala (se y; = ax; + h, la kurtosi del campione y coincide con quella di x). Y2 tende ad assumere valori vicini a O se il campione proviene da una popolazione normale (vedremo più tardi, vedi il paragrafo 4.4 e l 'Esempio 5.5, cosa ciò voglia dire). Invece Yz < O se il campione proviene da una legge che ha una densità che tende a O all 'infinito più velocemente della densità normale; Yl > O se la densifa tende a O più lentamente.

    ==:c1=::::i.---1---4---1---l---1--..!--.J....--1-��====i

    -3.25

    -2.2)

    - I .25

    -.25

    .25

    1 .15

    2.25

    3.25

    l a) è un evento per ogni a E i!t (è il complementare cli {w; X (w) s a)) e dunque anche (w; a < X (w)

    s b) = {w; X (w) s bi n {w; X (w) > a )

    lo è, come intersezione dì eventi . [w; X (w) = x) è anch 'esso un evento per ogni x E IP... Ù facile infatti mostrare che è possibile ottenerlo come intersezione di eventi mediante la relazione \w; X (w) = Xl = n[w; x - ;� < X ( = 1 -l x ·

    (3.7)

    00

    Il

    11=0

    Da queste relazioni se ne possono ricaYare altre per derivazione: poiché la (3.7) vale p:::r ogni Jxl < I , derivando a destra ed a sinistra rispetto a x e ricordando (o dando per scontato) che in una serie di potenze si può derivare termine a termine all'interno dell'intervallo di convergenza, si ottiene 00 00 1 nx 11 - 1 = ---- . L (n + l )x" "' � L, ( 1 - x)Z Poiché

    troviamo la relazione (3.8) e dunque

    r.=1

    n=O

    00

    .. ___ - --�- = ___:__ L nx" == __ (1 - x) 2 1 - x (l - x)2

    n=O

    P(T - I

    !

    = k) = P(T = k + 1) = p ( l - p)' .

    Quindi T - l segue una distribuzione geometrica di parametro p. Chiameremo Lgeometriç:a)

    :,�'.'!�Jicatà i di parametro p la densi fa definita nella (3. 10).

    Osservazione 3.10 Nell'Esempio 3.9 siamo stati un po' sbrigativi: abbiamo definito una v.a. T e ne abbiamo calcolato la legge senza nemmeno preoccuparci di dire su quale spazio di probabilit11 essa fosse definita. È inoltre chiaro che lo spazio cli probabilit1, dello schema successo-i nsuccesso del l 'Esempio 2 . 1 3 non è adatto, perché esso descrive un numero prefissato II di prove successive, mentre per studiare l'istante di primo successo T occorre poter considerare un numero arbitraria­ mente grande di prove.

    ·,t;s�frt��-o spazio di probabilità (Q, si., P) ed una v.a. X su di esso, tali -�nsità . Ad esempio se XJ , X2 . , . sono i numeri per cui p(x) > o, si può 'rtt. f'tt• � • . §�,i: si. = insieme delle parti di Q _,;_'. .: :- � = {.q , x2 . . . J ,

    robabilltà P ponendo P({x;}) = p(x;); se su (Q, s!, P) definiamo una v.a. X : 'mediante X (xi) = x; , si ha P(X = x;) = p(x;) e dunque X ha p come densità. r questo 'motivo, nel seguito, lo spazio di probabilità sarà sempre meno esplicito e ci ac­ tciiiéreino di supporre che esiste uno spazio di probabilità sul quale certe v.a. sono definite, �itzfprécisarlo ulteriormente. La nozione sempre più importante d'ora in avanti sarà quella ili ,distribuzione di una variabile aleatoria. Abbiamo appena visto del resto che, datà una densità discreta p, esistono sempre uno spazio (Q, f.11, P) ed una v.a. X ivi definita che ha p come distribuzione; nei calcoli poco importerà di sapere come siano fatti esplicitamente (Q, s1, P) e X.

    #

    Se X ha legge geometrica di parametro p, è talvolta utile la formula 00

    00

    rcx o:.. k) = I> o - pi = c1 - pl I > o - p>j = k}. Poiché T - l è una v.a. geometrica, grnzie alla (3.J I ) abbiamo P(T = k + m I T > k) = P(T - 1 = k + m - I I T - I ?: k) = P(T - 1 = m - J) = P(T = m) .

    Dunque la probabilità di dover attendere per il primo successo ancora m prove è la stessa che si avrebbe se le prime k prove non avessero avuto luogo. Questa proprietà è del resto ovvia se si pensa che in uno schema a prove ripetute indipendenti i risultati delle prime prove non hanno influenza sulle successive; dunque, se le prime k prove non hanno dato successo, non si vede perché la probabilità di avere successo nelle prove successive debba essere modificata. La proprietà di mancanza di memoria è in realtà una caratteristica della distribuzione geometrica: si può dimostrare che se una v.a. gode di questa proprietà ed è a valori interi o:, O, allora si tratta necessariamente cli una v.a. di legge geometrica (in esercizio: non è difficile).

    .I

    3.2 Variabili aleatorie discrete

    39

    Osservll'i;ione 3.12 Spesso un gioco consiste in prove ripetute indipendenti ( lotto, roulette.. . ) e i giocatori usano la tecnica di giocare sugli eventi in ritardo. Cioè, ad esempio, di puntare si­ stematicamente su un numero al lotto che non esca da molte settimane. Se le prove ripetute sono indipendenti , è chiaro che questa tecnica non ha fondamento, a causa della proprietà d i mancanza di memoria della legge geometrica, per la quale la probabilità di dover attendere un certo numero di estrazioni l'uscita di un numero non dipende dal ritardo del numero. I giocatori che usano questa tecnica sostengono però che se, ad esempio, un numero al lotto ha un ritardo di 100 settimane, allora se esso non uscisse si avrebbe un ritardo di I O I settimane. Poiché la probabilità di un tale ritardo è effettivamente molto piccola, è molto improbabile che ciò si veri fichi. Dov'è l'errore in questo ragionamento?

    Osservazione 3.13 In alcuni degli esempi abbiamo fatto ipotesi che ci hanno permesso di costruire un modello con il quale abbiamo calcolato le probabilità che ci interessavano. Ad esempio nel caso delle prenotazioni aeree abbiamo supposto che i comportamenti dei singoli passeggeri fossero indipendenti. A ben guardare non è una ipotesi totalmente ovvia, perché si sa che i passeggeri viaggiano spesso in gruppo (famiglie, squadre dì calcio . . . ), il che significa che i comportamenti dei passeggeri del gmppo non sono indipendenti (o partono tutti o non parte nessuno). L'ipotesi d'indipendenza in questo caso, come in altri, va quindi considerata una prima approssimazione che comunque pe1mette di costruire un modello semplice e di dare delle risposte. È però naturale il problema dì verificare a posteriori se il modello sia adeguato o no . È questa una questione che prende il problema al contrario rispetto a come lo abbiamo sempre considerato: mentre finora abbiamo fatto delle previsioni sul fenomeno basate sul suo modello, ora si richiede, a partire dall'osservazione del fenomeno, di decidere della bontà del modello. È questo un tipico problema di Statistica Matematica. li Calcolo delle Probabilità e la Statistica Matematica si servono degli stessi strumenti mate­ matici ma, mentre il primo usa un modello per fare delle previsioni su un fenomeno, la seconda cerca, al contrario, di ricavare informazioni sul modello a partire dall'osservazione. Si chiama distribuzione (di PoissonJ di parametro À, À > O, la densità

    CÀ !'{__ k = O, 1 , 2 . . . . (k) k! ={ P O altrimenti Si tratta di una densifa perché (sviluppo in serie di potenze della funzione esponenzialt:) oo )._k

    è = L rr k=O

    e quindi (3.2) è verificata. Vedremo più tardi delle situazioni in cui le distribuzioni di Poisson appaiono in modo naturale. Mostriamo intanto che esse possono essere usate per approssimare le leggi binomiali. Consideriamo infatti una v.a. X ~ B(n, ¾) e studiamo il comportamento della sua densità per 11 ➔ oo. k )_ n-k )._ , 11-k = -ii! -- )._ = - I - -) P(X == k) = l -k Il 11 ) l: !(ll - k) ! ll k ( li = !'{__ k!

    (ll)( )._)k(

    Il

    (i _ �)"

    11(11 -

    � -k -> l ) . . . (11 - k + 1) (l _ 11 ) n-,oo nk

    40

    Capitolo 3 Modelli discreti

    dove abbiamo usato i limiti

    (1 - � )"

    n(11 - 1) . . . (n - k + 1) nk

    ➔ -►

    n-+oo

    e-i. l.

    Quest'ultimo lirrùtc si calcola facilmente osservando che si tratta del quoziente di due polinorrù di grado k nella variabile n e che il lirrùte per n --> oo del rapporto di due polinomi nella variabile 11 aventi Io stesso grado è uguale al quoziente dei coefficienti dei temùni di grado mas�imo, qui entrambi uguali a 1 , dato che, sviluppando, il terrrùne di grado massimo al numeratore è nk . Quindi , se X è una v.a. di legge B(n, p) con n grande e p piccolo, la su a densità può essere approssimata con una densità di Poisson d i parametro 11p. Ciò è molto utile, perché per n grande la manipolazione dei coefficienti binonùali è disagevole. 0.20 0.15

    O.IO 0.05 0.00

    Figura 3.4 Confronto frn una distribuzione binomiale B(20, 0.2} (sbane piene) ed una di Poisson di parametro À = 20 • 0.2 = 4 (sbarre chiare). 0.20 0. 1 5

    O.tO

    0 05 . 0.00

    -�-0 1l_ J

    Il 12 5 6 9 tO O Fig1m1 35 Confronto fra una distribuzione binomiale B(4, O.O ! ) (sbarre piene) cd una di Poisson sempre di parametro À = 40 • O.I = 4 (sbarre chiare). L'approssimazione è ora migliore.

    r(l -ç,

    Qne.sto calcolo implica anche che le distribuzioni di Poisson appaiono in maniera naturale come leggi di quantità casuali X che rappresentano il numero di successi su un numero molto grande di prove ripetute indipendenti, in ciascuna delle quali la probabilità di successo sia molto piccola. Un esempio tipico di questa situazione è il numero di telefonate che giungono ad un central ino in un determinato periodo di tempo. Si può infatti supporre che il numero di persone che potrebbero fare una chiamata sia molto grande e che ciascuna di esse chiami effettivamente con piccola probabilil;i (e indipendentemente dalle altre). Ripetendo questo tipo di argomenrazioni si può supporre che seguano una distribuzione di

    3.2 Variabili alealorie discrete

    41

    a) il numero di complicazioni postoperatorie per un dato intervento chirurgico in un dato periodo di tempo, quando il numero di interventi nel periodo considerato è elevato e la probabilità di complicazione piccola; b) il numero di piante di un determinato infestante presenti in una parcella di terreno; c) il numero di clienti che si presentano ad uno sportello in un dato periodo di tempo; eccetera.

    Data una v.a. X si chiama \fi111i.i@e di ripartizione i di X la funzione Fx ; ìlt - ► [O, 1] definita da Fx(t) = P(X S: I) .

    La funzione di ripaitizione (f.r.) è definita per ogni v.a. (discreta o no) ed è chiaro che è sempre una funzione non-decrescente, poiché se I cresce l'evento (X s t) diventa più grande. Se X è discreta, l'andamento della sua f.r. è molto semplice da descrivere; se, per semplicità , supponiamo che X sia a valori interi , allora Fx è costante nell 'intervallo tra due interi successivi, mentre può presentare una discontinuità in corrispondenza dei valori interi.

    o Figura 3.6 Funzione di ripartizione di una v.a. uniforrne su O, . . . , 6.

    2 O 3 Figura 3.7 Funzione di ripartizione di una v.a. di legge B(6, 0.5).

    La funzione di ripartizione è importante perché la sua conoscenza è equivalente a quella della densità cli X. Infatti per la (3.4) si ha la relazione Fx (I ) =

    L p(x,.)

    che esprime la f.r. in tcrnùni della densità. Viceversa, se supponiamo per semplicità che X µr�nda solo valori interi, allora 2

    . ,.. tà,·di,uria v.a. può essere più facile ca.Icolare prima la funzione di ' d;si&so;,la. funzione I - FX) e poi da questa ricavare la densità tranùtc ,_p,òcedura che abbiamo seguito nell'Esempio 3.9 per trovare la densità del èesso. ' Xgèometrica di parametro p la f.r. vale Fx (k) = P(X :'é k) = p I)1 k

    i=O

    - Pi = l - ( I - pl+1 ,

    k = 0, 1 , . . .

    (si usa la (3.6)). Se invece Y è geometrica modificata, allo stesso modo si trova (3. 14)

    Fy(k)

    = P(Y s k) = p �)1 - p) i - l k

    i=l

    = l - (I - p)k ,

    k = 1 , 2, . . .

    Invece per te densità binomiali o di Poisson non ci sono formule semplici per la f.r. In questo caso può essere necessario ricorrere al calcolo numerico. Quasi tutti i pacchetti software dì calcolo scientifico (mathcmatica®, matlab®, scilab®,. . . ) e quelli specificamente orientati alla statistica (come R®, ma ce ne sono tantissimi) prevedono comandi per il calcolo di queste f.r. (e anche di quelle delle v.a. continue che vedremo nel prossimo capitolo). Tra questi scilab e R sono gratuiti e si trovano in rete ai siti www . scilab . org e cran . r-project . org rispettivamente.

    Esempio 3.14 I processori prodotti da una ùitta sono difellosi con probabilità p == 0.02, indipen­ dentemente tra di loro. Qual è la probabilità che in un lotto di 1000 ce ne siano non più di 18 difettosi? Il numero X di processori difettosi nel lotto considerato si modcllina con una v.a. binomiale B(1000, 0.02). La quantità richiesta non è altro che Fx 0 8) , cioè la f.r. di X calcolata in 1 8. Usando scilab il comando è cdfbin. 1n questo caso è ragionevole anche dì pensare ad approssimare la legge B(IO00, 0.02) con una di Poisson di parametro 0.02 >< 1 000 = 20. In questo caso il comando scilab è cdfpoi. Il risultato numerico sarebbe in questo caso 0.3797 valore esatto approssimazione poissoniana 0.38 14 .

    3.3 Leggi congiunte, indipendenza

    Talvolta è necessario considerare delle quantità aleatorie a valori multidimensionali. Per questo introduciamo la seguente, che è un 'estensione della definizione di v.a.

    i.��?i:�fI:::� �1!Ye%:t}�f;J�;�i:i��ll�]r11�1vtJ,;;;;�;;;:�};;;�;:1

    :it!:���t.�f t '.

    7:ioìii

    È chiaro che se X è una v.a. m -dimensionalc discreta a!lorn essa può assumere al più un'infinità numernbi!e di valori x E !R"' . Infatti, se x = (x 1 , . . . , x,;,) E ìR"' , a!lora {X = x ) = {X1 = x1 } n . . . n (X,,,

    = xm} ,

    ---- - ----

    ---- - - -- -

    3.3 Leggi congiunte, indipendenza

    -

    -

    - -

    43

    x è dunque un valore assunto da X se e solo se simultaneamente x 1 è un valore assunto da X t ,

    x2 u n valore assunto O, S,, = X 1 + . . . + Xn ed inoltre SN (w) = X 1 (w) + . . . + XN(w)(w) .

    La quantità SN (w) viene determinata nel modo seguente: si calcola prima il valore N(w) assunto da ,V e poi si fa la somma di X; pe� _i_ _':; .l i ·. c� _ ,J'{_(w) (se N(w) = O si pone S,v(w) = O). Per questo motivo chiameremo SN unal.iqmhia aléciioriij]. Variabili di questo tipo appaiono spesso in presenza di fenomeni casuali che dipendono a loro volta da altri fenomeni casuali. Supponiamo ad esempio che in una colonia di batteri ogni individuo dia luogo, suddividendosi, ad un numero z 1 aleatorio di d iscendenti, dove Z 1 è una v.a. di densità p. La seconda generazione i;arà allora composta da un numero z2 d'individui, dove Z2 è una somma di Z 1 variabili indipendenti tutte ancora di densità p . Possiamo qu indi descrivere Z2 come una somma aleatoria. Vediamo ora come si può determinare la densità di SN , quando si fa l 'ipotesi che le v.a. N, X 1 , X2 , . . . siano indipendenti. L'idea è di usare la formula delle probabilità totali (2.8). In effetti gli eventi {N = i l , i = O, I , 2, . . . costituiscono una partizione di Q, per cui Où

    P(SN = X) = L P(SN = .X , N = i) . i= O

    Ma su (N = i) si ha SN = S; e dunque, ricordando anche che S; e N sono indip-�ndenti, e quindi

    P (SN = x, N = i) = P(S;

    = x, N = i) = P(S; = x)P(N = i)

    00

    P(SN = x) = L/(S1 = x) P(N = i ) . i=O

    (3.29)

    j Esempio 3.30 Le telefonate che giungono a un centralinovengono indirizzate a u n operatore con I probabilità p, O :.:; p :.:; 1 , e smistate a un altro servizio con probabilità 1 - p. Supponendo che il numero N di telefonale che giungono in un giorno si modellizzi con una v.a. di Poisson di parametro À e che gli esiti delle singole telefonate siano indipendenti tra loro, qual è la probabilità che all'operatore in un giorno giungano k telefonate? Se indichiamo con X 1 , X2, . . . gli esiti delle singole telefonate (I se giungono all'operatore, O altrimenti), il numero di telefonate che giungono all'operatore si può scrivere SN

    = X I + . . . + XN

    Applichiamo la(3.29). In questo caso S; - B(i, p) e P (S; = k) == Osek ?'.: i. Dunque, sviluppando il coefficiente binomiale c poi ponendo j = i - k, 00 Ài I I _. . ,; i-k P(SN = k) = L k 1/c l - p)• -• c >. = B e A Pk L i - k) ! A ( l - p) = TI

    "" (i) .



    .._

    f�

    ,d (

    = _.!._ c ->. 1/ ..!... ;_ì+k ( I - p)j = 2_ e->-(Àp)" (À( I - p)).Ì J. k! L1! k! . = O �

    :f:-,

    j

    .... 1___ 0 �--�

    = k-'.,. e-1-P(i,p)" .

    Dunque SN è di Poisson di parametro Àp.

    3.5 Speranza matematica

    53

    3.5 Speranza matematica

    Sia X u na v.a. (discreta) che assume i valori x1 , x2 . . . ed indichiamo con p la sua densità. Si dice che X ha speranza matematica finita s e (3 .30)

    L lx;! p(x; ) < +oo .

    (3.3 1 )

    E[X] = LX; p (x;) = I:x.- P(X = x;) .

    Jn questo caso si chiama(spe.i-a11za maieb1àtiéaÌ di X la quantità

    Jn altre parole la speranza matematica di X è data dalla (3 .31), a condizione che la serie converga assolutamente. Sinonimi di speranza matematica sono i temùni media, valore medio, attesa, valore aueso. In effetti, osservando che i termini che intervengono nella (3 .3 1 ) non sono altro che i possibili valori di X moltiplicati per la probabilità con cui essi vengono assunti, il significato intuitivo della speranza matematica è quello di media dei valori assunti da X. ln analogia con la meccanica di un corpo rigido, se ponessimo sulla retta nei punti x 1 , x2 . . . delle masse proporzionali a p (x 1 ) , p(x2) • • • rispettivamente, l a quantità E[XJ non sarebbe altro che la coordinata del baricentro del sistema di masse così definito. Se E[X] = O si dice anche che X è centrata. È importante osservare che la speranza matematica di una v.a. dipende 1111icamcnte dalla scia densità: se due v.a. hanno la stessa densità, allora se una di esse ha speranza matematica finita ciò è vero anche per l'altra e le due speranze matematiche sono ugt1ali. Sia X = (X 1 , . . . , X.,) una v.a. (discreta) m-dimensionale e T/ e O � altrimenti. È chiaro che (X - E[X])2 ;o: Y perché Y = 1/ < (X - E[XJ)2 sull'evento [IX - E[X]I > TJ} mentre sull ' evento { I X - E[X] I :': 11} y vale O mentre (X - E[X])2 � O. Prendendo la speranza matematica si ha Var(X) = E [(X - E [X}) 2) � E[Y] = E[11 2 1 11x-F.[Xll>q} ] = ry2 P(I X - E[X] I > T/)

    Osserviamo che, per dimostrare la Proposizione 3.39, ci siamo serviti solo della definizione della· varianza, data dalla (3.38)), e di alcune proprietà della media come, ad esempio la Proposizione 3.3 4 a) . Vedremo nel prossimo capitolo delle v.a. che non hanno la limitazione di prendere solo un insieme discreto di valori e la cui legge è definita in maniera diversa. Per queste v.a., però, la speranza matematica e la varianza continueranno a soddisfare le proprietà che abbiamo visto per le v.a. discrete, ed in particolare la Proposizione 3 .34 a). Potremo quindi affermare che anche per esse vale la disuguaglianza di Chebyshcv. Vedremo che lo stesso discorso si può ripetere anche per i risultati dei prossimi due paragrafi. La disuguaglianza di Chebyshcv affenna che più Var(X) è piccola, più è piccola la probabilità che X prenda valori lontani dalla sua media. Ritroviamo quindi in maniera più precisa l'idea intuitiva che la varianza misura la dispersione di una v.a. La disuguaglianza di Chebyshev è in realtà una maggiorazione grossolana della probabilità P(I X - E(X]i > 11) . Se X è ad esempio la v.a. di poco fa, con i valori 1 e - 1 assunti entrambi con probabilità e per la quale E[X} = O e Var(X) = I , scegliendo 71 = 2 si ha P(I X - E[X]! > 11) = O mentre Var(X)/1-,2 = Per ,, < 1 si ha addirittura Var(X)/1,2 > 1 mentre è chiaro che P(IX - E[XJ! > 11) può valere al massimo 1 . Ciononostante e anche se più tardi vedremo stime di dispersione più precise, si tratta di una disuguaglianza preziosa in molte circostanze. Si usa indicare con il simbolo a 2 la varianza di una v.a. X, così come si usa indicare con µ la speranza matematica. La quantità a = var(X) si chiama la id_el'iaziom;}fq,Ì1dàrè{ di X . Riprendendo l a (3.38) e indicando con µ. la speranza matematica d i X, s i trova

    i

    ¼.



    (3.39) Var(X)

    = E[(X - 11.)2] = E[X 2 - 2µ.X + 11.2] = E[X2 ] - 2Jt . µ + µ2 = E[X2] - E[X]2

    che è un 'altra definizione della varianza: è la differenza tra la speranza del quadrato e il quadrato della speranza. La (3.39) è am:i la formula che si usa di solito per il calcolo (vedi gli Esempi 3.40). Osserviamo comunque che da (3 .38) è chiaro che la varianza è sempre 2: O, cosa che non è evidente nella (3 .39). Sono utili le seguenti proprietà della varianza: (3.40)

    Var(aX) = a2 Var(X) Var(a + X) = Var(X)

    Le (3 .40) sono praticamente immediate: per la seconda delle due, ad esempio basta scrivere

    Var(a + X) = E[(X + a - E[X + a]) 2 ] = E[(X + a - E[X] -- a}2] = E [(X - E[X])2} = Var(X) .

    GO

    Capitolo 3 Modell� �i,sc reli ____ - ::� _:.:

    ___ ____________

    ___

    Questa- relazione è,del resto coerente con l'interpretazione della varianza com� _misura_ della 1 dispersione: se si aggiunge ad X una costante a, �a med_ia_µ,_ s1 sposta della quant_Lla � , co� pure X d1 nspetto a -r quella e µ, a nspetto X d1 e dispersion la definitiva In X. da sunti � a. come i valori a µ. + a sono le stesse. (;· céchiahi:o un'espressione per la varianza di X + y. Si ha (3.41)

    2 Var(X + Y ) = E[(X + Y - E[X + YJ) ] = E[( (X - E[X]) + (Y - E[YD) ] = = E[ (X - E[X])2] + E[ (Y - E[Y])2) + 2E[ (X - E[X])(Y - E[Y])] = = Var(X) + Var(Y) + 2 Cov(X, Y) . 2

    dove abbiamo posto (3.42)

    Cov(X, Y) = E[ (X - E[X]) (Y - E[Y])]

    La quantità Cov(X, Y) si chiama la [ cò�driaizia·: di X e Y. Una espressione alternativa per la covarianza è (3.43)

    Cov(X, Y) = E[ (X - E[Xl)(Y - E[Y])] = = E[XY - XE[Y] - YE[XJ + E[XJE[YJ] = E[XY] - E[X) E[Y] .

    In particolare se X e Y sono indipendenti, allora per la Proposizione 3.33 (3.44)

    Cov(X, Y)

    = E[XY] - E[X]E[Y] = O

    da cui segue che, se X e Y sono indipendenti, allora Var(X + Y) = Var(X) + Var(Y). Anzi, ripetendo i calcoli della (3.41) per i l caso di III v.a., si ha facilmente (3.45)

    Var(X1 + . . . + X,,, ) = L Var(X;) + i=l

    e, se X 1 , . . . , X111 sono indipendenti , (3.46)

    L

    i.j=l ,if-j

    Cov(X;, Xj)

    Var(X 1 + . . . + X,,. ) = Var(X i) + . . . + Var(X,.) ,

    ovvero la varianza di 1' .

    3.8 La retta di regressione

    11igura 3.10 Le sbarre piene indicano i valori teorici Pi , le altre quelli empirici p;. 4

    5

    6

    7

    8

    9

    65

    10

    . che per alcuni valori le prime siano più grandi delle seconde e vice�ersa in maniera casuale e sen a un preciso andamento. Qui invece i valori teorici sono sempre più grandi di quelli empirici � per I valon centrah (1 = 4, 5, 6) e più piccoli per gli altri, il che fa pensare ad una sionificativa 0 differenza tra le due distribuzioni. _ In conclu�ione ci sono indizi che il modello binomiale qui non funzioni . Ci mancano, per ora, gh s trumenl! per arrivare ad affermarlo in maniera rigorosa (nei limiti dell'evidenza statistica) ma notiamo che comunque . l a legge dei grandi numeri e i metodi grafici come i diagrammi a barre danno già delle indicazioni u tili. j

    Sottolineiamo comunque che in questi esempi ci stiamo ponendo il problema di verificare, a partire dalle osservazioni, il modello di un fenomeno aleatorio . Quindi, come accennato nell'Osservazione 3 .13, si tratta dì problenù di Statistica Matematica. ?sserviamo i �oltre che la Legge dei Grandi Numeri è conseguenza di alcune proprietà della vananza (essenzialmente delle (3 .40) e della (3.45)), oltre che della disuguaglian7.a cli Chebyshev. P�iché _vedremo che queste f?rmule valgono anche per le variabili continue, la Legge dei Grandi Numen vale, con le stesse 1potes1, anche per le v.a. (X,,) ,, aventi una densità continua che studieremo nel prossimo capitolo.

    *3.8 La retta di regressione

    Siano X e Y v.a. (continue o discrete). Vogliamo trovare i numeri a e b che rendono m.inìma la quantità

    (3.49)

    E[(Y - aX - b}2 ] .

    Poiché la quantità in (3 .49) è tanto più piccola quanto più Je v.a. Y e aX + b sono vicine. il problema in oggetto consiste nel trovare la migliore approssimaiione di Y mediante wiaf11nzio11e lineare di X . Si tratta di una questione d i grande .interesse applicativo: s i può pen�are che l a quantità y rappresenti un segnale che non si può osservare direttamente, mentre X è una osserva7.ione di y tramite un'apparecchiatura di misura, eventualmente distor1a o con l'aggiunta dì un errore. Ci si trova quindi confrontati con il problema di dare una stima di Y mediante una funzione 00

    a velocità esponenziale. In questo senso il Teorema d i Shannon-McMillan fornisce un metodo d i compressione: esso infatti afferma che con grande probabilità possiamo restringere l'insieme dei possibili segnali a quelli che si trovano in A,, , poiché la probabilità di osservare un segnale fuori da A11 è piccola. Il 'foorcma 3.48 è in realtà una versione semplice del Teorema di Shannon-McMil!an, soprattutto pcrchè è molto limitativo considerare solo segnali in cui i bit successivi sono indipendenti. Di esso esistono versioni più sofisticate, in cui si prendono in considerazione strutture del senale "' più complesse e realistiche. .

    3.9 La compressione dei segnali e il teorema di Shannon-McMillan

    69

    Esempio 3.49 Consideriamo un segnale binario di lungheaa n per il quale si possa supporre

    che i bit sono indipendenti. Supponiamo che il simbolo 1 appaia con probabilità ¼ (e dunque O con probabilità. ¾) - Quale guadagno massimo si può pensare di ottenere nella compressione del segnale con il Teorema di Shannon-McMillan? Senza ricorrere alla compressione la registrazione del segnale richiede 11 bit. Usando il Teo­ rema 3.48 invece, se ci restringiamo a considerare i segnali dell'insieme An , questi sono al più e•(h+ q) . L' entropia Jr vale in questo caso -(¼ log { + ¾ log ¾) = 0.56. Dunque per 7/ -> O (cioè considerando la compressione massima) basta considerare un numero e056 " = 1. 75" di segnali, che si possono codificare usando numeri binari di lunghezza 11

    log l .75 =c. 0 . 8 1 11 log Z

    È possibile quindi una compressione fino al 20% circa.

    .

    f!IW@iii del Teorema 3 .48. Perogni w € Q definiamo il vettore delle frequenze empiriche Pn = ( fin. I , • • • , Pn.k )

    dove fin.i = g/- (n ; è definito in (3.52)). In altre parole p,,_; è la proporzione di simboli in w che sono uguali a x; , ovvero la frequenza empirica di x; in w. Indichiamo ix - yl la distanza euclidea tra punti di l!t" : lx - y!2 = (x 1 - y1J 2 + . . . + (x" - y" )2 . Fissiamo un numero 8 > O e poniamo A"

    = [w; lji,. - p! s 8 ) ,

    A 11 ,i = [w; 11111,i -- p;I S :7rl. i = I. , ... • k

    (p è il vettore (p1 , • • • , Pk)). Mostriamo che P(A 11 ) --,.11 _, 00 l . È chiaro che se lfJ,. - JJ I > 8, Se così non allora almeno una delle coordinate del vettore p,, - p deve essere più grande di fosse sarebbe



    lii,, - PI = )1 J1n.l - P i i2 -i- · · • + IJJ11.k - 1h 12 S

    g

    =O·

    Dunque Ae == (lp11 - pi > 8 ) e A' 1 u. . . u A' k . Per la Legge dei Grandi Numeri (vedi l 'Esempio 3 . 5) jJ,, _; "_, Pi in probabilità e dunque P(A:::i ) --,. 1 per n -> oo, per ogni i = I , . . . , I: . Dunque 4 P(A;. ) -> O e P(A�) -> O per ,r --,. oo. Ne segue che P(A ,. ) --+ I cd esisterà quindi un numero 11 0 tale che, per 11 > 110 , P(A,,) 2: I - E. Per provare 2 ) eonùnciamo con il mostrare che, se w E A11 , allora P(w) non può essere troppo piccola. Sappiamo che I: k P(u>) = P? . . . p�• = exp ( L n; log p;) = exp (11 L P11. i log pi) . i =1 i=] Ma se w € A11 , allora, per i = I , . . . , k, si ha I fin.i -- p; I S IPn - pi :::: li e, in particolare, />r.,i :s Pi + 8. Quindi, se w E A,, , ricordando che i numeri Pi sono pi(1 piccoli di 1 e dunque i loro logaritmi sono negativi, k k k (3 .53) P(w) :::. exp n Ì:::(p; + lì) log p;) = exp (11 p; log Pi - 110 LI log p;I) � e-"('•+ql i=I i=I i=l

    (

    L

    �;

    70

    Capitolò 3 Modem discreti

    :..�•· -�· �--

    "-':il"�:�ndizione ,di scegliere 8 abbastanza piccolo, in modo che sia o L ��i I log p; I _:s 1'/ , Come · ,c4�guénza di (353), si ottiene . ·-i2c11 + 1)c1 - p)"z" • n=O

    e quindi P x+r (n ) = p2 (n + 1) ( 1 - pt , 11 = O, 1, 2 . . .

    Dalla conoscenza di ,Jrx si possono calcolare media e la varianza d i X . Vediamo come: d a (3 .55) derivando si ha 1 p(n) iJr� (z) =

    I>z"-

    n �I e dunque, se il raggio di convergenza della serie in (3 .55) è > 1, ponendo z = I , iJrk O) = I: 11p (11)

    (3.57)

    n=l

    Derivando un'altra volta e dunque per cui

    ,ftf! (z) =

    L 11 (11 - l)z"-2 p(n)

    n=2

    ,ftf( l ) = 2)112 - n) p (n) n=2

    = E[X] .

    = L(n2 - 11) p(11) = E[X2J - E[XJ

    2 Var(X) = E[X2J - E[XJ 2 = t/,f!. (l ) + 1/,:� 0 ) - ,t,{ (1 ) .

    (3.58)

    Esempio 355 (Media e varianza di una v.a. geometrica) Se X è geometrica di parametro p , allora e dunque

    Se z =

    ,( ) 1/tx z

    =

    p (l - p) (I - z ( l - p))2 .

    ,, 2p(l - p)2 1"x (z) = (1 - z( I - p))3

    l E[XJ = _-_P:_ p 2p(l - p)2 l - p (1 - p)2 I - p Var(X) = + -···- - 3 p2 · p2 - p p X + l è geometrica modificata, allora E(Z) "" Naturalmente Var (Z) = Var(X) =

    i.

    0

    Le f.g. sono utili anche per calcolare l a legge delle somme aleatorie SN dell'Esempio 3.29.

    7f.

    �'i!�tai:�r;g't{1{�t1�ìflj�tf�m!J���;tfJ:�,l��g2:tt" Vr: (I) - 17>: (O) = l . Infine Fx è derivabile con derivata continua, trnnne che in O e in I . Una densità è dunque data dalla sua derivata, che vale

    Figura 4.2

    Fx (t)

    ={1

    f( ) t

    = {O

    I

    se O < t < I altrimenti .

    Il grafico di Fx .

    Osserviamo che, se O s a < b :5 1, si ha

    P{a :5 X :5 b) =

    b

    1 dt = b - a

    Cioè la probabilità che X assuma valori in un sottoinlervallo [a . hj di [O, J] dipende solo dall'am­ piezza del souointervallo e non, ad esempio, da dove esso è collocato. Quindi si tralla di una v.a. che prende, in �n certo senso, ogni valore in [O, 1] C�!J,4:JICs�� _probabilità. Diremo, in analogia ; con la nozione introdotta nel paragrafo 2.2, che X è UIJ.! iforpze ; rn [O, 1]. Si possono facilmente definire delle densità / umform1 su un 1ntervallo [e, ti] . con e, cl E IR, e < d. Infatti, se / è uguale ad una costante k su [e, cl] e vale O al cli fuori, si ha ancora, per e ::: a < b :5 d e indicando con X una v.a. cli densità /, P (a :5 X :5 b ) =

    b

    1 k dt = k(b - a)

    e si vede ancora che P(a :5 X ::' b) dipende solo dall'ampiezza dell'intervallo [a, b]. La cost;u!le k resta determinata dal fatto che deve essere l

    =1

    d

    f (t ) dt = k(d - e)

    78

    Capitolo 4 Modelli continui

    e dunque k =

    ;t-:;:-

    Esempio 4.2 Si chiama (espo�1e11ziale / di parametro 1 la densità (4.5)

    . fx (t) = { �e-J '

    se t > O altrimenti .

    È immediato verificare che f soddisfa alla condiiione (4.4). La f.r. di X si calcola facilmente: Fx (t) = O per t :::: O. mentre Fx (t)

    = À Jf' e->-, d.1· = 1 - e- �,

    o per t > O. Se X è esponenziale di parametro À e s, t > O, si ha t + s, X > t) P(X > t + s) P( - X> l'(X > t + s· ! X > I ) P(X > I) P(X > t) (4.6) e-À(l+s) = � = e__,_, = P(X > s) .

    Dunque le leggi esponenziali godono anch'esse della proprietà di mancanza di memoria, che avevamo già messo in evidenza per le v.a. geometriche. Vedremo meglio, più tardi, che le v.a. esponenziali appaiono in maniera naturale per mo­ dellizzare dei tempi d'attesa. La proprietà di assenza di memoria è allora utile per capire il campo di applicazione di questo modello. Ad esempio non si userà una densità esponenziale per modellizzare il tempo di rottura di un 'apparecchiatura soggetta a usura, per la quale dunque più è grande il tempo di servizio, più è grande la probabilità di una rottura imminente. Supponiamo che la f.r. Fx sia cont.inua. Per il teorema dei valori intermedi l'equazione

    (4. 7) Fx (x) = et ha sicuramente soluzione per ogni O < a < 1 . Se per di più Fx è strettamente crescente (il che succede ad esempio se X ha densit1, strettamente positiva), aliora questa soluzione è unica. Jndichiamola con l]a : lJa è dunque l'unico numero reale tale che P(X _:::: lJ« ) = a .

    q" si chiama il �@� di ordine a di X. Si chiama 1Ì(ei!iq1�J di X il quantile q 112 ; si tratta cioè di quel numero lll tale che P(X :::: m) = ½ - Naturalmente si ha anche P(X 2: m) =



    6 2 4 10 8 Figurn 43 Il quanlile qa , per O < a < I , I: quel numero tale che !'are.� ombreggiata abbi• superficie uguale ad a. Qui Ì! indicato il quantile di ordine a = 0.1, cioè la superficie ombreggiata ha area O.I. Questo è il grafico di una densità f(3, 1), che vcnà introdotta nel paragrafo 4.5.

    ,--=,--,

    0.25 1�

    4.2 Calcolo di leggi

    79

    0.2

    :,: �

    10 2 q1 _n 4 6 8 Figura 4.4 Per la stessa densità della Figura 4.3 qui troviamo segnata la mediana= q112 , cioè la superficie ombreggiata ha area ½, come pure l'altra metà del sottogralico.

    Esempio 4.3 S.ia X una v.a. esponenziale di parametro À. Quanto vale il suo quantile di ordine a? Quanto vale la sua mediana? Per trovare il quantile di ordine a, O < et < I, occorre risolvere l'equazione (4.7). Abbiamo visto che la funzione di ripartizione di una v,a. esponenziale è Fx (x) = 1 - e -u, per cui l 'equazione precedente ha soluzione e, scegliendo o· =

    qa = _ .!_ Ioga ).

    ½, troviamo che la mediana è uguale a

    1 J 1 lJI/2 = -). log = ). log2 . 2

    4.2 Calcolo di leggi

    Molti problemi di probabilità si riconducono alla determinazione di una densità, per poi calcolare la probabilità di eventi tramite il calcolo di integrali come nella (4.3). Spesso il problema si riconduce al calcolo della densità di una v.a. della forma ,p (X), dove X è una v.a. di cui si conosce la densità f e ,p è una funzione lR -+ [�. A differenza del caso delle v.a. discrete, ora bisogna fare un po' di attenzione perché, date una v.a. X ed una funzione ,p, non è detto che ip(X) sia sempre una v.a., a differenza del caso discreto in cui ciò era sempre vero. Si può però dimo.�trnre che t/J (X) è una v.a. non appena rj, sia abbastanza regolare. Ad esempio se ,/J è continua oppure comunque del tipo delle funzioni che si incontrano abitualmente nei corsi di calcolo (cioè, in pratica, quasi sempre). Faremo tacitamente l'ipotesi che ef, soddisfi a queste condizioni, per cui ,j, (X) sarà sicuramente una v.a. d ' ora in avanti. Vedremo in questo paragrafo vari modi per calcolare la legge di 4> (X) . Un primo metodo consiste nel detem1inare prima la f.r. di (X); essa si può in teoria sempre ottenere con la relazione (4.8)

    G (t)

    = P( (X) ::S r) = P((X) E) - oo, t]) = P(X E ,p - 1 () - oo, t])) = f

    4>- 1 0-00.1])

    /(x) dx .

    Una volta determinata la f.r. C, la densità g si ottiene per de1ivazione, come nell'esempio seguente.

    Capitolo 4 Modelli continui

    80

    Esempio 4.4 Sia X una v.a. reale di densità f . Qual è la densità di X2 ? n questo caso

    O, O, allora

    e, derivando,

    G(t)

    = P(aX + h .:5 t)

    = P(X :5 1·;/ )

    = Fx ( ':b )

    g(t) = G' (t) = � f('-/) .

    Se invece a < O, bisogna stare attenti al cambio di verso nella disuguaglianza:

    e quindi

    G(t) "' l'(aX + b :5 t) = P(X ?: ';b ) = I - Fx(!.'f!-!) g(t) = G'(t) = -� f( r-1, ,, ) .

    a Mettendo insieme i due casi si ha, qualnnque sia il segno di a,

    4.10)

    4.2 Calcolo di leggi

    81

    In particolare, se scegliamo a = - 1 e b = O, troviamo che -X ha densità g (t) = J(-t) . Dunque se la densità J è una funzione pari, le due v.a. X e -X hanno la stessa densità. Si dice in questo caso che X è Gr;;J;;�fri;;':.

    La nozione d'indipendenza di v.a., che abbiamo visto per le v.a. discrete nella Definizione 3.19, si può dare anche per il caso generale (cioè per v.a. non necessariamente discrete). In generale vale la definizione seguente, che si potrebbe d imostrare che implica la Definizione 3.19 se le v.a. sono discrete.

    \ t e Y > t . Dunque, per t > O, 1 - Fw(t) = P( W > t) = P(min(X, Y} > t ) = P ( X > t , Y > 1) = P(X > r)P(Y > t ) = e -i,e- 1"

    da cui, pc. r > O, Fw (t) = I - c·--Arc -w = I - c··().+µ )r. Dcrivaudo troviamo che la densità di W è, sempre per 1 > O, (À + µ) e-P-+1•l' : W è anch 'essa cspone117jaJe, ma di parametro )._ + µ .

    J

    82

    Capitolo 4 Modelli continui

    *4.3 Densità congiunte

    Come nel caso discreto è opportuno studiare delle v.a. multidimensionali. Supponiamo ad esem' pio di considerare due dispositivi indipendenti aventi tempi di rottura esponenziali di parametri >,_ e J.L rispettivamente. Qual è la probabilità che il primo si rompa prima del secondo? A quest; l '. domanda sarà facile rispondere con le nozioni di questo paragrafo. Sia (Q, .11., P) uno spazio di probabilità e Z ; Q -,. JR"' un'applicazione. Ricordiamo (Definì.: zione 3.15) che Z è una v.a. m-dimensionale se le sue componenti Z1 , . . . , Zm sono delle v.a: (reali). Per semplicità nel seguito supporremo m = 2 e indicheremo con ?[. Y le componenti dellà v.a. bidìmension�le Z = (X, Y) . Diremo che X e Y hanno \de,j�itp!'�qfz� f. f ; �2 -.- R, se f è integrabile, positiva e tale che, per A e IR.2 (4 . 1 1)

    P((X, Y) e: A) = P(Z E A) cc

    Scegliendo A = JP..2 si vede subito che deve essere (4. 12)

    f

    ]p,.2

    i

    f(u, v) du dv .

    J(z) clz = I .

    Osservazione 4.S Se le v.a. X e Y sono discrete, abbiamo visto nel capitolo 2 che l'insieme

    ((X, Y) E A} e Q è un evento, qualunque sia il sottoinsieme A e JR . Se X e Y non sono discrete I ciò non è più vero in generale e si conoscono esempi di sottoinsiemi A e iR tali che {(X, Y) E A} ; 2

    non è un evento (e tali quindi che non si può calcolare la probabilità P((X, Y) E A)). Dctcrminare qualì siano i sottoinsiemi A e lft2 tali che { (X, Y) E A) sia un eventoè un problema che va al dì là degli scopi di questo testo. Si può però dimostrare che perché ciò sia vero basta che A sia un sottoinsieme di JR2 abbastanza regolare. In particolare {(X, Y) E A} è un evento se A è uno dei sottoinsiemi di 11{2 che s'incontrano nei corsi sugli integrali multipli. Una questione simile si presenta quando, data una funzione ip ; H.2 -> JR, si considera l'applicazione Y) = À/L

    1 0

    +00 dx

    1+00 .t

    e-À. O e definita arbitrariamente (= O ad esempio) se fy (y) = O. Analogamente, scambiando i ruoli di X e Y , si definisce la densità condizionale di Y dato X = x. Come conseguenza della (4.13) si vede subito che se jy (y) > O allora

    1

    00

    fxp· (x lY) dx = r f (y) -= + _

    dunque x ➔ fxtY (x)y) è una densità.

    1

    /

    f (x, y) dx :c l

    4.3 Densità congiunte

    89

    Intuitivamente fx1r( ·IY) è la densità di X quando si viene a sapere che Y ha preso il valore y. Se X e Y sono indipendenti, allora per la (4.16) fx 1r (x!y) = fx(x) e dunque la conoscenza del valore assunto da Y non modifica la previsione del valore assunto da X, in accordo con il significato intuitivo della nozione di indipendenza. Esempio 4.19 Se X e Y sono uniformi sul cerchio come nell'Esempio 4.lO e -1 ::: y :e: l allora altrimenti

    ovvero la legge condizionale di X dato Y = y è la distribuzione uniforme su [-�.

    /I=:v2' i.

    La (4.20) permette di calcolare l a densiià condizionale a partire dalla densità congiunta ma anche, viceversa, di calcolare la densità congiunta qualora i dati del problema forniscano la densità di Y e la densità condizionale di X dato Y, poiché evidentemente f(x, y) = fx1Y (x)y) fy ( y) .

    Esempio 420 Il tempo di vita di un componente elettronico dipende dalla concentrazione di silicio nel materiale di cui è fatto; più precisamente esso ha legge esponenziale di parametro À, dove .l. è appunto il valore di tale concentrazione. Una macchina produce questi componenti, ma nel processo produttivo non è possibile controllare la concentrazione di silicio che pertanto si può considerare una variabile aleatoria, che indicheremo con A, uniformemente distribuita su [O, l ] . Indichiamo con Y i l tempo d i vita del componente prodotto. Qual è la legge d i Y? I dati del problema permettono di affermare che se y ::: O altrimenti .

    Tenendo conto che A è uniforme su [O, 1], la densità congiunta f dì A e Y vale dunque _ j(À, y) = { >-- e-) y se � ::: O, _ O :::: >-- :: l O altnmenl! ,

    Il calcolo della densità di Y si riduce ora a quello della seconda marginale di f, che si fa facilmente usando la (4. 1 4). Il calcolo numerico dà, con una integrazione per parti, fy (y) =

    t

    lo

    À e-1->' dÀ = � ( 1 - y e-Y - e-Y)

    per y > O, mentre Jy(_y) = O per _y :'.': O.

    Y

    Come nel caso discreto, spesso si deve calcolare la densità della sonuna di v.a.

    90

    Capitolo 4 Modelfl còntlnui

    :Consideriamo il vettore Z = (X, Y) e la �nzione ,j, �x, y) _=_x + y. La regione I& dèhpianq:dei,punti"(x, y) tali che q', (x, Y! = x + y :'.S t non e altro c he 1! sem1pian A che • trova � � fsinistiadella:retta x + y = t (ombreggiato nella FJgura 4.8). Dunque la f.r. G di X + Y e •�i(t)

    oo

    = P(X + Y s t) = P((X, Y) E A) = fJ f(x, y) dx dy ""' 1-: ,\

    x

    dx 1-: f(x, y) dy .

    x -t- y = t ✓

    Ma, con il cambio di variabile z = y + x, 11-X _

    00

    f (x, y) dy =

    1'

    _00

    f(x, z - x) dz

    (in questo integrale la variabile d'integrazione è y mentre .x è una costante). Riprendendo il calcolo e cambiando l 'ordine d'integrazione G (r) =

    l 1/-x + -+oo oo =

    dx

    -=

    f (x , y ) dy =

    1' 1 "" -oo

    dz

    dx -oo 1'-oo f(x, z - x) dz = 1+00

    f(x, z - x) dx =

    che esprime appunto il fatto che g è la densità di X + Y . -CX)

    1'

    -cc

    g(z)dz

    Esempio 4.22 Siano X , Y indipendenti e csponenziali di parametro ).. _ Qual è l a densità d i X +Y? Poiché X e Y sono indipendenti, la loro densità congiunta è f(x, y) "" fx (x) fy (y). Dunque per il Teorema 4.21 la densità g della loro somma è g (y) =

    f

    fx (x ) fy (y - x) dx .

    Osservi�mo che fx (x) = O per x :'.S O e anche che fy (y - x ) = O a meno che non sia y - x > O ovvcro x < y . Dunque nell'integrale precedente l'integrando è diversoda zcro solo se O < x < y . Per questi valori di x e y inoltre si ha fx (x)J.,. (y - x) "" À2 e-J.xc-!.(y-x) = À2 e-J.y . Dunque

    Il problema del calcolo della densità della somma di due v.a. è una questione che si presenta

    4.4 Leggi normali

    91

    calcolo di un integrale che non sempre si riesce a fare. Vedremo più tardi altri metodi che, talvolta, possono portare al risultato più rapidamente.

    4.4 Leggi normali

    Si può dimostrare che la funzione (4.21)

    f (x) = __I___ e-x /2

    ./2ir è una densità di probabilità (cioè che il suo integrale da -oo a +oo è uguale a I). Essa è il prototipo di una classe importante di distribuzioni. Se X è una v.a. di densità f e O , allora sappiamo, grazie all'Esempio 4.5, che l a v.a . ha densità (4.22)

    2

    2 I V - µ, l (y - µ,) g ( y) = iai 1 ( � ) = JTii e-1 /2 è una funzione pari, per l 'Esempio 4.5 con a = - 1 e b = O, si vede che e X ~ N(O, 1 ) , allora le due v.a. X e -X hanno la stessa legge e dunque la legge N (0, 1) è immetrica. Da questa proprielil si ricava la relazione

    4.2 3)

    ${x) = P(X :::: x)

    = P(-X :::: x) = P(X � -x) = l -- P(X :,: -x) = I - (-x) .

    Esempio 4.23 Quanto vale la probabilit11 (- 1.05}

    = P(X :::: - 1 .05} per una v.a. N (0, ])? Quanto vale i l quantile di ordine 90% di una v.a. N (O, l)? Uno sguardo alla tavola a p. a-1 mostra che essa riporta i valori di (t) solo per valori positivi i t. La quantità P(X ::::: 1 .05) vale 0.853 14 (all'incrocio tra la riga che comincia con il valore 1 .0 la colonna che porta in alto il valore .05). Dunque, grazie alla (4.23), otteniamo (-1 .05) = - (1 .05) = 0. 147 . Invece il quantile di ordine a = 0.9 è qnel valore di t tale che (I) = 0.9. Cerc�ndo sulla tavola trova che ( 1.28) = 0.899, mentre (1 .29) = 0.90 1 . Dunque il quantile cercato è compreso a 1 .28 e 1.29. Con un software adatto si troverebbe subito il valore 1 .281 5 .

    a (4.23) permelte di ricavare alcune relazioni molto utili per i quantili. Indichiamo con t/>a il uantile di ordine a della N(0, 1 ) . Ricordando che il numero O,

    r(l)

    =

    1+oo

    e--' dx = l

    (4.27)

    Da (4.26) e (4.27) si ha facilmente, per ogni intero positivo 11, f (ll) = (ll - 1) ! .

    Se a > 0 e À > O , chiameremo [deiisità GÌllimici) di paramelri a e À (oppure diremo che è r (cr, À)) la densità "' -- x"-l e-/.x x > O f(x) = '(a) · � altrimenti . Osserviamo che per a = I ritroviamo le densità esponenziali.

    { À

    Figura 4.13 Grafico di densità Gammn per ).. = 2 e diversi valori di a.

    Osservazione 4.24 Se una densità g è della forma

    se x > O altrimenti

    dove e è una costante positiva, allora g è necessariamente una densità f(a, À) e e = J...a/ f (a). Infatti, poiché g è una densità, con il cambio di variabile Àx = y, e dunque e = Àa / f(a).

    Esempio 4.25 Sia X una v.a. N(O, a 2); allora (Esempio 4.4) X2 ha densità per y > O mentre g(y) = O per y � O. Poiché g è una densità (è la densità di X2 ), per l'Osservazione 4.24 g è r(½, �) ed inoltre scopriamo che l'( ! ) = ✓ii.

    Una proprietà importame è la seguente.

    f � l i 1 f t � � ; f 1 � � ; 5 �; � � , � �!i

    ' l·.· ����� '.;

    '.'.: , : •� · :: ," '' (

    Mdli � (La dimostrazione fa uso di no:lioni .introdotte nel paragrafo 4.3; vedi l ' Esempio 4.46 per una dimostrazione diversa) Cominciamo con il caso m = 2 e indichiamo con / , h le densità f'(a1 , À) e f(a2, À) rispettivamente. Per la Proposizione 4.21 la densità g di Xi g (y) =

    l

    cc f1 (x) h (y - x) dx .

    +oo

    1

    + x2 è

    4.5 Leggi Gamma

    95

    Tenendo conto che sia fi che fz sono nulk per valori negativi della variabile, l'inregrando si annulla al di fuori dell'intervallo [O, y] e

    Con il cambio dì variabile x = ty si trova

    Quindi per l'Osservazione 4.24 g è una densità f (c, 1 + a2 , À) e per di più vale la relazione

    (4.28)

    per ogni a 1 > O, a2 > O. Abbiamo quindi completato la dimostrazione nel caso m = 2. Se m = 3, basta osservare che X 1 + X2 e X3 sono indipendenti per l'osservazione successiva alla Proposizione 4.18. Applicando due volte il risultato sulla somma di due v.a. si ha e iterando questo ragionamento si ha la tesi.

    Non ci sono formule semplici per la funzione di ripartizione delle leggi Gamma, a meno che a non sia un numero incero. Infatti esiste una relazione di ricorrenza tra le funi.ioni di ripartizione: indichiamo con Fa la f.r. di una v.a. f(a, ),) , si ha allora, per x > O,

    che per a = m intero diviene (4.29)

    r",., (X ) = -

    (ì.xr~ t e ÀX + l' 'm- t (X) • (lii _ l ) !

    Poiché sappia1110 già che per 111 = J , cioè le leggi esponenziali, (4.30)

    96

    Capitolo 4 Modelli continui

    terando la (4.29) otteniamo

    4.3 1)

    m- 1 Àx . = - (Àx) F,,, (x) e - + Fm__ 1 (x) = (m - l ) !

    ÀX m - 1 ' m- 1 ()..x ) m-2 _ . _ -( ) c >-x c > x + Fm -2 (x) = . . . = J - e->-x L (Àx) · - (m - l ) ! � (m - 2) ! k=O

    Esempio 4.2.7 Una lampada ha un tempo di vita che segue una legge re i4 ) . Appena si guasta iene sost1tu1ta con un'altra. Qual è la probabilità che IO lampade non siano sufficiellli per un nno (= 365 giorni)? Supponendo i tempi di vira delle IO lampade indipendenti, il tempo di guasto della decima ampada si rappresenta con una v.a. Z ~ r{5, ,k ) . II valore richiesto dunque non è altro che (Z .S: 365), cioè il valore della f.r. F di Z calcolata in x = 365. Con uno dei software indicati opra si ottiene F(365) = 0.55.

    i,

    e leggi Gamma quando il parametro cx è intero si chiamano anche i leggi di Erl;;;g,_ Si chiama nvece legge del [�,;�;�J;:;;i�j con n gradi di libertà e si indica co� �2 (11) una legge re 2, il­ �r l 'Esempio 4.25 e la Proposizione 4.26, r(,:, è la densità di una v.a. Y della forma y = Xj + . . . + X� dove X 1 , . . . , Xn sono v.à. i ndipendenti e N(O, I ) .

    !)

    .6 Il Processo d i Poisson, processi di arrivi

    elle applicazioni 1alvoltaoccorre rnodellizzare un processo di arrivi. Esempi di queste situazioni ono gli arrivi di telefonate a un centralino, l'arrivo di nuovi clienti in una fila d'attesa, di veicoli un incrocio, il prodursi di guasti in apparecchiature. . . Un approccio per modellizzare queste situazioni consiste nel considerare una succc�sione di a. S1. S2 . . . a valori ':: O, che rappresentano i tempi che intercorrono tra due arrivi successivi li "intertcrnpi"). Dunque il primo arrivo avviene al tc"n-tpo S 1 , il secondo al tempo S1 + S2 e così a. Il tempo dello n-esimo arrivo è dunque T,, = S 1 + . . . + Sn . Lo studio di questi processi ha to luogo ad una teoria molto avanzata che va al di là delle possibilità di qucsl_i agpu nti, possiamo rò vedere _una proprietà impo�ante di un partic�l �e proces �o di arrivi, il_ [Er��e.i-.fo' d{Poissa.fi} c Questo s1 presenta quando st suppone che gli 111tcrtemp1 s1 , s2 . . . s1anoìrul 1pcndenti Oi nsità esponenziale di parametro À > O fissato. Sappiamo allora, per la Proposizione 4.26, che - f(k, À). Qual è la probabilità che, per un processo di Poisson, nell'intervallo di tempo [O, t] vi siano attamente k arrivi ? Se indichiamo con N, i! numero di arrivi nell' intervallo di tempo [O, t], dobbiamo calcolare probabilità P(N, "' k) , ovvero la densità (discreta) di N, . Poiché 1� è il tempo dello ,,-esimo rivo, un attimo di riflessione mostra che

    {N1 _s; k} = {Tk I > t) . + fatti, dire che N, S k equivale a dire che il (k + i)-esimo arrivo ha avuto luogo dopo il tempo Poiché Tk ~ f(k, ).) , la sua f.r. Fk è quindi data da (4.31) e dunque

    P(N, .S: k) = P(Tk I >

    t)

    = I - l�+I (t) = e ~J.r

    L (�? k

    4.6 Il Processo di Poisson, processi di arrivi

    97

    Riconosciamo a destra la funzione di ripartizione di una legge di Poisson di parametro J..t . Dunque N, è di Poisson di parametro Àt e P(N, = k) = e-À,.

    Q{f-

    Il processo di Poisson è l'esempio più importante di processo di arrivi e costituisce un modello soddisfacente in molte situazioni applicative. Tuttavia il fatto che gli intertempi siano modelliaali da v.a. esponenziali l o rende poco adatto, ad esempio, nei problemi di affidabilità, in cui gli "arrivi" sono i guasti di apparecchiature. In questi casi, se usassimo la legge esponenziale per modellizzare il tempo di vita, la proprietà di assenza di memoria affermerebbe che la probabilità di guasto in un intervallo ]t, t +h] di un'apparecchiatura che è stata in funzione nell'intervallo [O, t}. non dipende da quanto sia grande t , cioè non dipende da quanto tempo l'apparecchiatura sia stata in servizio. Spesso invece è ragionevole supporre che ci sia un effetto di usura e dunque che la probabilità di' guasto in un intervallo ]t, r +h], di ampiezza h fissata, aumenti al crescere del tempo r, trascorso dal momento della messa in servizio. In questi casi, quale densità è ragionevole attribuire agli intertempi Sk '! Supponiamo che Sk abbia una densità continua f e chiamiamo F la sua f.r. Osserviamo che l a probabilità che un'apparecchiatura s i guasti nell 'intervallo d i tempo ]1, t + h] sapendo che è staia in funzione nel periodo [O, t} è data da P(Sk :e: t + h I Sk > t) =

    l'(t -< S - < t --t- h) P(S: � t)

    =

    1,-;./,

    l I _ F(I) '

    Se h è piccolo e f è continua, questa probabilitii è dell'ordine di

    j (s) ds .

    h f(t) "f=""F(t)

    Poniamo allora (4.32)

    r(l) =

    _fl!l_ 1 - F(t)

    La funzione ,- si chiama il ftasso istantaneo di guasto i ( i11stantaneousjail11re-��t� ;, i.f.r. in in­ glese) della densità f. Vol�nèlo moclclhzzare 1!"temp� d1 v1taO

    98

    Capitolo 4 Modelli continui

    e F(t) = O per I ::o O. Facendo il quoziente, si vede subito che la densìtà / ha proprìo i.f.r. uguale a r. Non è difficile di mostrare anzi che questa densità è l'unica avente i.f.r. r. In particolare le densità esponenzi ali sono le uniche ad avere i.fa. costante.

    Esempio 4.28 Per À, f3 > O fasati, consideriamo la funzione r : R+ ...... JR+ r(t)

    =

    "iiÀ r - I /J

    Qual è l a densità f avente r come i .f.r.? Si ha facilmente J; r(s) ds = À 1P e, come abbiamo vìsto,

    (4.33)

    1>0

    e / (1) = O per t :,: O. La f.r. è invece F(t) = 1 - e-M" per t > O. La densità definita dalla (4.33) si chiama di [@j_pÈf] di parametri À e /3. Si vede subito che, se /J > 1 , lo i.f.r. è crescente (per f3 = I ritroviamo le leggi esponenziali) e quindi si tratta di densità adatte a model!izzare fenomeni di usura. Per f3 < 1 invece lo i.f.r. è decrescente in I; pensando all 'esempio dei guasti, l 'apparecchiatura diventerebbe sempre più affidabile al passar del tempo. È meno immediato i mmaginare una situazione di questo genere, ma, pensandoci bene, nella realtà un apparecchio appena messo in servizio può nascondere dei difetti di produzione che si manifestano nei primi tempi di servizio; è quindi ragionevole pensare che un apparecchio che ha superato senza inconvenienti il primo periodo di funzionamento debba essere considerato più affidabile di uno nuovo di fabbrica. Le leggi d i Weibull sono l'oggetto degli Esercizi 4.12 e 4.46.

    A voler essere realistici, per modellizzare il tempo di vita di un 'apparecchiatura, Io i .f.r. dovrebbe avere un andamento come quello della Figura 4.14: decrescente per t piccolo, crescente per t grande e senza grandi variazioni per valori di I intermedi.

    I

    Figura 4.14

    4.7 Speranza matematica, momenti

    In questo paragrafo definiremo la speranza matematica delle v.a. assolutamente continue. Sia X una v.a. òi densità (continua) J. Si dice che X ha speranza matematica finita se e solo se

    1

    co lxlf(x) dx < +oo . -+00

    4.7 Speranza matematica, mo01_enti__�

    Se X ha speranza matematica finita si ch iama fillf�I!�a;effjifi(!)i. p'i�çp_,j di X la quantità . (4.34)

    E[XJ =

    1

    oc xf(x) dx . -+00

    In altre parole la speranza matematica è data dalla (4.34), a condizione che_l'integrale converga assolutamente. Il significato intuitivo della speranza matematica come media dei valori assunti da X è abbastanza evidente anche nella (4.34). La speranza matematica delle v.a. assolutamente contìnue gode delle stesse proprietà che abbiamo visto per le v.a. discrete. Non ne daremo la dimostrazione.che pure non è particolarmente complicata e consiste nell'approssimare le v.a. a�solutamente continue che stiamo considerando con delle v.a. discrete, alle quali si appl i cano i risultati citati.

    Esempi 431 a) (Distribuzione uniforme su [O, 1)) Una v.a. X uniforme su [O, l] ha una densità f che vale I su [O, l ] e O fuori di [O, l]. Dunque E[X] =

    1

    o

    1

    1

    x dx = - ·

    2

    b) (Leggi nonnali) Calcoliamo la speranza matematica di una v.a. X di legge normale N (µ., a2) . 2 Trattiamo prima i l caso X ~ N(O, 1 ) . Poiché x ➔ x e -• /2 è una funzione dispari (tralasciamo, qui come negli esempi che seguono, la verifica che gli integrali convergono assolu­ tamente). Se invece Y ~ N(µ., a 2 ) allora, poiché Y = a X + µ, dove X ~ N (O, I ) , E{Y] = aE[X] + µ. = µ. .

    00

    Capilo/o 4 Modelli continui

    :J!e,fftCc:l_i .densità fx è. jy. rispettivàmcnte: Se esse hanrìò'. :iÌ-:;furb'prodottò XY ha speianzil 'm• atenìJÙcà finii� e [J •

    ,,,i;:f/?;\?t•�>,;,• �:-�::; .•�• :•.�:')� ,• .: '. �r�YJ::;: E�x;J �rp :::



    V•. :�

    :-,,,:i

    Teorema 433, molco simile a l Teorema 3.3 1 che avevamo visto nel caso discreto, è anch'esso olto utile: supponiamo di dover calcolare la speranza matematica di una v.a. Y = (X), che è na funzione di una v.a X di cui conosciamo la densità fx - Se applicassimo la definizione (4.34) ovremmo prima calcolare la densità, Jr , di Y e poi l'integrale f tfy(t) dt .

    Teorema 4.33 ci dice che si ottiene lo stesso risultato facendo l'integrale

    parmiandoci quindi il calcolo di fy .

    j

    if> (x)fx (x) dx

    empio 4.34 Supponiamo che X sia uniforme su [O, I]. Quanto valgono E[sin(2rr X)] e E[ex]? Usando il Teorema 4.33 si trova subito I E[sin(h X)J = sin(2rrx) dx = O

    lo I E[e ] = fu e dx = e - l . x

    -
    ,._,C(I E(X 1 ) , sempre in probabilità. Quindi, ricomponendo il binomio,



    t

    (';) E(X})(-E(X i))"' -k = t ( X; - X,.)'" �"' " ; �1 k=O

    = E[f, (';) x}(-E(X i ))'"-t] == E[ (X 1 - E(X 1 ))"') . k=O

    112

    Capitolo 5 Convergenza e approssimazione

    Dunqùc, se x1 ha momento di ordine 2m finito, le v.a. definite nella (5.3) convergono in pro­ babilità, ·per ,r -> oo, al momento centrato di ordine m. Quindi la Legge dei Grandi Numeri afferma che, nelle condizioni che abbiamo detto, i momenti centrati delle osservazioni sono una approssimazione dei momenti centrati della legge delle osservazioni. Osserviamo comunque che, qui come nel!'Esempio 5 .3 e nel successivo Esempio 5.5, usiamo, d�ndole per scontate, alcune intuitive proprietà della convergenza in probabilità che andrebbero però dimostrate. In particolare che, se (Xn )11 e (Y.) 11 sono successioni di v.a. convergenti in pro­ babilità alle costanti x e y rispettivamente, allora (Xn +Y,.),, e (Xn Yn )n convergono, i n probabilità, a x + y e xy rispettivamente.

    Esempio 55 (Convergenza di skewness e kurtosi) Sia (X,. ). una successione di v.a. indipendenti e aventi la stessa legge. Supponiamo inoltre che E(Xf) < +co. Allora, grazie all'esempio precedente, se consideriamo l' indice di skewness di X 1 , • . . , X. ,

    (5.4)

    Yl, n

    3 = I (X; - X.) = ( 1 ¼ L; n - , ) 3(2 ,i Li=! (X; - X,.)-

    esso converge in probabilità, per 11 ---,. oo, a

    E[(X1 - E(X 1 )) 3 ] E[(X 1 - E(X 1 )) 2]3/2

    5.5)

    , in maniera simile, per l'indice di kurtosi, Y2,n

    ¾ I:;'= 1 (X; - X,.) 4

    = 1

    ( ,. I:;'= I (X;

    - Xn) 2)2

    -

    3

    p -> n -H>O

    E[(X 1 - E(X 1 ))4] E[(X1 - E(X 1 )) 2] 2

    3.

    Quindi skewness e kurtosi delle osservazioni sono stime della skewness e deJla kurto5i della loro distribuzione (definite rispettivamente negli Esercizi 4 . 1 3 e 4.45).

    Supponiamo di osservare delle quantifa X t , . . . , X,. , che si possono considerare indipendenti cd aventi la stessa densità. Sì può dire che questa densità sia gaussiana? Una prima verifica i può fare calcolando l ' indice di skewncss (5.4). Osserviamo che, se X 1 ~ N(µ., a 2) , allora X1 - E(X 1 ) ~ N(O, a 2) e si può scrivere X 1 - E(X i ) ~ aZ, con Z ~ N (O, 1). Dunque E[(X 1 - E(X 1 ) )3 ] = a3 E(Z3 ) = O e la quantità in (5.5) è uguale a O (vedi anche l'Esercizio 4.13). Se 11 è grande, l'indice di skewncss (5.4) del campione deve quindi essere vicino a O. Una seconda verifica si fa considerando l'indice di kurtosi: con le stesse notazioni di poco fa, E[(X 1 - E(X 1 ))4] = a4E(Z4 ) = 3a 4 (vedi la (4.37)). Dunque, se Xi ~ N (µ., a 2) , E[(X 1 -- E(X1))4] _ 3 = 3a 4 _ 3 = O a4 E[(X 1 - E(X 1 ))2)2

    , se le osservai ioni X t , . . . , X,, provengono da una distribuzione gaussiana. per n grande l'indice i kurtosi del campione deve essere vicino a O. Queste considerazioni hanno finora un valore solo esplorativo (non sappiamo precisare cosa ignifichi "vicino"). Ritroveremo comunque il problema di vedere se le osservazioni seguono una istribuzione gaussiana negli Esempi 5.7 e 5.8.



    5.1 La Legge dei Grandi Numeri: applicazioni

    113

    Esempio 5.6 (Convergenza degli istogrammi) Consideriamo una successione X 1 , X 2 - . . d i v.a. i ndipendenti e aventi la stessa densità continua f . Fissiamo un intervallo limitato [a, b] , che suddividiamo in sottointervalli Ii , . . . , h. Per ogni h = 1 , .. . , k poniamo Z;, = n1 � L., l 1. (Xi ) . i=l

    :[;'= 1 I 1• (Xi ) è il numero di volte che X; E Ih , i = 1, . . . , 11, e zt> è dunque la proporzione delle prime ,r osservazioni X 1 , . . . , X. i cui valori si trovano nel!' intervallo /h , Si è soliti visualizzare le v.a. ztl, . . . , zt> costruendo al di sopra dell'intervallo /1, un rettangolo di arca proporzionale a zt>; se gli intervalli /1, sono di uguale ampiezza ciò significa naturalmente che le altezze dei relt�ngoli sono proporzionali a Zi''). La figura che ne risultasi chiamafù1Jg}�-;;;;;�ì, che abbiamo già incontralo nel paragrafo 1 .4: si tratta di un metodo molto usato per claréunade.fcrizione visiva di come sono ripa1titi i valori di X 1 , . . . , X,, .

    2 O Figura 5.1 Istogramma di 200 osservazioni ìndipendcnci di legge r(3, l), a confronto con la relativa densilà.

    ------ --- ------- - -�- - -� ---Figura 5.2 Istogramma di 4096 valori simulati con il metodo di Box-Muller (vedi p. 105) a confronto con la densità N (O, I) . Per 11

    - >

    cx, la Legge dei Grandi Numeri afferma che

    zt)

    i

    11-+co

    E[ t ,. (X; ) ) � P(X;

    E

    I,, ) =-= J J(x) dx _ f1t

    Se gl'intcrvalli li, sono abbastanza piccoli, in modo che la variazione di f su l;, sia piccola, allora i rettangoli dell'istogramma tenderanno ad avere altezze proporzionali ai corrispondenti valori di

    ·e:dèlle informazioni sull'andamento di f. 'fog;-ammi confrontati con le relative densità.

    \iÌi) Siano X 1 , . . . , Xn delle v.a. indipendenti , aventi tutte la crè'ia"; poco importa). Indichiamo con F la loro f.r. Se poniamo vede subito che E( l ,1, (X 1 )) = P(X 1 ::': t) = F(t) . I n "' 1 A, (Xk) n-)-OO � E ( l A, (X 1 )) = F(t) . 1l- L.,,

    · Indichiamo con F,, (t) il termine a sinistra nella (5.6), cioè k=I

    - . � 1 F,,(t) = Ii L I A, (X.) = ;, x numero di indici k tali che X; ::: t . ,

    F,, � una fu,�zionc di t eh� si chiama la !JJ/!.!_if..o_:�:_1i ripqrtizion;· �,�pi;;;;;;. Un altro modo, per _ _ certi v�r�1 più sempl '.ce, �1 v_c?ere la stessa cosa è ìl segue111e--:-friiiicliiam-o con X { !) , . . . , X(nl i < numen Xl , - . - , Xn nordmal! rn senso crescente: X (I) sarà quindi il valore più piccolo e X (Il X(2) ::: . . . ::: X(n) · Allora è chiaro che k�I

    l\ (t) = � .

    mentre FnU) = O per t < x{I ) e Fn (t) = 1 per X(n) ::: t . Infaui s e x(k) ::': t < x(k+ I), c i ò vuol dire che v1 sono esattamente k i ndici i tali che X; :': t e dunque 1 11 k - "' lA 1 (Xk) = Tl L,__;

    n

    k=I

    S �Uolin�iamo comunque che, per ogni valore di t, f.,, (t) è una quantità aleatoria, perché dipende dai valon :: 1 , . • . , Xn - Dunque la (5.G) non fa che affermare che, per ogni t fissato, la f.r. empirica co11verge m probabilit?i alla f.r. F.

    �- ­

    _ f;,--�------,

    --�·�_ ,. . -: · ·

    - ;· · ·r·- - -�

    - - - ���-- .

    -j·--+-------1..-t---t------+---+--X(J)

    Figura 53 Escmpio di funzione di ri artizione cmpirica per un campione di rango 7 di una legge _ _ d1pnpart,z10 _ N(O, 1), a contronto con la funzione nc teonca (a puntini). X(I) X(2)

    X(4)

    X(SJ

    X(6)

    X(1)

    . 1_L_a__e 5_ -- - ---- -------�--_ L ....cgc..cgc...e_dei Grandi Numeri: applicazioni

    115

    Queste osservazioni hanno delleconseguen,e pratiche inleressanti. Talvolta, in presen,a di dati sperimentali X 1 , . . . , X. , ha un interesse di stabilire se essi seguano una distribuzione assegnata, N(O, 1) ad esempio. Se così fosse, per II abbastanza grande, per la Legge dei Grandi Numeri, la differenza tra la f.r. empirica f,"';, e F deve risultare piccola. Se F = ( è al solito la f.r. della densità N(O, !)), poiché sappiamo che F,, assume il valore f nel punto X(i) , ciò vuol dire che i numeri � e (XciJ ) devono essere vicini. Applicando la funzione (X(i) ), otteniamo che anche i due valori e

    devono trovarsi vicini tra loro. Il punto - 1 (f) è i l numero in cui la f.r. prende il valore h e dunque non è altro che il quantile 365). Usando le tavole della legge normale e la {5 .8)

    lt;

    P(X 1 + . . + X40 > 365) = l - P(X 1 + . . . + X40 :,: 365) 1'S

    __.;:.--- r- --.. (·\

    /'- . - · - ....

    ,,, ..

    �tJ3 -

    ,

    · ··''�-.,.

    Figura 5.9 Andamento della densità di s,; per vari valori di n, quando le v.a. X; sono indipendenti e uniformi su {-� , ½J. Per n = 2 si trova il classico grafico "a casetta", vedi anche l'&ercizio 4.24. Gli altri grafici sono per n = 3 (a trattini), 11 = 6 (trattini e puntini) e n = 12 (tratto pieno). Si vede che al crescere di II il grafico assomiglia sempre di più a quello di una N(O. !). Il grafico di quest'ultima non viene tracciato perché sarebbe indistinguibile da quello per 11 = 12. Da notare che il Teorema 5.12 g_ar:mtisce_ la conve:genza d_ellc funzioni di ripartizione e non quella delle densità: per quest'ultimo nsultato c, sono alto teoremi che non affrontiamo ma che valgono, ad esempio, per le densità uniformi su [ ½] di ques10 esempio.

    -½,

    · "" I -

    28), dove le X; sono indipendenti e B ( I , ½)- Sempre sando l'approssimazione normale (5.8), P(X 1 + . . . + Xso > 28) = I - P(X 1 + . . . + X50 :': 28) "" 28 - 50 - 0.5 "" l - ( ---- ) = I - (0.85) = 0.2 . .Jso . o.5

    e avessimo calcolato numericamente la f.r. della densità B(50, ½l, avremmo ottenuto come sultato 0.16. Osserviamo però che, poiché le X; assumono valori interi , P(X 1 + . . . + Xso > 28)

    l 'approssimazione normale darebbe ora

    = P(X 1 + . . . + Xso > 28.5)

    P(X1 + . . . + Xso > 28.5) = I - P(X 1 + . . . + X50 :'.:' 28.5) "" 28.5 - 50 · 0.5 e:;: I -· ( --=--- ) = I - (0.99) = 0.1 6 . .Jso . o.5

    generai � cu � v.a. a valori interi si ottiene una migliore appros�jmazione scri�cn,,➔oo a2 in probabilità, anche s; -> n➔oo a 1 in probabilità. .2) = E(s,,

    Torniamo al calcolo degli interval li di fiducia per la media. L'idea come abbiamo visto è semplice: sostituire nella (5.10) alla quantità sconosciuta a con la sua stima s11 • Si può dimostrare che, se (Xn) n è una successione di v.a. indipendenti di legge N(µ, o-2), allora la v.a. (5 . 14)

    I- -,,11

    - 11. x,.-­ s,.

    seoue una leooe che si chiama i t tli Student ! con n - I gradi di libertà e si indica con il simbolo �(� - I ) . No�è difficile dare un�dcÌìnÌzio�;·rigorosa di queste leggi e anche calcolarne la densità: si chiama densità di Student con II gradi di libertà quella di una v.a. T definita da

    X T = - 01 ./Y

    dove X e Y sono indipendenti , X -· N (O. I) e Y ~ x 2 (11) . L1 densità cli una v.a. di Student si pub calcolare con i metodi che abbiamo visto nel Capitolo 3 (anz.i questo è l'oggetto dell'Es"rcizio 4.62, per cui la densità si può vedere a p. e-45). Per i nostri scopi, però, non serve di conoscere la densità ma è piuttosto necessario disporre dei quantili , che indicheremo tc,(11) . Questi sono riportati su tavole (vedi a p. a-2). Uno sguardo a queste ultime mostra che i valori dei quantili si

    -3

    -2

    Figura 5.11 Confronto tra densità N(O, I) (puntini), t(9) (lr:ittini) e t(I) (tratto pieno). D a notare -1

    che le densità di Student decrescono all'infinito più lentamente.

    vicinano per Il grande a quelli corrispondenti della legge N (O. I) e anzi, per valori di 11 supèriori 1 20, si usano i quantili della N(0, I) al posto di quelli delle leggi di Student. Ciò è suggerito che dalla Figura 5 . I I dove si vede che l'andamento della densità 1 (11) è anch'esso a campana che al crescere di n si avvicina a quello della N (O, l ) . È facile mostrare che l a densità della legge d i Student è una funzione pari (si vede anche dalla gura) . Quindi, ripetendo gli stessi argomenti che hanno portato alla (4.23), si trova che la f.r. G una legge t (n) soddisfa alla relazione G(x) = I - G(-x) .

    d iamo come si può utilizzare il fatto che la v.a. definita nella (5.1 4) segue una legge di Studcnt r determinare un intervallo di fiducia per la media. Supponiamo che le osservazioni X 1 , X2, . . . no indipendenti e seguano tutte una legge N(µ, a 2 ). Allora, ripetendo passo a passo i calcoli lla (5.9) e indicando stavolta con Z una v.a. di legge 1 (11 - l), 1 5)

    P(IX/1 - /li .'.5 8) = P(l../ii xli - µ I .'.5

    = P(--f;;../ii .'.5 Z .'.5

    #;../ii) =

    i.fii) ""' P(I Z I .'.5 t.fii ) =

    P(Z :::= f; -./n) - P(Z .'.5 - -f;; ./ii) =

    Sn

    S,1

    = G(t./ii) - G (-f;./ii ) = 2 G(f;./ii ) - I .

    egliendo 8 = � t 1 _,,12 (11 - l ) si ha G( ;;� �lii) = G(t 1 -a;2(11 - 1 )) = 1 - � e dunque P(IX11 - µ/ .'.5 7,z t1 -a12 (11 -

    0) = 2( 1 - 1 ) - 1 = 1 - a .

    petendo il ragionamento che ha portato all' intervallo (5. 10), si ha I X,, - /.li .'.5 -}, 1 1 _,,12(11 - I ) e solo s e 1 6)

    s,, . s,, µ E [ X,, - r.; t 1-a;2(11 - ! ) , X,, + e '1 -a12(11 ·- 1 ) vu vn



    altre parole, nell'intervallo d i fiducia (5. IO) s i può sostituire v con s,, , a condizione d i sostituire uantil i della legge N(O, 1) con quelli della legge d i Studcnt. Il risultato ottenuto è esatto se le . X 1 , X2, . . . sono normali. Si utilizza nella pratica anche senzaquesta ipotesi sc11 è abbastanza ande.

    5.4 Problemi di stima

    1 25

    Esempio 5.17 Calcoliamo l'intervallo (5 . 1 6) per i dati dell'Esempio 5.16 e confrontiamolo con quello ottenuto nella (5. 1 1). Si ha n_ -� � n_ a2 = _ s2 = _ ( Il Il -- l " Il - l Il L.., '

    xz - x�) .

    i=l

    Poiché tra le osservazioni ce ne sono 43 che prendono il valore I e 57 che prendono ìl valore O, 2

    S11

    =

    100 �2 ) = 0.247 (0.43 - 0.4-' 99

    e quindi s,, = ✓0.247 = 0.497. Si tratta di 100 osservazioni: le tavole non forniscono i quantili delle leggi r (99) . Dalle tavole, però, si vede che i quantili variano poco al variare di 11, quando 11 è grande. Usiamo allora il quantile per 11 = IOQ e con questa approssimazione si trova 1_975(99) = 1 .98. Si trova 1 .98, 0.43 + � 1 .98] = [0.33 ] ' 0.528] [0.43 -

    91tJ1

    che è un intervallo molto simile a quello ottenuto nella (5.1 I). Se il vero valore incognito p è però molto piccolo (vicino a O) o molto grande (vicino a I) l'intervallo (5. 1 6) può risultare molto più piccolo, come mostra l'esempio seguente.

    Esempio 5.18 Una fabbrica vuole controllare la qualità dei pezzi prodotti. Per questo ne vengono scelti a caso 1 000 e ispezionati; 27 risultano difettosi. Che cosa si può dire della proporzione di pezzi difettosi? Se si usa l 'intervallo di fiducia (5. 10), maggiorando il valore sconosciuto di a 2 con ¼ come nell'Esempio 5 . 1 6, si ottiene l ' intervallo [0.027 -

    ..J..� 0.027 + � ] = [-0.004, 0.059] . 2✓1000 2✓1000 '

    Calcoliamo invece l'intervallo (5.16). Nel campione ci sono 27 valori uguali a I e 973 uguali a O. Dunque 1 000 2 _ .., 1 ,ooo 1000 -s-, - ----" X, 2. - O •0272) = -- (0.027 - 0.027 ) --- 0.0,.6 999 ,: - 999 ( JOOO L.., I i=l

    e quindi s,, = ✓0.026 = 0. 1 62. Come abbiamo detto, i quantili della legge di Student per 11 = 999 si approssimano con quelli della N(0, I ) . Si ottiene quindi l 'intervallo di fiducia .9 . 0 62 0 62 . [0.027 - ! % - - � , 0.027 + 1 G · 1 ] = [0.0 17, 0.037] ./IOOO . ./Iooo

    che è molto più stretto.

    Esempio 5.19 Riprendiamo i dati dell'Esempio 1 .3 a p. 7 (le mìsurazoni della velocità della luce j di Michelson). Che stima se ne può ottenere della velocìlà della luce?

    26

    Capi tolo 5 Con11e rg enza e app_r_ m_a_ io o_ _n_e_____ z_ ss _i_

    _______ _ ______

    La media dei valori è .i = 852.4 e la deviazione standard s = 79.0. Abbiamo già visto nei lcoli dell 'Esempio 5 .17 che 1_975 (99) = 1.98. Dunque l'intervallo di fiducia di livello 95% è [852.4 - 1 .98

    .17)

    '.ffi, 852.4 - 1 .98 ifi] = [836.72, 868.08} .

    eul!ime misurazioni della velocità della luce (Evanson eta!., 1 973)dannoil valore 299 792, 4574, atto fino alla terza cifra dopo la virgola. Questo valore non si trova nell'intervallo di fiducia .17) ed è abbastanza evidente che le misurazioni di Michelson sovrastimavano sistematicamente.

    prossimo esempio propone un altro classico tipo di problemi di statis_ùca.

    sempio 5.20 Il partito A è convinto di avere la maggioranza e commissiona un sondaggio. Su 00 individui intervistati 853 si dichiarano a favore di A. Cosa se ne può dedurre? Il problema naturalmente sta nel fatto che A ha certamente la maggioranza nel campione, dato e 853/ 1600 = 53.3%. Ma cosa si può dire dell'intero corpo elettorale? Si può dire che A ha la aggioranza anche. tra tutti gli elettori? Oppure la scelta degli individui che fomiano il campione emplicemente stata "fortunata"? Un modo di procedere è il seguente: supponiamo che A abbia una percentuale inferiore al 50% a tutti gli elettori, quale sarebbe la probabilità di scegliere un campione di 1600 individui nel ale A ha una percentuale 2: 53.3%? Indichiamo con X la v.a. "numero d'individui favorevoli A nel campione". Se la reale proponione di A tra tutti gli elettori è p , 0 :s p :s ! , e gli individui l campione sono stati scelti in maniera indipendente, allora X avrebbe una legge B(1600, p) . indichiamo con Fp la f.r. di questa distribuzione, avremmo P(X ::-: 853) = J - P(X :5 852)

    = I - Fp (852) .

    fosse p == ½ (cioè se A avesse solo il 50% degli elettori), allora, usando l'approssimazione rmale con la correzione di continuità, avremmo F1 (852) ~ 17

    Cl)( 852·5 - np ) = (852 · 5 - ,800 ) = (2.625) = 0.99 56 Jnp(l - p)

    40 - 2

    nque se A avesse sulo il 50% degli elettori , la probabilità di avere almeno 853 elettori favorevoli l campione sarebbe 1 - 0.9956 = 0.0044 = 0.44'ìo, da considerarsi molto bassa. Il pmtito A ò stare tranquillo. Possiamo verificare la bontà dell'approssimazione normale in questo caso calcolando il vero lore della f.r. di una legge B(l600, ½) usando un software appropriato li risultato è F1 12 (852) = . 9956: l'approssimazione normale qui è particolannente buona.

    esempio precedente è tipico: si fa un'ipotesi (p :: � nelt'Esempio 5 .20) e si vuole vedere se i ti permettono di respingerla.

    empio 5 .21 Si sospl,lta che un dado sia truccato, in modo da dare il risultalo uno con prohabilità ù grande di Il dado viene lanciato 900 volte e si ottiene uno 165 volte. Cosa si può concludere? Come nell'Esempio 5 .20, se i l dado fosse equilibrato si avrebbe uno con probabiliti1 i; ad ogni ncio e il numero, X, dì uni ottenuti in 900 lanci dovrebbe dunque essere una v.a. di legge 900, -t;)- La media di questa v.a. è 900 - ¼ = 1 50, dunque effettivamente il numero di uni



    osservato è un po' più grande della media. Si tratta di una differenza sig�� probabilità che una v.a. di legge B(900, ¼) prenda valori 2: 165? ,,· ;:ì '� . . __ Se usiamo l'approssimazione normale con la correzione di continuità, allom:irico una v.a. B ( l , !) ha varianza ! � = fii , , .; ,:·.·/

    (k 150, --� ) • 30 -6-

    -�-

    k - ½ - 150 > 0.99 . (--=-e=-- ) 5./5

    Poiché (vedi le tavole) si ha (x) ::: 0.99 per x 2: 2.33 (all'incirca) deve dunque essere k - l - 1 50

    s./5

    ovvero k - 5: - 1 50 ::: 5./5 • 2.33 e dunque

    .33 ?:: 2

    l k 2: 5./5 . 2.33 + ?. + 1 50 = l 76.55 .

    Dunque occon-ono almeno 177 uni nei 900 lanci per poter essere sicuri che il dado è truc_cato �o� questo livello di certezza. Naturalmente la scelta ckll' ! % è arbitraria e, a seconda delle s1tuaz1om si possono scegliere livelli diversi.

    L'esempio precedente illustra (senza troppo preoccuparsi di dare defmizio�i precise) !l modo con cui in generale si affronta un problema di test in statistica: si dctenmna una regione (la

    n�Ìemc: di possibili valori delle osservazioni, che risulta òi proba­ ét§sa'fò' ilumero a se l'ipotesi fosse vera e si stabilisce di respingere ·nÒJ\•alori proprio nella regione di rigetto. Nell'Esempio 5.21 ad esempio · . . . + x900 2: 1 77 è una regione di rigetto di livello cz = 0.01 per

    mpio"'CS2� Riprendiamo i dati di A. Geissler (Esempi 1.2 a p.5 e 3 .46 a p . 64) e consideriamo ffijté;i che gli esiti di nascite diverse siano indipendenti e diano luogo ad un maschio con proba­ tà 0.517. Ricordiamo che dalle valutazioni qualitative che avevamo fatto eravamo propensi a nere che questa ipotesi non fosse vera. Come si può costruire una regione di rigetto di qu_esta esi di l ivello O.O!? Possiamo ragionare così: se l'ipotesi fosse vera, il numero di figli maschi in una famiglia, Y, uirebbe una distribuzione B(IO, 0.5 17) . La probabilità che una v.a. con questa legge assuma lori O oppure 1 è P(Y = O) + P(Y = I) = (I - 0.SJ 7) 10 + 10 - 0.S 1 7 . ( I - 0.5 17)9 = 0.008 := p

    a somma di /Jo e di p 1 , vedi la tabella dell'Esempio 3.46). Se l'ipotesi fosse vera, il numero amiglie aventi O oppure l figlio maschio si modellizzerebbe dunque come la somma S = + . . . + X26 soo di 26 500 v.a. indipendenti tutte di legge binomiale B(lO, p) (p = 0.008 come cato sopra). Fissiamo un livello a = O.O l e cerchiamo un numero k tale che

    8)

    P(S ::: k) ::: a

    biliamo quindi di rigettare l'ipotesi se nel campione si osserva un numero di famiglie con al un figlio maschio che è superiore a k. Osserviamo che nel campione si sono osservaci No = 35 1 = 239 famiglie rispettivamente con nessun oppure un solo figlio maschio, che fa un totale 74 famiglie con al piì, un maschio. Dobbiamo dunque determinare il valore di k a partire dal e vale la (5.l 8) e potremo respingere l'ipotesi se questo numero k risulterà più piccolo di 274. erviamo che 11p = 26 500 x 0.008 = 2 1 2 , cioè un numero ben più grande di 5: la regolctta per plicazione dell'approssimazione normale è soddisfatta. Come già visto altre volte abbiamo P(S � k)

    = 1 - P( S � k - 1) "" 1 - (

    ché questa quantith sia ::: 0.01 dovrà essere

    k - �- - 26500 . p

    J26500 - p(l - p)

    k - ½ - 26500 · p

    q, ( -;======== ) > - 0.99 . J26500 · p(I - p)

    )•

    uantile di online 0 .99 della legge N(O, l) è 2.33 e dunque dobbiamo dunque risolvere

    dà immediatamcntè

    k - k" - 26500 · p > 2.33 /26500 · p ( I - p) -

    k ::: ½ + 2.33 /26500 · p(l - p) + 26S00 · p = 248.78 .

    )f{;

    ·J

    ·J

    J. i]

    ·� 1�

    5.4 Problemi di stima

    1 29

    Dunque possiamo rigeuare l'ipotesi, dato che le famiglie con al più un figlio maschio sono 274 . La scelta del livello a = O.O 1 è comunque arbitraria. Cosa sarebbe successo se avessimo scelto un livello a = 0.001 ? Calcoliamo quanto vale la probabilità P(S 2: 274) nell'ipotesi che S abbia legge 8(1 0, 0.517): P(S 'è: 274) = 1 - P(S � 273) "" I -

    273 · 5 - 26500 . p 4>( J26500 ) = l - (4.06) . · p(l p)) -

    Si tratta di una probabilità molto piccola che non si trova neanche sulle tavole. Un software adeguato dà comunque 1 - c!> (4.06) = 0.0000246. Possiamo dunque respingere l'ipotesi che le nascite fossero indipendenti anche a un livello a = 0.001 o addirittura 0.000 1 .

    l

    Tracce

    Esercizi per il Capitolo 1 L'esecuzione degli esercizi di statistica descrittiva richiede dei calcoli numerici in genere di scarso interesse (! 'interesse risiede nell ' interpretazione dei risultati). L'uso di un software appropriato è quindi naturale, in modo da evitare di perdere tempo con il calcolo numerico e di concentrare l'attenzione sull'analisi dei risultati. È facile trovare in rete dei software adatti, anche gratuiti (vedi le indicazioni a p.42). I dati degli esercizi si trovano nel sito www . ateneonline . i t/pbaldi doveso110 in formato lesto , in modo che non è necessario inserirli a mano nel computer, operazione che si può invece fare facilmente usando i comandi di in pur/output de! software. Nel silo indicato sopra si trova anche una sessione tipo della loro risoluzione usando uno di questi software: scilab. Si tratta di un software gratuito, facilmente reperibile in rete (vedi sempre a p . 42) .

    1 Consideriamo le misurazioni della percentuale di grassi nel latte di 1 20 vacche (come indicato sopra i dati numericì si scaricano dal sito www . ateneonline . it/pbaldi) . Calcolare le usuali grandezze statistiche: media e mediana, varianza, ampiezza dell'intervallo interquartile, range.

    2 Nel sito sono riportate le misurazioni della lunghezza (in cm) di conchiglie prese in un giacimento in Spagna. a) Calcolare media, mediana e varianza. Calcolare il range e l 'ampiez;,;a clcl l'intervallo io­ lerquartilc. L'istogramma mostra qualcosa d ' interessante? b) È stato poi determinato che le ultime 8 misurazioni in realtà riguardavano conchiglie di un'altra famiglia. Calcolare le stesse statistiche per il campione senza queste ullirne misurazioni . Confrontare l a variazione della media con quella della mediana e quella d e l range c o n quella del l ' intervallo interquarlilc. Disegnare l'istogramma elci dati, tolti gli ultimi 8. Cosa si osserv�?

    3 Nel sito sono riportate le misure della densità della Terra, effettuale da H. C.1vendish nel 1798 . Il valore riportato è in termini di mullipli della densitil dell'acqua. Il valore accettato oggigiorno per la densità della Terra è 5.517 volte quella dell'acqua. a) Qual è la media delle osservazioni di Cavcndish? E la mediana? b) Ci si è accorti in seguilo che il set!imo valore riportato, 5.88, era in realtà 4.SS. Quanto valgono ora media e mediana? e) Calcolare, per i dati corretti con 4.88 al posto cli 5.88, la skewncss e disegnare l ' istogramma .

    e-4

    t:eserciziario

    (Questi dati vengono ripresi nell'Esercizio 5.26) .

    Nel sito sono riportati i valori della concentrazione di ozono e dell'irraggiamento solare osservati in 1 1 J giorni consecutivi da una stazione di rilevamento. a) Quanto vale la media delle concentrazioni di ozono osservate? Calcolare l' indice di skewness per il carattere ozono e disegnare l 'istogramma. Quanto vale la mediana? b) Rispondere alle stesse domande per le misurazioni dell'irraggiamento solare. c) Calcolare la covarianza tra le due variabili e il coefficiente di correlazione. Determinare la retta di regressione della concentrazione di ozono rispetto al l' intensità d'irraggiamento. d) È ragionevole supporre che la concentrazione di ozono in un dato giorno sia correlata con quella del giorno precedente. Come pensate di mettere in evidenza questo fatto?

    Nel sito sono riportati, per 43 stati degli Stati Uniti e per il District of Columbia (Washington), il numero, X, di sigarette vendute all 'anno (in centinaia per abitante) e il numero, Y , di decessi per cancro del polmone per JOO mila abitanti nel 1 960. a) Che tipo di valore della covarianza tra le variabili X e Y vi aspettate? Quanto vale il coefficiente di correlazione trn questi due caratteri? Ritenete che i dati confermino l 'esistenza di una dipendenza tra i due caratteri? b) Calcolare la retta di regressione di Y rispetto a X e disegnare il grafico dei dati sul piano. Quale degli stati presenta valori che si discostano dagli altri?

    Nel sito sono riportate le osservazioni rispettivamente del l'età, X, e dello stipendio, Y, di 59 amministratori delegati di piccole aziende, riportati dal Forhes Magazine nel 1993. a) Quanto vale la media degli stipendi del campione? Calcolare l'indice di skewness e dise­ gnare l 'istogramma. Quanto vale la mediana? Cosa ritenete più opportuno usare come indice di centralità per gli stipendi, la media o la mediana? b) Che tipo di valore vi aspettate per la covarianza delle due variabili ,stipendio ed età? Calcolare la covarianza, il coefficiente di correlazione e la retta di regressione.

    Nel sito sono riportate le misurazioni delle portate medie, in metri cubi al secondo, del fiume Fraser (British Columbia, Canada) nei mesi di marzo che vanno dal 1913 al 199 1 . a ) Calcolare media e varianza. I dati si dispongono i n maniera simmetrica rispetto alla media? Cosa si può dire della kurtosi? b) Sarebbe interessante valutare se, tenden,:ialmente, il flusso medio è andato aumentando 0 diminuendo nel tempo. Come pensate di fare?

    Nel sito sono riportate le variazioni in percentuale di una azione quotata in borsa in 48 giorni lavorativi consecutivi . Di quanto è aumentato, in percentuale, il valore dell'azione alla fine dei 48 giorni? Quanto è stato l ' aumento medio?

    Nel sito sono riportate le misurazioni del peso (in once) di un campione di neonati maschi. I dati sono stati raggruppati per classi: Zk e Nk indicano rispettivamente il centro e l 'effettivo della classe k-esima. a) Quanti sono gli individui del campione? b) Quanto valgono media e varianza? Se ora i dati venissero trasformati in grammi (una oncia=28.349 granuni) come si trasformerebbero questi valori? c) Cosa si può dire della mediaua e dei quartili? d) Sapreste ricavare nna formula per calcolare skewness e kurtosi con i dati in questa forma?

    l

    Tracce

    e-5

    .IO Nel sito sono riportate le temperature in gradi Fahrenheit, Y, osservate per 60 giorni consecutivi in un paese dell'Oklahoma e le previsioni fatte il giorno prima da due stazioni meteorologiche, X 1 e X2 . Calcolare la covarianza di Y e X 1 e di Y e X2 e i relativi coefficienti di correlazione. Quale delle due stazioni è da considerarsi più accurata, secondo voi?

    Esercizi per il Capitolo 2

    2.1 Nella lotteria di Oslo vengono venduti I milione di biglietti. Al momento dell'estrazione da ognuna di sei urne, contenenti ciascuna dieci palline numerate da O a 9, vengono estratte le cifre del biglietto vincente, partendo da quella di sinistra. a) Costruire uno spazio di probabilità (Q , sl, P) adeguato a descrivere questa situazione. In "Un biglietto della lotteria" di J.Verne il biglietto di Olc Kamp ha il numero 009672; qual è la probabilità che venga estratto'! b) Nel romanzo, J .Verne discute quale sia la probabilità che Ole Karnp ha di vincere dopo che dalle prime quattro urne sono stati estratti i numeri 0096. Indichiamo con A l'evento "le prime quattro urne hanno dato i numeri 0096". Descrivere la probabiliH1 condizionale P( l A ) . E se A fosse l'evento "le prime cinque urne hanno dato i uumeri 00967'"1

    2.2 Da un 'urna contenente 4 palline bianche e 3 nere si eseguono due estrazioni con rimpiazzo {cioè la pallina estratta viene subito rimessa nell'urna). a) Calcolare la probabilità che le due palline estratte siano del medesimo colore. b) Calcolare la probabilità che almeno una delle due palline estratte sia nera. 23 Due numeri vengono estratti, senza reimbussolamento, da un'urna contenente sei palline numerate da 1 a 6. Qual è la probabilità che i due numeri estratti siano consecutivi?

    2.4 a) Due amici si trovano entrambi in coda a uno sportello, insieme ad altre 11 - 2 persone. Qual è la probabilità che essi siano separati esattamente da k persone (n ?.: k + 2)? b) Due palline vengono estratte da un'urna che ne contiene n numerate da l a n. Quai è la probabilità che i due numeri differisca.no di k (n ?.: k + I )?

    2.5 I componenti prodotti da una certa ditta possono presentare due tipi di difetti, con percentuali del 3% e 7% rispettivamente. I due tipi di difeuosità si possono produrre in momenti diversi della produzione per cui si può assumere che le presenze dell'uno o del l'altro siano indipendenti tra loro. a) Qual è la probabilità che un componente presenti entrambi i difetti? b) Qual è la probabilità che un componente sia difettoso (cioè che presenti almeno uno dei due difetti)? e) Qual è la probabilità che il componente presenti il difetto I, sapendo che esso è difettoso? d) Qual è la probabilità che esso presenti uno solo dei due difetti s;ipendo che esso è difettoso?

    2.6 Un 'urna contiene due ca11e: una di esse ha entrambi i lati neri mentre l'altra ha un lato nero e uno bianco. Una carta viene estratta e se ne guarda uno solo dei lati: è nero. Qual è la probabilità che anche il secondo lato sia nero?

    2.7 Volendo impedire telefonate interurbane ai suoi dipendenti, un capoufficio decide di mettere un lucchetto sui dischi dei telefoni (quelli di una volta. . . ); decide però di metterlo sul 9, in 111anicra da impedire solo che venga formato lo O. In questo modo è possibile effettuare telefonate urbane, anche se naturalmente può succedere che un numero urbano contenga uno O, nel qual caso non è

    6

    Ceserciziario

    ossibile comporlo . Considerando dei numeri di otto cifre (ùi cui la prima è diversa da O), qual è probabilità che un numero possa effettivamente essere chiamato?

    n dado viene lancialo 3 volte. a) Qual è la p robabilità p di ottenere 6 almeno una volta? b) Quante volte deve essere lanciato il dado perché la probabilità di o!lcnert! 6 almeno una volta a maggiore o uguale al 90%?

    na dipendente di una società di Gainesville, Florida. accusò nel 1 976 i suoi datori di lavoro stenendo d i avere subito ingiuste discriminazioni sulla base del sesso nel corso della sua carriera. a commissione , composta da 5 donne e 3 uomini, le diede ragione: infatti le 5 donne votarono favore mentre i 3 uomini si dich iararono contrari. A questo punto la società fece ricorso sostenendo che l'esito del giudizio precedente era dovuto clusivamente alla composizione della commissione. Qual è la probabilità che, in caso di ripartizione casuale, per una votazione 5 a 3 i voti si ddividano come è avvenuto (le 5 donne a favore ed i 3 uomini contro)? Cosa avreste deciso se ste stato il giudice? E se i 5 voti a favore della parte lesa fossero stati dati da quattro donne e un uomo?

    2. 1

    2.1

    2 .1

    n giocatore di poker riceve all 'inizio del gioco cinque carte da un normale mazzo di 52. a) Qual è la probabilità che riceva almeno 2 assi? b) Qual è la probabilità che riceva cinque carte dello stesso seme? c) Qual è la probabilità che riceva un poker servito?

    n giocatore gioca al lotto i numeri 1 , 2, 3. Per aiutare la fortuna nottetempo egli fa in modo di giungere ali' urna tre palline supplementari con i numeri l, 2, 3 (quindi ora vi sono nel! 'urna 93 lline). Qual è la probabilità che il trucco venga scoperto {cioè che vengano cstr::nte :ilmeno due palline n numeri uguali)? (Continua nell'Esercizio 3 .25)

    e urne numerate I , 2, 3 sono inizialmente vuote. Esse vengono poi riempite con n palline che ngono messe, una dopo l'altra, i n una delle urne, scelta a caso ogni volta. a) Qual è la probabilità che l'urna I rimanga vuota? b) Qual è la probabilità che le urne J e 2 rimangano vuote'! e) Qual è la probabil ità che una delle u rne rimm1ga vuota?

    eci urne contengono tutte 4 palline rosse (R) e un numero variabile di palline bianche (B). Più ecisamente l 'urna i-esima contiene 4 palline R e i palline B. Un'urna viene scelta a caso e da sa vengono estratte due palline. a) Qual è la probabilità che le due palline siano una B e una R? b) Supponiamo che l 'estrazione abbia dato come risultato una pallina B e una R. Qual è la obabilità p; che l' urna prescelta sia la i -esima? Qual è l'urna più probabile ? e) Supponiamo invece che vi siano 2 urne contenenti 4 palline R e 10 B (le urne sono quindi ). Se l'estrazione ha dato come risultato una pallina B ed una R, qual è ora la probabilità che rna prescelta sia di tipo i (cioè contenga i palline B)? Qual è ora il valori:'

  • Dacì due cwncì ,I e H. indìd1ian10 con C l 'evento "uno solo tra A e B si verifica". b l i hprimcn: e ronn:dmcnce come unioni, intersezioni , complementari . . . di A e B . ll1J Mo,tr:m: che P ( C ) = P(1\ J + P( B J - 2P{A n B) . (confrontare con l a (2.5)). hJJ Jn rikrime111o ,illa situazione di a), qual è la probabilità che una persona sia affetta da e,a11:11ncntc 111111 delle due malattie?

    2 JO persone s · inconcrnno in un viaggio organizzato che dura 16 giorn i . a} Uno dei partecipanti dice "La probabilifa che ci sia almeno uno del gruppo che festeggia il compleanno durante il viaggio è molto alta". Cosa 11e pensate? b) Quanto dovrebbe durare il viaggio perché la probabilità che almeno uno dei IO parteeip�nti festeggi il compleanno durante il viaggio sia :::. 50%? :::: 90%? e) Quanti dovrebbero essere i partecipanti perché durante i l 6 giorni del viaggio uno di loro tcstcggi il compleanno durante il viaggio con probabilità :::: 50%? :::: 90%? Una grave malattia colpisce il 3% della popolazione. Un test per i l suo depistaggio è efficiente al 95% tra i malati e all'80% tra i sani. Ciò vuole dire che con probabilità del 5% un malato non viene individuato, mentre con la probabilità del 20% una persona sana viene trovata positiva alla malallia. a} Qual è la probabiliti1 che un paziente risulti positivo al test? b) Qual è la probabilità che un individuo che risulta positivo al test sia effettivamente malato? e) Qual è la probabilità che un individuo che risulta negativo al test sia invece malato'!

    Una scatola contiene 1 0 monete; 8 di queste sono equilibrate, men tre le altre 2 danno testa (T) con probabilità ] e croce (C) con probabilit1, j . a) Qu al è l a probabilità che una moneta scelta a caso tra l e 1 0 e lanciata tre volte di a TTT'! b) Una moneta scelta a caso viene lanciata tre volte e si ottiene TTT. b l ) È più probabile che sia equilibrata o no? b2) Qual è la probabilità che anche un quarto lanc i o dia T? c) Una moneta scelta a caso viene lanciata 11 volte. Quanto grande deve essere II perché la probabilità che la moneta non sia equilibrata sapendo che gli 11 lanci hanno dato T sia :::. 50%?

    È molto i mportante che tra le due sedi di una stessa compagnia vi sia sempre una linea di comunicazione attiva. Perquestoesse sono state collegate con II linee di trasmissione indipendenti . Dunque le due sedi potranno comunicare fintanto che sad1 funzionante almeno una di queste 11 linee cli comunicazione. Supponiamo che ogni linea sia operativa con probabili tà 80%. a) Esprimere, in funzione di 11, la probabilità che le due se
  • O , À > O consideriamo l a fu nzione J(x ) ""'

    I cx - 0.+ l l

    lo

    a) Determinare e in modo che f sia una densità. b) Qual è la legge di Y = log f·?

    se x > r se x :S r

    Sia X U!la v.a. uniforme su ] - 'f , ;J.[ (cioè di densità f (x) = altrimenti). Calcolare la legge di Y ,;; tan X.

    f se -f

    e= x :5 } e f(x ) = O

    Un componente clcllronico è formato da tre elementi in serie, ciascuno dei quali ha un tempo di vita esponenziale di parametri À = 0.3 , Il = O. I , y = 0 .2 rispeHiv:nnente. Figura c.4

    a) Indichiamo con T la v.a. "tempo di vita" del componente. Qual è la legge di T? Quanto vale il tempo medio di vita del componente? b) Per aumentare l'affidabilità viene proposto di aggiungere un componente identico in paral­ lelo (vedi la Figura e.S ) . Qual è la densità del tem po di vita ciel nuovo complesso? Quanto è ora il tempo medio?

    Figura c.5

    e) Un'altra possibilità consiste nel consiciernre u1i complesso come nella Figura e.6, tripl icando cioè il primo com ponente (che è il più frag ile) e raddoppiando il terw. Quanto vale ora il tem po medio di vita? Quale delle due soluzioni (q uesta o quella del puuto h)) è p iù conveniente? a) Calcolare media e varianza di una legge di Rayleigh (vedi Esercizio 4.2).

    -22

    t.:eserciziario

    4.1 Figura c.G

    b) Si chiama legge di Cauchy quella di densità

    . J(x) = __I _ 1r ( I + x2) erificare che J è effettivamente una densità. Quanto vale la media di una legge di Cauchy? er quali valori di ;: è definita la sua trasformata di Laplace? (Questa densità compare anche el! 'Esercizio 4 .4). c) Sia Z una v.a. d i densità f come nell' Esercizio 4.3. Per quali valori di À 2 ha speranza atematica finita? Per quali valori di À Z ha varianza finita? Calcolare E(Z) e Var(Z) per i valori À per cui queste quantiH1 sono definite. Come si comportano media e varianza per À ➔ +oo?

    5 . 20)

    4.1

    ano X e Y due v.a. indipendenti. entrambe di legge normale N (O, I ) . Quanto valgono P( X > Y) P(X > Y + � )? ( Usare eventualmente le tavole delle leggi normali).

    pu nteggio u l lcnuto dagli studenti :11la prova scritta di un esame universitario si può modellizzare on una v.a. di legge normale di media 21 e varianza 9. Qual è la probabilità che uno studente tenga un voto superiore (::>::) al 24? Qual è la probabilità che uno studente ottenga un voto feriore alla sufficienza (:,; 17)?

    suppone che l'altezz,1 degli uomini in Italia segua approssimativamente una v.a. normale di edia 1 75 cm e varianza 8 1 . Quale sarebbe la percentuale di italiani di statura superiore al metro 90'! Alla visita di leva vengono scartate le reclute d i altezza inferiore ai 1 53 cm. Quale sarebbe percentuah: di reclute scartate alla visita cli leva ?

    legislazione ami!ricana è molto severa sul la veridicifo delle dichiarazioni che, per legge, devono parire sulle confezioni dei prodotti. In particolare essa richiede che, per le bottiglie di cham­ gne, il contenuto dichiarato debba essere inteso come un minimo garantito. Periodicamente ispettori fanno dei controlli. scegliendo a caso una bottiglia e infliggendo forti multe se essa sulta contenere meno di quanto dichiarato. La marca Veuve Coquclicot, che dichiara per le sue bouiglie un contenuto di 730 ml dispone macchine imbottigliatrici che forniscono un riempimento X aleatorio che segue una legge ormale di media /l, regolabile, e di varianza o- 2 = 625. Come deve essere fissata µ. perché la obabilità che una bouiglia venga trovata con un contenuto insufficiente sia inferiore a 0.002? uanto dovrebbe valere 11 se la compagnia disponesse invece di imbottigliatrici c:on varianza = 400?

    a / la funzione definita da

    se x =::: O se x < O .

    4.

    Tracce

    e-23

    a) Determinare k in modo che f sia una densità. b) Siano X e Y v.a. indipendenti e di densità J. Qual è la densità di X + Y? Qual è la densità di 2X? Si tratta di densità note?

    ( Leggi di Weibufl )Per a > O, À > O consideriamo la funzione

    se t > O se r s O .

    a) Mostrare che J è una densità e calcolarne la f.r. b) Sia X una v.a. esponenziale di parametro À e si a ,B > O . Quanto vale E(XP)? Qual è la legge di Xfl? Quanto vale la speranza matematica di una legge di Wcibull di parametri a, À? Quanto vale la sua varianza? e) Mostrare che per la funzione Gamma, per ogni t ::a:: O si ha r ( l + 2r) :".. r ( l + 1) 2 . Si chiama indice di skew11ess (o di asimmetria) di una v.a. X la quantità

    Y=

    E[(X - µ.) 3 ] a3

    dove !l = E(X) e cr� = Var(X) (purché X abbia un momento di ordine 3 finito). L'indice Y i� un certo senso misura la simmetria della legge di X: valori di y positivi indicano la presenza d1 una "c:oda spessa" verso destra (come nella Figura e.7), mentte valori negativi indicano la stessa cosa verso sinistra.

    Figura 5.7

    a) Quanto vale l'indice di skewness per una legge N(/1., a 2)'! b) E per una legge esponenziale? Per una r(a, J..)? c) Quanto vale y per una v.a. cli Poisson'! 3 2 3 3 (Si ricorda lo sviluppo del binomio di terzo grado: (li + b) = a + 3a"b + 3ab + b )

    4 a) Sia X una v.a. di legge N(J.l, a 2). Calcolare la densità della v.a. Y = c x ( densità log11or111llle di parametri µ, e a 2). b) Mostrare che se X ~ N (O, l) e s E R allora E(e'x) "' c, ,2 . 2

    c) S ia Y una v.a . di legge log,1onnale di parametri /.l e cr2 . c l ) Quanto valgono media e varianza cli Y? c2) Ricordiamo che si chiama mediana di una v.a. continua Z un 11umero 111 !aie che P(� :'." 111) = 4 . Qual è la mediana di l'? Se si fa variare u 2 e si tiene fisso el, come vanano la media e la mediana di Y?

    e-24

    L'eserciziario

    Descrivere una procedura per simulare le leggi x 2 (11) . 1'(11 , À),

    rq, À) (11 intero positivo).

    a) Sia X una v.a. esponenziale di parametro À e poniamo Y == [X J . Qual è la legge di Y? Si trnt!a di una legge nota? Calcolarne la media. b) Quale potrebbe essere una procedura per simulare una legge geometrica di parametro p?

    Un punto è scelto a caso sul piano con densit1i

    •4

    Indichiamo con Z la distanza del punto dall'origine. a) Qual è la legge di Z? Ammette una densità? b) Qual è la probabilità che il punto si trovi fuori della palla di centro l'origine e raggio I ?

    Due v.a. X e Y sono indipendenti e uniformi s u [O, I J . Calcolare a) P(XY > ½) b) P(XY < ! I X > ½ ) c) P(XY > { l i > 2) .

    ) Siano X 1 , X2, X , v.a. indipendenti e uni fo1mi s u [O. I ] . Qual è l a probabilità che X " sia minore ia di X 1 che di X3? b) Un generatore uniforme su [O, I) produce i seguenti 30 numeri a caso 0.56 1 0.229 0.673 0.561 (l.006 0. 144 0.8 1 5 0.378 0.4 1 6 0.796 0.456 0.544 0.802 0.27 1 0.950 0.6 1 8 0. 1 80 0.293 0.550 0. 1 73 0.676 0.988 0.591 0.614 0.078 0.024 0.768 0.595 0.573 0.732

    Che cosa ne pensate?

    Un componente elellronico ha un tempo di vita che segue una legge esponenziale di media IO giorni . Un secondo compone.nte è composto da due elementi in parallelo (il che significa che funziona fintanto che uno almeno dei due clementi è fu nzionante), ciascuno dei quali ha tempo dì vita esponenziale di media 6 giorni. a) Qual è la densità del tempo di vita del secondo componente? Quanto vale la sua vita media? È maggiore o minore della vita media del primo componente? b) Qual è la probabilità che il primo componente duri più a lungo del secondo?

    Un'apparecchiatura ha un tempo di vita Y che segue una legge esponenziale di parametro x che dipende dalla qualità di uno dei materiali impiegati . Nel processo di produzione non è però possibile controllare la qualità x del materiale, che quindi si deve considerare aleatoria di legge r(a, À) . a) Qual è la legge di Y? b) Per quali valori di a, À la v.a. Y ha speranza matematica finita? In questi casi quanto vale E(Y)? c) Se indichiamo con X la v.a. "qualità del materiale", qual è la densitlt condizionale di X dato Y = y? Quanlo vale la speran7�, condizionale di X dato Y cc y?

    Un componente viene prodotto da una fabbrica che utilizza due diverse linee di lavorazione da cui escono clementi esteriormente indistinguibili ma di qualità diversa. Si può anzi supporre che i peni prodotti rlalla prima e dalla seconda linea abbiano un tempo di vita esponenziale di

    '4

    '4

    Tracce

    e-25

    parametri À e 11. rispettivamente (1i > À, per fissare le idee). Inol tre è noto che le propor1:ioni di pezzi prodotti dalle due linee sono rispettivamente p e q (p > O, q > O, p + q = I ) . a ) Un pezzo viene scelto a caso e indichiamo con T i l suo tempo d i vita. Qual è la legge d i 7'? Quanto vale E ( T)? b) Sapendo che il pezzo è ancora funzionante al tempo s , qual è la probabilità che esso provenga dalla prima linea? Quanto vale questa probabilità per s grande?

    23 L'esecuzione di un calcolo da parte di un computer si compone di due fasi indipendenti e suc­ cessive, ciascuna delle quali richiede un tempo esponenziale di parametri À e µ. rispettivamente. Indichiamo con T il tempo necessario all'esecuzione del calcolo. a) Qual è il tempo medio di esecuzione del calcolo? b) Calcolare la legge di T. (Attenzione a distinguere i due casi . . . : quando si tratta di una legge nota?) c) Supponiamo che al tempo s l 'esecuzione non sia terminatit. Qual è la probabilità che si debba attendere ancora un tempo 1? Supponiamo À = I , 11. == 2, 1 = I : quanto vale questa probabilità per s = I ? E per s = 2? Per quak di questi due valori essa è più grande? d) Sapendo che al tempo s l 'esecuzione non è ancorn terminata, qual è la probabilità che la prima fase non sia ancora terminata? Come si comporta questa quantità per s -> +oo? Quanto vale per À = l , µ. cc 3 e per s grande?

    24 Calcolare la legge della somma di due v.a. X, Y indipendenti e uniformi su [O, l ] .

    25 Due numeri X e Y vengono scelti a caso e indipendentemente con distribuzione uniforme su [O, I]. a) Qual è la probabilità che essi differiscano per più di } ? b) Indichiamo con Z la dist:inza tra X e Y. Qual è la d�nsità di l'! Qual è la distanza media tra X e Y?

    26 Consideriamo la funzione

    se / > O se 1 :::: O •

    a) Mostrare che J è una densith di probabilit11. h) Si modellizza il tempo di vita di una larnpaùa mediante una v.a. T di densità f. Qual è la probabilità che la lampada sia ancora funzionante a I tempo 3 ?

    27 S i a X una v.a. uniforme sull'inlcrvallo [O, 1 1. Calcolare l a densità delle v.a. Y = 3� -x og , dove A' e. un numero > O . Z= y

    28 Sia X una v.a. di densitl,

    _ ( ) { /)/fl-1

    J 1

    =

    o

    dove O > O. a) Calcolare la f.r. di X. b) Quanto valgono P(X ::: 3) e P(X :s { )? e) Qual è l a legge della v.a. Y = - log X'! d) Quanto valgono media e varianza di X?

    se O < l '.':; l altrimenti ,

    -J: log X e

    !..'.eserciziario

    hiama densità di Pareto di parametri a, 0 la funzione f(t)

    ={

    t

    aeu -1- t)«+I

    4.3

    se r > O

    altrimenti

    a > 0, 0 > O . Calcolare la f.r. F d i u n a densità d i Pareto. Per quali valori di a, 0 una v.a. di densità f ha speranza matematica finita? Per quali valori arianza finita? Calcolare speranza matematica e varianza, nei casi in cui sono definite.

    4.3

    a X una v.a. u niforme su (O, rr ]. Calcolare la densità di Y = cos X. E se invece X avesse densità / (!) = � (] - COS I) ? ](

    Calcolare E(Y) nei due casi a) e b). Ricordare che la funzione coseno è decrescente nell'intervallo [O, rr ].cosi come è decrescente a i nversa, arcocoseno, : f- 1 . I ] - > [O, rr]. Ricordare anche che d - arccos t dt

    I

    = -----

    43

    4.3

    J1 - I"

    iama legge di Laplace di parametro À quella individuata dalla densità Calcolare media e varianza di una legge di Laplace. Se X ì: di Laplace di parametro À , qual è la legge della v.a . aX? E di IXI?

    o X 1 , • • • , Xn v.a. indipendenti e di legge uniforme su [O, 1 ) . Poniamo X • = 111in(X 1 , . . . , X,,) . Quanto vale P(X. 5: r)? Qual è l a ùensi 111 d i X..? Poniamo X'' = max (X 1 , . . . , X,.). Qual è la densità di X*? Mostrare che I - x� ha la stessa legge di X.*. Calcolare E(X,) e E(X•).

    v.a. X segue una legge N(0, ¾> - Calcolare, usando le tavole, P(X ::, l ) . P(X è: � ) . P(O :, X 5: 1 ) . P(IXI :,:: 04).

    nteggio ottenuto dagli studenti alla prova scritta di un esame universitario si può model!izzarc una v.a. di legge normale di media 2 1 e varianza 9. Inoltre si può supporre che i risultati dei oli studenti siano indipendenti tra loro. Qual è la probabilità che uno studente prenda un voto inferiore a 1 3 ? I n 1111 compito scritto con 200 studenti, qual è l a probabiliti, che ci sia u n voto inferiore a 13? In 1111 compito scritto con 1 00 studenti , guai è la probabilità che il votO medio sia compreso 0.5 e 21 .5?

    4.

    4.

    4.

    4.

    4.

    Tracce

    e-27

    Consideriamo II numeri aleatori indipendenti X 1 , . . , X., , tutti di legge N (O, l ) . a ) Qual è la f.r. della v.a. x• = max (X 1 , • • • , X11 )? b) Se 11 = 1 00 qual è la probabilità che x• sia pii1 grande dì 2.8? c) Quanto deve essere grande 11 perché la probabilità che X' sia più grande di 2.8 sia maggiore
  • O.

    !..'.eserciziario

    Calcolare P(IX - Yi > ¼ ). Qual è la densità della v.a. I X - Y i? Qual è la densità di X - Y?

    X, Y) una coppia ùi v.a. aventi distribuzione congiunta: f (x, y) = { )

    •4.

    se O < x < y < l

    altrimenti

    Quanto vale la costante di normalizzazione e? Qual è la densità di X? E quella d i Y? X e Y sono indipendenti? Che valore vi aspettereste per la covarianza di X e Y? Quanto vale Cov(X, Y)? Calcolare P(Y > 2X).

    mponente A è formalo da due elementi in serie e quindi funziona fintanto che sono funzionanti mbi gli elementi che Io compongono. Un secondo componente, B, è invece formato da un elemento. Supponiamo che i tre elementi abbiano tempi di vita indipendenti e di legge esponenziale rametro ).. Qual è la probahilit11 che il componente A duri più a lungo di B? Supponiamo che i tre elementi abbiano tempi di vita indipendenti e di legge uniforme su . Qual è la probabilità che il componente A duri più a lungo di 8'! È più grande questa abilità o quella calcolata in a)? Supponiamo che i tre clementi abbiano tempi di vita indipendenti cd aventi la stessa densità J. oniamo che f sia continua e strettamente positiva in un i ntervallo ]O, b[ (con eventualmente +oo) e nulla al di !ltori di ]O, b[. Calcolare la probabilità che il componente A duri piì1 a di B .

    oppia di v.a. X , l' ha densità congiunta J(x, y)

    = (/J + 1 )

    1, (eOx + eO.v - 1 ) 2+ ;; cO:reOY

    x > O, y > O

    , y) == O altrimenti, dove 0 > O . Calcolare la dcnsitl1 di X e quella di Y. X e Y v.a. di densità congiunta

    . y) = O altrimenti. Calcolare le densir/1 di X e di Y . Qual è la dcnsit:1 d i X Y?

    X >

    0, y > 0

    X e Y v.a. indipendenti e di legge f' (2, J ) e r ( I , � ) . Qu:111to valgono E(X) e E(l')? Quanto vale P(Y ?: X)? Sì tratla di una quantità maggiore o minore di � ?

    . Y è esponenziale d i parametro À mentre X ha una densità condizionale dato Y eibull di para1m:tri e, e y, cioè

    = y che è

    ------ ----------·· ···--• ---- ---

    a) Qual è la densità di X? b) Qual è la densità condizionale di Y dato X condizionale?

    2 La v.a. Y ha legge x 2 (n) Calcolare la densità di T.

    = x?

    Tracce

    e-31

    Quanto vale la media di q uesta densità

    = f ( ;i , ½) mentre la legge condizionale di T dato Y = y è N{O, %) -

    Esercizi per il Capitolo 5

    1 Sia (X,.),, una successione di v.a., dove per ogni n X11 ~ x 2 (n ) . Qual è il comportamento della successione (¾X,.) 11 ·, Sì può dire che converge in probabilità? In legge?

    2 Sia (X,,),. una successione di v.a . indipendenti di Poisson di parametro }.. e poniamo f (X1 + . . . + X11) . a) Stimare con l a disuguaglianw d i Chebyshev la probabilità

    X,,

    P(!X,. - ÀI ::: 17)

    b) Stimare la stessa quantità usando l'approssimazione normale. e) Confrontare le due stime per À = I , T/ = J 0-2 , n = 1 0000.

    3 Sia (X,,)11 una successione di v.a. e supponiamo che X,, ~ f (11 , À) . a) Qtrnnto valgono P(X 1 > l) e P(X3 > f)? b) Dare un'approssimazione, per 11 grande, di

    4 Marco e Giovanni hanno l'abitudine di giocare a testa o croce a chi paga il caffè. Marco però ha l'impressione che tocchi a lui un po' troppo spesso e, poiché è sempre Giovanni che fornisce la moneta, comincia a tenere conto dei risultati . In effetti è toccato a lui 64 volte su 100, ma Giovanni ha liquidato le sue proteste dicendo che si traila solo di sfortuna. Voi che ne pensate?

    ,5 Sia (X11 ) 11 una successione di v.a. indipendenti avc111i la stessa legge, tutte di media O e varianza o·2 . Mostrare che la successione di v.a.

    Z

    ,. -

    converge in legge e determinarne il limite.

    (X I + . . . + X,;) 2 Il

    .6 Sia (X,,),. una successione di v.a. indipendenti, tutte di legge uniforme sull'intervallo [O, 2a]. a) Calcolare media e varianza delle v.a. X; . b) Calcolare, per 11 --> oo e per x E JA: fissato, il limite delb probabilit;I. P(X 1 + . . . + X,, >

    110

    Quanto vale questo limite per x = a? E per x cc - � a'/

    + x✓,i" ) .

    .7 Un calcolatore addiziona un milione di numeri e in ognuna di queste operazioni effettua 1111 errore di arrotondamento; supponiamo che i singoli errori siano tra loro indipendenti e abbiano distribuzione uniforme su [-0.5- J 0- 10 , 0.5- 10- 10] (cioè la decima cifra decimale è s igni ficativa).

    32

    L'.eserciziario

    a) Qual è fa probabilitil che l 'errore finale sia più piccolo in valore assoluto di 0.5 · 10- 7 ? (cioè al è.: f.t probabil ìtìi che la settima cifra decimale sia significativa?) b) Qual è la probabi lità che l'errore sia più piccolo in valore assoluto di 0.5 - 10-8 ?

    dado equilibrato viene lanciato 900 volte; indichiamo con X il numero di volte in cui compare 6. a) Quanto vale E(X)? Qu,mto vale P(X ::: 1 80)? b) Supponiamo di sapere dell'esistenza di una partita di dadi truccati che producono il 6 con obabilità r Per decidere se un dado è di questi ultimi usiamo la procedura seguente: lo lanciamo 0 volte e decidiamo che esso è truccato se si ottiene il 6 pit, (?:) di I 80 volte. Qual è la probabilità e un dado truccato venga effettivamente individuato?

    segnale consiste in una parola di II bit, ciascuno dei quali può assumere i valori O oppure J . l corso della trasmissione ogni bit con probabilità p = 0 . 0 1 può essere distorto (cioè può essere utato eia O a I oppure da I a O). a) Qual è il numero medio di bit distorti? Qual è l a probabilità che un segnale di 1000 bit ntenga bit distorti? Qual è la probabilitli che contenga almeno 1 O bit distorti? b) Per ridurre la distorsione si usa il seguente protocollo: ogni bit viene trasmesso tre volte ed vcru valore viene deciso a maggioranza: il bit viene posto uguale ad A (A = O oppure I) se sono almeno due valori A tra quelli ricevuti . Qual è ora la probabi lità che un singolo bit sia torto? Qual è l a probahi litil che un segnale di 1 000 bit contenga bit distorti?

    lla trasmissione di un'immagine il colore di ogni pixel è descritto da 8 bit, cioè da un vettore , . . . , a8) dove a 1 , . . . , as possono prendere i valori O oppure J . Durante la trasmissione di ni singolo bit si può avere una distorsione con probabilità p = 0.0002 = 2 . 1 0-4 ; cioè ogni trasmesso può venire alterato (da O a J o da J a O) con probabilità p = 2 . 1 0- 4 e per di più ipendentemente da un bit all 'altro. ) Qual è la probabilità che un singolo pixel venga trasmesso correttamente? ) Un'immagine è composta da 5 1 2 x 256 = 1 3 1 072 pixel . Qual è il numero medio di pixel torti in un' immagine? Qual è la probabilità che vi siano più (?: ) di 200 pixel distorti?

    (X,. ),. una successione di v.a. rispettivamente d i legge geometrica di parametro p,, cessione (!, X,, ),, converge in legge? In caso affermativo, qual è la legge limite?

    "' t- La

    (X,.) ,, una successione di v.a. indipendenti !Lllle di legge cli l'oisson di parametro À. Quanto e, al variare di À > O, il limite lim P(X 1 + . . . + X,, ::; 11) ?

    Jl-►00

    (X,, ),. una successione di v.a. indipendenti tali che P(X; . > X) =

    { I\--À

    se x > l se x ::: I

    ve À è un numero > O . ) Calcolare media e varianza delle v .a. X; . ) Poniamo Y; = log X; . Qual è la legge di Y, ? ) Mostrare che la successione di v.a . ( (X 1 X2 . • • X,, ) 1 1" ),, converge in probabili tli e determi­ rne il limite.

    Tracce

    e-33

    l 4 Sia (X,, ),. una successione di v.a. indipendenti, centrate, equidistribuite e di varianza finita. a) Consideriamo la v.a. X I X2 . Quanto vale la sua media? Ha varianza finita? b) Poniamo V,, = .!_ ( X1 X2 + X3 X4 + . . . + X:,_,, _ , X2,,) . 11 Quali valori vi aspettate di osservare per V,1 quando 11 è grande? Si può dire cl1e V,, converge in probabilità? Verso quale v.a. limite? c) E se fosse V,,

    =

    i (X 1 X2 + X3 X4 + . . . + X1,. - 1 X2,. ) ? .fi

    d) Sllpponiamo per di pit, che sia E(Xf) < +oo. Le successioni W,. =

    I

    4

    11 (X 1

    4 , + . . . + X,,)

    convergono i n probabilità? A cosa?

    V,,

    =

    Xf + . . . + X;; 4 X 1 + . . . + X411

    1 5 Sia X 1 , X2 , . . una successione di v.a. indipendenti, tulle di lt:gge uniforme su [O, I ] e poniamo Z"

    = min (X t , . . . , X,,) -

    a) La successione (Z,,)11 converge in legge per 11 ➔ oo? Converge in probabilità? b) Mostrare che la successione (112,,),. converge in legge per 11 ➔ oo e determinare la legge limite. Dare un'approssimazione, per II grande, della probabi lità P ( rnin(X 1 , . . . , X,.) :::

    n

    .16 (La convergenza in legge non implica la convergenza delle medie e/o delle varianze) a) Sia (X11 )11 una successione di v.a. tali che P(X,.

    = O) = l - cx,.

    P(X,, = 11) = cx,, ,

    dove (cx,,),, è una successione di numeri reali compresi tra O e J . Mostrare che se lim,._,,,, et11 = O allora (X,, ),, converge in legge e calcolarne il limite. b) Costruire un esempio di successione (X.,),, convergente in legge ma tale che le medie e le varianze di X,, non convergano alfa media e alla varianza del limite.

    17 Una sorgente produce segnali binari di lunghezza 11 senza memoria (cioè i valori di bit diversi sono tra di loro indipendenti) e nei quali ogni bit può assumere i valori O oppure I con probabilità 0 . 8 e 0.2 rispettivamente. a) Qual è la probabilità che per 11 = I 000 lu sorgente produca un segnak in cui la proporzione [},. di 1 sia più grande di 0.23? b) Fissinmo ,; = 10- 2 e continuiamo a indicare con p,, la proporzione di I in u n messaggio ùi lunghezza 11. Quanto deve essere grande 11 perché l 'eventualità di osservare un segnale in cui p,, differisca da 0.2 per più d i e si verifichi con probabilità minore di 11 = 4 · 10-1 ?

    .lS a) Sia (X,,),. una successione di \I.a. tutte di legge normale e supponiamo che E(X11 ) = b,.

    ➔ b, n➔OO

    Var(X,,) = o}

    t.:eserciziario

    rare che Xr. l N (b, a 2 ) per 11 ----> oo. Sia (Z,, )11 una successione di v.a. indipendenti e N(O, (f ) . Consideriamo la successione ta per ricorrenza da 2

    Xo = x E lit,

    al < I (cioè X 1 , . . . , X11 , • • • sono le posizioni successive di un mobile che ad ogni istante sta dalla posizione attuale X,. in a X ,, ma subisce anche una perturbazione Zn ) Qual è la legge di X 1 ? E quella di X2? Mostrare che, per 11 -+ co, X 11 converge in legge ad una v.a. di_ cui si preciserà la distri­ ne. Se a 2 = I , a = 0.5, quanto vale la probabilità che X,, disti dall'origine meno di I per 11 e?

    a (X,,),, una successione di v.a. tale che X,, ~ 8(11, p), O < p < I . Mostrare che la ssione µ E R c a} -• O . are che l a successione converge in legge a d u n a v.a. N(µ,, O. Mostr.i.re che la successione converge in legge ad a. di legge di Poisson di parametro À. Sia (X,,)11 una successione di v.a. tale che, per ogni 11 , X11 ~ r(a, )..11) e supponiamo che À > O. Mostrare che la successione converge i n legge ad una v.a. di legge f(a, À).

    ompagnia che produce materiale elettronico sostiene che nella sua produzione di un certo onente vi è una percentuale di pezzi difettosi solo del 7%. Dare una stima della probabilità che in un lotto di 100 pezzi ve ne siano più ( :>:) di IO difettosi onendo che le affem1azioni della compagnia siano esatte). Una rivista specializzata decide di controllare le affermazioni della compagnia. Su un locto in effetti IO pezzi risultano difettosi . Cosa se ne può concludere? E se i pezzi difettosi o stati 1 3?

    udenti che si presentano alla prova scritta di Analisi II dimenticano ciascuno e in maniera ndente dagli altri di scrivere il proprio nome sul compito con probabilità p = WJ. Sup­ mo che 200 studenti si presentino all'esame. Qual è la probabilità che nessun compito sia senza nome? Qual è la probabilità che vi s iano più (>) di 2 compiti senza nome? Quale sarebbe il valore st:1 probabilitì1 dato dall'approssimazione di Poisson? Quale quello dato dall'approssi­ ne normale? Che valutazione date di queste due approssimazioni? Quale di queste due simazioni non dovrebbe essere utilizzata in questo caso e perché?

    ndiamo la situazione dell'Esercizio 3.30: in un tesi a risposta multipla vengono poste 30 nde, ciascuna con 4 possibili risposte una sola delle quali è quella giusta. Per il superamento t si richiede di rispondere correttamente ad almeno 16 domande. Uno studente non sa niente e risponde a caso. Calcolare, usando l'approssimazione normale, babilità che superi il test e la probabilità che riesca a rispondere a meno (:") di 5 domande.

    5.2

    5.2

    5.

    5.2

    5.2

    5.

    -----

    ---

    ---- - --

    -

    -----

    --

    --

    Tracce e-35 � _ _ _ _ ..______ ____

    b) Uno studente leggermente meglio preparato è in grado, per ogni domanda di escludere una delle risposte proposte e decidere di rispondere a caso scegliendo una delle tre risposte rimaste. Sempre usando l'approssimazione normale, qual è la probabilità che superi il test? e) (Un po' più complicato) Uno studente è in grado di rispondere correttamente ad una domanda con probabilità p. Quanto deve essere grande p perché lo studente superi il testcon una probabilità del 40%? d) Secondo voi è giustificato l'uso dell'approssimazione normale in questo esercizio?

    a) Calcolare la probabilità che 1 0 lampade non siano sufficienti per un anno, come ncll 'Esempio 4.27, ma usando l'approssimazione normale e confrontare il risultato ottenuto con quello esatto. b) Calcolare, con l'approssimazione normale la probabilità che 50 lampade siano sufficienti . per 5 anni (trascurando i bisestili. . . ) e confrontare il risultato ottenuto con quello esatto: 0.5. c) Indichiamo con X la v.a. che modellizza la durata di 10 lampade (intendendo che quando una sì guasta viene sostituita immediatamente con un'altra) e con Y quella che modellizza la durata di 50 lampade (con la stessa regola). Calcolare le skewncss di X e di Y (vedi l'Esercizio 4 . 1 3) e confrontarle con quella di una legge normale. Cosa ne deducete? Una società demoscopica deve effettuare un sondaggio per decidere tra due partiti, A e B, quale abbia la maggioranza. A questo scopo sceglie un campione di n individui a cui chiede di quale orientamento siano. Supporremo che gli intervistati rispondano tutti (nessuno dice "non so", cioè). Supponiamo che la percentuale dei simpatizzanti del partito A tra i votanti sia del 52%. a) Supponiamo n = 900. Qual è la probabilità che anche nel campione il partito A sia maggioritario? b) Quanto grande deve essere n perché la probabilità che nel campione il partito A sia maggioritario sia almeno del 99%?

    6 Calcolare l'intervallo di fiducia di livello 95% per il valore della densità della Terra, sulla base delle misure di Cavendish (vedi Esercizio 1.3). Il valore 5.5 17 oggi comunemente accettato si trova all'interno dell'intervallo? (X 1 + . . . + Xgoo) • 7 Siano X 1 , • • . , X900 v.a. di Bernoulli B ( l . p) indipendenti e poniamo X = a) Usando l'approssimazione normale, quanto vale P(X :>: 0.22) se p = 0.20? b) Usando l'approssimazione normale, quanto vale P(X :" 0.22) se p = 0.24'!

    'Y-k

    8 Dire quali delle seouenti affermazioni sono vere e quali sono false.

    :.r a) Se (X,,)11 è u�a successione di v.a. aventi ciascuna densità (continua) fx. e X,, _, X, la v.a. X potrebbe essere una v.a discreta. f: b) Se (X,,),, è una successione di v.a. discrete e X,, _ / X, la v.a. X potrebbe avere una densità continua. c) Sia (X,,),, una successione di v.a. e convergente in legge ad una v.a. X avente densità continua J. Allora se tutte le X,, prendono valori :" 1 con probabilit,, 1 , lo sl

    f, P ( R) = ¼ , P ( G) = f, ­

    = O 013 b) (��)_(� - 5 6 -

    .

    .

    C(tl -· .

    a) Le sequenze sono equiprobabi li. b) TTTTTT.

    ) _ a 9-to - 0 05 ' 3 1? - '· ( 'J �@ _ 2•46 a) · ( ) -- 23-24-25 ( 1 9 15-� _ 0 2... ii)_ _(_'f) , 2 r; ?- R • I °ill) - iIT-f°25 - O · ·

    i m1 + 4

    O) = 1 - ( 1 - (I - Pi) N . b) xk è di Pois­ S011 di parametro .\.( I - pjl: . Rimangono in media À ( l - p) 3 = 0.3 errori, probabilità che rimangano ancora errori = l -e-0· 3 = 0.259.

    Risultati

    :

    3.48 a) P(X = 3) = , ' b) E(X) = ½ , 2 ./2 Var(X) = l . e) X + Y è geometrica d i para­ metro ½ ·

    3.49 a) i/rx, (t) = (½ + 2 ) 2 . b) P(X 1 + . . . + X,, = k) = (1t) k X1 + . . . + X,, ~ B (211, ½),

    3.50 P(S,v = 0 ) = e-1 C:-p) , P(S,v Àp ( l - p)e- 1-C: -p) . 3.51 e = - 10 g, allora P(X

    =

    l)

    =

    h; se X ha funzione generatrice = 11) = r 1 -(3À + µ. + 2y) e -(J>.+µ+Zy)r; tempo medio"" À·I I� I r . 2>.+�•+y + j).+7 l , E(Z) = /!:r- Ha varianza finita per ), > 2, Var(X) = J. ��-� t i; per ), ➔ +oo la C - - ) media tende a r, la varianza a O.

    4.7 P(X > Y) = (0.35) = 0 .36.

    ½, P(X

    > Y + ½)

    4.8 1 - (l) = 0 . 1 6 , l - ( l .33)

    =

    I -

    I-

    4.9 l - (l .66) = 5%, O. b) l'(Z > 1 1 1) = 1 - F2 ( 1 ) = e- 2 .

    4.18 a) J ( l - log2) . b) log 2) .

    i log 2 .

    e)

    }0 -

    4.19 a) ¼. b) Se si suddividono i 30 numeri in terzine si vede che in tulle il numero di mezzo è più piccolo sia del primo che del terLO. Se fossero nu meri aleatori uniformi su [O, JJ e indipendenti , la probabilifa che ciò succeda è 3 - IO = 1 .7 . 1 0-s . . .

    4.20 a) f(t) = ½c- 116 (1 ... e-1/6) , I > O ; vita media: 9 , più piccola. b) = 0.48.

    i�

    44

    l'eserciziario

    eranza matematica finita per a > I , E( Y) = e) fw (x I y ) = Ltw;;' x" e- C).+yJx , x > T

    22 a) f (t ) = pÀe->-1 +q µe-''' , t > O; E(T) f + �f , b) p+�,1!�1,1 _1.,, , -> J per s ➔ +co.

    3 a) f + b) Se À = /J. T ~ 1'(2, À); se i il. fT (x ) = � (e · ·f oo converge a O À > /,1, e a l - h se À < µ .

    t;-

    4 f(t) 5 1 s 2.

    =

    I

    per O

    5 a) b ) fz (I) Z) = } .

    i-

    sI s

    I , = 2 - I per

    = 2(1 - t). O S I 5

    l;

    6 b) e - ·.- = O.OD I . '7

    r(l, l) . fz (l) = 3t 2e-À' 3 , r > o. a) Fx (x) = x0 per O s x s I , = O per

    7 Y~

    8 s O e = 1 per x � l . b) P(X � 3) = O, XS = 3 -0 . e) Y ~ 1' ( 1 , 0) d) E(X) = Var(X) = to+ tJ� . h•

    1)

    9 a) F(r) = I - (U�J" . b) Speranza mate­ tica: ,,�r per a > l , varianza: �.:fj{,,_2 ) a > 2.

    h,

    0 a) f>-(t) = -1 5 t 5 L b) rcv l - 1(t) = } ( l - 1 ) 1 /2(1 + t) - 1 12 _ e) E(Y) = o caso a), E(Y) = ½ nel caso b).

    fI·

    1 a) E(X) = O. Var(X) = b) aX è di i Xi ~ l' ( J , ì. ) . place d i para metro

    fui,

    2 a ) P(X. 5 t) = l - ( l -- t)" , fx. (t) =, - /}" '·· l , 0 _s; t :-;'. I . b) fx• (F) = ll/ 11 - I , '.o I :5 ] . cl) E ( X*) "' ;m , E(X.) = .

    ;,.h ­

    3 a) 0.9772. b) 0.0668. e) 0.4772. d) 763 .

    4 a) cJ> (-2.66) = 0.0039. b) 0.54. e) 0.9. 5 a) F.r (/) = ct>(r)". b) 1 - ; -

    4.42 a) E[{-] = a�I , cx > I . Var(:(,) = J · 11 '·' - ..};'__r l"(a) · +"Je- ,/i (a - 1 )-(a-2) ' a > ?-- b) g (r) 4.43 a l ) r (a, À) . a2) } qp . b i ) r ( J 00, 100). 1>2) a = 0 .8 1 , b = 1 .2.

    4.44 a) g è ancora I' ( ! , À) . b) g (x) = � (I + À.r)e-1..,· . c) g è di Pareto di parametri r/- l e À.

    4.45 b) 3 (indipendente da fl e a 2). e) 6 ( indipendente da À).

    4.46 a l ) F(r) = � eÀI , t � O , e J - !;e'-' , t � 0 . a2) S e X è u�iforme su (0, ! ] . F :. 1 (X) è di Laplacc di pnra111etro ). , dove F- 1 (y) = { log(2y) pery s J e F - 1 (y) = -} log(2( l -­ y)) per y � !, . b) Se X è uniforme su [O. l ] . F- 1 (X) è c1rweibul l d i parametri /3 e >. se I p- l (y) = (- ¼ l og( l - y)) //J _ 4.47 a) /l "" -- ½ u 2 . b) X 1 X1 è lognormale

    di parametri /J. J + JJ,2 e a{ + a}. e) Ancora lognormale
  • O com'era da prevedere. d) P(Y > 2X) = ½ -

    ¼,

    4.57

    aH . bq . cH ,

    4.SS X, ì' ~ r ( I , l) (per ogni valore di O).

    4.59 a) X ~ f (J , À) , fr ( y ) = (y-: I )· , p er y > O. b) X Y ~ r(l , ), ) . 4.60 a) E( X) """ E ( Y } 4 9·

    = 2.

    b) P(Y � X ) =

    4.61 a) f.\, (x} = c;.,,;_,· •··'- '-• -t > O . b) . +xa)� p-'r fl'!x (yjx) = (À + x v ) 2ye-· )•(/.;-.,"I p er y > O. media: J,.],. u . 4 .62 fx (x )

    =

    i�'lt.k '� •tl .

    5.1 f;X,, --,. P l e quindi anche in legge.

    5.2 a) P(JXIl - ,\. I > 11) :-;: Var 1 (x 4 ), = l - ( l .732) = 0.04 1 per x = a, = I - (-0.866) = 0.807 per x = - ½ a . 5,7 a ) s::

    (-l .732) = 0.917. b) s:: (0. l 73) - (-0. 1 73) = 0 . 1 37 .

    5.8 a ) E(X) = 1 50, P ( X � J 80) "" I (2.63) = 0.0044. b) "" ! - {0.81 6) = 0.21 . b) l - (0.608) = 0.27 1 .

    5.37 a) (0.572, 0.768], maggiorando a 2 con ¼, [0.577, 0.763) stimando la varianza dai dati. bl) Sì, ai livelli usuali. b2) # maschiè: 59. e) Il � 2401. 5.38 al) 1 -