27 0 1MB
Các phân phối rời rạc
Các phân phối liên tục
Xác suất thống kê Bài 3: Một số phân phối xác suất thông dụng Lê Văn Chánh [email protected], [email protected] Khoa Toán Trường Đại học Khoa Học Tự Nhiên Hồ Chí Minh Bài giảng được cải tiến từ bài giảng của ThS. Nguyễn Thị Hiên
Ngày 28 tháng 7 năm 2018 1/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
1
Các phân phối liên tục
Các phân phối rời rạc Phân phối nhị thức Khi nào chọn phân phối Nhị thức làm mô hình xấp xỉ?
Phân phối Poisson Khi nào chọn phân phối Poission làm mô hình xấp xỉ
2
Các phân phối liên tục Phân phối đều Phân phối Mũ Phân phối Chuẩn
1/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Biến ngẫu nhiên Bernoulli Định nghĩa Thực hiện một phép thử, ta quan tâm đến biến cố A. Nếu biến cố A xảy ra (thành công) thì X nhận giá trị là 1 (X = 1), ngược lại biến ngẫu nhiên X nhận giá trị 0. Phép thử này gọi là phép thử Bernoulli. Giả sử xác suất xảy ra biến cố A là p, 0 < p < 1 P(A) = P(X = 1) = p, và ¯ ) = P(X = 0) = 1 − p = q. P(A Khi đó biến ngẫu nhiên X được gọi là biến ngẫu nhiên có phân phối Bernoulli với tham số p, ký hiệu X ∼ B(1, p). 2/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Bernoulli Các phép thử sau đây cho kết quả là một biến ngẫu nhiên Bernoulli Tung ngẫu nhiên một đồng xu: X = 1 nếu xuất hiện mặt sấp, X = 0 nếu xuất hiện mặt ngửa. Kiểm tra ngẫu nhiên một sản phẩm trong lô hàng: X = 1 nếu gặp được sản phẩm tốt, X = 0 nếu gặp sản phẩm kém. Trả lời ngẫu nhiên 1 câu trắc nghiệm: X = 0 nếu trả lời đúng, X = 1 nếu trả lời sai. Mua vé số: X = 0 nếu trúng số, X = 1 nếu không trúng số.
3/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Bernoulli Bảng phân phối xác suất của biến ngẫu nhiên X ∼ B(1, p) có dạng X 1 0 P p q với q = 1 − p. Dựa vào bảng phân phối xác suất của biến ngẫu nhiên X ta dễ dàng tính được E(X) = p,
Var(X) = pq.
4/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Luật phân phối Bernoulli Thí dụ 1.1 Gieo 1 đồng xu cân đối đồng chất 5 lần là 5 phép thử Bernoulli. Một người bắn lần lượt 7 viên đạn vào 1 mục tiêu là 7 phép thử Bernoulli. Nếu 7 người bắn, mỗi người bắn 1 viên đạn là phép thử Bernoulli. Tuy nhiên nếu biết rằng khả năng bắn trúng bia của 7 người là như nhau thì đó lại là 7 phép thử Bernoulli.
5/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Nhị thức Định nghĩa Thực hiện n phép tử Bernoulli độc lập với xác suất thành công trong mỗi phép thử đều là p. Gọi X là số lần thành công (biến cố A xảy ra) trong n phép thử thì X = X1 + . . . + Xn với Xi (i = 1, n) là biến ngẫu nhiên có phân phối Bernoulli với cùng tham số p. Khi đó X là biến ngẫu nhiên rời rạc với miền giá trị S = {0, . . . , n} và xác suất P(X = k) = Ckn pk qn−k ,
k ∈ S.
X được gọi là có luật phân phối Nhị thức với các tham số n, p, kí hiệu X ∼ B(n, p). 6/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Nhị thức I Lưu ý 1 (Experiments vs. trial(s)) Thông thường, (random) experiments và trial đều được hiểu với nghĩa như nhau- phép thử ngẫu nhiên. Tuy nhiên, trong trường hợp đặc biệt sau chúng được hiểu khác nhau. Phép thử (Random experiments) thường được thực hiện lặp lại nhiều lần. Bằng cách cố định số lần lặp lại một phép thử giống nhau, ta có ’tạo ra’ một phép thử (experiment). Khi đó mỗi lập thực hiện ’thao tác thành phần’ (một phép thử ban đầu) được gọi là một trial. Thí dụ, nếu chúng ta tung một đồng xu 1000 lần thì mỗi lần tung đồng xu được xem xét như thực hiện trial each result và việc tung 1000 đồng xu được gọi là một phép thử. 7/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Lưu ý 2 (Khi nào chọn phân phối Nhị thức làm mô hình xấp xỉ?) Chọn phân phối Nhị thức làm mô hình xấp xỉ khi các giả thiết sau đúng: 1 Phép thử (the random experiment) gồm n trial được lặp lại. 2 Mỗi phép thử có thể nhận đúng một trong hai kết quả, thường gọi là ’thành công’ và ’thất bại’. 3 Xác suất thành công được ký hiệu là p (giá trị này không đổi đối với các phép thử). 4 Các phép thử đôi một ’độc lập’ nhau. Các điều kiện trên giúp ta nhận ra mô hình phân phối nhị thức xuất hiện trong các “bài toán”. 8/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Nhị thức Thí dụ 1.2 Tại 1 địa phương, theo số liệu thống kê có 20% dân số mắc bệnh A. Chọn ngẫu nhiên 8 người, tính khả năng để có 3 người mắc bệnh A. Lời giải Khi chọn ngẫu nhiên 1 người thì có 2 khả năng xảy ra: mắc bệnh hoặc không, với xác suất mắc bệnh là 0.2. Gọi X là số người bị sốt rét trong 8 lần chọn, ta có X ∼ B(8, 0.2). Suy ra P(X = 3) = C38 (0.2)3 (0.8)5 = 0.147. 9/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Nhị thức Thí dụ 1.3 Trong một nhà máy sản xuất vi mạch điện tử, biết rằng tỷ lệ vi mạch không đạt chất lượng là 5%. Kiểm tra ngẫu nhiên 15 vi mạch. Tính xác suất a. Có đúng 7 vi mạch không đạt chất lượng. b. Có ít nhất 1 vi mạch không đạt chất lượng. Bài toán 1.1 Một hộp bi có tỉ lệ 3 bi đỏ và 1 bi xanh. Chọn ngẫu 7 viên bi lần lượt và có hoàn lại. Xác suất để có 5 viên bi màu đỏ và 2 viên bi màu xanh bằng bao nhiêu? 10/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Nhị thức Định lý (Các đặc trưng của BNN có phân phối nhị thức) Nếu X là biến ngẫu nhiên có phân phối nhị thức B(n, p) thì i) E(X) = np, ii) Var(X) = npq, iii) Với x, h là hai số nguyên dương thì
P(x ≤ X ≤ x + h) = P(X = x) + P(X = x + 1) + . . . + P(X = x Định lý 1.1 Nếu X ∼ B(n, p) và Y ∼ B(m, p) là hai biến ngẫu nhiên độc lập thì X + Y ∼ B(n + m, p). 11/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Nhị thức Thí dụ 1.4 Một học sinh làm một bài thi trắc nghiệm có 60 câu hỏi, mỗi câu có 5 đáp án và chỉ có 1 đáp án đúng. Biết rằng học sinh không học bài và đánh ngẫu nhiên toàn bộ bài thi. Tính xác suất a. Học sinh làm đúng ít nhất 1 câu; b. Học sinh làm đúng 30 câu; c. Số câu trả lời đúng trung bình mà học sinh làm được là bao nhiêu? Tính phương sai của số câu trả lời đúng.
12/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Nhị thức Thí dụ 1.5 Trong một nhà máy, hàng đóng thành từng kiện, mỗi kiện 10 sản phẩm, trong đó có 3 phế phẩm. Khi kiện hàng được giao cho khách hàng, khách hàng sẽ lấy ngẫu nhiên ra 2 sản phẩm trong kiện để kiểm tra. Nếu cả 2 sản phẩm đều tốt, kiện hàng sẽ được nhận, ngược lại thì kiện hàng sẽ bị trả lại. Gọi X là số kiện hàng được nhận trong số 50 kiện hàng giao cho khách. a. Tính xác suất có 40 kiện hàng được nhận. b. Tính E(X) và Var(X).
13/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Poisson I Mô hình phân bố Poisson là mô hình thường được dùng cho các biến ngẫu nhiên dạng “số sự kiện xảy ra trong một khoảng thời gian nào đó”. Sự kiện có thể là xe hơi qua trạm, vụ tai nạn, .... Thông thường, phân phối này có đặc tính: xác suất để sự kiện xảy ra được một ’xuất hiện’ trong một khoảng thời gian nhỏ là rất nhỏ (sự kiện hiếm) và trung bình số lần ’xuất hiện’ trong một khoảng thời gian nhất định không đổi.
14/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Poisson II Định nghĩa 1 Biến ngẫu nhiên rời rạc X nhận các giá trị từ 0, 1, 2, . . . gọi là có phân phối Poisson với tham số λ, ký hiệu X ∼ P(λ), nếu f (x) = P(X = x) =
e− λ λ x , x!
x = 0, 1, 2, . . .
Kỳ vọng và phương sai của X lần lượt là E(X) = λ,
Var(X) = λ.
15/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Poisson III 1
2 3
X là số sự kiện xảy ra trong khoảng thời gian I nào đó (I có thể là một ngày, một giờ, một tháng, 2 giờ, một trang sách, ...). Ở đây, ta không ấn định khoảng thời gian cụ thể mà chỉ xét một ngày nào đó, một giờ nào đó, .... λ là trung bình sự kiện xảy ra trong khoảng thời gian I. P(X = x) là xác suất xảy ra x, x ∈ Z+ , sự kiện trong khoảng thời gian I.
16/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Khi nào chọn phân phối Poission làm mô hình xấp xỉ Chọn phân phối Poission làm mô hình xấp xỉ nếu các giả thiết sau đúng (nguồn: https: //en.wikipedia.org/wiki/Poisson_distribution): 1 K is the number of times an event occurs in an interval and K can take values 0, 1, 2, ... 2 The occurrence of one event does not affect the probability that a second event will occur. That is, events occur independently. 3 The rate at which events occur is constant. The rate cannot be higher in some intervals and lower in other intervals. 4 Two events cannot occur at exactly the same instant. 5 The probability of an event in an interval is proportional to the length of the interval. Thí dụ 1.6 Giả sử một sự kiện xảy ra theo phân phối Poission với trung bình xảy ra 1 lần trong 4 phút. Bây giờ, ta quan tâm số lần sự kiện xảy ra trong khoảng thời gian 10 phút, ta dùng mô hình phân phối Poisson với ’trung bình’ trong mỗi khoảng 10 phút là λ = 10/4 = 2.5. Các điều kiện trên giúp ta nhận ra mô hình phân phối Poisson xuất hiện trong các “bài toán”. L.V. Chánh
XSTKB
17/53
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Poisson Thí dụ 1.7 Một số biến ngẫu nhiên mô tả các sự kiện sau thường được xem là tuân theo phân phối Poisson: Số lỗi in trong một (hoặc một số) trang sách. Số người sống lâu trên 100 tuổi. Số người đến bưu điện nào đó trong một ngày. Số tai nạn hoặc sự cố giao thông xảy ra tại một điểm giao thông trong một ngày, ... Các biến ngẫu nhiên được sử dụng để mô tả, "đếm"số lần xảy ra của một biến cố, sự kiện nào đó xảy ra trong một khoảng thời gian và thỏa một số điều kiện (các điều kiện này thường thỏa mãn trong thực tế) thường được mô tả bằng phân phối Poisson. 18/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Poisson I Thí dụ 1.8 (Khảo sát phương tiện giao thông) Trên một tuyến đường cần được xem xét để mở rộng làn đường, ta thực hiện một khảo sát lượng xe tải qua một điểm trên tuyến đường qua mỗi phút trong giờ cao điểm. X là biến ngẫu nhiên số lượng xe trên phút và dữ liệu thu được cho bởi bảng: X 0 1 2 3 4 5 6 7 8 9 Tần số 7 34 84 140 176 176 146 104 65 36 10 11 12 13 14 ≥ 15 X Tần số 18 8 4 1 1 0 Lời giải: 19/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Poisson II X là biến ngẫu nhiên rời rạc nhưng không là biến ngẫu nhiên có phân phối nhị thức vì giá trị của X không giới hạn. Từ bảng dữ liệu ta tính được giá trị trung bình (kỳ vọng của X) x¯ =
0 × 7 + 1 × 34 + · · · 14 × 1 ≈ 4.997, 1000
và phương sai của X :
s2 =
02 × 7 + 12 × 34 + · · · + 142 × 1 − 4.9972 ≈ 5.013. 1000
Xem xét mối quan hệ các tần số liên tiếp của dữ liệu 20/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Poisson III 34 5 ≈ , 7 1 176 5 ≈ , 176 5 36 5 ≈ , 65 9
84 5 ≈ , 34 2 146 5 ≈ , 176 6 18 5 = . 36 10
140 5 = , 84 3 104 5 ≈ , 146 7
176 5 ≈ , 140 4 65 5 = , 104 8
Từ P(X = 0) = 0.007 = p, ta có 5 P(X = 1) = P(X = 0), 1 5 52 P(X = 2) = P(X = 1) = P(X = 0), 2 2×1 21/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Poisson IV 5 53 P(X = 3) = P(X = 2) = P(X = 0), 3 3×2×1 P(X = 4) =
54 P(X = 0). 4×3×2×1
Tổng quát ta có P(X = n) =
5n 5n P(X = 0) = P(X = 0). n(n − 1) . . . 2.1 n!
22/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Poisson V Do tổng xác suất bằng 1, ta có 52 p 53 p 54 p 1 = p + 5p + + + + ··· 2! 3! 4! 52 53 54 = p 1 + 5 + + + + ··· 2! 3! 4!
= pe5 , ⇒
p = e−5 .
23/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Poisson Thí dụ 1.9 Giả sử số lỗi in trong một trang nào đó của quyển sách có phân phối Poisson với tham số λ = 0.5. (a) Tính xác suất không có lỗi in nào trong trang này? (b) Tính xác suất có ít nhất một lỗi in trong trang này? (c) Xem xét 20 trang sách, tìm xác suất để có không quá 3 trang sách mà mỗi trang không có lỗi in.
24/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Thí dụ 1.10 Số cuộc điện thoại gọi đến một tổng đài điện thoại trong một giờ có phân phối Poisson với λ = 10. Tính xác suất a. Có 5 cuộc gọi điện thoại đến trong 1 giờ, b. Có nhiều nhất 3 cuộc gọi điện thoại đến trong 1 giờ. c. Có nhiều nhất 3 cuộc gọi điện thoại đến trong 3 giờ.
25/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Poisson Thí dụ 1.11 Giả sử ta cần truyền đi n bit qua một kênh truyền hình tín hiệu số. Gọi X là số bit lỗi trong n bit được truyền. Khi xác suất một bit bị lỗi là hằng số và việc truyền tín hiệu độc lập, X có phân phối nhị thức. Gọi p là xác suất một bit truyền đi bị lỗi. Đặt λ = np thì E(X) = np = λ và P(X = x) =
Cxn px (1 − p)n−x
=
Cxn
x λ λ n−x 1− . n n
Giả sử số bit truyền đi tăng lên và xác suất một bit bị lỗi giảm xuống sao cho np không đổi. Nghĩa là, n và p đồng thời tăng và giảm sao cho E(X) là hằng số. Ta có thể chỉ ra 26/53 L.V. Chánh − λ XSTKB x
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Poisson I Định lý 1.2 (Xấp xỉ phân phối Nhị thức bằng phân phối Poisson) Cho X ∼ B(n, p), nếu n → ∞ và p → 0 sao cho np → λ thì lim P(X = x) =
n→ ∞
e− λ λ x . x!
Trong thực tế, phân phối Poisson sẽ xấp xỉ tốt cho phân phối Nhị thức khi n > 10 và p < 0.1 [Soo04] (một số tài liệu khác đưa ra điều kiện n ≥ 30, và (λ := np < 5 hoặc n(1 − p) < 5).
27/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Poisson II Thí dụ 1.12 Trong 1 lô thuốc, tỷ lệ thuốc hỏng là p = 0.002. Kiểm tra 1000 ống. Tính xác suất để gặp 3 ống bị hỏng? Ta có mô hình Bernoulli với p = 0.002 rất nhỏ, n = 1000 lớn. Gọi X là số lọ thuốc bị hỏng trong 1000 lọ. Khi đó X ∼ P(λ) với λ = np = 2 P(X = 3) =
23 e − 2 = 0.18. 3!
28/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Poisson III Định lý 1.3 Nếu X ∼ P0 (λ) và Y ∼ P0 (µ) là hai biến ngẫu nhiên độc lập thì X + Y ∼ P0 (λ + µ).
29/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Poisson Thí dụ 1.13 Trong một đợt tiêm chủng cho trẻ em ở một khu vực, biết xác suất một trẻ bị phản ứng với thuốc sau khi tiêm là 0.001. Thực hiện tiêm cho 2000 trẻ, tính xác suất có nhiều nhất 2 trẻ bị phản ứng với thuốc sau khi tiêm. Phần tự nghiên cứu 1 Chứng minh rằng phân phối Poission là giới hạn của phân nhị thức X ∼ Binomial(n, p) với p = λn khi n → ∞, nghĩa là lim P (X = k) =
n→ ∞
e− λ λ k . k! 30/53
L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối đều I Bài toán 2.1 Một thanh sắt có chiều dài l (được mô hình như một thanh chỉ quan tâm đến chiều dài). Ta gắn thanh với trục tọa độ Ox với O trùng với một đầu của thanh. Ta tác dụng một lực F theo phương vuông góc với thanh. Giả sử tải trọng p (lực/ một đơn vị độ dài) phân phối đều, nghĩa là tại trọng tại mỗi điểm trên thanh như nhau, p(x) = C = const∀x ∈ [0, l]. Hiển nhiên p(x) = 0 nếu x < 0 ∨ x > l. Hãy xác định hằng số C.
31/53
Các phân phối rời rạc
Các phân phối liên tục
Phân phối đều II Định nghĩa 2 Biến ngẫu nhiên liên tục X được gọi là có phân phối đều trên đoạn [a, b], ký hiệu X ∼ U [a, b], nếu hàm mật độ xác suất của X có dạng 1 , khi x ∈ [a, b], f (x) = b−a 0 nơi khác.
32/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối đều III Từ định nghĩa trên, ta có được hàm phân phối xác suất của X ∼ U [a, b] 0x − a khix < a, F(x) = khi x ∈ [a, b], b−a 1 khi x > b. Ta có E(X) =
a+b (a − b)2 , Var(X) = . 2 12
33/53
Các phân phối rời rạc
Các phân phối liên tục
Phân phối đều Thí dụ 2.1 Tỷ lệ mắc bệnh A tại khu dân cư B là biến ngẫu nhiên có hàm mật độ ( 1 khi x ∈ [5, 25], f (x) = 20 0 otherwise. Tính P (|X − 10| > 2.5)?
34/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối đều Lời giải Ta có |X − 10| > 2.5 ⇔ X < 7.5 X > 12.5. khi x < 5 0 x−5 F(x) = khi x ∈ [5, 25] 20 1 khi x > 25 W
P (|X − 10| > 2.5) = P(X < 7.5) + P(X > 12.5) = F(7.5) + 1 − F(12.5) = 0.75.
35/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối đều Thí dụ 2.2 Lịch xuất bến của một trạm xe bus như sau: chiếc xe đầu tiên trong ngày sẽ khởi hành vào lúc 7h, sau 15 phút sẽ có một xe khác đến trạm. Giả sử một hành khách đến trạm trong khoảng thời gian từ 7h-7h30. Tìm xác suất để hành khách này chờ a. Ít hơn 5 phút. b. Ít nhất 12 phút. c. Ít nhất 12 phút khi biết hành khách đã chờ 5 phút.
36/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Mũ Định nghĩa Biến ngẫu nhiên liên tục T được gọi là có phân phối mũ với tham số λ nếu hàm mật độ xác suất có dạng −λt λe nếu t ≥ 0, f (t) = 0 nếu t < 0. trong đó λ là số biến cố trung bình xảy ra trong một đơn vị thời gian. t là số đơn vị thời gian cho đến biến cố kế tiếp. 37/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Mũ Các đặc trưng của phân phối mũ Ta suy ra hàm phân phối xác suất có dạng: 1 − e−λt nếu t ≥ 0, F(t) = 0 nếu t < 0. Định lý 2.1 Nếu T ∼ exp(λ) thì kỳ vọng và phương sai của T lần lượt bằng E(T ) =
1 ; λ
Var(T ) =
1 . λ2 38/53
L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối mũ Thí dụ 2.3 Trong một mạng máy tính ở một công ty, biết rằng số người dùng đăng nhập vào mạng trong một giờ có phân phối Poisson với trung bình bằng 25. a. Tính xác suất không có người dùng nào đăng nhập trong khoảng thời gian 6 phút. b. Tính xác suất lần đăng nhập kế tiếp cách lần đăng nhập đầu từ 2 đến 3 phút.
39/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối mũ Thí dụ 2.4 Số khách hàng đến làm thủ tục tại một quầy dịch vụ ở ngân hàng với tỷ lệ là 15 người một giờ. Hỏi xác suất thời gian giữa 2 khách hàng liên tiếp đến quầy dịch vụ ít hơn 3 phút là bao nhiêu? Thí dụ 2.5 Trong một nhà máy sản xuất linh kiện điện tử, biết tuổi thọ của một mạch điện là biến ngẫu nhiên có phân phối mũ với tuổi thọ trung bình 6.25 năm. Nếu thời gian bảo hành của sản phẩm là 5 năm. Hỏi tỷ lệ sản phẩm bảo hành của nhà máy là bao nhiêu? 40/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Chuẩn Định nghĩa 3 Biến ngẫu nhiên liên tục X nhận giá trị trong khoảng (−∞, +∞) được gọi là có phân phối chuẩn tham số µ, σ nếu hàm mật độ xác suất của X có dạng 1 f (x) = √ exp − (x − µ)2 /(2σ2 ) σ 2π
x ∈ R,
trong đó µ, σ là hằng số và σ > 0, ký hiệu X ∼ N (µ, σ2 ). Khi X ∼ N (µ, σ2 ), ta có E(X) = µ, Var(X) = σ2 .
41/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Chuẩn Tính chất Đồ thị có dạng “hình chuông”. Phân phối đối xứng. Vị trí của phân phối được xác định bởi kỳ vọng µ. Vị trí của phân phối được xác định bởi độ lệch tiêu chuẩn σ. Xác định trên R.
42/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Chuẩn Nhờ vào định lý sau, nên nếu biến ngẫu nhiên X có phân phối chuẩn thì biến đổi tuyến tính của X cũng có phân phối chuẩn. Định lý (Tính "tuyến tính"của phân phối chuẩn) Nếu các biến ngẫu nhiên X có phân phối chuẩn kỳ vọng µ, phương sai σ2 và nếu Y = aX + b, (a, b là hằng số và a 6= 0), thì Y có phân phối chuẩn với kỳ vọng aµ + b và phương sai a2 σ2 . Định lý 2.2 Nếu các biến ngẫu nhiên X1 , . . . , Xn là độc lập và nếu Xi có phân phối chuẩn kỳ vọng µi và phương sai σi2 (i = 1, n) thì tổng X1 + . . . + Xn có phân phối chuẩn với kỳ vọng µ1 + . . . + µn và phương sai σ12 + . . . + σn2 . L.V. Chánh
XSTKB
43/53
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Chuẩn Mệnh 2.1 Nếu các biến ngẫu nhiên X1 , . . . , Xn là độc lập và nếu Xi có phân phối chuẩn kỳ vọng µi và phương sai σi2 (i = 1, n). Và a1 , . . . , an và b là các hằng số sao cho có ít nhất một ai 6= 0, thì biến ngẫu nhiên a1 X1 + . . . + an Xn + b có phân phối chuẩn với kỳ vọng a1 µ1 + . . . + an µn và phương sai a21 σ12 + . . . + a2n σn2 . Phân phối Chuẩn hóa Biến ngẫu nhiên Z được gọi là có phân phối chuẩn hóa nếu nó có phân phối chuẩn với tham số µ = 0, σ2 = 1 và ta ký hiệu X ∼ N (0, 1). Theo qui ước, hàm phân phối của biến ngẫu nhiên chuẩn tắc được ký hiệu là Φ(z), có dạng 1 Φ (z) = √ 2π
Z z −∞
x2 e 2 dx. −
44/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Chuẩn hóa Nếu X ∼ N (µ, σ2 ) thì
X−µ có phân phối chuẩn tắc: σ X−µ ∼ N (0, 1). σ
Dựa vào tính chất này, ta có thể tính xác suất của biến ngẫu nhiên X ∼ N (µ, σ2 ). X−µ b−µ P(X ≤ b) = P ≤ σ σ b−µ = Φ . σ Tương tự, P(a < X ≤ b) = P(X ≤ b) − P(X ≤ a) b−µ a−µ = Φ −Φ . σ σ 45/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân phối Chuẩn hóa Nếu X ∼ N (µ, σ2 ) thì X−µ ≤k P(|X − µ| ≤ kσ ) = P −k ≤ σ = 2Φ(k) − 1.
người ta hay gọi đẳng thức trên là "Quy tắc k-sigma (kσ )". Với k = 3 ta có quy tắc 3-sigma: X−µ P(|X − µ| ≤ 3σ) = P −3 ≤ ≤3 σ = 2Φ(3) − 1 ≈ 0.9973. 46/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Hình 2.1: 3-σ (thecuriousastronomer.wordpress.com)
47/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Phân vị Chuẩn hóa Định nghĩa 4 Cho biến ngẫu nhiên X ∼ N (µ, σ2 ), phân vị chuẩn hóa mức α, ký hiệu xα , là giá trị của biến ngẫu nhiên X thỏa mãn điều kiện P(X ≤ xα ) = α. Thí dụ 2.6 Cho X ∼ N (2, 16), tính các xác suất sau (a) P(X < 13), (b) P(X > 9), (c) P(6 < X < 14),
(d) P(X < 2 hoặc X > 4). (e) P(X2 < 9). (f) P(X2 > 4). 47/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Thí dụ 2.7 Cho a) b) c) d) e)
X ∼ N (10, 4), tìm x sao cho P(X > x) = 0.03, P(X < x) = 0.95, P(x < X < 10) = 0.2, P(−x < X − 10 < x) = 0.95, P(−x < X − 10 < x) = 0.99.
48/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Định lý giới hạn trung tâm Định lý 2.3 Nếu X1 , . . . , Xn là các biến ngẫu nhiên độc lập và cùng phân phối với kỳ vọng µ và phương sai σ2 hữu hạn. Ta đặt Sn = X1 , . . . , Xn , Sn có kỳ vọng là E(Sn ) = nµ và phương sai Var(Sn ) = nσ2 . Khi n → ∞ thì biến ngẫu nhiên Sn →F X,
X ∼ N (nµ, nσ2 ).
Hay biến ngẫu nhiên Zn =
Sn − nµ √ →F Z, σ n
Z ∼ N (0, 1),
nghĩa là khi n lớn thì với mọi x ∈ R, Sn − nµ √ P < x ≈ P(Z < x), σ n
Z ∼ N (0, 1). 49/53
L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Áp dụng: Xấp xỉ phân phối nhị thức bằng phân phối chuẩn Xét X ∼ B(n, p), ta có E(X) = np và Var(X) = npq. Khi n lớn, theo định lý giới hạn trung tâm thì phân phối của biến ngẫu nhiên X được xấp xỉ bằng phân phối chuẩn N (np, npq). Xác suất a − np X − np b − np P(a ≤ X < b) = P √ ≤ √ < √ npq npq npq b − np a − np ≈ Φ √ −Φ √ . npq npq Điều kiện xấp xỉ: np > 5 và n(1 − p) > 5 (hoặc np(1 − q) ≥ 10 [Ros14]). L.V. Chánh
XSTKB
50/53
Các phân phối rời rạc
Các phân phối liên tục
Thí dụ 2.8 Trong một cuộc bầu cử ở một thành phố, biết rằng 40% người dân ủng hộ ứng cử viên A. Chọn ngẫu nhiên 200 người, hỏi xác suất gặp được từ 76 đến 120 người ủng hộ ứng cử viên A là bao nhiêu? Thí dụ 2.9 Trong một kênh truyền hình tín hiệu số, biết rằng xác suất một bit bị lỗi khi truyền là 1 × 10−5 . Nếu 16 triệu bit được truyền đi, hỏi xác suất có hơn 150 lỗi là bao nhiêu?
51/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Xấp xỉ phân phối nhị thức bởi phân phốichuẩn Bài toán 2.2 Gọi X là biến ngẫu nhiên thể hiện số phân tử phóng xạ phát ra trong 1 giờ. Biết rằng X ∼ P0 (λ = ln 5). (a) Tìm xác suất có ít nhất 30 giờ, trong 168 giờ của một tuần nào đó, không có phân tử phóng xạ nào phát ra. (b) Sử dụng mô hình xấp xỉ thích hợp để tìm giá trị xấp xỉ cho xác suất ở (a). (c) Sử dụng phân phối Poisson để xấp xỉ (không cần kiểm tra điều kiện) để tìm giá trị xấp xỉ cho xác suất ở (a). So sánh và đưa ra bình luận các giá trị xác suất đã tìm được ở (a-c). 52/53 L.V. Chánh
XSTKB
Các phân phối rời rạc
Các phân phối liên tục
Tài liệu tham khảo [DcT15] Nguyễn Tiến Dũng and Đỗ Đức Thái. Nhập môn hiện đại xác suất và thống kê. Tủ sách Sputnik, 2015. [Ros14] Sheldon M Ross. Introduction to probability models. Academic press, 2014. [Soo04] Tsu T Soong. Fundamentals of probability and statistics for engineers. John Wiley & Sons, 2004.
53/53 L.V. Chánh
XSTKB