Bài giảng Xác suất thống kê - Chương II: Biến ngẫu nhiên

II.1. Định nghĩa và phân loại
Định nghĩa:
Một biến số được gọi là biến ngẫu nhiên ( hay còn gọi là biến
số ngẫu nhiên – random variable, đại lượng ngẫu nhiên) nếu
trong kết quả của mỗi phép thử nó sẽ nhận một và chỉ một
trong các giá trị có thể có của nó tùy thuộc vào sự tác động
của các yếu tố ngẫu nhiên .
Kí hiệu cho biến ngẫu nhiên: X, Y, Z , X1 , X2 …, Xn, …
Các giá trị có thể có của chúng được kí hiệu bằng chữ cái in
thường x, x1, x2,..,xn,.. y1, y2….
Biến X nào đó được gọi là ngẫu nhiên vì trước khi tiến hành
phép thử ta chưa thể biết chắc chắn nó sẽ nhận giá trị là bao
nhiêu, chỉ có thể dự đoán điều đó với một xác suất nhất định. 
pdf 74 trang thamphan 28/12/2022 1960
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Xác suất thống kê - Chương II: Biến ngẫu nhiên", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfbai_giang_xac_suat_thong_ke_chuong_ii_bien_ngau_nhien.pdf

Nội dung text: Bài giảng Xác suất thống kê - Chương II: Biến ngẫu nhiên

  1. Chương II: BIẾN NGẪU NHIÊN ( ĐẠI LƯỢNG NGẪU NHIÊN) II.1. Định nghĩa và phân loại. II.2. Biểu diễn các phân phối xác suất của biến ngẫu nhiên. II.2.1 Bảng phân phối XS của BNN rời rạc. II.2.2 Hàm phân phối XS của BNN. II.2.3 Hàm mật độ XS của BNN liên tục. II.3 Một số tham số đặc trưng của BNN. II.3.1 Kz vọng toán II.3.2 Phương sai và độ lệch II.3.3 Mốt II.3.4 Trung vị II.3.5 Mômen, Hệ số bất đối xứng,Hệ số nhọn (tham khảo). II.3.7 Sử dụng máy tính bỏ túi để tính 1 số tham số đặc trưng. 1
  2. II.1. Định nghĩa và phân loại Định nghĩa: Một biến số được gọi là biến ngẫu nhiên ( hay còn gọi là biến số ngẫu nhiên – random variable, đại lượng ngẫu nhiên) nếu trong kết quả của mỗi phép thử nó sẽ nhận một và chỉ một trong các giá trị có thể có của nó tùy thuộc vào sự tác động của các yếu tố ngẫu nhiên . Kí hiệu cho biến ngẫu nhiên: X, Y, Z , X1 , X2 , Xn, Các giá trị có thể có của chúng được kí hiệu bằng chữ cái in thường x, x1, x2, ,xn, y1, y2 . Biến X nào đó được gọi là ngẫu nhiên vì trước khi tiến hành phép thử ta chưa thể biết chắc chắn nó sẽ nhận giá trị là bao nhiêu, chỉ có thể dự đoán điều đó với một xác suất nhất định. 3
  3. Nếu kí hiệu { xi ,i I } là tập các giá trị có thể có của X thì việc X nhận một giá trị nào đó như “X= x1”, “X=x2” thực chất là các biến cố ngẫu nhiên. Hơn nữa, khi thực hiện một phép thử, X nhất định sẽ nhận một và chỉ một trong các giá trị có thể có trong tập {xi ,i I} , do đó tập tất cả các biến cố ,“X= xi” ,i I } tạo nên một nhóm biến cố đầy đủ. Lưu {: cần phân biệt khái niệm “Biến cố ” và “Biến ngẫu nhiên“. II.2 Biểu diễn các phân phối xác suất của BNN • Quy luật phân phối xác suất của biến ngẫu nhiên là sự tương ứng giữa các giá trị có thể có của nó với các XS tương ứng. • Người ta thường dùng 3 hình thức mô tả quy luật phân phối xác suất của BNN là: - Bảng phân phối xác suất (chỉ dùng cho BNN rời rạc ) - Hàm mật độ xác suất (chỉ dùng cho BNN liên tục ) - Hàm phân phối xác suất (dùng cho cả 2 loại BNN ). 5
  4. II.2.2 Hàm mật độ xác suất của BNN liên tục Để biểu thị mức độ tập trung xác suất của biến ngẫu nhiên liên tục trong lân cận của một điểm, người ta đưa vào khái niệm hàm mật độ xác suất . Ta nói f(x) là hàm mật độ f( x )  0, x xác suất của biến ngẫu nhiên f( x ) dx 1 liên tục nào đó Các tính chất: b P( a X b) = f() x dx a P( X = x0) = 0 , x0 ; * P( a X < b) = P( a X b) = P( a < X < b) = P( a < X b) 7
  5. Các tính chất của hàm phân phối xác suất : 0 F(x) 1,  x F(- ) = 0 F(+ ) = 1 Nếu x1 < x2 thì F(x1) F(x2) F(x) là hàm tăng trên . P( a X < b) = F(b) – F(a) Nếu X là BNN rời rạc thì F(x)  pi xxi x Nếu X là BNN liên tục thì F(x) f ( t ) dt ; khi đó f(x) = F’(x) và P( a X b) = F(b) – F(a). * F(x) là hàm khả vi trên ( hoặc có thể trừ một số đếm được các điểm). Hàm phân phối của BNN liên tục là liên tục trên . 9
  6. Hướng dẫn: a) Các giá trị X có thể nhận được là , 0; 1; 2; 3}. P(X=0)  Xác suất KHÔNG CÓ bi xanh nào trong 3 bi được lấy ra. C3 7 7 C3 24 10 CC12 3 7 21 P(X=1)  XS CÓ 1 bi xanh trong 3 bi được lấy ra 3 C10 40 CC21 3 7 7 P(X=2)  XS CÓ 2 bi xanh trong 3 bi được lấy ra 3 C10 40 C3 1 P(X=3)  Xác suất cả 3 bi lấy ra đều có màu xanh 3 3 C10 120 Bảng phân phối xác suất của X: xi 0 1 2 3 Pi 7 21 7 1 24 40 40 120 11
  7. Ví dụ 2 Một người tung cùng lúc 2 con xúc xắc cho đến khi được tổng số chấm trên 2 con xúc xắc lớn hơn 10 thì dừng lại. Gọi Y là số lần người đó đã tung xúc xắc. . a) Hãy lập bảng phân phối xác suất của Y. b) Tìm P( 2 < Y2 < 10). c) Trung bình người đó phải tung bao nhiêu lần để được tổng số chấm trên 2 con xúc xắc lớn hơn 10? ( câu c) xem phần L{ thuyết II.3 ở phía sau). 13
  8. Ví dụ 3 Cho biến ngẫu nhiên X có hàm mật độ: 0,x 22 fx() a.cos( x ) x , 22 a) Tìm hệ số a. π π 3π b) Tính P- <X< v àP0<X< (2 công thức) 6 4 4 c) Tìm xác suất trong 5 lần thực hiện phép thử ngẫu nhiên ππ thì có ít nhất 3 lần X nhận giá trị trong khoảng -, 64 d) Tìm hàm phân phối F(x) của biến ngẫu nhiên X. e) Tính E(X); D(X). 15
  9. d) x 0.dt 0 khi x 2 xx 2 1 1 1 F(() x) P X x f( t ) dt 0. dt cos t . dt sin x khix 2 2 222 2 2 2 1 x 0.dt cos t . dt 0. dt 1 khi x 2 2 22 17
  10. Các tính chất : * E(C) = C C là một BNN đặc biệt nhận giá trị C với xác suất =1. E( a.X+b.Y) = a.E(X) + b.E(Y), với X,Y là các BNN; a,b R E( XY) = E(X) . E(Y) nếu các BNN X, Y là độc lập, (X,Y độc lập tức là quy luật phân phối của biến ngẫu nhiên này không phụ thuộc vào biến ngẫu nhiên kia nhận giá trị là bao nhiêu, có thể xem thêm ở chương III). Tham khảo: Giả sử X, Y là các biến ngẫu nhiên và Y = (X), thì: + nếu X là BNN rời rạc có E(Y)=φ(xii ).p E(X)= xi .pi i i + E(Y)= (x ). f ( x ) dx nếu X có hàm mật độ f(x). Các BNN X+Y; X.Y sẽ được nhắc về mặt l{ thuyết ở chương III 19
  11. II.3.2 Phương sai và độ lệch chuẩn: Phương sai ( Variance/Dispersion, còn gọi là Tán số) của biến ngẫu nhiên X được định nghĩa bằng trung bình của bình phương sai lệch giữa biến ngẫu nhiên với kz vọng toán của nó. Kí hiệu bởi D(X) hay V(X). Công thức tính: D(X) = E[X-E(X)]2 hay D(X) = E(X2) – [E(X)]2 - Nếu X là BNN rời rạc thì: CT1 CT2 2 2 2 D(X) = [xi -E(X)] p i = x i p i - [E(X)] ii - Nếu X là BNN liên tục thì: CT1++ CT2 2 2 2 D(X) = [x-E(X)] f(x)dx = x f(x)dx-[E(X)] 21
  12. Khi cần đánh giá mức độ phân tán của biến ngẫu nhiên theo đơn vị đo của nó, người ta thường dùng độ lệch chuẩn chứ không phải phương sai vì độ lệch chuẩn có cùng đơn vị đo với biến ngẫu nhiên cần nghiên cứu, còn đơn vị đo của phương sai bằng bình phương đơn vị đo của biến ngẫu nhiên . Các tính chất : D(X) 0 ; D(C) = 0 D(CX) = C2.D(X) D( X+Y) = D(X) + D(Y) , với X,Y là độc lập. D( X -Y) = D(X) + D(Y) , với X,Y là độc lập. D( C+ X) = D(X) 2 HQ: Nếu X1,X2, ,Xn là các BNN độc lập; E(Xi)=a; D(Xi)=  ; i, thì: 2 • BNN U = X1 + X2+ + Xn có E(U) = n.a và D(U) = n. ; X +X + +X  2 • BNN X= 1 2 n có E X = a ; D X = . n n 23
  13. Quay lại các VD1 VD3: Ví dụ 1: d) E(X)=0,9 E(X2)=1,3 D(X)=0,49 Mod(X)=Med(X)=1. e) E(2X+1) = 2E(X)+1 = 2,8 E(3X2+5)= 3.E(X2)+5 = 8,9 Ví dụ 2: c) Số lần tung trung bình là E(Y) kk 11 11 1 1 11 1k 1 11 E(Y) k .  k .  k . q ; q k 1 12 12 12 k 1 12 12 k 1 12 , , 1 , 1 1 q 1 1 qqkk . 12  2 12kk 11 12 12 1 q 12 (1) q Ví dụ 3: e) 2 E(X) = xf ( x ) dx x cos( x ) dx 0 2 2 D(X) xfxdxEX2 ( ) ( ) 2 x 2 cos( xdx ) 0,9348 2 25
  14. Hướng dẫn: * Nếu thực hiện theo phương án I cần 5000 xét nghiệm. * Gọi X là số xét nghiệm cần thực hiện đối với mỗi nhóm 10 người theo phương pháp II. X là biến ngẫu nhiên có bảng phân phối xác suất : X 1 11 P 0,910 1-0,910 E(X) = 1 0,910 + 11 (1-0,910 ) = 7,5132 Suy ra số xét nghiệm trung bình cho 500 nhóm như vậy là: 500 7,5132 3 757 xét nghiệm. * Như vậy có thể nói số xét nghiệm cần thực hiện theo phương án II là ít hơn phương án I. 27
  15. Ví dụ 7: Cho biết tuổi thọ X ( đơn vị: tháng) của một loại côn trùng là một ĐLNN có hàm phân phối xác suất : 00x 4xx34 F(x)= k x 0;4 34 1 x>4 a) Tìm hệ số k và tính xác suất để côn trùng chết trước khi nó được 1 tháng tuổi. b) Tìm hàm mật độ xác suất của X. c) Hãy tính tuổi thọ trung bình của côn trùng đó. d) Hãy tìm mức tuổi thọ mà 1 nửa số côn trùng không sống qua được mức đó. 29
  16. II.3.7 HD Sử dụng MTBT tìm 1 số đặc trưng của BNN rời rạc: Các bước thực hiện Máy CASIO fx 570 ES Máy CASIO fx 500 MS . Xóa nhớ bài cũ . Mở cột tần số (nếu SHIFT MODE (SETUP) – máy chưa mở)  4 (STAT) 1 (ON) Vào chế độ thống kê MODE 3 (STAT) 1 (1-VAR) MODE MODE 1 (SD) một biến. Nhập dữ liệu X FREQ Nhập lần lượt trên dòng theo thứ tự: 1 x1 p1 Xi ; pi M+ 2 x2 p2 Xi là các giá trị của BNN, pi là các XS tương ứng, xn pn AC Đọc kết quả E(X) SHIFT – 1 (STAT)- 4 (VAR) – SHIFT – 2 (SVAR) -1 ( x ) = 2 ( x ) = Đọc kết quả D(X) SHIFT – 1 (STAT)- 4 (VAR) – SHIFT – 2 (SVAR)- 2 ( x σn ) = 3 (σX ) = Tham khảo các KQ SHIFT – 1 (STAT)- 3 (SUM) - . SHIFT – 1 (SSUM) - trung gian
  17. II.4.2 Phân phối nhị thức: Định nghĩa: BNN rời rạc X gọi là có phân phối nhị thức (Binomial Distribution), kí hiệu X  B(n, p), với 2 tham số n ; p (0,1); (q=1-p) nếu X có bảng PPXS dạng: X 0 1 k n n 1 n-1 n Pi q n.p .q k k n k p Cn p q Tính chất: * Xét dãy n phép thử Bernoulli với xác suất “thành công” trong mỗi phép thử là p. K{ hiệu X là số lần “thành công” xuất hiện trong dãy n phép thử thì X  B(n, p). * Nếu X  B(n, p) thì E(X) = np và D(X) = npq , với q=1-p . * Mod (X) chính là số lần “thành công” có khả năng nhất. 33
  18. Một số lưu { thêm: * Xấp xỉ ở công thức (2) là tốt nhất nếu n lớn và np>5; nq>5 hoặc npq>20. Công thức (2) là kết quả định lý giới hạn Moivre – Laplace. * Công thức (2) có thể hiệu chỉnh để có kết quả tốt hơn bằng cách tăng k2 lên nửa đơn vị và k1 giảm đi nửa đơn vị , khi tính x1, x2. Cụ thể : kk 2 Ck p k q n k ()() x  x  n 2 1 kk 1 11 k12 np k np 22 xx12 npq npq * Công thức (3) xấp xỉ tốt khi n> 20 và p 100 và =np <10). Vì p nhỏ nên người ta còn gọi nó là công thức của định luật số hiếm. 35
  19. Ví dụ 9 Tỷ lệ nảy mầm của một loại hạt giống là 75%. Nếu gieo ngẫu nhiên 120 hạt giống thì xác suất có được từ 80 hạt nảy mầm trở lên là bao nhiêu? Ví dụ 10 Xác suất 1 sản phẩm bị lọt qua khâu kiểm tra chất lượng ban đầu là 8%. a) Tính xác suất trong 900 sản phẩm có 70 sản phẩm không được kiểm tra chất lượng ban đầu. b) Tính xác suất trong 9000 sản phẩm có từ 700 đến 800 sản phẩm không được kiểm tra chất lượng ban đầu. 37
  20. II.4.3 Phân phối Hình học (tham khảo) Định nghĩa: BNN rời rạc X gọi là có phân phối Hình học (Geometric Distribution), kí hiệu X  G(p) với tham số p (0;1) nếu bảng phân phối xác suất của X có dạng: X 1 2 3 k 1 2 k-1 Pi p q .p q .p (1-p) .p Tính chất: 1 1 1 * Nếu X  P() thì: E(X) = ; D(X) = 2 ppp * X được coi là số thử nghiệm Bernoulli cần thiết để có được sự thành công. * Trong Ví dụ 2, BNN Y có phân phối hình học. 39
  21. II.4.4 Phân phối siêu bội. Định nghĩa: BNN X gọi là có phân phối Siêu bội (Hypergeometric Distribution), kí hiệu X  H(N,M,n), với tham số là các số tự nhiên n, N, M , n M N ; nếu bảng PPXS của X có dạng: X 0 1 k n n 1 n-1 k n-k n Pi CC C CN-M M N-M CCM N-M M n n n n C CN C Tính chất: N CN N * Nếu X  H(N,M,n) thì E(X) = np Nn M và D(X) = npq với p và q = 1-p . N 1 N • Khi n << N (n rất nhỏ so với N ) thì người ta thường xấp xỉ phân phối Siêu bội với phân phối Nhị thức , tức là coi như CCk n-k M N-M k k n-k (xem mục II.5.5) pkn =n C p q ; k = 0,1, ,n. CN 41
  22. II.4.5 Phân phối Poisson. Định nghĩa: Biến ngẫu nhiên rời rạc X gọi là có phân phối Poisson (Poisson Distribution), kí hiệu X  P() ; với tham số >0 , nếu bảng phân phối XS của X có dạng: X 0 1 2 k   2  k Pi  e . e  e e . 2! k! Tính chất: * Nếu X  P() thì E(X) = D(X) =  * -1 ≤ Mode X ≤ ; Mode X * Trong thực tiễn, công thức Poisson có thể dùng thay cho công thức Bernoulli khi số phép thử rất lớn và xác suất thành công rất nhỏ. Có nhiều BNN tuân theo luật phân phối Poisson, chẳng hạn như số người vào các trạm phục vụ công cộng trong một đơn vị thời gian; hay số lỗi trong mỗi trang của một quyển sách; số hoa nở trong ngày của một loại hoa; số lần truy cập vào máy chủ web trong mỗi phút; số lượng ngôi sao trong 1 thể tích không gian vũ trụ, 43
  23. Ví dụ 14 Biết rằng số người vào một đại lý bưu điện trong một khoảng thời gian xác định là một BNN có phân phối Poisson. Quan sát thấy cứ 5 phút có 12 người ghé vào một đại lý bưu điện. Tìm xác suất trong một phút có 3 người vào đại lý bưu điện đó. Hướng dẫn: Gọi X là số người vào một đại lý bưu điện trong khoảng thời gian 1 phút. Khi đó X  P(). Từ giả thiết ta thấy số người trung bình vào ĐLBĐ này trong 1 phút là 12/5 = 2,4 E(X) = 2,4  = 2,4. 2,43 Vậy xác suất cần tìm là P(X=3) = e 2,4 0,2090 3! 45
  24. * Trong thống kê người ta thường có quy ước: nếu ta không biết gì về giá trị của tham số cần ước lượng thì coi như mỗi giá trị có thể có của tham số là đồng khả năng. Điều đó dẫn đến việc quan niệm giá trị tham số cần ước lượng như một BNN tuân theo quy luật phân phối đều. Ví dụ 15 Giả thiết rằng cứ 15 phút có 1 chuyến xe buýt đi qua trạm. Chuyến đầu tiên bắt đầu lúc 5g00. Sinh viên A tới trạm vào một thời điểm bất kz trong khoảng từ 5g00 đến 5g30. Tìm xác suất sinh viên A phải đợi trên 10 phút. Ví dụ 16 Một đoạn thẳng AB dài 12 cm được chia thành 2 đoạn bởi một điểm M lấy ngẫu nhiên trên AB. Người ta dùng 2 đoạn AM và BM để làm 2 cạnh của 1 hình chữ nhật. Tính diện tích trung bình của hình chữ nhật đó. 47
  25. II.4.7 Phân phối mũ. Định nghĩa: Biến nn liên tục X được gọi là có phân phối mũ (Exponential Distribution) với tham số  > 0, kí hiệu X  E(), nếu hàm mật độ của nó có dạng : 00x fx() ex x 0 Tính chất: 1 1 * Nếu X  E() thì E(X) = và D(X) =   2 Phân phối mũ có ứng dụng trong nhiều lĩnh vực, nó thường được dùng trong việc đánh giá quá trình sản xuất và cung cấp dịch vụ. Trong các hệ thống kỹ thuật, thời gian làm việc liên tục của máy móc thiết bị giữa 2 lần sửa chữa cũng tuân theo phân phối mũ. 49
  26. II.4.8 Phân phối chuẩn. Định nghĩa: BNN X được gọi là có phân phối chuẩn (Normal Distribution), ký hiệu X N(a, 2), nếu hàm mật độ xác suất của X có dạng: ()xa 2 1 2 f( x ) e2 , 0, x  2 Tính chất: - Nếu X N(a, 2) thì E(X) = a, D(X) = 2
  27. - Hàm phân phối xác suất của phân phối chuẩn tắc là một hàm không biểu diễn được ở dạng hàm sơ cấp. x t2 1 F() x e2 dt 2 - Trong tính toán người ta còn thường dùng hàm tích x t2 phân Laplace: 1 2  ()x e dt 0 2 Hàm  là hàm lẻ , tăng trên R. Dễ thấy F(x) = (x) + 0,5. 53
  28. 2  aa * Nếu X N(a,  ) thì : PX(  )  ( )  ( )   PX( a  ) 2.  ( ) 0.   a Cm:  ()xa 2 2 đb  y 112 xa P()  X e2 dx e 2 dy , y 22 a    a a ()()    P()) X a  P(  X a  PX(a  a ) a  aaa  () ( ) 2    55
  29. • Phân phối chuẩn là 1 quy luật phân phối rất thường gặp vì có nhiều phân bố xác suất trong tự nhiên và trong thực tế đời sống có hình dáng khá giống phân phối chuẩn. • Trong công nghiệp, người ta đã xác định được rằng kích thước của các chi tiết do các nhà máy sản xuất ra sẽ có phân phối chuẩn nếu quá trình sản xuất diễn ra bình thường. • Trong nông nghiệp, năng suất của cùng một loại cây trồng tại các thửa ruộng khác nhau cũng có phân phối chuẩn. • Các chỉ số về thể lực và trí tuệ con người cũng tuân theo phân phối chuẩn 57
  30. Ví dụ 20 Tuổi thọ của một loại sản phẩm là biến ngẫu nhiên phân phối chuẩn với trung bình 11 năm và độ lệch chuẩn là 2 năm. a) Nếu quy định thời gian bảo hành sản phẩm là 10 năm thì tỉ lệ sản phẩm phải bảo hành là bao nhiêu? b) Nếu muốn tỉ lệ sản phẩm phải bảo hành chỉ là 10% thì người ta cần quy định thời gian bảo hành là bao lâu ? c) Nếu một sản phẩm đã hoạt động tốt qua thời gian bảo hành là 10 năm (câu a) thì xác suất nó vẫn hoạt động tốt trong 3 năm tiếp theo là bao nhiêu ? Tuổi thọ sản phẩm trong bài này được quy ước là khoảng thời gian từ khi người dùng mua sản phẩm cho đến khi sản phẩm cần đem đến bảo hành. 59
  31. SV đọc giáo trình để tìm hiểu thêm về các dạng phân phối sau: II.4.9 Phân phối Student (A) 0.4 0.35 Khi n 30, PP Student coi như 0.3 (A) xấp xỉ PP Chuẩn chuẩn tắc. 0.25 0.2 f(t) II.4.10 Phân phối Chi bình phương (B) 0.15 0.1 ( hay Khi bình phương) 0.05 0 -5 -4 -3 -2 -1 0 1 2 3 4 5 II.4.11 Phân phối Fisher (C) t 1 0.9 Xem trong Giáo trình. 0.8 0.7 (C) (B) 0.6 0.5 f(x) 0.4 0.3 0.2 0.1 0 0 0.5 1 1.5 2 2.5 3 3.5 4 x 61
  32. II.5.2 Định lý Chebyshev: • Nếu các BNN X1, X2, ,Xn độc lập từng đôi, có các kz vọng toán hữu hạn và các phương sai đều bị chặn trên bởi hằng số C thì với mọi số dương  tùy ý ta luôn có: XXX EXEXEX limP 12 n 12 n  1 n nn • Trường hợp riêng, nếu các BNN X1, X2, ,Xn độc lập từng đôi, có cùng kz vọng E(Xi) = m, i=1,2, ,n; và các phương sai cùng bị chặn trên thì với mọi số dương  tùy ý ta luôn có: XXX12 n limPm  1 n n Định l{ này còn gọi là luật số lớn của Chebyshev.
  33. II.5.3 Định lý Bernoulli: m Nếu f = là tần suất xuất hiện biến cố A trong n phép thử độc n n lập và p là xác suất xuất hiện biến cố đó trong mỗi phép thử thì với mọi số dương  tùy ý ta luôn có: limP fn p  1 n • Định lý này còn gọi là luật số lớn của Bernoulli, được xem là cơ sở toán học của định nghĩa xác suất theo thống kê. • Ở đây sự hội tụ theo xác suất của tần suất f = m/n p khác với sự hội tụ theo nghĩa giải tích cổ điển. Theo nghĩa giải tích, với  >0 cho trước, luôn tồn tại số tự nhiên N để với mọi n> N thì |m/n – p|< . Sự hội tụ hiểu theo nghĩa xác suất ở chỗ dù n lớn bao nhiêu đi nữa thì vẫn có thể xảy ra trường hợp cá biệt mà biểu thức |m/n – p|<  không được thỏa mãn.
  34. Ví dụ 22: Tung 1 con xúc xắc 200 lần. Tính xác suất tổng số chấm thu được trong các lần tung nhận giá trị từ 300 đến 650. Gọi Xi là số chấm xuất hiện trên con xúc xắc ở lần tung thứ i, i=1,2, ,200. Các Xi độc lập, ta tính được E(Xi) = 3,5 và D(Xi) 2,9167. Đặt X = X1+ X2 + + X200 . E(X) = 200 3,5 = 700; D(X) = 200 2,9167 = 583,3333 . Theo định l{ giới hạn trung tâm: X  N(700; 583,3333) Do đó xác suất cần tìm: 650 700 300 700 P(300 X 650)   1,92% 583,3333 583,3333
  35. II.5.5 Các công thức gần đúng: ( trích từ GT, đã sử dụng ở mục II.4.2; II.4.4) 1- Xấp xỉ Phaân phoái Sieâu bội vớiø phaân phoái Nhò thöùc M Ñònh lyù 4.18 Cho X ~ H (N, M, n). Neáu n coá ñònh vaø lim p thì vôùi k 0, n, ta coù N N k k n k ˆ lim P (X k) Cn p q N M Theo ñònh lyù 4.18, neáu N khaù lôùn so vôùi n thì coù theå coi X ~ B n, N k n k Ck Cn k M M töùc laø ta coù coâng thöùc gaàn ñuùng M N M k n Cn 1 , k 0, n CN M N 2- Xấp xỉ Phaân phoái Nhò thöùc vớiø phaân phoái Poisson Ñònh lyù 4.19 Cho X ~ B (n, p). Neáu p 0 vaø np  khi n thì vôùi k 0, n ta coù k lim P (X k) e  n k! Theo ñònh lyù 4.19, neáu p khaù beù vaø n khaù lôùn thì coù theå coi X ~ P (np), töùc laø ta np k coù coâng thöùc gaàn ñuùng: Ck pkqn k e np , k 0, n n k!
  36. II.6 HÀM CỦA BIẾN NGẪU NHIÊN Dạng bài: Cho biết quy luật phân phối xác suất của biến ngẫu nhiên X, hãy tìm quy luật phân phối xác suất của biến ngẫu nhiên Y=f(X). Ví dụ 24 Cho X coù baûng phaân phoái xaùc suaát: X 1 2 n 1 1 1 P 2 22 2n Tìm baûng phaân phoái xaùc suaát cuûa BNN YX cos 2
  37. Ví dụ 25 Cho X là biến ngẫu nhiên có phân phối đều trên đoạn *1, 4+. Tìm hàm phân phối xác suất của biến ngẫu nhiên Y = lnX + 1 . Hướng dẫn: 1 x [1;4] Hàm mật độ xác suất của X: fxX () 3 0x [1;4] 01x Hàm phân phối XS của X : 11 FX (x) xx 1 4 33 14x Kí hiệu FY(y) là hàm phân phối xác suất của Y. Ta thấy: