Báo cáo môn Xác xuất thống kê - Nguyễn Kiều Dung

Bài 1:

Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau:

1) Thực hiện phương pháp phân tổ dữ liệu (A).

2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 91% (A).

4) Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.

5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không.

27 trang thamphan 7600

Download

Bạn đang xem 20 trang mẫu của tài liệu "Báo cáo môn Xác xuất thống kê - Nguyễn Kiều Dung", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

bao_cao_mon_xac_xuat_thong_ke_nguyen_kieu_dung.docx

Nội dung text: Báo cáo môn Xác xuất thống kê - Nguyễn Kiều Dung

ĐẠI HỌC QUỐC GIA TP.HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA    BÁO CÁO Môn:Xác Xuất Thống Kê Giáo Viên Hướng Dẫn : Nguyễn Kiều Dung Thành Viên Trong Nhóm : Họ Và Tên MSSV 1. Kiều Văn Phước 1413046 2. Chu Thị Minh Khuê 1411881 3. Phạm Minh Nghĩa 1412472 4. Lương Phan Bích Tuyền 1414459 5. Phan Văn Thi 1413702 6. Lê Thái Nho 1412735 7. Phạm Hải Thành 1413583 8. Nguyễn Quang Vũ 1414753
1.1) Thực hiện phương pháp phân tổ dữ liệu A: ► Nhập vào Excel: + Xác định số tổ cần chia: k =( 2×n) ^(1/3) Chọn ô A6 nhập vào biểu thức =(2*Count(A1:J4))^(1/3) Kết quả 4.309 chọn k=4 + Xác định trị số khoảng cách h theo công thức: ℎ=(Xmax-Xmin )/k Chọn ô A7 nhập vào biểu thức =(Max(A1:J4)-Min(A1:J4))/4 Kết quả 5.25 Chọn h=5 + Ta xác định được các cận trên và cận dưới các tổ lần lượt là: Tổ 1:34-39 Tổ 2:39-44 Tổ 3:44-49 Tổ 4:49-54 → Nhập vào các ô từ A9 đến A13 lần lượt các giá trị: ➢ Chọn chức năng Data/ Data Analysis/Histogram. + Input Range: địa chỉ tuyệt đối chứa dữ liệu.
1.2) Vẽ đồ thị phân phối tần số và đa giác tần số (A): ➢ Vẽ đồ thị phân phối tần số: + Quét chọn bảng tần số B2:B5 + Dùng chức năng Insert Column Chart trên menu Insert. ➢ Vẽ đa giác tần số: + Sử dụng bảng phân phối tần số của dữ liệu (A) + Thêm giá trị 0 vào đầu và cuối bảng phân phối tần số + Quét chọn bảng tần số từ A2:B7 + Dùng chức năng Insert/ Line/2D Line trên menu Insert.
+ Confidence Level for Mean: độ tin cậy cho trung bình. Kết quả thu được là: 1.4) Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị. ➢ Nhập dữ liệu và bảng tính:
Kết luận : + Tỉ lệ hư hỏng của các thiết bị không đồng đều. + Tỉ lệ hư hỏng nhiều nhất là bình tròn với gần 40%. + Tỉ lệ hư hỏng thấp nhất là đũa thủy tinh với chỉ khoảng 1% mà thôi. 1.5) Kiểm định phân phối chuẩn Giả thiết kiểm định: H0: Mẫu A phù hợp phân phối chuẩn Giả thiết đối H1: Mẫu A không phù hợp phân phối chuẩn Các đặc trưng mẫu: n=40; x 41.525; sˆ 29.025 a 41.525;  29.025 2 2 Miền bác bỏ: W ( (k r 1); ) (0.08 (4 2 1); ) Dùng hàm: CHIINV(Probability,deg_freedom) Trên Excel ta nhập: =CHIINV(0.08,1) Miền bác bỏ: 푊 = (3.06490172; + ∞)
o TCKĐ: x1 x2 Tqs 0.3485 w s2 s2 1 2 n1 n2 Vì T 0.3485 w nên chấp nhận giả thuyết H qs 0 ➢ Kết luận: Hàm lượng nicotine trong thuốc lá hiệu A bằng với hiệu B 3) Bài làm : ➢ Nhập bảng giá trị: ➢ Dùng công cụ: T-Test: Two-Sample Assuming Unequal Variances ➢ Vào menu Data ➢ Chọn công cụ Data Analysis ➢ Chọn T-Test: Two-Sample Assuming Unequal Variances và nhấn Ok ➢ Một hộp thoại hiện ra: Tại các ô ta nhập: Variable 1 Range: $B$3:$L$3 Variable 1 Range: $B$4:$K$4 Chọn: Labels Alpha: 0.04 Output Rangge: $A$6 + Nhấn: Ok + Ta được bảng kết quả như sau:
+Giá trị P ở hai phía: P = 0.732009103 Bài 3: 1) Đề bài :
B b b b T A 1 2 m i x111 x121 x1m1 x112 x122 x1m2 T x a1 1  1 jk : : : j,k x11r x12r x1mr x211 x221 x2m1 x212 x222 x2m2 T x a2 2  2 jk : : : j,k x21r x22r x2mr : : : : : : : : xn11 xn21 xnm1 xn12 xn22 xnm2 T x an n  njk : : : j,k xn1r xn2r xnmr T x T x T x T x T*j* *1*  i1k *2*  i2k *m*  imk  ijk i,k i,k i,k i, j,k 2 2 2 2 - Cần tính:  xijk Ti T* j* Tij* i, j,k i j i, j - Suy ra 2 2 2 T SST= (x x) x  ijk  ijk nmr i, j,k i, j,k 2 Ti 2 2 i T SSA= mr(xi x) i mr nmr T 2  * j* 2 2 j T SSB= nr (x x)  * j* nr nmr j T 2 2 T 2  ij* Ti  * j* 2 2 i, j j T SSAB= r (x x x x) i  ij* i * j* r mr nr nmr i, j 2  x ij* i , j SSE=SST - SSA - SSB - SSAB= x 2  ijk r i , j ,k
➢ Áp dụng công cụ “Anova: Two-Factor With Replication”: + Chọn chương trình Anova: Two-Factor With Replication trong hộp thoại Data Analysis rồi nhấn nút OK. ➢ Trong hộp thoại Anova: Two-Factor With Replication lần lượt ấn định: + Phạm vi đầu vào (Input Range) + Hàng mỗi mẫu (Rows per sample) + Mức ý nghĩa (Alpha)
+ FR= 1.574718 Không thể so sánh doanh thu của các cửa hàng dựa theo ngành nghề. + FC= 2.519514 Không thể so sánh doanh thu của các cửa hàng dựa theo khu vực. + FI= 5.213272 > F9;48;0.01= 2.801816 => Có sự tương tác giữa ngành nghề và khu vực. BÀI 4: 1) Đề bài: Quan sát 400 người về màu tóc và màu mắt người ta được bảng số liệu sau: Màu tóc Vàng Nâu Đen Màu mắt Đen 12 65 121 Nâu 38 59 105 Với mức ý nghĩa 5% có thể cho rằng màu tóc và màu mắt không có liên quan gì với nhau hay không? 2) Cơ sở lí thuyết : ➢ Dạng bài: kiểm định tính độc lập ➢ Phương pháp giải: Áp dụng kiểm định chi bình phương  2 ➢ Công cụ giải: Hàm CHITEST trên excel. ➢ Cơ sở lý thuyết : -Trong thống kê, kiểm định chi bình phương hay kiểm tra  2 . (đôi khi đọc là "khi bình phương") là một họ các phương pháp kiểm định giả thiết thống kê trong đó thống kê kiểm định tuân theo phân bố  2 nếu giả thuyết không là đúng. Chúng gồm: • Kiểm định chi bình phương Pearson. • Kiểm định chi bình phương Yates. • Kiểm định chi bình phương Mantel-Haenszel. • - Dạng thống kê kiểm định thông dụng nhất là:
Tính giá trị P = Chitest. Nếu P α thì thừa nhận giả thuyết Ho. 3) Bài làm: ➢ Bước 1: Nhập dữ liệu vào bảng tính: ➢ Bước 2: Tính tổng các hàng và các cột: tong _ hang *tong _ cot tan_ so _ ly _ thuyet ➢ Bước 3: Tính các tần số lý thuyết: kich _ thuoc _ mau ➢ Bước 4: Sử dụng hàm CHITEST tính xác suất P: 4) Kết quả và biện luận: Giả thuyết H0 : màu tóc và màu mắt có liên quan với nhau H1 : màu tóc và màu mắt không liên quan với nhau Ta có P=0.000580118 0.05  Bác bỏ H0 , chấp nhận H1 Vậy màu tóc và màu mắt không liên quan với nhau. Bài 5: Đề bài: 1)Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi quy tuyến tính đơn. Thực hiện các yêu cầu:
Đối GT ➢ Giá trị thống kê: F = MSE Phân bố Fischer v1=1, v2=N-2 ➢ Kết luận: Nếu F chấp nhận giả thiết H0 B)Bài làm: Theo thực nghiệm khảo sát mối liện hệ giữa lực và độ biến dạng cảu vật liệu Inox 304(Mẫu thử). Ta có bảng thông kê phục vụ cho việu tính toán như sau: Lực F(N) 75 150 225 300 375 450 525 600 675 750 825 900 Độ dãn 37 34 55 59 67 73 76 81 87 89 92 93 Δl(mm) 1/ Tìm hệ số tương quan: - Nhập giữ liệu như hình . Dữ liệu nhất thiết phải được nhập theo cột. - Chọn Data, Data Analysis, Correlation
➢ Áp dụng Regression ➢ Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis ➢ Chọn chương trình Regression trong hộp thoại data Analysis rồi nhấp OK Trong hộp thoại Regression ,làn lượt ấn các chi tiết: - Phạm vi của biến số Y (input Y range) - Phạm vi của biến số X (input X range) - Nhãn dử liệu(Labels) - Mức tin cậy (Confidence level) - Tọa độ đầu ra(Output range) - Đường hồi quy (line Fit Plots),
Hệ số hồi quy0.000247711< 0,05: hệ số hồi quy Bo không có ý nghĩa. 2.0122E-07 < 0,05: hệ số B không có ý nghĩa. Phương trình hồi quy tuyến tính này không thích hợp vì 0.000020122 < 0,05. 3 ) Sai số chuẩn của ước lượng - Đối với biến tự do: SE = 75.12299301 - Đối với biến X: SE = 1.030363839