Báo cáo bài tập lớn Xác suất thống kê - Đề tài 8

Bài 1:  Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau:

1)Thực hiện phương pháp phân tổ dữ liệu (A).

2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 98% (A).

4)Trình bày dữ liệu định tính (B) dạng phân loại  bằng các đồ thị.

5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không.

 

docx 23 trang thamphan 28/12/2022 2740
Bạn đang xem 20 trang mẫu của tài liệu "Báo cáo bài tập lớn Xác suất thống kê - Đề tài 8", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • docxbao_cao_bai_tap_lon_xac_suat_thong_ke_de_tai_8.docx

Nội dung text: Báo cáo bài tập lớn Xác suất thống kê - Đề tài 8

  1. ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA CƠ KHÍ BÁO CÁO BÀI TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ Đề Tài 8 GVHD: NGUYỄN KIỀU DUNG THỰC HIỆN: NHÓM 8 – L08B STT Họ Tên MSSV 1 Nguyễn Hoài (N.trưởng) Đức 1410937 2 Nguyễn Viết Duy 1410603 3 Đặng Tấn Lực 1412210 4 Ngô Thanh Phi 1412861 5 Nguyễn Thanh Phong 1412885 6 Nguyễn Thành Sơn 1413318 Tp.HCM, Ngày 5 tháng 5 năm 2016
  2. +Bin Range: địa chỉ chứa bảng phân nhóm. + Output options: vị trí xuất kết quả. +Confidence Level for Mean: độ tin cậy cho trung bình. + Chọn Cumulative Percentage để tính tần suất tích lũy nếu không Excel chỉ tính tần số. Kết quả Cumulative Bin Frequency % 3 4 8.00% 4 5 18.00% 5 13 44.00% 6 25 94.00% 7 3 100.00% More 0 100.00% Có thể chỉnh lại như sau: khoảng tần số tích điểm tần số lũy 3 4 8.00% 4 5 18.00% 5 13 44.00% 6 25 94.00% 7 3 100.00%
  3. 4 5 13 25 3 0 dùng chức năng Insert Line Chart trên menu Insert kết quả : khoảng điểm lý cuối kì 30 25 20 15 khoảng điểm lý cuối kì 10 5 0 1 2 3 4 5 6 7 Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 98% (A). Nhập dữ liệu vào bảng tính theo hàng:
  4. Cho ta kết quả Column1 giá trị trung Mean 5.21 bình Standard Error 0.152589887 sai số mẫu Median 5.5 trung vị Mode 6 Standard độ lệch Deviation 1.078973435 chuẩn phương sai Sample Variance 1.164183673 mẫu Kurtosis 0.558636783 độ nhọn đỉnh - Skewness 1.003187819 độ nghiêng khoảng biến Range 5 thiên Minimum 2 tối thiểu Maximum 7 tối đa Sum 260.5 tổng số lượng Count 50 mẫu Confidence Level(98.0%) 0.366962161 độ chính xác Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị. Nhập dữ liệu và bảng tính: phân sinh viên khoa cơ khí k14 số sinh ngành học viên KSTN cơ điện tử 30 KSTN chế tạo máy 30 cơ điện tử 102 kỹ thuật điện lạnh 86 kỹ thuật chế tạo 165 kỹ thuật thiết kế 55 kỹ thuật máy xây dựng và nâng chuyển 45 tổng 513
  5. Vẽ biểu đồ đứng thể hiện số lượng sinh viên ở các chuyên ngành. +Quét chọn cột Số sinh viên (H7=> H13) +Dùng chức năng Insert /Insert Column Chart/2-D Column trên menu Insert. Kết quả thu được: kết quả phân ngành KSTN cơ điện tử KSTN cơ chế tạo cơ điện tử kĩ thuật điện lạnh kỹ thuật chế tạo kĩ thuật thiết kế kĩ thuật máy xây dựng và luân chuyển
  6. Nếu t > tα hay tα/2 thì bác bỏ giả thuyết H0 Nếu P>훼 chấp nhận H0 Nếu P<훼 bác bỏ H0 Áp dụng vào Excel Nhập dữ liệu vào bảng Khối toàn bảng số liệu, vào lệnh Data Analysis và chọn“ t – Test: Paired Two Sample for Means” , nhập phạm vi hàng và cột như hình Kết quả: Trước cải tiến Sau cải tiến Mean 6.4 7.1 Variance 2.357894737 1.357894737 Observations 20 20 Pearson Correlation 0.447089765 Hypothesized Mean Difference 0
  7. Chọn chương trình Anova: Two-Factor With Replication với số lần lặp là 3 và mức ý nghĩa 0,02 Ta thu được bảng số liệu sau: Anova: Two-Factor With Replication SUMMARY Nam Trung Bắc Total Count 3 3 3 9 Sum 7.2 6.6 9.8 23.6 Average 2.4 2.2 3.266667 2.622222
  8. Bài 4: Bệnh đau mắt hột được chia làm 4 thời kỳ T 1, T2, T3 và T4. Một kết quả kiểm tra các bệnh nhân đau mắt hột được cho trong bảng sau: Địa Mức độ đau mắt hột phương T1 T2 T3 T4 A 47 189 807 1768 B 53 746 1387 946 C 16 228 438 115 Hãy nhận xét xem tình hình đau mắt hột ( cơ cấu phân bố 4 mức độ) ở 3 địa phương trên có giống nhau hay không, sử dụng mức ý nghĩa 1%. Bài làm Dạng bài toán: Bài toán kiểm định tỉ lệ 1. Cơ sở lý thuyết ✓ Giả thiết kiểm định H0: cơ cấu phân bố 4 mức độ của bệnh đau mắt hột ở 3 địa phương là như nhau. Giả thiết đối H1: cơ cấu phân bố 4 mức độ của bệnh đau mắt hột ở 3 địa phương là khác nhau. 2 ✓ Tra bảng 휒훼( ― 1)( ― 1): c là số cột, r là số hang, 훼 là mức ý nghĩa. 2 2 ( 푖푗 ― 푖푗) ✓ Tiêu chuẩn kiểm định: 휒푞푠 = ∑푖,푗 푖푗 Trong đó: O ij là tần số thực nghiệm của hàng i, cột j (Tổng hàng i)x(Tổng cột j) Eij = Tổng cộng Eij: Tần số lý thuyết của hàng i và cột j ✓ Kết luận: 2 2 - Cách 1: 휒푞푠 > 휒훼 => bác bỏ H0 => cơ cấu phân bố 4 mức độ đau mắt hột ở 3 địa phương là khác nhau. - Cách 2: P(X > ) bác bỏ H0 => cơ cấu phân bố 4 mức độ đau mắt hột ở 3 địa phương là khác nhau và ngược lại. 2. Thực hiện bài toán:
  9. Bài 5: Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi quy tuyến tính đơn. Thực hiện các yêu cầu: 1) Tìm hệ số tương quan giữa X,Y. 2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ. 3) Tìm sai số chuẩn của ước lượng, Bài làm: Khảo sát lượng calo đốt cháy trung bình của 1 người khi chạy bộ để giảm cân trong 2 tuần (14 ngày). Thời gian Lượng calo (phút) đốt cháy 20 250 30 400 22 260 26 320 26 320 27 340 29 380 35 500 34 480 25 300 33 460 31 420 28 360 32 440 1.Tìm hệ số tương quan giữa X và Y: ➢ Cơ sở lý thuyết: Hệ số tương quan: Nếu R > 0 thì X,Y tương quan thuận. Nếu R < 0 thì X,Y tương quan nghịch.
  10.  Kết quả: Lượng calo đốt Thời gian cháy Thời gian 1 Lượng calo đốt cháy 0.991710734 1 Ta có hệ số tương quan là R = 0,991711 chứng tỏ giữa thời gian và lượng calo đốt cháy có quan hệ khá chặc chẽ và có tương quan thuận. 2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Nếu có, hãy ước lượng đường hồi quy tuyến tính Y theo X. ➢ Cơ sở lý thuyết: Giả thiết H0: X và Y không có tương quan tuyến tính: ➢ Thực hiện trên Excel: Tính T : chọn ô F9 và nhập biểu thức =F8*SQRT(14-2)/SQRT(1-F8^2). Tính c: chọn ô F10 và nhập biểu thức =TINV(0.05,12) (c là phân vị mức α/2=0.025 của phân bố Student với n-2=12 bậc tự do).
  11. Dùng chức năng Data/Data Analysis/Regression: Kết quả:
  12. - Đối với biến tự do: SE = 19,1892 - Đối với biến X: SE = 0,6675