Báo cáo bài tập lớn Xác suất thống kê - Đề tài 6

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó  cho các yêu cầu sau:

1)Thực hiện phương pháp phân tổ dữ liệu (A).

2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 96% (A).

4)Trình bày dữ liệu định tính (B) dạng phân loại  bằng các đồ thị.

5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không.

docx 23 trang thamphan 28/12/2022 2820
Bạn đang xem 20 trang mẫu của tài liệu "Báo cáo bài tập lớn Xác suất thống kê - Đề tài 6", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • docxbao_cao_bai_tap_lon_xac_suat_thong_ke_de_tai_6.docx

Nội dung text: Báo cáo bài tập lớn Xác suất thống kê - Đề tài 6

  1. TRƯỜNG ĐẠI HỌC BÁCH KHOA THÀNH PHỐ HỒ CHÍ MINH KHOA CƠ KHÍ BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ ĐỀ TÀI 6 GVHD: NGUYỄN KIỀU DUNG THỰC HIỆN: NHÓM 06 – L08 1) 1410272 Hoàng Thái Bình 2) 1410611 Phan Thái Duy 3) 1411564 Phạm Hoàng Hùng (L06) 4) 1412373 Nguyễn Hữu Nam 5) 1412449 Lê Trung Nghĩa 6) 1412854 Từ Tấn Phát (L10) 7) 1414174 Nguyễn Quốc Khánh Triều 8) 1414402 Nguyễn Bá Tuấn Thành phố Hồ Chí Minh, tháng 5 năm 2016 1
  2. Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau: 1)Thực hiện phương pháp phân tổ dữ liệu (A). 2)Vẽ đồ thị phân phối tần số và đa giác tần số (A). 3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 96% (A). 4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị. 5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không. Bài làm: 1) Thực hiện phương pháp phân tổ dữ liệu A: A: Khảo sát thời gian hoàn thành một sản phẩm tiện của 40 sinh viên khi học thực tập Cơ khí ta có bảng số liệu: Thời gian (phút). - Xác định số tổ cần chia: 1 k = (2 × n)3 Biểu thức nhập vào Excel: =(2*COUNT(A1:J4))^(1/3) Kết quả 4,31 Chọn k = 4 - Xác định trị số khoảng cách h: (Xmax ― Xmin) h = k Biểu thức trong Excel: =(MAX(A1:J4)-MIN(A1:J4))/4 Kết quả: 4,25 - Các tổ lần lượt là: o Tổ 1: 12 - 16 o Tổ 2: 16 - 20 o Tổ 3: 20 - 24 o Tổ 4: 24 - 29 3
  3. o Chọn bảng: A16:B21 o Chọn Insert/ Insert Line Chart/Chọn chart o Chỉnh sửa o Kết quả 3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 96% (A). - Nhập lại dữ liệu: 5
  4. - Chọn bảng A1:B8 - Chọn Insert/ Insert Pie: - Chỉnh sửa: - Kết quả: 5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không. Ho : Mẫu phù hợp phân phối chuẩn H1 : Mẫu không phù hợp phân phối chuẩn Tính các đặc trưng mẫu: n = 40 ; = 18,375 = ; 푠 = 4,46 = 휎 푙à ướ 푙ượ푛 ℎợ 푙ý ự đạ푖 ℎ표 ò푛 푠2 푙à ướ 푙ượ푛 ℎợ 푙ý ự đạ푖 ℎ표 휎2 7
  5. 8 B 185 179 9 B 176 175 10 B 169 173 Với mức ý nghĩa 0,07 có thể cho rằng dùng loại nguyên liệu A làm đế giày bền hơn dùng loại nguyên liệu B hay không? Tìm thêm giá trị P trong kiểm định. Bài làm: 1) Nhận dạng: bài toán thuộc dạng kiểm định so sánh hai trung bình khi chưa biết 2 2 σ1 và σ2 . 2) Cơ sở lý thuyết - Được dùng khi mẫu bé,độc lập và có phương sai khác nhau. X1 ― X2 2 2 - Tiêu chẩn kiểm định: t= S1 + S2 n1 n2 - Phân vị 2 phía t∝/2 là : t Critical two-tail - Nếu |t|> t∝/2 thì bác bỏ H0, chấp nhận H1 - Nếu |t| ≤ t∝/2 thì chấp nhận H0, bác bỏ H1 - Giá trị P: +∞ - ∫ f(x)dx, với P = |t| k + 1 k+1 Γ x2 2 f(x) = 2 1 + k k kπ Γ 2 3) Thực hiện trên Excel - Gọi 1, 2 là độ bền của đề giày được làm từ vật liệu A và B. - Giả thuyết kiểm định: 표: 1 = 2 - Giả thuyết đối: 1: 1 > 2 - Nhập số liệu vào bảng tính: - Chọn Data/ Data Analysis/ T-Test: Two-Sample Assuming Unequal Variances. Nhấn Ok - Hộp thoại T-Test: Two-Sample Assuming Unequal Variances hiện ra. Trong đó: o Phạm vi của dữ liệu 1( variable 1 range): Chọn B2:K2 o Phạm vi dữ liệu 2 ( variable 2 range): Chọn B3:K3 9
  6. ❖ Cơ sở lý thuyết : - Dạng bài toán: Kiểm định về giá trị trung bình (Kiểm định giả thuyết có tham số) - Phương pháp: PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ Phép phân tích phương sai được dùng trong các trắc nghiệm để so sánh các giá trị trung bình của hai hay nhiều mẫu được lấy từ các phân số.Đây có thể được xem như phần mở rộng các trắc nghiệm t hay z (so sánh hai giá trị trung bình). Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một yếu tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát, Yi(i=0,1,2, ,k). - Mô hình: Yếu tố thí nghiệm 1 2 K Y11 Y21 Yk1 Y12 Y22 Yk2 Y1N Y2N YkN Tổng cộng T1 T2 Tk T trung bình ___ ___ ___ ___ Y1 Y2 Yk Y Bảng ANOVA: Nguồn sai Bậc sai Tổng số bình phương Bình phương trung Giá trị thống số số bình kê Yếu tố k-1 k T 2 T 2 SSF MSF SSF= i MSF= F=  k 1 MSE Sai số N-k i 1 N N SSE SSE=SST-SSF MSE= N k k n 2 Tổng cộng N-1 2 T SST= Y n i 1 j 1 N Trắc nghiệm: • Giả thiết: H0: 1 2 k “Các giá trị trung bình bằng nhau” H1: i  j “Ít nhất có hai giá trị trung bình khác nhau” 11
  7. Bảng Anova: Từ giá trị trong bảng Anova: 13
  8. Từ giá trị trong bảng Anova: FR= 4.879478 > F0.05=2.901295 => Không chấp nhận giả thiết H0 Kết luận: Không có sự liên quan giữa yếu tố doanh thu và yếu tố thời gian. 15
  9. Tính P(X > ²) = CHITEST (Bảng thực tế, Bảng kỳ vọng) = CHITEST (C3:E7,C13:E17) = 8.67E-06 Phân tích kết quả: P(X > ²) = 8.67E-06 < = 0.05 Do đó giả thuyết Ho không được chấp nhận. Kết luận: Vậy độ dày lớp mạ phụ thuộc vào bể mạ được dùng. 17
  10. o Kết quả: R = 0,790711973 > 0 và R → 1 nên thời gian và khối lượng phoi thải có tương quan chặt và tương quan thuận 2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ. • Xét quan hệ giữa X, Y: - Cơ sở lý thuyết: Giả thiết Ho: X và Y không có tương quan tuyến tính: 푛 ― 2 = 1 ― 2 - Thực hiện trên Excel o Tính T: =B8*SQRT(12-2)/SQRT(1-B8^2) o Tính c: =TINV(0.05,10) (c là phân vị mức α/2 = 0,025 của phân bố Student với n – 2 = 10 bậc tự do). o Vì |T| > c nên bác bỏ Ho o Vậy X và Y có tương quan tuyến tính. • Ước lượng đường hồi quy tuyến tính Y theo X: - Cơ sở lý thuyết: 19
  11. o Kết quả 21
  12. - Đối với biến tự do: SE = 151,2200 - Đối với biến X: SE = 4,2594 23