Báo cáo bài tập lớn Xác suất thống kê - Đề tài 10

BÀI 1 :

Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau:

1. Thực hiện phương pháp phân tổ dữ liệu (A).

2. Vẽ đồ thị phân phối tần số và đa giác tần số (A).

3. Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 96% (A).

4. Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.

5. Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với một phân bố xác suất nào đó hay không?

docx 17 trang thamphan 28/12/2022 2760
Bạn đang xem tài liệu "Báo cáo bài tập lớn Xác suất thống kê - Đề tài 10", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • docxbao_cao_bai_tap_lon_xac_suat_thong_ke_de_tai_10.docx

Nội dung text: Báo cáo bài tập lớn Xác suất thống kê - Đề tài 10

  1. . TRƯỜNG ĐẠI HỌC BÁCH KHOA THÀNH PHỐ HỒ CHÍ MINH BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Giáo viên hướng dẫn: NGUYỄN KIỀU DUNG Nhóm 10: Sinh viên thực hiện: 1. Lê Bá Bảo 1410198 L05-A 2. Nguyễn Mạnh Cường 1410452 L05-A 3. Trần Quang Khôi 1411875 L05-A 4. Nguyễn Nhật Linh 1412027 L10-B 5. Nguyễn Hữu Phúc 1412962 L05-A 6. Trần Hoàng Tiến 1414003 L05-A Dĩ An, tháng 5 năm 2016
  2. ➢ Xác định trị số khoảng cách h theo công thức: x x h max min k ➢ Kết quả: h=21,25 ➢ Ta xác định được các cận trên và cận dưới các tổ lần lượt là: + Tổ 1 : 13 - 34,25 + Tổ 2 : 34,25 – 55,5 + Tổ 2 : 55,5 – 76,75 + Tổ 2 : 76,75 – 98 ➢ Nhập vào các ô từ A11 đến A14 lần lượt các giá trị như sau: ➢ Chọn Data/ Data Analysis/ Histogram: • Input Range: địa chỉ tuyệt đối chứa dư liệu. • Bin Range: địa chỉ chứa bảng phân nhóm. • Output options: vị trí xuất kết quả. • Confidence Level for Mean: độ tin cậy cho trung bình. Chọn Cumulative Percentage để tính tần suất tích lũy nếu không Excel chỉ tính tần số. ➢ Kết quả sau khi hiệu chỉnh:
  3. 3/ Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 96% (A). ➢ Nhập dữ liệu vào bảng tính: ➢ Chọn chức năng Data/Data Analysis/Descriptive Statistics. + Input Range: địa chỉ tuyệt đối chứa dư liệu. + Output options: vị trí xuất kết quả. + Confidence Level for Mean: độ tin cậy cho trung bình.
  4. ➢ Vẽ biểu đồ tròn thể hiện số lượng chuyến bay đến các địa điểm + Quét chọn cột Số sinh viên (C3:C9) + Dùng chức năng Insert/Insert Pie/2-D Pie trên menu Insert. ➢ Kết quả thu được:
  5. ✓ Vào Data/ Data Analysis/ F-Test Two-Sample for Variances ✓ Chọn các mục như hình : ✓ Kết quả hiện thị: ✓ Biện luận đầu tiên : Giả thiết : 2 2 H0 : σ1 = σ2 “Lượng sơn phun từ máy là đồng đều ở 2 ngày.” 2 2 H1 : σ1 > σ2 “Lượng sơn phun từ máy là không đồng đều ở 2 ngày.” Miền bác bỏ : 푊훼 = (0,17892; + ∞) F = 0,5503 > F0,01 = 0,1782 Bác bỏ giả thiết H0, tức là phương sai của máy phun sơn ở 2 ngày là khác nhau. ✓ Tiếp tục vào Data/ Data Analysis/ T-Test Two-Sample Assuming Unequal Variances ✓ Chọn các mục như hình :
  6. 8,1 4,2 2,5 13,4 1,8 3,9 Hãy áp dụng bài toán phân tích phương sai 2 yếu tố thích hợp với cơ sở số liệu trên và mức ý nghĩa = 5%; trình bày các kết luận thu được. TRÌNH BÀY : Dạng bài : Bài toán phân tích phương sai 2 yếu tố (có lặp) Cơ sở lí thuyết :
  7. ✓ Kết quả hiển thị : ✓ Biện luận : FR = 0,6410 F0,05 = 3,4028 Bác bỏ giả thiết H0. F1 = 3,4952 > F0,05 = 3,4028 Bác bỏ giả thiết H0. BÀI 4 : Một nghiên cứu được tiến hành ở thành phố công nghiệp X để xác định tỉ lệ những người đi làm bằng xe máy, xe đạp, xe buýt. Việc điều tra được tiến hành trên 2 nhóm và có kết quả như sau: Xe máy Buýt Xe đạp Nữ 25 100 125 Nam 75 120 205 Với mức ý nghĩa = 5%, hãy nhận định xem có sự khác nhau về cơ cấu sử dụng các phương tiện giao thông đi làm trong 2 nhóm người lao động nam và nữ hay không. TRÌNH BÀY : Dạng bài : Kiểm định giả thiết về tỉ lệ. Cơ sở lí thuyết : o Giả thiết : H0 : P1 = P1,0, P2 = P2,0, Pk,0 “Các cặp Pi và Pi,0 giống nhau.” H1 : “Ít nhất có 1 cặp Pi và Pi,0 khác nhau.”
  8. BÀI 5 : Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi quy tuyến tính đơn. Thực hiện các yêu cầu: 1) Tìm hệ số tương quan giữa X,Y. 2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ. 3) Tìm sai số chuẩn của ước lượng. TRÌNH BÀY : Khi nghiên cứu lực nâng hình thành trên biên dạng cánh, người ta quan sát lực nâng theo góc tấn (angle of attack), là góc hợp bởi phương của vận tốc gió và dây cung cánh. Từ đó, rút ra bảng hệ số lực nâng theo góc tấn (deg) đối với 1 biên dạng cánh nào đó. 0 1 2 3 4 5 6 7 8 9 10 11 12 Cl 0,24 0,35 0,46 0,56 0,65 0,76 0,87 0,97 1,07 1,16 1,26 1,35 1,44 1. Tìm hệ số tương quan giữa X và Y, ở đây là giữa và Cl : o Cơ sở lí thuyết : Hệ số tương quan : ∑ x y ― ∑ x ∑ y R = i i i i 2 2 2 2 n ∑ xi ― ( ∑ xi) n ∑ yi ― ( ∑ y) ▪ Nếu R > 0 thì X, Y tương quan thuận. ▪ Nếu R < 0 thì X, Y tương quan nghịch. ▪ Nếu R = 0 thì X, Y không tương quan. ▪ Nếu | R |= 1 thì X, Y có quan hệ hàm bậc nhất. ▪ Nếu | R |→ 1 thì X, Y có tương quan chặt (tương quan mạnh). ▪ Nếu | R |→ 0 thì X, Y có tương quan không chặt (tương quan yếu). o Thực hiện trên Excel : ✓ Nhập dữ liệu vào bảng tính : ✓ Chọn chức năng Data/Data Analysis/Correlation :
  9. Giả thiết H0 : “Phương trình hồi quy tuyến tính không thích hợp”. H1 : “Phương trình hồi quy tuyến tính thích hợp”. Trắc nghiệm F < Fα,1,n―2: chấp nhận H0. o Thực hiện trên Excel : Dùng chức năng Data/Data Analysis/Regression. Cl Line Fit Plot 15 10 a 5 a 0 Predicted a 0 0.5 1 1.5 2 -5 Cl o Biện luận: Phương trình hồi quy: 푠 = ― 2,5399 + 9,9657 Hệ số hồi quy: 1,50587E-12 < 0.05 Hệ số tự do không có ý nghĩa. 9,64802E-19 < 0.05 Hệ số của x không có ý nghĩa. Phương trình hồi quy tuyến tính này không thích hợp vì 9,64802E-19 < 0.05. 3) Tìm sai số chuẩn của ước lượng : Dùng kết quả từ bảng SUMMARY OUTPUT từ câu trên ta xác định được sai số chuẩn của ước lượng: Đối với biến tự do: SE = 0,073853139 Đối với biến X: SE = 0,078943999