Báo cáo bài tập lớn Xác suất thống kê - Đề tài 3

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó  cho các yêu cầu sau:

1)Thực hiện phương pháp phân tổ dữ liệu (A).

2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 93% (A).

4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.

5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không.

 

docx 29 trang thamphan 28/12/2022 2580
Bạn đang xem 20 trang mẫu của tài liệu "Báo cáo bài tập lớn Xác suất thống kê - Đề tài 3", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • docxbao_cao_bai_tap_lon_xac_suat_thong_ke_de_tai_3.docx

Nội dung text: Báo cáo bài tập lớn Xác suất thống kê - Đề tài 3

  1. TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HỒ CHÍ MINH KHOA CƠ KHÍ BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: Nguyễn Kiều Dung Nhóm 3 – Đề tài 3 SVTH: - Phạm Minh Cảnh 1410325 L04-A - Nguyễn Quốc Kiệt 1411926 L02-A - Từ Phước Lâm 1411973 L10-B - Nguyễn Trường Thịnh 1413791 L04-B - Nguyễn Văn Long 1412096 L10-B - Trần Công Hậu 1411154 L06-A - Trần Trọng Phát 1412851 L10-B
  2. 1/ Thực hiện phân tổ dữ liệu (A): ❖ Nhập dữ liệu (A) vào Excel: 1 ❖ Xác định số tổ cần chia: = (2푛)3 • Chọn ô A6 nhập vào biểu thức: =(2*COUNT(A1:J4))^(1/3)  Kết quả: 4.31 • Chọn k = 4 ― 푖푛 ❖ Xác định số khoảng cách h theo công thức: ℎ = • Chọn ô B6 nhập vào công thức: =(MAX(A1:J4)-MIN(A1:J4))/4  Kết quả: 2 • Chọn h = 2 ❖ Lập ra các tổ chia được từ giá trị h=2
  3. ❖ Kết quả: Hay 2/ Vẽ đồ thị phân phối tần số và đa giác tần số (A). ❖ Vẽ đồ thị phân phối tần số: • Quét bảng tần số C11:C14 • Dùng chức năng Insert Column Chart trên menu Insert ❖ Kết quả: ❖ Vẽ đa giác tần số: • Sử dụng bảng phân phối tần số dữ liệu (A). • Thêm giá trị 0 vào đầu và cuối bảng phân phối tần số.
  4. ❖ Chọn chức năng Data/Data Analysis/Descriptive Statistics • Input Range: Địa chỉ tuyệt đối chứa dữ liệu. • Output Option: Vị trí xuất keesrt quả. • Confidence Lever for Mean: Độ tin cậy cho trung bình. ❖ Kết quả:
  5. ❖ Tính tỉ lệ sinh viên cho các ngành: Nhập vào C2: =(B2/$B$9), copy cho các ô còn lại. Kết quả: ❖ Vẽ biểu đồ đứng thể hiện số lượng sinh viên ở các chuyên ngành: • Quét chọn cột Số sinh viên (B2:B8). • Dùng chức năng Insert/Insert Column Chart/2-D Column trên manu Insert. ❖ Kết quả:
  6. Bài 2: Một giám đốc doanh nghiệp quyết định gửi 8 nhân viên của mình đi dự một lớp tập huấn về “Dịch vụ khách hàng”. Dưới đây là phản hồi của bộ phận chăm sóc khách hàng về các nhân viên được cử đi tập huấn. Tên nhân Số lần phàn nàn của khách hàng viên 3 tháng trước tập huấn 3 tháng sau tập huấn A 3 2 B 5 4 C 12 10 D 8 6 E 6 6 F 5 3 G 7 3 H 9 4 Hãy nhận xét hiệu quả của quyết định trên với mức ý nghĩa 5%. Tìm thêm giá trị P trong kiểm định. Giải Cơ sở lý thuyết Trong trường hợp hai mẫu nhỏ (N 2 (đợt tập huấn thực sự có hiệu quả) Phương pháp kiểm định: So sánh hai trung bình với dữ liệu cặp (paired two samples for means), phân phối Student với n=8, 1 phía. Tiêu chuẩn kiểm định: ― 휇 = 푠/ 푛~ (푛 ―1) Giá trị kiểm định: 푡 = 푠2/푛
  7. + Nhãn dữ liệu (Labels) + Ngưỡng tin cậy (Alpha) + Sai biệt giữa hai giá trị trung bình ước tính (Hypothesized Mean Difference) + Phạm vi đầu ra (Output Range). _ Sau đó chọn OK _ Ta sẽ được kết quả trong hộp thoại sau: Ta chú ý đến các giá trị t Stat (giá trị kiểm định t ở trên), P(T≤t) one-tail (giá trị P của phép kiểm định) và t Critical one-tail (giá trị tới hạn T cho mức ý nghĩa 5%). Ta thấy푡 = 3,6604 > = 1,8946 , đồng thời với giá trị P nhỏ (0,004034), ta bác bỏ H₀ và kết luận “đợt tập huấn đã có hiệu quả”. P = 0.00403388
  8. B 푖* = 푖푗 푗 1 → 푗 → 1 11 1푗 1 ⇒ 1∗ ↓ A 푖 푖1 푖푗 푖 ⇒ 푖∗ ↓ 푛 푛1 푛푗 푛 ⇒ 푛∗ ⇓ ⇓ ⇓ ⇓ = *푗 푖푗 *1 *푗 * ⇒ = 푖푗 푖 Bảng ANOVA: Nguồn SS Df MS F ∑ 2 2 푆푆 푆 Yếu tố A 푖 푖* 푆푆 = - = 푛 - 1 푆 = 퐹 = (hàng) 푛 푆 ∑ 2 2 푆푆 Yếu tố B 푗 *푗 푆 푆푆 = - = - 1 푆 = 퐹 = (cột) 푛 푛 푆 푆푆 Sai số 푆푆 = 푆푆 - 푆푆 - 푆푆 푒 = × 푆 = 푒 2 푆푆 = Tổng 푖푗 - 푛 + + 푒 푖,푗 Nếu 퐹 > 퐹 푒(1 ― 훼) thì bác bỏ yếu tố A (hàng) Nếu 퐹 > 퐹 푒(1 ― 훼) thì bác bỏ yếu tố B (cột) Áp dụng: Ta có được bảng sau:
  9. Bài 4: Khảo sát ngẫu nhiên 300 sinh viên đã tốt nghiệp cùng một chuyên ngành từ 3 trường A, B và C sau một năm ra trường, người ta có kết quả: Trường Đã đi làm Học tiếp Chưa có việc làm A 60 12 28 B 55 10 35 C 65 6 29 Với mức ý nghĩa 3%, hãy cho biết có thể coi tình trạng việc làm của sinh viên 3 trường trên là như nhau không? Bài làm 1. Dạng toán: Bài toán kiểm định tính đồng nhất (bằng cách kiểm tra tính độc lập) 2. Cơ sở lí thuyết: ➢ Giả thuyết: H0: Tình trạng việc làm của sinh viên 3 trường là như nhau. H1: Tình trạng việc làm của sinh viên 3 trường khác nhau. B B B B Tổng A 1 2 k A1 n11 n12 n1k n10 A2 n21 n22 n2k n20 Ar nr1 nr2 nrk nr0 Tổng n01 n02 n0k N • Nếu giả thiết Ho “Hai dấu hiệu A và B độc lập” chúng ta có hệ thức sau: pij = pio.poj • Các xác suất pio và poj được ước lượng bởi: 푛푖0 ≈ 푖0 푛 푛0푗 ≈ 0푗 푛 • Do đó Ho đúng thì:
  10. • Dùng hàm CHITEST để tính. Nhấn vào Tab Fomulas chọn Insert Function chọn CHITEST rồi nhấn OK Lúc đó sẽ xuất hiện hộp thoại Function Argument ➢ Kết quả thu được:
  11. Y(vẽ cơ khí) 7.5 7 6 6.5 7.5 5.5 9 8 6.5 7.5 8 9.5 8 7.5 6.5 *CƠ SỞ LÝ THUYẾT -Dạng: Bài toán kiểm định tương quan và hồi quy -Phân tích bài toán bằng Excel -Hệ số tương quan n (xi x).(yi y) r i 1 n n 2 2 (xi x) (yi y) i 1 i 1 -Kiểm tra quan hệ tuyến tính ta có r n 2 T 1 r 2 -Ta xét mối quan hệ giữa T và c là phân vị mức α/2 = 0.025 của phân phối Student với n-2 bậc tự do. -Nếu |T|>c thì X,Y có tương quan tuyến tính. *QUY TRÌNH THỰC HIỆN 1/Tìm hệ số tương quan giữa X và Y. Cơ sở lý thuyết Nếu r > 0 thì X,Y tương quan thuận Nếu r < 0 thì X,Y tương quan nghịch Nếu r = 0 thì X,Y không tương quan Nếu |r| = 1 thì X,Y có quan hệ hàm bậc nhất Nếu |r| → 1 thì X, Y có tương quan chặt (tương quan mạnh) Nếu |r| → 0 thì X, Y có tương quan không chặt (tương quan yếu) Thực hiện -Nhập dữ liệu vào bảng tính
  12. -Kết quả thu được: -Từ bảng trên, ta tìm được hệ số tương quan r = 0.685417 -Kết luận: vậy X và Y có tương quan thuận. 2/Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không?Hãy ước lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ. Cơ sở lý thuyết -Giả thiết kiểm định Ho: X và Y không có tương quan tuyến tính
  13. -Kiểm định hệ số a, b: + Giả thiết Ho: Hệ số hồi quy không có ý nghĩa (=0). + H1: Hệ số hồi quy có ý nghĩa (≠0). + Trắc nghiệm t ô B16) Input X Range: phạm vi đầu vào ô (ô A1-> ô A16) Chọn Labels (thêm nhãn dữ liệu) Output Range: phạm vi đầu ra (ô D13) Chọn Line Fit Plots trong Residuals để vẽ đường hồi quy
  14. -Kết luận: Đường hồi quy của Y đối với X là y x 0.435376968 4.478666114 -Hệ số hồi quy: 0.0002<0.05 : Hệ số tự do không có ý nghĩa