Báo cáo bài tập lớn Xác suất thống kê - Đề tài 1

Bài 1:  Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau:

1) Thực hiện phương pháp phân tổ dữ liệu (A).

2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 91% (A).

4) Trình bày dữ liệu định tính (B) dạng phân loại  bằng các đồ thị.

5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không.

docx 27 trang thamphan 28/12/2022 1980
Bạn đang xem 20 trang mẫu của tài liệu "Báo cáo bài tập lớn Xác suất thống kê - Đề tài 1", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • docxbao_cao_bai_tap_lon_xac_suat_thong_ke_de_tai_1.docx

Nội dung text: Báo cáo bài tập lớn Xác suất thống kê - Đề tài 1

  1. TRƯỜNG ĐẠI HỌC BÁCH KHOA THÀNH PHỐ HỒ CHÍ MINH KHOA KHOA HỌC ỨNG DỤNG BỘ MÔN TOÁN ỨNG DỤNG BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ ĐỀ TÀI 1 GVHD: NGUYỄN KIỀU DUNG THỰC HIỆN: NHÓM 1 – L08 1) VĂN CÔNG BẰNG - 1410258 2) NGUYỄN KHÁNH BÌNH - 1410284 3) VÕ MINH ĐẠI - 1410756 4) PHAN THẾ HIỀN - 1411231 5) TRẦN VĂN HUY - 1411514 6) BÙI LÊ NGỌC MIN - 1412249 7) ĐẶNG HỒNG NHẬT - 1412670 8) LƯƠNG HÀ PHƯƠNG – 1413016 Thành phố Hồ Chí Minh, tháng 05 năm 2016
  2. Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm 1 Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau: 1) Thực hiện phương pháp phân tổ dữ liệu (A). 2)Vẽ đồ thị phân phối tần số và đa giác tần số (A). 3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 91% (A). 4) Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị. 5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không. Bài làm: Dạng bài: Thống kê mô tả Dữ liệu A: Khảo sát 50 sinh viên năm thứ 2, ngành Máy Tính về số ngôn ngữ lập trình mà sinh viên sử dụng thành thạo bao gồm (được học và tự học). 6 1 2 4 3 1 4 2 2 7 5 2 3 1 2 0 5 3 1 7 1 1 4 3 3 1 5 4 4 8 3 4 4 6 4 2 5 5 5 2 4 8 4 8 2 3 4 5 7 2 Dữ liệu B: Kết quả phân ngành của sinh viên khoa Máy Tính: Kỹ sư tài năng Khoa Học Máy Tính 40 Kỹ sư tài năng Kỹ Thuật Máy Tính 17 Khoa Học Máy Tính 190 Kỹ Thuật Máy Tính 53 Thực hiện phân tổ dữ liệu A: Nhập dữ liệu (A) vào Excel: 1.1. Phân tổ dữ liệu (A) 1 - Xác định số tổ cần chia: k = (2 * n) 3 - Nhập vào ô A7 biểu thức: = (2*COUNT(A1:J5))^(1/3) - Kết quả: 4.641589, chọn k = 4. 3
  3. Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm 1 - Kết quả: 1.2) Vẽ đồ thị tần số và đa giác tần số (A): - Quét bảng tần số B11:B14 - Insert Column Chart - Kết quả: - Vẽ đa giác tần số: + Sử dụng bảng phân phối tần số của dữ liệu (A): + Thêm giá trị 0 vào đầu và cuối bảng phân phối tần số: 5
  4. Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm 1 * Chọn chức năng Data/Data Analysis/Descriptive Statistics - Input Range: Địa chỉ tuyệt đối chứa dữ liệu - Output options: Vị trí xuất kết quả - Confidence Level for Mean: Độ tin cậy cho trung bình. * Kết quả: 1.4) Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị 7
  5. Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm 1 * Vẽ biểu đồ tròn thể hiện tỉ lệ sinh viên ở các chuyên ngành: - Quét chịn cột Số sinh viên (C2:C7). - Dùng chức năng Insert/Insert Pie/2-D trên menu Insert. * Kết quả: 9
  6. Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm 1 *Có sử dụng dữ liệu bảng tính ở câu 3 11
  7. Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm 1 - Vào Data/Data Analysis/ t-test: Paired Two Sample for Means. - Chọn các mục như hình: + Input: địa chỉ tuyệt đối chứa dữ liệu tương ứng của mẫu 1 và 2 + Output options: vị trí xuất kết quả + Apha: mức ý nghĩa α * Kết quả: - Biện luận:Giả thuyết H0: a1 a2 “Doanh số bán ra của cửa hàng trong 2 tháng là như nhau”. H1: a1 a2 “Doanh số bán ra của cửa hàng trong 2 tháng khác nhau”. t = 1.2400 Chấp nhận 0.03 giả thuyết H0. Vậy doanh số bán hang trong 2 tháng là như nhau. Giá trị P cần tìm: P = 0.2408. 13
  8. Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm 1 - Phạm vi đầu vào (input range): chọn bảng tính ta vừa tạo. -Nhãn dữ liệu (labels in first row/column) -Ngưỡng tin cậy: Alpha = 5% = 0.05 -Phạm vi đầu ra (output Range). Sau khi click Ok thì kết quả được hiện trong wooksheet mới: Page | 15
  9. Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm 1 Bài 4: Ba loại vật liệu được thử sức bền dưới ảnh hưởng của việc thay đổi nhiệt độ vô cùng lớn, chúng ta có số liệu: Kết cục Vật liệu 1 Vật liệu 2 Vật liệu 3 Vỡ vụn 25 45 41 Bị phá hủy một phần 40 35 33 Còn toàn vẹn 35 20 26 Hãy kiểm định xem có mối liên hệ phụ thuộc giữa loại vật liệu với tác động thay đổi nhiệt độ không? Sử dụng mức ý nghĩa 2%. BÀI LÀM: ➢Dạng bài: Kiểm định giả thiết về tỉ lệ. ➢Phương pháp giải: Áp dụng Kiểm định chi bình phương 2. ➢Công cụ giải: hàm CHITEST trên Excel. ➢Cơ sở lý thuyết: - Trong thống kê, kiểm định chi bình phương hay kiểm tra 2. (đôi khi đọc là "khi bình phương") là một họ các phương pháp kiểm định giả thiết thống kê trong đó thống kê kiểm định tuân theo phân bố 2 nếu giả thuyết không là đúng. Chúng gồm: •Kiểm định chi bình phương Pearson •Kiểm định chi bình phương Yates •Kiểm định chi bình phương Mantel-Haenszel • - Dạng thống kê kiểm định thông dụng nhất là: (표 ― 푒)2 훾2 = 푒 Với o là dữ liệu đo đạc, e là giá trị dự đoán chính xác. Xét một bộ A gồm r tính trạng, A = (A1, A2, Ar), trong đó mỗi cá thể của tập hợp chính H có và chỉ có một trong các tính trạng (hay phạm trù) Ai. Gọi pi (i = 1, 2, r) là tỷ lệ cá thể tính trạng Ai trong tập hợp chính H. Khi đó véctơ =(p1 , p2, pr) được gọi là phân bố của A trong tập hợp chính H. Giả sử (p1, p2, pr) là phân bố của (A1, A2, Ar) trong tập hợp chính H và (q1, q2, qr) là phân bố của A = (A1, A2, Ar) trong tập hợp chính Y. Ta nói (A1, A2, Ar) có phân bố như nhau trong X và Y nếu (p1, p2, pr) = (q1, q2, qr) p1 = q1, pr = qr. Chúng ta muốn kiểm định xem A = (A1, A2, Ar) có cùng phân số trong X và Y hay không dựa trên các mẫu ngẫu nhiên rút từ X và Y. 푖 푖 푖 푖 Tổng quát hơn, giả sử ta có k tập hợp chính H1, H2, Hk. Gọi = ( 1, 2, , ) là phân bố của A = (A1, A2, Ar) trong tập hợp chính Hi. Ta muốn kiểm định giả thuyết sau: Page | 17
  10. Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm 1 đó c được tìm từ điều kiện P{T > c} = . Vậy c là phân vị mức của phân bố 2 với (k- 1)(r-1) bậc tự do. Đối với thí nghiệm có các kết quả, để so sánh các tỉ số của các kết quả đó, ta dùng kiểm định 2 (chi-quared): 2 (푛 ― 푛 ) 푡ổ푛 ℎà푛 푡ổ푛 ộ푡 2 푖푗 푖푗 훾 = 푣ớ푖 푛 푖 = n : tần số thực nghiệm; 푛 푛 ij 푖=1 푗=1 푖푗 npij: tần số lý thuyết của ô (i,j); r: số hàng; c: số cột Dùng hàm CHITEST (actual_range,expected_range). Tính giá trị: 푃( > χ2) = CHITEST 2 Nếu: 푃( > χ ) > ∝ thì chấp nhận H0 và ngược lại. ➢Thực hiện bài toán bằng excel: •Nhập dữ liệu vào bảng tính và tính tổng các hàng các cột: •Tính các tần số lý thuyết: tần số lý thuyết = (Tổng hàng × Tổng cột)/(Tổng cộng): •Sử dụng hàm CHITEST tính xác suất P(X> 2 ): Page | 19
  11. Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm 1 Bài 5: Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi quy tuyến tính đơn. Thực hiện các yêu cầu: 1) Tìm hệ số tương quan giữa X,Y. 2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ. 3) Tìm sai số chuẩn của ước lượng. Bài làm: ❖ Cơ sở lý thuyết : 1) Tìm hệ số tương quan X và Y: 2) Quan hệ giữa X và Y có được coi là tuyến tính hay không: Giả thiết H0: X và Y không có tương quan tuyến tính: r n 2 T 1 r 2 Page | 21
  12. Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm 1 ✓ Kết quả: => Ta có hệ số tương quan là R = 0.74871046 chứng tỏ giữa thời gian và công suất tiêu thụ có quan hệ khá chặt chẽ và có tương quan thuận. 2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Nếu có, hãy ước lượng đường hồi quy tuyến tính Y theo X. ➢ Thực hiện trên Excel: - Tính T : chọn ô B10 và nhập biểu thức =B7*SQRT(10-2)/SQRT(1- B7^2). - Tính c: chọn ô B11 và nhập biểu thức =TINV(0.05,8) (c là phân vị mức α/2 = 0.025 của phân bố Student với n-2=8 bậc tự do). Page | 23
  13. Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm 1 • Kết quả: ➢ Biện luận: Phương trình hồi quy: yx = -90.4433 + 11.4218x Hệ số hồi quy: 0.6762> 0.05 => Hệ số tự do có ý nghĩa. 0.0256 Hệ số của x không có ý nghĩa. => Phương trình hồi quy tuyến tính này không thích hợp vì 0.02560 Dùng kết quả từ bảng SUMMARY OUTPUT từ câu trên ta xác định được Page | 25
  14. Báo Cáo Bài Tập Lớn Xác Suất Thống Kê_Nhóm 1 Page | 27