Báo cáo Bài tập lớn Xác suất thống kê - Nhóm 10

+ Tính các giá trị Ti..

Chọn ô B7 nhập vào biểu thức=SUM(B2:E2)

Chọn ô C7 nhập vào biểu thức=SUM(B3:E3)

Chọn ô D7 nhập vào biểu thức=SUM(B4:E4)

Chọn ô E7 nhập vào biểu thức=SUM(B5:E5)

+Tính các giá trị T.j..

Chọn ô B8 nhập vào biểu thức=SUM(B2:B5)

Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến ô E8

+Tính các giá trị T..k

Chọn ô B9 nhập vào biểu thức=SUM(B2,C5,D4,E3)

Chọn ô C9 nhập vào biểu thức=SUM(B3,C2,D5,E4)

Chọn ô D9 nhập vào biểu thức=SUM(B4,C3,D2,E5)

Chọn ô E9 nhập vào biểu thức=SUM(B5,C4,D3,E2)

docx 35 trang thamphan 28/12/2022 2520
Bạn đang xem 20 trang mẫu của tài liệu "Báo cáo Bài tập lớn Xác suất thống kê - Nhóm 10", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • docxbao_cao_bai_tap_lon_xac_suat_thong_ke_nhom_10.docx
  • pdfbáo cáo.pdf
  • xlsxđề bài thực hiện.xlsx
  • docxtóm tắt.docx
  • pdftóm tắt.pdf

Nội dung text: Báo cáo Bài tập lớn Xác suất thống kê - Nhóm 10

  1. TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐHQG TP.HCM KHOA KỸ THUẬT XÂY DỰNG MÔN XÁC SUẤT THỐNG KÊ o0o BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ NHÓM 10 GVHD: PGS.TS Nguyễn Đình Huy Họ tên SV: Nguyễn Văn Tuấn MSSV: 1414418 Nhóm_Lớp: L11_C (Sáng thứ 2) TP. HCM tháng 11, năm 2015. Giảng viên hướng dẫn: PGS. TS. Trương Tích Thiện Sinh viên: Võ Anh Hùng Lớp: XD14XD05 MSSV: 1411579 Đề: Tháng 05 năm 2015
  2. BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Bài 1a 1 Đề bài Trình bày ví dụ 3.4 trang 207 sách BT XSTK 2012(N.Đ.Huy) Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo ba yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau Yếu tố B Yếu tố A B1 B2 B3 B4 A1 C1 9 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 ` 2 Yêu cầu Hãy đánh giá về ảnh hưởng của các yếu tố trên đến hiệu suất phản ứng? 3 Dạng bài: Kiểm định giá trị trung bình; Cơ sở lý thuyết. • Phương pháp giải: Phân tích phương sai 3 yếu tố (A, B, C) Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của ba yếu tố trên các giá trị quan sát G (i = 1, 2 r: yếu tố A; j = 1, 2 r: yếu tố B: k = 1, 2 r: yếu tố C). Mô hình: Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô hình vuông la tinh n×n. Ví dụ như mô hình vuông la tinh 4×4: B C D A C D A B D A B C A B C D Mô hình vuông la tinh ba yếu tố được trình bày như sau: GVHD: PGS-TS: NGUYỄN ĐÌNH HUY2
  3. BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ • Tính toán các giá trị + Tính các giá trị Ti Chọn ô B7 nhập vào biểu thức=SUM(B2:E2) Chọn ô C7 nhập vào biểu thức=SUM(B3:E3) Chọn ô D7 nhập vào biểu thức=SUM(B4:E4) Chọn ô E7 nhập vào biểu thức=SUM(B5:E5) +Tính các giá trị T.j Chọn ô B8 nhập vào biểu thức=SUM(B2:B5) Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến ô E8 +Tính các giá trị T k Chọn ô B9 nhập vào biểu thức=SUM(B2,C5,D4,E3) Chọn ô C9 nhập vào biểu thức=SUM(B3,C2,D5,E4) Chọn ô D9 nhập vào biểu thức=SUM(B4,C3,D2,E5) Chọn ô E9 nhập vào biểu thức=SUM(B5,C4,D3,E2) +Tính giá trị T Chọn ô B10 nhập vào biểu thức =SUM(B2:E5) + Tính các giá trị SUMSQTi , SUMSQT.j., SUMSQT k, SQT SUMSOYijk Chọn ô G7 nhập vào biểu thức=SUMSQ(B7:E7) Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9 Chọn ô G10 nhập vào biểu thức=POWER(B10,2) Chọn ô G11 nhập vào biểu thức=SUMSQ(B2:E5) + Tính các giá trị SSR, SSC, SSF, SST và SSE Các giá trị SSR, SSC, SSF GVHD: PGS-TS: NGUYỄN ĐÌNH HUY4
  4. BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Bài 1b 1 Đề bài: Trình bày ví dụ 4.2 tr 216 BT XSTK Người ta dùng ba mức nhiệt độ gồm 105, 120 và 135°C kết hợp với ba khoảng thời gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của phản ứng (%) được trình bày trong bảng sau: Thời gian (phút) Nhiệt độ (°C) Hiệu suất (%) X1 X2 Y 15 105 1.87 30 105 2.02 60 105 3.28 15 120 3.05 30 120 4.07 60 120 5.54 15 135 5.03 30 135 6.45 2 Yêu cầu Hãy cho biết yếu tố nhiệt độ và thời gian/hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115°C trong vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu? 3 Dạng bài: Phân tích tương quan và hồi quy tuyến tính. ❖ Cơ sở lý thuyết. • Phương pháp giải :Hồi quy tuyến tính đa tham số. Trong phương trình hồi quy tuyến tính đa tham số, biến số phụ thuộc Y có liên quan đến k biến số độc lập Xi (i=1,2, ,k) thay vì chỉ có một như trong hồi quy tuyến tính đơn giản. Phương trình tổng quát Ŷx0,x1, ,xk = B0 + B1X1 + + BkXk GVHD: PGS-TS: NGUYỄN ĐÌNH HUY6
  5. BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ ❖ Bài làm. Nhập dữ liệu vào bảng tính Dữ liệu nhất thiết phải được nhập theo cột. Áp dụng Regression Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis Chọn chương trình Regressiontrong hộp thoại Data Analysis rồi nhấp OK Trong hộp thoại Regression, lần lượt ấn định các chi tiết: • Phạm vi của biến số Y (input Y range) • Phạm vi của biến số X (input X range) • Nhãn dữ liệu(Labels) • Mức tin cậy(Confidence level) • Tọa độ đầu ra(Output range) • Đường hồi quy (Line Fit Plots), GVHD: PGS-TS: NGUYỄN ĐÌNH HUY8
  6. BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Phương trình hồi quy: Ŷx2=f(X2) 2 Ŷx2= -11.141 +0.129X2 (R =0.76, S=0.99) 2 t0=3.418> t0.05=2.365(hay Pv =0.011>α=0.05) =>Bác bỏ giả thiết H0 t1= 4.757>t0.05=2.365(hay Pv =0.00206 Bác bỏ giả thiết H0 F=22.631>F=5.590(hay Fs=0.00206 Bác bỏ giả thiết H0 Vậy cả hai hệ số -11.141 (B0) và 0.129 (B1) của phương trình hồi quy Ŷx2=-11.141 +0.129X2 đều có ý nghĩa thống kê.Nói cách khác phương trình hồi quy này thích hợp. Kết luận 2: Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp. GVHD: PGS-TS: NGUYỄN ĐÌNH HUY 10
  7. BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Sự tuyến tính của phương trình Ŷx 1, x2 =-12.70+0.04X1+0.13X2. Có thể được trình bày trong biểu đồ phân tán (scatterplots): Y 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 1 0 GVHD: PGS-TS: NGUYỄN ĐÌNH HUY 12
  8. BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Bài 2 1 Đề bài Bảng sau đây cho ta một mẫu gồm 11 quan sát (x i, yi) từ tập hợp chính các giá trị của cặp ĐLNN (X,Y): X 0,9 1,22 1,32 0,77 1,3 1,2 Y -0,3 0,1 0,7 -0,28 -0,25 0,02 X 1,32 0,95 1,45 1,3 1,2 Y 0,37 -0,70 0,55 0,35 0,32 2 Yêu cầu ❖ Tìm đường hồi quy của Y đối với X. ❖ Tính sai số tiêu chuẩn của đường hồi quy ❖ Tính tỷ số F để kiểm định sự đúng đắn của giả thiết: Có hồi quy tuyến tính của Y theo X. 3 Dạng bài Phân tích tương quan và hồi quy tuyến tính. ❖ Cơ sở lý thuyết • Phương pháp giải :Phân tích hồi quy tuyến tính Phương trình hồi quy tuyến tính: S a r y y x a bx ; ; b y ax Sx Kiểm định hệ số a, b: Giả thuyết Ho: Hệ số quy hồi không có ý nghĩa (= 0) H1: Hệ số hồi quy có ý nghĩa (≠ 0) Trắc nghiệm t t N 2 chấp nhận Ho Kiểm định phương trình hồi quy: Giả thuyết Ho: “Phương trình hồi quy tuyến tính không phù hợp” H1: “Phương trình hồi quy tuyến tính phù hợp” Trắc nghiệm F F 1, N 2 : chấp nhận Ho. GVHD: PGS-TS: NGUYỄN ĐÌNH HUY 14
  9. BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ :Sau khi nhập đủ các thông số, ta có được bảng sau: GVHD: PGS-TS: NGUYỄN ĐÌNH HUY 16
  10. BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ c) Tỷ số F = 12.6267 Với mức ý nghĩa a=0.05, Ta thấy F=12.6367 > 5.12 (bảng Fisher [1, 9]) Pv=0.006169 < 0.05 Bác bỏ giả thiết Ho Vậy cả hai hệ số -1.73948(Bo) và 1.547892(B1) của phương trình hồi quy Y= 1.547892 X- 1.73948 có ý nghĩa. Nói một cách khác, phương trình hồi quy này thích hợp. Kết luận: Y có liên quan tuyến tính với X. GVHD: PGS-TS: NGUYỄN ĐÌNH HUY 18
  11. BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ ❖ Bài làm Tính bằng excel Bước 1: Lập giả thiết H 0: Phân bố thu nhập giữa hai nhóm tuổi này trong số các công nhân lành nghề là như nhau. Nhập bảng số liệu Bước 2: Tính tổng hàng và tổng cột. Đặt con trỏ tại ô B11 rồi giữ chuột kéo đến ô H13. Sau đó nhấn nút trong Tab Home. Ta được tổng hàng và tổng cột Bước 3: Tính tần số lý thuyết. Tần số = (tổng hàng * tổng cột) / tổng cộng. Ô B23 nhập lệnh = $I3*C$5/$I$5 rồi enter. GVHD: PGS-TS: NGUYỄN ĐÌNH HUY 20
  12. BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Lúc đó sẽ xuất hiện hộp thoại Function Arguments Nhập các giá trị tần số quan sát vào mục Actual_range Rồi nhập các giá trị tần số quan sát vào mục Expected_range. Nhấn OK Kết quả Ta được P = 0.511582 Vì giá trị P > α = 2% => Chấp nhận giả thuyết H0 Kết luận: Phân bố thu nhập giữa hai nhóm tuổi này trong số các công nhân lành nghề là như nhau. GVHD: PGS-TS: NGUYỄN ĐÌNH HUY 22
  13. BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ ˆ n p io , io n ˆ noj p oj n Do đó Ho đúng thì ˆ ˆ ˆ nio.noj pij pio.poj , n2 và số cá thể có đồng thời dấu hiệu Ai và Bj sẽ xấp xỉ bằng ˆ nionoj n np ij ij n ˆ Các số nij được gọi là các tần số lý thuyết (TSLT), còn các số n ij được gọi là các tần số quan sát (TSQS). Khoảng cách giữa các TSLT và TSQS được đo bằng đại lượng sau: k r ˆ 2 (nij nij) T ˆ   n j 1 i 1 ij Người ta đã chứng minh được rằng nếu n lớn và các TSLT không nhỏ hơn 5 thì T sẽ 2 có phân bố xấp xỉ phân bố  với bậc tự do là (k–1).(r–1). Thành thử Ho sẽ bị bác bỏ ở mức ý nghĩa nếu T > c, trong đó c là phân vị mức của phân bố  2 với (k–1).(r–1) bậc tự do. Cách 2: Sử dụng hàm CHITEST trong Excel: CHITEST (nij,γij), với lưu ý số lượng các giá trị của nij và γij phải bằng nhau. ✓ Kết luận 2 2 Nếu 0  → Chấp nhận giả thiết H0. Hoặc kết quả hàm CHITEST > α =0.01 → Chấp nhận giả thiết H0. GVHD: PGS-TS: NGUYỄN ĐÌNH HUY 24
  14. BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Sau đó nhấn nút trong Tab Home. Ta được tổng hàng và tổng cột Bước 3: Tính tần số lý thuyết. Tần số = (tổng hàng * tổng cột) / tổng cộng. Ô B9 nhập lệnh = =B$6*$E3/$E$6 rồi enter. Sau đó ta kéo chọn từ B9:D11 , sau đó ta ấn tổ hợp phím F2+ctrl+enter GVHD: PGS-TS: NGUYỄN ĐÌNH HUY 26
  15. BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Rồi nhập các giá trị tần số quan sát vào mục Expected_range. Nhấn OK Kết quả Ta được P = 0.14376 Vì giá trị P > α = 1% => Chấp nhận giả thuyết H 0, tuổi và thu nhập không phụ thuộc nhau. Kết luận: Tuổi và thu nhập không phụ thuộc nhau. GVHD: PGS-TS: NGUYỄN ĐÌNH HUY 28
  16. BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Tính tổng cột: ∗푗∗ = 푖푗 푖, B B1 B2 Bm Ti A X111 X121 X1m1 1∗∗ = 1푗 X112 X122 X1m2 푗, A1 : : : : : : X11r X12r X1mr X211 X221 X2m1 2∗∗ = 2푗 X212 X222 X2m2 푗, A2 : : : : : : X21r X22r X2mr : : : : : : Xn11 Xn21 Xnm1 푛∗∗ = 푛푗 Xn12 Xn22 Xnm2 푗, An : : : : : : Xn1r Xn2r Xnmr T *j* = = = ∗1∗ = 푖1 ∗2∗ 푖2 ∗ ∗ 푖 푖푗 푖, 푖, 푖, 푖,푗, Cần tính: 2 2 2 2 푖푗 푖∗∗ ∗푗∗ 푖푗∗ 푖,푗, 푖 푗 푖,푗 Suy ra: 2 2 2 푆푆 = ( ― ) = ― 푖푗 푖푗 푛 푖,푗, 푖,푗, 2 2 ∑ 푖∗∗ 푆푆 = ( ― )2 = 푖 ― 푖∗∗ 푛 푖 GVHD: PGS-TS: NGUYỄN ĐÌNH HUY 30
  17. BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ ✓ Biện luận ❖ Nếu FA <Fα [n-1 ; nm(r-1)] thì chấp nhận yếu tố A (hàng) ❖ Nếu FB < Fα [m-1 ; nm(r-1)] thì chấp nhận yếu tố B (cột) Nếu FAB <Fα [(n-1)(m-1) ; nm(r-1)] thì không có sự tương tác giữa A và B Bài làm: Bước 1: Giả thiết Ho -HA (yếu tố ngành nghề): doanh thu không phụ thuộc vào ngành nghề. -HB (yếu tố quận): doanh thu không phụ thuộc vào quận. -HAB(sự tương tác giữa 2 yếu tố): doanh thu giữa các ngành nghề và các quận không có liên quan tới nhau. Nhập dữ liệu vào bảng tính : GVHD: PGS-TS: NGUYỄN ĐÌNH HUY 32
  18. BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Kết quả và biện luận: Yếu tố hàng (mẫu): FR = 2.8929 Chấp nhận giả thiết H0 . → Tình hình kinh doanh giữa các ngành nghề là như nhau. Yếu tốc cột: FC = 0.8189 Chấp nhận giả thiết H0 . →Tình hình kinh doanh giữa các quận là như nhau. Ảnh hưởng: F = 0.6498 Chấp nhận giả thiết H0. → Không có sự tương tác giữa khu vực kinh doanh (quận) và ngành nghề kinh doanh. Kết luận: Vậy + tình hình kinh doanh là như nhau giữa các ngành nghề cũng như giữa các quận. +Không có sự tương tác giữa hai yếu tố ngành nghề kinh doanh và địa điểm kinh doanh (quận). GVHD: PGS-TS: NGUYỄN ĐÌNH HUY 34