Bài giảng Phân tích dữ liệu khách hàng bằng chương trình MS-Excel - Chương 1: Áp dụng MS-Excel trong thống kê mô tả - Nguyễn Đình Huy

A- TÍNH TOÁN GIÁ TRỊ THỐNG KÊ MÔ TẢ
3.1 Khái niệm thống kê
3.1.1 Giá trị trung bình (Mean, Average)
Một người tợ săn bắn một con vịt bằng hai loạt đạn, mỗi loạt gồm 5 viên. Loạt thứ nhất
cách con vịt một mét về phía trước, loạt thứ hai cách con vịt một mét về phía sau. Trên thực tế
con vịt chưa chết nhưng theo kết quả trung bình thì con vịt đã chết. Cái mà người thợ săn cần
bắn một phát trúng con vịt để được nuôi mồi, cái mà nhà khoa học cần thông thường là sự ước
tính để có giá trị trung bình. 
pdf 8 trang thamphan 28/12/2022 1660
Bạn đang xem tài liệu "Bài giảng Phân tích dữ liệu khách hàng bằng chương trình MS-Excel - Chương 1: Áp dụng MS-Excel trong thống kê mô tả - Nguyễn Đình Huy", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfbai_giang_phan_tich_du_lieu_khach_hang_bang_chuong_trinh_ms.pdf

Nội dung text: Bài giảng Phân tích dữ liệu khách hàng bằng chương trình MS-Excel - Chương 1: Áp dụng MS-Excel trong thống kê mô tả - Nguyễn Đình Huy

  1. PT DỮ LIỆU KH BẰNG CHƯƠNG TRÌNH MS-EXEL 1 Chương 1 ÁP DỤNG MS-EXCEL TRONG THỐNG KÊ MÔ TẢ  Tính các giá trị thông kê mô tả  Xác định và độ chính xác BỘ MÔN TOÁN GVGD: Nguyễn Đình Huy
  2. PT DỮ LIỆU KH BẰNG CHƯƠNG TRÌNH MS-EXEL 3 3.1.4 Độ lệch chuẩn (Standarl Deviation) Độ phân tán dữ liệu thường được diễn tả bởi phương sai (Variance) hai độ lệch chuẩn (căn số bậc 2 có phương sai): N 2 (X i X ) SD i 1 (N 1) Trong thí dụ 3: S = 3,08; trong thí dụ 4: S = 52,65. Độ phân tán của dữ liệu trong thí dụ 4 cao hơn độ phân tán của dữ liệu trong thí dụ 3: 3.1.5 Sai số chuẩn giá trị trung bình (Std. error of the mean) Giá trị trung bình của mẫu gần bằng giá trị trung bình của dân số hơn là các giá trị quan sát riêng biệt. S SEM SD(X ) S X N Trong thí dụ 3: SEM = 1,03; trong thí dụ 4: SEM = 17,55 Khi cỡ màu càng lớn (N tăng) thì giá trị trung bình càng gần µ 3.1.6 Giới hạn và khoảng tin cậy Với một mức tin cậy (Confidence level) nhất định là α giới hạn tin cậy (confidence limits) của một giá trị trung bình được cho bởi tích số: t S : (N 30) Lưu ý: Công cụ phân tích “Deseriptive Statistics” trong chương trình MS-EXCEL chỉ áp dụng cho mẫu nhỏ. trong trường hợp mẫu lớn, bạn phải tính lại tích số , với tα được tra trong bảng tích phân Laplace. 3.1.7 Hệ số phân tán (Coefficient of variatio) S Hệ số phân tán còn được gọi là sai số tương đối (relative deviation): CV 100 X Trong thí dụ 3: CV = 1,50%; trong thí dụ 4: CV = 25,77% Hệ số phân tán có liên qujan đến độ chuẩn (cũng như độ chính xác của phương pháp đo lường) và giá trị trung bình của các kết quả. 3.1.8 Giá trị yếu vị (Mode) Giá trị yếu vị là giá trị có tần số cao nhất trong một chuỗi dữ liệu. trong thí dụ 3: giá trị yếu vị là 207; trong thí dụ 4: giá trị yếu vị là 257. BỘ MÔN TOÁN GVGD: Nguyễn Đình Huy
  3. PT DỮ LIỆU KH BẰNG CHƯƠNG TRÌNH MS-EXEL 5 c- Trong hộp thư thoại Data Analysis, ấn định lần lượt các chi tiết: - Phạm vi đầu vào (Input Range), - Cách sắp xếp theo hàng hay cột (Group By), - Nhãn dữ liệu (Labels in Fisrt Row/Column), - Mức tin cậy (Confidence Level), - Phạm vi đầu ra (Output Range), - Kết quả tóm tắc (Summary Satt.istics). 3.2.3 Tính các giá trị thống kê Từ đầu ra của MS-EXCEL, bạn phải tính giới hạn tin cậy t S đồng thời tính thêm hệ số X S phân tán CV 100 bằng cách: X - Chọn B18 trong bảng tính chứa đầu ra của MS-EXCEL, nhập biểu thức = 2.306*B4 dùng con trỏ kéo nút tự điều đến ô D18 (2,306: giá trị của t với α = 0,05; B4: tọa độ của giá trị S ). X B7 - Chọn B19 trong bảng tính chứa đầu ra của MS-EXCEL, nhập biểu thức x100 rồi dùng B3 con trỏ kéo nút tự điều đến ô D19 (B7: tọa độ của giá trị S; B3: tọa độ của giá trị X ). A B C D 1 TD3 TD4 2 3 Mean 204.3333333 Mean 204.3333333 4 Standard Error 1.027402334 Standard Error 17.54992877 5 Median 204 Median 202 6 Mode 207 Mode 257 7 Standard Deviation 3.082207001 Standard Deviation 52.64978632 8 Sample variance 9.5 Sample variance 2772 9 Kurtosis -1.330431342 Kurtosis -2.423671859 10 Skewness 0.058546077 Skewness 0.020438933 11 Range 9 Range 109 12 Minimum 200 Minimum 150 13 Maximum 209 Maximum 259 14 Sum 1839 Sum 1839 15 C ount 9 count 9 16 Confidence Level (95.0 2.369189782 Confidence Level (95.0 4047020829 17 18 19 Kết quả: BỘ MÔN TOÁN GVGD: Nguyễn Đình Huy
  4. PT DỮ LIỆU KH BẰNG CHƯƠNG TRÌNH MS-EXEL 7 B- XÁC ĐỊNH ĐỘ ĐÚNG VÀ ĐỘ CHÍNH XÁC 3.3 Khái niệm thống kê A B C D A: chính xác, không đúng B: Không chính xác, không đúng C: Chính xác, đúng D: Không chính xác, không đúng Độ chính xác (Precision): độ lập lại của các giá trị quan sát S P 100 CV 1 100 X Độ đúng (Accuracy): độ trùng hợp giữa các giá trị quan sát (hay thực nghiệm) với giá trị lý thuyết. Giá tri trung bình A 100 Giá tri lí thuy h Độ chính xác và độ đúng phản ánh chất lượng của một phương pháp đo lường. một phương pháp tốt vừa chính xác vừa đúng. Áp dụng MS-EXCEL Thí dụ 5: người ta xác định hàm lượng hoạt chất trong một mẫu thuốc bằng cách tiến hành song song 10 lần trong hai điều kiện; mẫu không được thêm và được thêm một lượng hoạt chất biết trướclà 10 mg X 9,8 9,7 9,9 10,0 10,1 9,8 10,2 10,0 9,8 9,8 X’ 19,5 19,6 19,6 20,0 19,9 19,7 20,0 19,7 19,6 19,5 Tính độ chính xác và độ đúng của phương pháp: (X’ = X + 10mg) BỘ MÔN TOÁN GVGD: Nguyễn Đình Huy