Bài 4: Phương pháp tính các tham số đặc trưng của mẫu


Mời các bạn cùng tham khảo nội dung bài giảng Bài 4: Phương pháp tính các tham số đặc trưng của mẫu sau đây để tìm hiểu về trường hợp số liệu của mẫu cho dưới dạng gồm đủ n giá trị quan sát, trường hợp số liệu của mẫu cho dưới dạng có tấn số ni (nói chung ni > 1).

 

Tóm tắt lý thuyết

Giả sử có mẫu cụ thể WX = (X1, X2,. . . ,Xn), thì trung bình mẫu \(\overline X \) và phương sai mẫu (s2) là hai giá trị cơ bản nhất đối với mẫu cụ thể này, s có thể suy ra từ s2; còn f thì tính rất đơn giản. Do đó phần này chúng ta chỉ nêu ra công thức tính \(\overline x \) và s2 tương ứng với từng trường hợp số liệu hiện có như sau:

1. Trường hợp số liệu của mẫu cho dưới dạng gồm đủ n giá trị quan sát

Trường hợp này, để tính \(\overline x \) ta sử dụng công thức định nghĩa:

\(\overline x = \frac{1}{n}\sum\limits_{i = 1}^n {{x_i}} \)

Để tính s2 ta dùng công thức:

\({s^2} = \frac{1}{{n - 1}}\left[ {\sum\limits_{i = 1}^n {x_i^2 - n{{\left( {\overline x } \right)}^2}} } \right]\)

Chứng minh:

Theo công thức định nghĩa của S2 ta có:

\({s^2} = \frac{1}{{n - 1}}\sum\limits_{i = 1}^n {{{\left( {{x_i} - \overline x } \right)}^2}} \)

Ta có:

\({\left( {{x_i} - \overline x } \right)^2} = {\left( {{x_i}} \right)^2} - 2{x_i}\overline x + {\left( {\overline x } \right)^2}\)

Vậy: 

\(\sum\limits_{i = 1}^n {{{\left( {{x_i} - \overline x } \right)}^2}} = \sum\limits_{i = 1}^n {\left[ {{{\left( {{x_i}} \right)}^2} - 2\overline x .{x_i} + {{\left( {\overline x } \right)}^2}} \right]} \)

\(= \sum\limits_{i = 1}^n {x_i^2 - 2\overline x .{x_i} + n.{{\left( {\overline x } \right)}^2}} = \sum\limits_{i = 1}^n {x_i^2 - n} .{\left( {\overline x } \right)^2}\)

Suy ra: 

\({S^2} = \frac{1}{{n - 1}}\left[ {\sum\limits_{i = 1}^n {x_i^2 - n{{\left( {\overline x } \right)}^2}} } \right]\)

Thí dụ 3: Quan sát điểm thi môn Toán cao cấp của 10 sinh viên được chọn ngẫu nhiên từ một lớp ta thu được các số liệu sau:

5; 6; 7; 4; 6; 9; 4; 5; 5; 7

Tính \(\overline x \) và s của mẫu này.

Giải

Ta có: \(\sum\limits_{i = 1}^{10} {{x_i}} = 58\) vậy: \(\overline x = \frac{{58}}{{10}} = 5,8\)

\(\sum\limits_{i = 1}^{10} {x_i^2} = 358\) vậy: \({s^2} = \frac{1}{9}\left[ {358 - 10.{{(5,8)}^2}} \right] = 2,4\)

\( \Rightarrow s = \sqrt {{s^2}} = \sqrt {2,4} = 1,549193\)

Chú ý:

Để tính \(\overline x \) ta có thể dùng hàm AVERAGE trong Excel: \(\overline x = AVERAGE\left\{ {{x_i}} \right\}\)

Để tính s2 ta có thể dùng hàm VAR trong Excel: s2 =VAR{Xi}

Để tính s ta có thể dùng hàm STDEV trong Excel: s = STDEV{Xi}

Cách thức thực hiện các lệnh này cũng tương tự như lệnh AVERAGE (xem phụ lục 1).

Thí dụ 4: Có các số liệu về doanh số bán (Y) và chi phí chào hàng (X) của 12 công ty thương mại tư nhân cho ỏ bảng dưới đây. Hãy tính trung bình mẫu và độ lệch chuẩn mẫu của X và Y.

Doanh số bán (yi) triệu đ/năm Chi phí chào hàng (xi) triệu đ/năm Doanh số bán (yi) triệu đ/năm Chi phí chào hàng (xi) triệu đ/năm

1270

1490

1060

1626

1020

1800

100

106

60

160

70

170

1610

1280

1390

1440

1590

1380

140

120

116

120

140

150

Tính trung bình mẫu và độ lệch chuẩn mẫu của X và Y.

Từ các số liệu cho ở bảng trên, ta tính được:

\(\sum\limits_{i = 1}^{12} {{x_i}} = 1452\) Vậy: \(\overline x = \frac{{1452}}{{12}} = 121\)

\(\sum\limits_{i = 1}^{12} {{y_i}} = 16956\) Vậy: \(\overline y = \frac{{16956}}{{12}} = 1413\)

\(\sum\limits_{i = 1}^n {x_i^2} = 188192\). Vậy: \(s_X^2 = \frac{1}{{11}}\left[ {188192 - 12{{(121)}^2}} \right] = 1136,363636\)

\( \Rightarrow {s_X} = \sqrt {1136,363636} = 33,71\)

\(\sum\limits_{i = 1}^n {y_i^2} = 24549576\). Vậy: \(s_Y^2 = \frac{1}{{11}}\left[ {24549576 - 12{{(1413)}^2}} \right] = 53704,36364\)

\(\Rightarrow {s_Y} = \sqrt {53704,36364} = 231,742\)

2. Trường hợp số liệu của mẫu cho dưới dạng có tấn số ni (nói chung ni > 1).

Trường hợp này, để tính \(\overline x \) và s2 ta áp dụng công thức: 

\(\overline x = \frac{1}{n}\sum\limits_{i = 1}^k {{n_i}{x_i}} \)

\({s^2} = \frac{1}{{n - 1}}\left[ {\sum\limits_{i = 1}^k {{n_i}x_i^2 - n{{\left( {\overline x } \right)}^2}} } \right]\)

Chú ý:  \(\sum\limits_{k = 1}^k {{n_i}} {x_i}\) trong công thức (6.30) cũng chính là  \(\sum\limits_{i = 1}^n {x_i}\) trong công thức (6.27); Tương tự  \(\sum\limits_{k = 1}^k {{n_i}} {x_i^2}\) trong công thức (6.31) cũng chính là \(\sum\limits_{k = 1}^n {x_i^2}\) trong công thức (6.28).

Với các số liệu cho ở thí dụ 3, ta có thể trình bày số liệu quan sát của mẫu này dưới dạng có tần số như sau:

xi 4 5 6 7 9
ni 2 3 2 2 1

Từ số liệu ở bảng trên, ta tính được:

\(\sum\limits_{i = 1}^k {{n_i}} {x_i} = 58;\sum\limits_{i = 1}^k {{n_i}} x_i^2 = 358\)

So sánh với kết quả tính ở thí dụ 3 ta có thể minh chứng cho nhận xét nêu trên.

Thí dụ 5: Tính trung bình và phương sai của mẫu cho ở bảng sau:

xi 4 5 7 9
ni 10 15 13 12

Giải:

Từ số liệu của mẫu đã cho ta tính được: \(\sum\limits_i {{n_i}{x_i} = 314} \). Vậy: \(\overline x = \frac{{314}}{{50}} = 6,28\)

\(\sum\limits_i {{n_i}} x_i^2 = 2144\). Vậy: \({s^2} = \frac{1}{{49}}\left[ {2144 - 50.{{(6,28)}^2}} \right] = 3,5118\)

Thí dụ 6: Số liệu cho ở cột 1 và cột 3 của bảng dưới đây (bảng 6.33) là số liệu quan sát về lượng hàng bán được (kg/ngày) của một đại lý. Hãy tính trung bình mẫu và phương sai mẫu.

Lượng hàng bán được(kg/ngày) Số ngày

800-850

851-900

901-950

951-1000

1001-1050

1051-1100

1101-1150

1151-1200

1201-1300

9

12

24

36

25

20

16

10

8

Ta thay mỗi khoảng bằng giá trị trung tâm khoảng, từ đó ta có bảng sau: (bảng 6.34)

xi ni

825

875,5

925,5

975,5

1025,5

1075,5

1125,5

1175,5

1250,5

9

12

24

36

25

20

16

10

8

  n = 160

Từ số liệu của bảng trên, ta tính được: \(\sum\limits_i {{n_i}} {x_i} = 162175,5\)

Vậy: 

\(\overline x = \frac{{162175,5}}{{160}} = 1013,596875\)

\(\sum\limits_{i = 1}^n {{n_i}x_i^2} = 166159712,75\)

Vậy

\({s^2} = \frac{1}{{159}}\left[ {166159712,75 - 160.{{(1013,125)}^2}} \right] = 11189,51384\)