Bài 5: Kiểm định giả thiết về tỷ lệ tổng thể và sự bằng nhau của hai trung bình


Nội dung bài giảng Bài 5: Kiểm định giả thiết về tỷ lệ tổng thể và sự bằng nhau của hai trung bình sau đây sẽ giúp các bạn tìm hiểu về kiểm định giả thiết về tỷ lệ tổng thể, kiểm định giả thiết về sự bằng nhau của hai trung bình.

Tóm tắt lý thuyết

1. Kiểm định giả thiết về tỷ lệ tổng thể

Giả sử tỷ lệ các phần tử có tính chất A của tổng thể là p (p chưa biêt). Ta cần kiểm định giả thiết:

\(H_0: p = p_0\); và giả thiết đối  \({H_1}:p \ne {p_0}\) với mức ý nghĩa a.

Để kiểm định giả thiết trên, ta lấy mẫu kích thước n khá lớn, khi đó nếu Ho đúng thì đại lượng ngẫu nhiên:

\(Z = \frac{{\left( {F - {p_0}} \right)\sqrt n }}{{\sqrt {{p_0}(1 - {p_0})} }}\)  (8.14)

phân phối xắp xỉ N(0, 1)

Từ đó ta có thể áp dụng qui tắc quyết định như sau:

  • Từ mẫu cụ thể tính f rồi tính:

\(z = \frac{{\left( {f - {p_0}} \right)\sqrt n }}{{\sqrt {{p_0}(1 - {p_0})} }}\)

  • Với \(\alpha\) đã cho, xác định \({Z_{\alpha /2}}\) (tra bảng hoặc dùng hàm NORMSINV)
  • Nếu \(\left| z \right| > {z_{\alpha /2}}\) thì ta bác bỏ H0;
  • Nếu \(\left| z \right| \le {z_{\alpha /2}}\) thì ta có thể chấp nhận H0.

Từ việc chấp nhận (hay bác bỏ) H0 ta suy ra kết luận cuối cùng theo yêu cầu của bài toán thực tế.

Miền bác bỏ ứng với các loại giả thiết đối khác rthau cho ở bảng sau đây:

Giả thiết Miền bác bỏ
\(\begin{array}{l} {H_0}:p = {p_0}\\ {H_1}:p < {p_0} \end{array}\) \({{\rm{W}}_\alpha } = \left\{ {z = \frac{{\left( {f - {p_0}} \right)\sqrt n }}{{\sqrt {{p_0}(1 - {p_0})} }}:z < - {z_\alpha }} \right\}\)
\(\begin{array}{l} {H_0}:p = {p_0}\\ {H_1}:p > {p_0} \end{array}\) \({{\rm{W}}_\alpha } = \left\{ {z = \frac{{\left( {f - {p_0}} \right)\sqrt n }}{{\sqrt {{p_0}(1 - {p_0})} }}:z > {z_\alpha }} \right\}\)
\(\begin{array}{l} {H_0}:p = {p_0}\\ {H_1}:p \ne {p_0} \end{array}\) \({{\rm{W}}_\alpha } = \left\{ {z = \frac{{\left( {f - {p_0}} \right)\sqrt n }}{{\sqrt {{p_0}(1 - {p_0})} }}:|z| > {z_{\alpha /2}}} \right\}\)

Chú ý:

Nếu kiểm định giả thiết: \({H_0}:p = {p_0};{H_1}:p \ne {p_0}\) Trường hợp bác bỏ giả thiết H0

  • Nếu f < p0 thì có thể kết luận p < p0 
  • Nếu f > p0 thì có thể kết luận p > p0

Thí dụ 4: Tỷ lệ phế phẩm của một nhà máy là 5%. Sau khi tiến hành một cải tiến kỹ thuật, người ta kiểm ưa 400 sản phẩm thì thấy có 16 phế phẩm.

Với mức ý nghĩa \(\alpha = 0,01\). Hãy kết luận xem việc cải tiến kỹ thuật có làm giảm tỷ lệ phế phẩm hay không ?

Giải: Gọi tỷ lệ phế phẩm của nhà máy sau khi cải tiến kỹ thuật là p. Đặt giả thiết \({H_0}:p = 0,05;{H_1}:p < 0,05\)

Với mức ý nghĩa \(\alpha = 0,01\) thì \({z_\alpha } = {z_{0,01}} = 2,326\). Tỷ lệ phế phẩm của mẫu là:

\(f = \frac{{16}}{{400}} = 0,04\)

Vậy

\(z = \frac{{\left( {0,04 - 0,05} \right)\sqrt {400} }}{{\sqrt {0,05(1 - 0,05)} }} = - 0,92\)

Ta thấy \(z = -0,92 > - z_{\alpha} = -2,326\), tức \(Z \notin {{\rm{W}}_\alpha }\) nên ta chấp nhận giả thiết H0. Tức biện pháp kỹ thuật chưa có tác dụng làm giảm tỷ lệ phế phẩm của nhà máy.

2. Kiểm định giả thiết về sự bằng nhau của hai trung bình

Giả sử hai ĐLNN X và Y độc lập, cùng có phân phối chuẩn với E(X) và E(Y) đều chưa biết, cần kiểm định giả thiết:

\(H_0: E(X) = E(Y)\) và giả thiết đối \(H_1: E(X) \ne E(Y)\) với mức ý nghĩa a.

Qui tắc quyết định như sau:

  • Lấy mẫu kích thước n1 (đối với X) và n2 (đối với Y) từ đó tính:

\(z = \frac{{\overline x - \overline y }}{{\sqrt {\frac{{v{\rm{ar}}(X)}}{{{n_1}}} + \frac{{v{\rm{ar}}(Y)}}{{{n_2}}}} }}\)   (8.16)

nếu không biết var(X) và var(Y)

hoặc: 

\(z = \frac{{\overline x - \overline y }}{{\sqrt {\frac{{s_X^2}}{{{n_1}}} + \frac{{s_Y^2}}{{{n_2}}}} }}\)  (8.17)

  • Các công việc còn lại giống như qui tắc quyết định khi kiểm định giả thiết về tỷ lệ tổng thể.

Thí dụ 5: Trọng lượng sản phẩm do hai nhà máy sản xuất là các đại lượng ngẫu nhiên phân phối theo qui luật chuẩn và có cùng độ lệch tiêu chuẩn là \(\sigma = 1kg\)

Với mức ý nghĩa \(\alpha = 0,05\), có thể xem trọng lượng trung bình của sản phẩm do hai nhà máy sản xuất ra là như nhau hay không? Nếu cân thử 25 sản phẩm của nhà máy A ta tính được: \(\overline x = 50kg\); Cân 20 sản phẩm của nhà máy B thì tính được: \(\overline y = 50,6{\rm{ }}kg\).

Giải:

Gọi trọng lượng sản phẩm của nhà máy A là X; của nhà máy B là Y. Theo giả thiết ta có X, Y là các đại lượng ngẫu nhiên cùng phân phối theo qui luật chuẩn với Var(X) = Var(Y) = 1.

Đặt giả thiết \(H_0: E(X) = E(Y); H_1: E(X) \ne E(Y).\)

Với mức ý nghĩa \(\alpha = 0,05\) thì \(Z_{\alpha/2} = 1,96\).

Tính 

\(z = \frac{{\left( {50 - 50,6} \right)}}{{\sqrt {\frac{1}{{25}} + \frac{1}{{20}}} }} = - 2\)

Ta thấy \(\left| z \right| = 2 > {z_{\alpha /2}}\) nên bác bỏ H0. Tức trọng lượng trung bình của sản phẩm sản xuất ở hai nhà máy là khác nhau.