Bài 1: Phân phối nhị thức


Nội dung bài giảng Bài 1: Phân phối nhị thức sau đây sẽ giúp các bạn tìm hiểu về bài toán tổng quát dẫn đến phân phối nhị thức, định nghĩa, các tham số đặc trưng.

Tóm tắt lý thuyết

1. Bài toán tổng quát dẫn đến phân phối nhị thức

Giả sử tiến hành n phép thử độc lập, gọi A là biến cố nào đó mà ta cần quan tâm. Trong mỗi phép thử chỉ có thể xảy ra một trong hai trường hợp: hoặc biến cố A xảy ra, hoặc A không xảy ra. Xác suất để cho A xảy ra trong mỗi phép thử đều bằng p. Gọi X là số lần biến cố A xảy ra trong n phép thử, thì X là đại lượng ngẫu nhiên rời rạc có thể nhận các giá trị: 0, 1, 2. . . n, với các xác suất tương ứng được tính theo công thức Bernoulli:

\({P_x} = P(X = x) = C_n^x{p^x}{q^{n - x}}\)            (3.1)

\((\forall x = 0,1,2,....,n)\)

2. Định nghĩa

Đại lượng ngẫu nhiên rời rạc X nhận một trong các giá trị: 0, 1, 2............ n, với các xác suất tương ứng được tính theo công thức (3.1) thì X có phân phối nhị thức với các tham số n và p.

Đại lượng ngẫu nhiên X có phân phối nhị thức với các tham số n và p được ký hiệu là: X ~ B(n, p)

Thí dụ: Xác suất để một máy sản xuất được sản phẩm loại I là 0,8. Cho máy sản xuất 5 sản phẩm. Gọi X là số sản phẩm loại I có trong 5 sản phẩm do máy sản xuất thì X ~ B(5; 0,8). Các giá trị mà X có thể nhận là: 0, 1, 2, 3, 4, 5. Với các xác suất tương ứng là:

  • P(X = 0) = (0,2)5 = 0,00032;             
  • P(X  =  1) = \(C_5^1\) (0,8)(0.2)4 = 0,0064;
  • P(X = 2) = \(C_5^2\) (0,8)2(0,2)3 = 0,512;   
  • P(X = 3) = \(C_5^3\) (0,8)3(0,2)2 = 0,2048;
  • P(X = 4) = \(C_5^4\) (0,8)4(0,2) = 0,4096;     
  • P(X = 5) = (0,8)5 = 0,32768;

Nếu X ~ B(n, p) và ta cần tính P(X = x) hoặc P(X \( \le \) x) thì có thể dùng hàm BINOMDIST trong Excel.

P(X = x) = BINOMDIST(x, n, p,0)

P(X\(\le \) x) = BIN0MDIST(x,n,p,1)

Thí dụ: X ~ B(50; 0,3) Tính P(X = 16) và P(12 \( \le \) X \( \le \) 18)

P(X = 16) =BINOMDIST(16,50,0.3,0) = 0,1147

P(12 \( \le \) X \( \le \) 18) = P(X \( \le \) 18) - P(X \( \le \) 11) 

= BINOMDIST(18,50,0.3,1) - BINOMDIST(11,50,0.3,1) = 0,7204

Trong thực tế, nhiều khi ta cần tính xác suất để đại lượng ngẫu nhiên X có phân phối nhị thức nhận giá trị trong khoảng (x, x+h) (với h nguyên dương và h \( \le \) n - x). Khi đó ta áp dụng công thức sau đây:

P(x \( \le \)\( \le \) x+h) = Px + Px+1 +.... + Px+h                   (3.2)

Trong đó: Px, Px+1,... , Px+h được tính theo công thức (3.1)

Thí dụ: Một phân xưởng có 5 máy hoạt động độc lập. Xác suất để ưong một ngày mỗi máy bị hỏng đều bằng 0,1. Tìm xác suất để:

a. Trong một ngày có 2 máy hỏng.

b. Trong một ngày có không quá 2 máy hỏng.

Giải: Nếu coi việc quan sát tình trạng của một máy ưong ngày là một phép thử thì ta có 5 phép thử độc lập. Trong mỗi phép thử chỉ có thể xảy ra một trong hai trường hợp: Hoặc máy bị hỏng, hoặc máy không bị hỏng. Xác suất máy bị hỏng trong ngày đều bằng 0,1. Gọi X là số máy hỏng trong một ngày thì X~B(5;0,1).

a. Xác suất để trong ngày có 2 máy hỏng chính là P(X = 2).

Theo công thức (3.1) ta có:

\(P(X = 2) = C_5^2{(0,1)^2}{(0,9)^3} = 0,0729\)

b. Xác suất để trong ngày có không quá 2 máy hỏng chính là:

P(X \(\le\) 2)

Vì X ~ B(5; 0,1) nên: \(P(X \le 2) = P(0 < X \le 2)\)

Áp dụng công thức (3.2) ta có:

\(P(0 \le X \le 2) = P(X = 0) + P(X = 1) + P(X = 2)\)

Theo công thức (3.1) thì:

\(P(X = 0) = C_5^0{(0,1)^0}{(0,9)^5} = 0,59049\)

\(P(X = 1) = C_5^1{(0,1)^1}{(0,9)^4} = 0,32805\)

\(P(X = 2) = 0,0729\) (tính ở câu a).

Vậy:

P(X\(\le\)2) = 0,59049 + 0,32805 + 0,0729 = 0,99144

3. Các tham số đặc trưng

Kỳ vọng toán: Nếu X ~ B(n, p) thì: E(X) = np

Chứng minh: Thật vậy, gọi X là số lần xuất hiện biến cố A trong phép thử thứ i (i = 1, 2,..., n). Xj là các đại lượng ngẫu nhiên độc lập và đều có qui luật phân phối xác suất như sau:

Xi 0 1
P q p

Theo định nghĩa kỳ vọng toán, ta có:

 E(Xi) = 0.q+1.p = p (\(\forall i\)= 1,2,..., n)

Gọi X là số lần xuất hiện biến cố A trong n phép thử. Như ta đã biết, X ~ B(n,p) và X = X1 + X2 + ... +Xn. Dođó:

E(X) = E(X1) + E(X2) + ... + E(Xn) = np

Phương sai: Nếu X - B(n, p) thì: Var(X) = npq

Chứng minh: Thật vậy, từ phân phối xác suất của X ở trên ta tính được:

\(E(X_i^2) = {0^2}.q + {1^2}.p = p\)

Theo công thức tính phương sai, ta có:

\(V{\rm{ar}}({X_i}) = E(X_i^2) - {\left[ {E({X_i})} \right]^2} = p - {p^2} = p(1 - p) = pq\)

\(V{\rm{ar}}(X) = V{\rm{ar}}({X_1} + {X_2} + ... + {X_n}) = npq\)

Giá trị tin chắc nhất:

Ngoài cách tìm Mod(X) từ bảng phân phối xác suất của X. Người ta đã chứng minh rằng: Nếu X - B(n, p) thì ta có thể áp dụng công thức sau để tìm Mod(X).

np - q \(\le\) Mod(X) \(\le\) np + p                           (3.3)

Chứng minh: Gọi X0 là Mod(X). Theo định nghĩa của mod(X) ta có:

\(P(X = {x_0}) \ge P(X = {x_{0 - 1}})\,\,và\,\,P(X = {x_0}) \ge P(X = {x_{0 + 1}})\,\)

Áp dụng công thức Bernoulli ta có: 

\(P(X = {x_0}) = C_n^{x0}{p^{x0}}{q^{n - x0}};\,\,\,\,\,\,\,P(X = {x_{{x_{0 - 1}}}}) = C_n^{x0 - 1}{p^{x0 - 1}}{q^{n - x0 + 1}}\)

Từ (3.4) ta suy ra:           

\(\frac{{C_n^{x0}{p^{x0}}{q^{n - x0}}}}{{C_n^{x0 - 1}{p^{x0 - 1}}{q^{n - x0 + 1}}}} \ge 1\)

\(\Leftrightarrow \frac{{(n - {x_0} + 1)p}}{{{x_0}q}} \ge 1 \Leftrightarrow (n - {x_0} + 1)p \ge {x_0}q\)

\(\Leftrightarrow {x_0}(p + q) \le (n + 1)p \Rightarrow {x_0} \le np + p\)  (3.6)

Tương tự, từ (3.5) ta cũng chứng minh được:  \({x_0} \ge np - q\) (3.7)

Kết hợp (3.6) và (3.7) ta được: \(np - q \le {x_0} \le np + p\)

Thí dụ: Một máy sản xuất được 200 sản phẩm trong một ngày. Xác suất để máy sản xuất ra phế phẩm là 0,05. Tìm số phế phẩm trung bình và số phế phẩm tin chắc nhất của máy đó trong một ngày

Giải:

Gọi X là số phế phẩm của máy trong một ngày thì x~ B(200, 0,05). số phế phẩm trung bình của máy trong một ngày chính là E(X). Theo công thức tính kỳ vọng toán của đại lượng ngẫu nhiên có phân phối nhị thức ta có:

E(X) = np = 200 x 0,05 = 10

Số phế phẩm tin chắc nhất của máy trong một ngày chính là Mod(X).

Ta có:

np - q = 200 x 0,05 - 0,95 = 9,05;

np + p = 200 x 0,05 + 0,05 = 10,05

Vậy theo công thức (3.3) ta có:

\(9,05 \le Mod(X) \le 10,05\)

Vì X ~ B(200; 0,05) nên Mod(X) phải là số nguyên

Vậy Mod(X) = 10