Mời các bạn cùng tham khảo nội dung bài giảng Bài 3: Xác suất của biến cố và các tính xác suất (phần 2) sau đây để tìm hiểu về phương pháp tính trực tiếp, phương pháp sử dụng sơ đồ, phương pháp sử dụng các khái niệm của giải tích tổ hợp.
Tóm tắt lý thuyết
1. Phương pháp tính trực tiếp
Đối với các phép thử mà việc nhận biết n, m khá đơn giản thì ta có thể dùng phương pháp tính trực tiếp.
Thí dụ: Một lớp có 50 sinh viên, trong đó có 22 nam và 28 nữ. Gọi tên ngẫu nhiên một sinh viên trong danh sách của lớp. Tìm xác suất để gọi được sinh viên nữ.
Giải: Đặt A là biến cố “gọi được sinh viên nữ”. Khi gọi ngẫu nhiên một sinh viên trong danh sách của lớp, ta có thể gọi được sinh viên thứ nhất, hoặc sinh viên thứ hai,.. ., hoặc sinh viên thứ 50. Vậy có 50 trường hợp đồng khả năng có thể xảy ra khi thực hiện phép thử, tức n = 50; Biến cố A sẽ xảy ra khi gọi được hoặc sinh viên nữ thứ nhất, hoặc sinh viên nữ thứ hai,..., hoặc sinh viên nữ thứ 28. Vậy số trường hợp thuận lợi cho A là: m = 28. Vậy theo định nghĩa cổ điển, ta có:
\(P(A) = \frac{m}{n} = \frac{{28}}{{50}} = 0,56\)
2. Phương pháp sử dụng sơ đồ
Đối với những phép thử mà để tính được m, n phải suy đoán phức tạp hơn ta có thể dùng sơ đồ, tức là mô tả các trường hợp đồng khả năng của phép thử dưới dạng sơ đồ để dễ nhận biết hơn. Trong thực tế ta có thể sử dụng các loại sơ đồ sau:
Sơ đồ hình cây:
Thí dụ: Giả sử xác suất sinh con trai và con gái là như nhau và đều bằng 0,5. Quan sát số con gái của một gia đình có 3 con được chọn một cách ngẫu nhiên. Tìm xác suất để gia đình này có 2 con gái.
Các trường hợp có thể xảy ra đối với một gia đình có 3 con có thể được mô tả bằng sơ đồ sau:
Theo sơ đồ trên, ta thấy có 8 truờng hợp đồng khả năng (tương ứng với 8 nhánh trên sơ đồ). Đó là:
GGG, GGT, GTG, GTT, TGG, TGT, TTG, TTT .
Gọi A là biến cố: gia đình này có 2 con gái. Số trường hợp thuận lợi cho A là 3. Đó là các trường hợp: GGT, GTG, TGG. Vậy:
\(P(A) = \frac{3}{8}\)
Sơ đồ dạng bảng
Thí dụ: Tung một con súc sắc 2 lần. Tìm xác suất để tổng số chấm của 2 lần tung không quá 6.
Giải:
Gọi B là biến cố “ tổng số châ'm của 2 lần tung không quá 6”. số trường hợp đồng khả năng có thể xảy ra là n = 36 và được mô tả bằng bảng sau:
Lần 2 | 1 | 2 | 3 | 4 | 5 | 6 |
Lần 1 | ||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 |
2 | 3 | 4 | 5 | 6 | 7 | 8 |
3 | 4 | 5 | 6 | 7 | 8 | 9 |
4 | 5 | 6 | 7 | 8 | 9 | 10 |
5 | 6 | 7 | 8 | 9 | 10 | 11 |
6 | 7 | 8 | 9 | 10 | 11 | 12 |
Trong đó: Các số ở cột 1 và dòng 1 của bảng ghi số chấm xuất hiện ở lần tung thứ nhất, thứ hai. Các ô còn lại của bảng ghi tổng số chấm xuất hiện ở lần tung thứ nhất và lần tung thứ hai. Theo bảng trên ta thấy trong số 36 trường hợp đồng khả năng (tương ứng với 36 ô của bảng) có 15 ô có tổng số chấm của hai lần tung không quá 6. (các số trong các ô này được in đậm). Tức ta có m = 15. Vậy:
\(P(A) = \frac{{15}}{{36}}\)
Sơ đồ dạng tập hợp
Thí dụ: Một lớp có 50 học sinh, trong đó có 15 học sinh giỏi toán; 14 học sinh giỏi văn; 18 học sinh giỏi ngoại ngữ; 3 học sinh giỏi cả văn và toán; 4 học sinh giỏi cả toán và ngoại ngữ; 5 học sinh giỏi cả văn và ngoại ngữ. Gặp ngẫu nhiên một học sinh của lớp, tính xác suất để gặp được một học sinh chỉ giỏi một môn trong 3 môn toán, văn, ngoại ngữ.
Giải:
Gọi A là biến cố gặp được một học sinh chỉ giỏi một môn trong 3 môn toán, văn, ngoại ngữ. Số trường hợp đồng khả năng có thể xảy ra trong phép thử là n = 50. Để tính được số trường hợp thuận lợi cho A, ta sử dụng sơ đồ sau:
Trong sơ đồ trên, vì có 2 học sinh giỏi cả 3 môn toán, văn, ngoại ngữ, nên ta ghi số 2 ở phần chung của 3 miền: giỏi toán, giỏi văn và giỏi ngoại ngữ. Phần còn lại trong phần chung của miền giỏi toán và miền giỏi văn ta ghi số 1 (vì có 3 học sinh giỏi toán và giỏi văn nhưng trong số đó có 2 học sinh giỏi cả 3 môn). Tương tự phần còn lại trong phần chung của miền giỏi toán và giỏi ngoại ngữ ta ghi số 2; phần còn lại trong phần chung của miền giỏi ngoại ngữ và giỏi văn ta ghi số 3. Từ đó ta suy ra:
Số học sinh chỉ giỏi toán là: 15 - (2 + 2 + 1) = 10
Số học sinh chỉ giỏi văn là: 14 - (1 + 2 + 3) = 8
Số học sinh chỉ giỏi ngoại ngữ là: 18 - (2 + 2 + 3) = 11
Vậy số học sinh chỉ giỏi một môn trong 3 môn toán, văn, ngoại ngữ của lớp này là: m = 10 + 8 + 11 = 29. Đó cũng chính là số kết cục thuận lợi cho A. Vậy:
\(P(A) = \frac{{29}}{{50}} = 0,58\)
3. Phương pháp sử dụng các khái niệm của giải tích tổ hợp
Khi chọn ngẫu nhiên k phần tử từ một tập hợp gồm n phần tử (k, n hữu hạn). Để tính số trường hợp có thể xảy ra khi thực hiện phép thử và số trường hợp thuận lợi ta có thể sử dụng các khái niệm của giải tích tổ hợp như: tổ hợp, chỉnh hợp, chỉnh hợp lặp, hoán vị,...
3.1 Qui tắc nhân
Bài toán: Một lớp có 40 sinh viên, trong đó có 26 nam và 14 nữ, hỏi có bao nhiêu cách chọn một nhóm gồm 2 sinh viên ưong đó có một nam và một nữ.
Giải: Để chọn một nhóm gồm có một nam và một nữ, trước hết ta chọn một sinh viên nữ (có 14 cách chọn); với mỗi cách chọn một sinh viên nữ ta lại có 26 cách chọn một sinh viên nam, như vậy có tất cả là n = 14x 26 = 364 cách chọn.
Tổng quát hoá thí dụ trên, người ta đưa ra một qui tắc, được gọi là qui tắc nhân (hay qui tắc đếm) như sau:
Nếu đối tượng A có thể được chọn bằng ni cách và sau mỗi lần chọn A ta lại có n2 cách chọn đối tượng B. Khi đó ta sẽ có tất cả: n = n1.n2
cách chọn A và B.
Qui tắc nhân có thể mở rộng cho trường hợp chọn k đối tượng \((k \ge 2)\). Khi đó số cách chọn k đối tượng sẽ là:
n = n1n2 ... nk (1.2)
trong đó: ni (i = 1, 2,..., k) là số cách chọn phần tử thứ i
3.2 Chỉnh hợp
Định nghĩa: Chỉnh hợp chập k của n phần tử \((k \le 2)\) là một nhóm có thứ tự gồm k phần tử khác nhau chọn từ n phần tử đã cho.
Như vậy từ n phần tử có thể tạo nên nhiều chỉnh hợp chập k khác nhau.
Số chỉnh hợp chập k của n phần tử được ký hiệu là \(A_n^k\)
Công thức tính:
\(A_n^k = \frac{{n!}}{{(n - k)!}}\)
Trong đó: n! = n(n - 1)(n - 2)... 2.1
Chứng minh: Để thành lập một chỉnh hợp chập k từ n phần tử, ta có thể làm như sau: Chọn phần tử thứ nhất (có n cách chọn). Với mỗi cách chọn phần tử thứ nhất ta lại có (n-1) cách chọn phần tử thứ hai (vì phần tử thứ hai phải khác phần tử thứ nhất); làm tương tự như vậy cho đến khi chọn phần tử thứ k. Đối với phần tử thứ k ta có (n-k+1) cách chọn [vì trước khi chọn phần tử thứ k đã có (k-1) phần tử đã được chọn, nên chỉ còn n-(k-1) = n-k+1 phần tử để chọn làm phần tử thứ k]. Vậy theo qui tắc nhân ta có số cách chọn một nhóm gồm k phần tử khác nhau là:
n(n-1)(n-2)....(n-k+1)
\(A_n^k = n(n - 1)(n - 2)....(n - k + 1)\) (1.4)
Từ (1.4) dễ dàng suy ra công thức (1.3)
Thí dụ: Một lớp phải học 8 mốn, mỗi ngày học 2 môn. Hỏi có bao nhiêu cách xếp thời khoá biểu trong một ngày ?
Giải: Vì mỗi cách xếp thời khoá biểu trong một ngày là việc ghép 2 môn trong số 8 môn, nên số cách xếp thời khoá biểu ưong một ngày chính là số cách chọn ra một nhóm gồm 2 môn, các nhóm này khác nhau hoặc do môn học khác nhau hoặc do thứ tự sắp xếp trước sau giữa 2 môn. Vì vậy số cách xếp thời khoá biểu trong một ngày chính là số chỉnh hợp chập 2 của 8 phần tử. Áp dụng công thức (1.3) ta có:
\(A_8^2 = \frac{{8!}}{{(8 - 2)!}} = \frac{{8!}}{{6!}} = 56\) cách
3.3 Chỉnh hợp lặp
Định nghĩa: Chỉnh hợp lặp chập k của n phần tử là một nhóm có thứ tự gồm k phần tử chọn từ n phần tử đã cho. Trong đó mỗi phần tử có thể có mặt 1, 2,..., k lần trong nhóm đó.
Vì mỗi phần tử có thể xuất hiện nhiều lần trong một chỉnh hợp lặp, nên k có thể lớn hơn n cũng được.
Số chỉnh hợp lặp chập k của n phần tử được ký hiệu là \(B_n^k\,\,hoặc\,\,\widetilde {A_n^k}\)
Công thức tính:
\(B_n^k\, = {n^k}\)
Chứng minh:
Để thành lập một chỉnh hợp lặp chập k của n phần tử, ta có thể chọn phần tử thứ nhất theo n cách, phần tử thứ hai cũng có n cách chọn, ..... phần tử thứ k cũng có n cách chọn (vì các phần tử được phép lặp lại nhiều lần trong nhóm). Vì vậy theo qui tắc nhân ta có: n . n ... n = nk
cách thành lập một chỉnh hợp lặp chập k khác nhau từ n phần tử đã cho. Do đó: \(B_n^k\, = {n^k}\)
Thí dụ: xếp 10 cuốn sách vào 3 ngăn. Hỏi có bao nhiêu cách xếp?
Ta thấy mỗi cách xếp 10 cuốn sách vào 3 ngăn là một chỉnh hợp chập 10 của 3 phần tử (vì mỗi lần xếp một cuốn sách vào một ngăn xem như chọn một ngăn trong 3 ngăn, do xếp 10 cuốn sách nên việc chọn ngăn được tiến hành 10 lần). Vì vậy số cách xếp là:
\(B_3^{10}\, = {3^{10}} = 59049\) cách xếp
Chú ý: Để tính số chỉnh hợp lặp chập k của n phần tử, ta có thể dùng hàm POWER(n,k) trong Excel.
\(B_n^k\, = P{\rm{OW}}ER(n,k)\)
Thí dụ: \(B_9^6\, = P{\rm{OW}}ER(9,6) = 531441\)
3.4 Hoán vị
Định nghĩa: Hoán vị của m phần tử là một nhóm có thứ tự gồm đủ mặt m phần tử đã cho.
Số hoán vị của m phần tử đươc ký hiệu là Pm
Công thức tính:
Theo định nghĩa ta thấy các hoán vị chỉ khác nhau bởi thứ tự sắp xếp của các phần tử mà thôi. Một hoán vị của m phần tử cũng chính là một chỉnh hợp chập m của m phần tử. Do đó:
\({P_m} = A_m^m = \frac{{m!}}{{(m - m)!}} = \frac{{m!}}{{0!}} = m!\)
Vậy ta có: \({P_m} = m!\)
Chú ý: Để tính pm ta có thể dùng hàm FACT(m) trong Excel.
\({P_m} = FACT(m)\)
Thí dụ: \({P_5} = FACT(5) = 120\)
3.5 Tổ hợp
Định nghĩa: Tổ hợp chập k của n phần tử \((k \le n)\) là một nhóm không phân biệt thứ tự, gồm k phần tử khác nhau chọn từ n phần tử đã cho.
Ta thấy mỗi tổ hợp cũng chính là một chỉnh hợp. Tổ hợp khác chỉnh hợp ở chỗ: Chỉnh hợp có phân biệt thứ tự của các phần tử trong nhóm, còn tổ hợp thì không phân biệt thứ tự của các phần tử, các chỉnh hợp nếu chỉ khác nhau bởi thứ tự sắp xếp của các phần tử được coi như cùng một tổ hợp mà thôi.
Số tổ hợp chập k của n phần tử được ký hiệu là \(C_n^k\).
Công thức tính: Để thành lập công thức tính số tổ hợp chập k của n phần tử, ta lập luận như sau: Giả sử từ n phần tử ta có thể thành lập được \(C_n^k\) tổ hợp chập k khác nhau. Ta đem hoán vị các phần tử trong các tổ hợp này thì mỗi tổ hợp sẽ tạo ra k! chỉnh hợp, mà ta có tất cả \(C_n^k\) tổ hợp. Vậy ta có đẳng thức:
\(C_n^kk! = A_n^k\)
Từ đó:
\(C_n^k = \frac{{A_n^k}}{{k!}} = \frac{{n!}}{{k!(n - k)!}}\)
Chú ý: Để tính \(C_n^k\) ta có thể dùng hàm COMBIN(n, k) trong Excel
Thí dụ: Một lớp có 50 sinh viên. Hỏi có bao nhiêu cách chọn một nhóm gồm 4 sinh viên từ lớp này?
Ta thấy mỗi cách chọn một nhóm gồm 4 sinh viên là một tổ hợp chập 4 của 50 phần tử (vì 4 sinh viên có thể coi là một nhóm gồm 4 phần tử khác nhau và ta không cần phân biệt thứ tự của các phần tử trong nhóm này). Vì vậy, số cách chọn chính là:
\(C_{50}^4 = \frac{{50!}}{{4!(50 - 4)!}} = \frac{{50!}}{{4!46!}} = \frac{{50.49.48.47}}{{2.3.4}} = 230300\)
Nếu sử dụng bảng tính Excel thì: \(C_{50}^4 = COMBIN(50,4) = 230300\)
Dựa vào công thức (1.7) ta có thể chứng minh các đẳng thức sau:
a. \(C_n^k = C_n^{n - k}\)
b. \(C_n^k = C_{n - 1}^{n - k} + C_{n - 1}^k\)
Thí dụ: Một hộp có 10 sản phẩm, trong đó có 6 sản phẩm loại I và 4 sản phẩm loại II. Lấy ngẫu nhiên không hoàn lại từ hộp ra 3 sản phẩm. Tìm xác suất để có 2 sản phẩm loại I trong 3 sản phẩm lấy ra từ hộp.
Giải: Gọi A là biến cố có 2 sản phẩm loại I trong 3 sản phẩm lấy ra từ hộp. Số trường hợp đồng khả năng có thể xảy ra là những nhóm gồm 3 sản phẩm (không phân biệt thứ tự) được chọn từ tập hợp gồm 10 sản phẩm, số nhóm như vậy chính là số tổ hợp chập 3 của 10 phần tử. Vậy:
\(n = C_{10}^3 = \frac{{10!}}{{3!(10 - 3)!}} = 120\)
Số trường hợp thuận lợi cho A là số nhóm gồm 3 sản phẩm trong đó có 2 sản phẩm loại I. Có tất cả: \(m = C_6^2.C_4^1 = 60\) nhóm như vậy. Do đó ta có:
\(P(A) = \frac{{60}}{{120}} = 0,5\)
Ưu điểm và hạn chế của định nghĩa cổ điển
Định nghĩa cổ điển có ưu điểm cơ bản là để tìm xác suất của biến cố ta không cần tiến hành phép thử (phép thử chỉ tiến hành một cách giả định). Ngoài ra nếu đáp ứng đầy đủ yêu cầu của định nghĩa thì nó cho phép ta tìm được một cách chính xác giá trị của xác suất.
Tuy nhiên định nghĩa cổ điển cũng có những hạn chế đáng kể. Nó đòi hỏi phép thử phải xác định được số u Jfờng hợp đồng khả năng và số trường hợp thuận lợi và những số đó phải là hữu hạn. Nhưng ưong thực tế, đa số các phép thử mà ta gặp không thỏa mãn yêu cầu đó.
Trong thực tế có nhiều phép thử mà ưong đó số trường hợp đồng khả năng và số trường hợp thuận lợi có thể là vô hạn. Trong trường hợp này ta không thể áp dụng định nghĩa cổ điển. Hạn chế này của định nghĩa cổ điển có thể khắc phục bằng cách đưa vào định nghĩa xác suất theo quan điểm hình học. Nhưng trong các nghiên cứu về kinh tế - xã hội ta ít sử dụng định nghĩa này.
Hạn chế lớn nhất của định nghĩa cổ điển là trong thực tế nhiều khi không thể biểu diễn kết quả của phép thử dưới dạng tập hợp các trường hợp đồng khả năng. Tính “đồng khả năng” thường chỉ được áp dụng cho những phép thử thuộc dạng như: tung đồng xu, tung súc sắc, hoặc chọn ngẫu nhiên k phần tử từ một tập hợp có n phần tử....
Nếu ta xét phép thử quan sát kết quả làm bài thi của một sinh viên. Rõ ràng các trường hợp bài thi được 0 điểm, bài thi được 1 điểm, . . . , bài thi được 10 điểm, không phải là các ưường hợp đồng khả năng. Đối với sinh viên học giỏi thì khả năng bài thi được điểm cao (7, 8, 9, 10) nhiều hơn khả năng bài thi bị điểm kém (0, 1, 2, 3). Còn đối với sinh viên học kém thì ngược lại.
Để khắc phục hạn chế nêu trên của định nghĩa cổ điển, trong thực tế người ta còn sử dụng định nghĩa xác suất theo quan điểm thống kê sau đây:
Định nghĩa thống kê của xác suất
Tần suất: Tần suất xuất hiện biến cố A trong n phép thử là tỉ số giữa số phép thử trong đó biến cố A xuất hiện và tổng số phép thử được thực hiện.
Nếu ký hiệu số phép thử là n, số phép thử A xuâ't hiện là k, tần suất xuâ't hiện biến cố A là f(A). Thì: \(f(A) = \frac{k}{n}\)
Cùng với khái niệm xác suất, khái niệm tần suất là một trong những khái niệm cơ bản của lý thuyết xác suất.
Thí dụ 1: Khi kiểm tra ngẫu nhiên 60 sản phẩm ở một lô hàng, người ta phát hiện ra 3 phế phẩm. Gọi A là biến cố “sản phẩm kiểm tra là phế phẩm” thì tần suất xuất hiện phế phẩm là: \(f(A) = \frac{3}{{60}} = 5\% \)
Thí dụ 2: Để nghiến cứu khả năng xuất hiện mặt sấp khi tung đồng xu, người ta tiến hành tung đồng xu nhiều lần và thu được kết quả cho ở bảng dưới đây:
Người làm thí nghiệm | Số lần tung | Số lần được mặt sấp | Tần suất f(A) |
Buyffon | 4040 | 2048 | 0,5069 |
Pearson | 12000 | 6019 | 0,5016 |
Pearson | 24000 | 12012 | 0,5005 |
Từ thí nghiệm trên ta thấy, khi số phép thử tăng lên, tần suất xuất hiện mặt sấp tiến dần đến 0,5 (xác suất xuất hiện mặt sấp khi đồng xu là 0,5).
Vậy tần suất tiến dần đến xác suất khi số phép thử tăng lên. Từ đó ta có định nghĩa sau:
Định nghĩa: Xác suất xảy ra biến cố A khi thực hiện phép thử là một số p không đổi mà tần suất xuất hiện biến cố trong n phép thử sẽ hội tụ theo xác suất về p khi n tăng lên vô hạn.
Trong thực tế với số phép thử đủ lớn ta có thể lấy tần suất làm giá trị gần đúng của xác suất. Tức \(P(A) \approx f(A)\) khi n khá lớn.
Chú ý: Khái niệm hội tụ theo xác suất của tần suất có nghĩa là với mọi \(\varepsilon\) dương ta luôn có: \(\mathop {Lim}\limits_{n \to 8} P\left( {\left| {f(A) - p} \right| < \varepsilon } \right) = 1\)
Chương 5 chúng ta sẽ chứng minh cơ sở lý thuyết của sự hội tụ này.
Nhờ những thành quả của toán học và kỹ thuật tính toán hiện đại, định nghĩa thống kê của xác suất có tầm quan ưọng đặc biệt trong ứng dụng.
Định nghĩa xác suất theo lối tiên đề
Định nghĩa xác suất theo lối tiên đề do Kolmogorov (nhà toán học Nga) đưa ra vào năm 1933 đã tạo nên một cuộc “cách mạng” trong môn lý thuyết xác suất.
Nguyên lý xác suất nhỏ và xác suất lớn
Trong nhiều bài toán thực tế, ta thường gặp các biến cố có xác suất rất nhỏ, tức gần bằng 0. Qua nhiều lần quan sát, người ta thấy rằng: các biến cố có xác suất nhỏ gần như không xảy ra khi thực hiện phép thử. Trên cơ sở đò có thể đưa ra "Nguyên lý thực tế không thể có của các biến cố có xác suất nhỏ" sau đây:
Nếu một biến cố có xác suất rất nhỏ thì thực tế có thể cho rằng trong một phép thử, biến cố đó sẽ không xảy ra.
Việc qui định một mức xác suất được coi là "rất nhỏ" tùy thuộc vào từng bài toán cụ thể. Chẳng hạn: Nếu xác suất để một loại dù không mở khi nhảy dù là 0,01 thì mức xác suất này chưa thể coi là nhỏ và ta không nên sử dụng loại dù đó. Song nếu xác suất để một chuyến xe lửa đến ga chậm 10 phút là 0,01 thì ta có thể coi mức xác suất đó là nhỏ tức có thể cho rằng xe lửa đến ga đúng giờ.
Một mức xác suất nhỏ mà với nó ta có thể cho rằng: biến cố đang xét không xảy ra trong một phép thử được gọi là mức ý nghĩa. Tuỳ theo từng bài toán cụ thể, mức ý nghĩa thường được lấy ưong khoảng từ 0,01 đến 0,05.
Tương tự như vậy ta có thể nêu ra" nguyên lý thực tế chắc chắn xảy ra của các biến cố có xác suất lớn" như sau: Nếu một biến cố có xác suất gần bằng 1 thì thực tế có thể cho rằng biến cố đó sẽ xảy ra trong một phép thử.
Cũng như trên, việc qui định mức xác suất được coi là "lớn" tùy thuộc vào bài toán cụ thể. Thông thường người ta lấy trong khoảng từ 0,95 đến 0,99.