Bài 2: Các tham số đặc trưng của đại lượng ngẫu nhiên (phần 1)


Nội dung bài giảng Bài 2: Các tham số đặc trưng của đại lượng ngẫu nhiên (phần 1) sau đây sẽ giúp các bạn tìm hiểu về định nghĩa và tính chất chứng minh và các ví dụ cụ thể về kỳ vọng toán.

Tóm tắt lý thuyết

Khi ta xác định được phân phối xác suất của đại lượng ngẫu nhiên thì ta đã nắm được toàn bộ thông tin về đại lượng ngẫu nhiên đó. Tuy nhiên trong thực tế rất khó và cũng không cần thiết phải nắm được toàn bộ những thông tin này, mà chỉ cần quan tâm đến những thông tin quan trọng nhất, phản ánh các đặc trưng cơ bản của đại lượng ngẫu nhiên đang nghiên cứu. Phần này chúng ta nêu ra một vài tham số dặc trưng quan trọng nhất, phản ánh từng mặt của một đại lượng ngẫu nhiên.

1. Kỳ vọng toán

Định nghĩa: Giả sử X là một đại lượng ngẫu nhiên rời rạc có thể nhận các giá trị: x1,x2, . . .xn với các xác suất tương ứng: p1, p2, . . . pn. Kỳ vọng toán của đại lượng ngẫu nhiên X [ký hiệu là E(X)] là tổng các tích giữa các giá trị có thể có của đại lương ngẫu nhiên với các xác suất tương ứng.

\({\rm{E(X) = }}\sum\limits_{i = 1}^n {{x_i}{p_i}} \)

Nếu X là đại lượng ngẫu nhiên liên tục có hàm mật độ xác suất là f(x) thì kỳ vọng toán được xác định bởi biểu thức:

\({\rm{E(X) = }}\int\limits_{ - \infty }^{ + \infty } {xf(x)dx} \)

Các tính chất:

Tính chất 1: Kỳ vọng toán của hằng số bằng chính hằng số đó. Tức:

E(C) = C (với C là hằng số)

Chứng minh: Thật vậy, hằng số C có thể xem như một đại lượng ngẫu nhiên đặc biệt, chỉ nhận một giá trị có thể có là C với xác xuất tương ứng bằng 1. Do đó theo định nghĩa:

E(C) = C.1 = C

Tính chất 2:            

E(CX) = C.E(X)   (với C là hằng số)

Chứng minh: Thật vậy, giả sử đại lượng ngẫu nhiên X có luật phân phối xác suất là:

X          x1                x2                ......                xn
P          p1                p2                ......                pn

Khi đó CX sẽ là đại lượng ngẫu nhiên rời rạc mà các giá trị có thể có là:

\(C{x_1},C{x_2},....,C{x_n}\)

Mặt khác, do 

\((X = {x_i}) = (CX = C{x_i})(i = 1,2,...,n)\)

nên

\(P(X = {x_i}) = P(CX = C{x_i})(i = 1,2,....,n)\)

Như vậy bảng phân phối xác suất của đại lượng ngẫu nhiên CX có dạng:

CX          Cx1               Cx2                ......              Cxn
P          p1                  p2                ......                pn

Theo định nghĩa ta có:

\(E(CX) = \sum\limits_{i = 1}^n {C{x_i}{p_i}} = C\sum\limits_{i = 1}^n {{x_i}{p_i}} = CE(X)\)

Tính chất 3: Kỳ vọng toán của tổng hai đại lượng ngẫu nhiên bằng tổng các kỳ vọng toán thành phần. Tức là:

E(X+Y) = E(X) + E(Y)

Chứng minh: Giả sử X, Y là các đại lượng ngẫu nhiên rời rạc có luật phân phối xác suất như sau:

X          x1               x2                ......              xn
Px          p1              p2                ......              pn

 

Y            y1                  y2                ......                ym
Py           q1                  q2                ......                qm

Khi đó ta có phân phối xác suất của đại lượng ngẫu nhiên tổng (X+Y) như sau:

X+Y          (x1+ y1)          (x1+ y2)         ...... (xi+ yj)  ........ (xn+ ym)
P          p11                  p12                ......  pij  .........         pnm

Trong đó: pij là xác suất để đại lượng ngẫu nhiên (X +Y) nhận giá trị: \(({x_i} + {y_j}).(i = \overline {1,n} ;\,j = \overline {1,m} )\)

Theo định nghĩa kỳ vọng toán ta có:

\(E(X + Y) = \sum\limits_{i = 1}^n {\sum\limits_{j = 1}^m {({x_i} + {y_j}} } ){p_{{\rm{ij}}}} = \sum\limits_{i = 1}^n {\sum\limits_{j = 1}^m {{x_i}.{p_{{\rm{ij}}}}} } + \sum\limits_{i = 1}^n {\sum\limits_{j = 1}^m {{y_i}.{p_{{\rm{ij}}}}} } \)

\(= \sum\limits_{i = 1}^n {{x_i}\sum\limits_{j = 1}^m {{p_{{\rm{ij}}}}} } + \sum\limits_{j = 1}^m {{y_i}\sum\limits_{i = 1}^n {{p_{{\rm{ij}}}}} } \)

Ta sẽ chứng minh rằng: \(\sum\limits_{j = 1}^m {{p_{{\rm{ij}}}}} = {p_i}\,\,\,\,\,(\forall i = \overline {1,n} )\)

Thật vậy: Biến cố (X = xi) sẽ xảy ra khi tổng (X+Y) nhận một trong các giá trị: \(({x_i} + {y_1});({x_i} + {y_2});....;({x_i} + {y_m})\)

Do đó theo công thức cộng xác suất ta có:

\(P(X = {x_i}) = {p_i} = P\left[ {(X + Y)} \right] = ({x_i} + {y_1}) + P\left[ {(X + Y) = ({x_i} + {y_2})} \right]\)

\(........ + P\left[ {(X + Y) = ({x_i} + {y_m})} \right] = {p_{i1}} + {p_{i2}} + ..... + {p_{im}} = \sum\limits_{j = 1}^m {{p_{{\rm{ij}}}}} \)

Tương tự ta cũng chứng minh được:  \(\sum\limits_{i = 1}^n {{p_{{\rm{ij}}}}} = {q_j}\,\,\,\,\,\,\,\,\,\,\,(\forall j = \overline {1,m} )\)

Từ đó ta có:

\(E(X + Y) = \sum\limits_{i = 1}^n {{x_i}{p_i}} + \sum\limits_{j = 1}^m {{y_j}{q_j}} = E(X) + E(Y)\)

Bằng phương pháp qui nạp ta có thể chứng minh được tính chất trên trong trường hợp tổng quát:

Kỳ vọng toán của tổng n đại lượng ngẫu nhiên: X1, X2, . . . , Xn bằng tổng các kỳ vọng toán thành phần. Tức là:

\(E\left( {{X_1} + {X_2} + ...{\rm{ }} + {X_n}} \right){\rm{ }} = {\rm{ }}E\left( {{X_1}} \right) + E\left( {{X_2}} \right) + ... + E\left( {{X_n}} \right)\)

Tính chất 4: Kỳ vọng toán của tích hai đại lượng ngẫu nhiên độc lập bằng tích các kỳ vọng toán của chúng. Tức là:

E(XY) = E(X).E(Y) nếu X, Y độc lập

Chứng minh: Giả sử X và Y là hai đại lượng ngẫu nhiên rời rạc. sử dụng các ký hiệu ở phần chứng minh tính chất 3, ta có:

\(E(XY) = \sum\limits_{i = 1}^n {\sum\limits_{j = 1}^m {{x_i}{y_j}} } {p_{{\rm{ij}}}}\)

Vì X, Y độc lập nên:

\({p_{{\rm{ij}}}} = {p_i}.{q_j}\,\,\,\,\,\,(\forall i = \overline {1,n} ;\,\,j = \overline {1,m} )\)

Do đó:

\(E(XY) = \sum\limits_{i = 1}^n {{x_i}{p_i}} .\sum\limits_{j = 1}^m {{y_j}{q_j}} = E(X).E(Y)\)

Bằng phương pháp qui nạp ta có thể chứng minh được tính chất trên trong trường hợp tổng quát:

Kỳ vọng toán của tích n đại lượng ngẫu nhiên độc lập với nhau bằng tích các kỳ vọng toán của chúng. Tức là:

\(E({X_1}{X_2}......{X_n}) = E({X_1}).E({X_2})....E({X_n})\)

Chú ý:

  • Hai đại lượng ngẫu nhiên được gọi là độc lập với nhau nếu phân phối xác suất của đại lượng ngẫu nhiên này không phụ thuộc gì vào việc đại lượng ngẫu nhiên kia nhận giá trị bằng bao nhiêu.
  • Tổng của hai đại lượng ngẫu nhiên X và Y là đại lượng ngẫu nhiên (X+Y) mà các giá trị có thể có của nó là tổng của mỗi giá trị có thể có của X và mỗi giá trị có thể có của Y. Nếu X, Y độc lập với nhau thì các xác suất tương ứng sẽ bằng tích các xác suất thành phần. Nếu X, Y phụ thuộc nhau thì các xác suất tương ứng sẽ bằng tích xác suất của thành phần này với xác suất có điều kiện của thành phần kia.

Thí dụ: Có hai kiện hàng, mỗi kiện có 12 sản phẩm. Sản phẩm trong hai kiện gồm 2 loại: loại I và loại II. Từ mỗi kiện lấy ngẫu nhiên ra 3 sản phẩm để kiểm tra. Gọi X1, X2 tương ứng là số sản phẩm loại I có trong 3 sản phẩm lấy ra từ kiện thứ nhất, thứ hai, X1, X2 là hai đại lượng ngẫu nhiên độc lập.

Bản chất và ý nghĩa của kỳ vọng toán

Để thấy được bản chất của kỳ vọng toán, ta xét các thí dụ sau đây:

Thí dụ 1: Một lớp có 50 sinh viên, trong kỳ thi môn toán có kết quả cho ở bảng sau:

Điểm 3    4      5      6    7    8    9
Số s/v 3    7    15    10    5    6    4

Nếu gọi X là điểm thi môn toán của một sinh viên chọn ngẫu nhiên từ lớp này thì X là đại lượng ngẫu nhiên có phân phối xác suất như sau:

X        3                4          5          6          7           8           9
P        0,06       0,14       0,3       0,2       0,1       0,12       0,08

Từ bảng phân phối của X ta tính được:

E(X) = 3 x 0,06+ 4 x 0,14 + 5 x 0,3 + 6 x 0,2 +7 x 0,1+ 8 x 0,12 + 9 x 0,08

Ta cũng có thể viết:

\(E(X) = \frac{{3x3 + 7x\,4 + 15x5 + 10x6 + 5x7 + 6x8 + 4x9}}{{50}} = 5,82\)

Dễ thấy rằng, E(X) = 5,2 chính là điểm thi trung bình môn toán của một sinh viên lớp đó.

Thí dụ 2: Khảo sát về thu nhập của những người làm việc trong một công ty, giả sử có số liệu cho ở bảng sau:

Thu nhập (triệu đ/tháng)       7          8         9        10       11      12      14
Số người       50      70      150      120      55      30      25

Gọi Y là thu nhập của một người làm việc ở công ty này, từ số liệu ở bảng trên ta có bảng phân phối xác suất của Y nnư sau:

Y         7           8         9         10         11         12         14
P       0,1      0,14      0,3      0,24      0,11      0,06      0,05

Vậy ta có:

E(Y) = 7 x 0,1 + 8 x 0,14 + 9 x 0,3 + 10 x 0,24 + 11 x 0,11 + 12 x 0,06 +14 x 0,05

\(= \frac{{7x50 + 8x70 + 9x150 + 10x120 + 11x55 + 12x30 + 14x25}}{{500}} = 9,55\)

Như vậy, trong thí dụ này, E(Y) = 9,55 triệu đ/năm chính là thu nhập trung bình của một người làm việc ở công ty này.

Vậy kỳ vọng toán của đại lượng ngẫu nhiên chính là giá trị trung bình của đại lượng ngẫu nhiên đó. Chẳng hạn, nếu X là chiều cao của một loại cây (cùng độ tuổi) thì E(X) là chiều cao trung bình của loại cây này; Nếu Y là năng suất lúa ở vùng đồng bằng sông cửu Long của năm 2010 thì E(Y) là năng suất lúa trung bình ở vùng này trong năm đó.

Trong thực tế người ta thường lấy một mẫu gồm n quan sát để nghiên cứu về một tổng thể. Khi đó kỳ vọng toán của đại lượng ngẫu nhiên xấp xi với trung bình số học các giá trị quan sát của đại lượng ngẫu nhiên (trung bình mẫu). Kỳ vọng toán phản ánh giá trị trung tâm của một phân phối xác suất, có nhiều giá trị của đại lượng ngẫu nhiên nhận giá trị gần với kỳ vọng toán. Chẳng hạn, ở thí dụ 2 nêu trên, ta có E(Y) = 9,55 có nghĩa là có nhiều người ở công ty này có mức thu nhập xấp xỉ ở mức 9,55 triệu đ/năm. Cụ thể là có 150 người có mức thu nhập 9 triệu đ/năm và 120 người có mức thu nhập 10 triệu đ/năm. 

2. Phương sai

Trong thực tế, nhiều khi nếu chỉ xác định kỳ vọng toán của đại lượng ngẫu nhiên thì chưa đủ. Để xác định một đại lượng ngẫu nhiên ta còn phải xác định mức độ phân tán các giá trị của đại lượng ngẫu nhiên xung quanh giá trị trung bình của nó. Chẳng hạn, khi nghiên cứu đại lượng ngẫu nhiên là năng suất lúa của một vùng nào đó, thì năng suất lúa trung bình (kỳ vọng toán) mới chỉ phản ánh được một mặt của đại lượng ngẫu nhiên này. Mức độ chênh lệch về năng suất (so với năng suất trung bình) ở những thửa ruộng khác nhau cũng là vấn đề cần quan tâm nghiên cứu. Bởi vì nếu mức độ chênh lệch này nhỏ thì chứng tỏ giống lúa đó có năng suất khá ổn định. Từ đó ta có khái niệm về phương sai.

Định nghĩa: Phương sai của đại lượng ngẫu nhiên X, ký hiệu là Var(X) [hoặc D(X)], được định nghĩa bằng công thức:

\(V{\rm{ar}}(X) = E\left\{ {{{\left[ {X - E(X)} \right]}^2}} \right\}\)

Chú ý: Phương sai được định nghĩa bằng một công thức. Nhưng

  • Nếu X là đại lượng ngẫu nhiên rời rạc thì:

\(V{\rm{ar}}(X) = {\sum\limits_{i = 1}^n {\left[ {{x_i} - E(X)} \right]} ^2}{p_i}\)

  • Nếu X là đại lượng ngẫu nhiên liên tục thì:

\(V{\rm{ar}}(X) = \int\limits_{ - \infty }^{ + \infty } {{{\left[ {x - f(x)} \right]}^2}} f(x)dx\)

Trong thực tế người ta thường tính phương sai bằng công thức:

\(V{\rm{ar}}(X) = E({X^2}) - {\left[ {E(X)} \right]^2}\)

Thật vây: Theo định nghĩa của phương sai, ta có:

\(V{\rm{ar}}(X) = E\left\{ {{{\left[ {X - E(X)} \right]}^2}} \right\} = E\left\{ {{X^2} - 2XE(X) + {{\left[ {E(X)} \right]}^2}} \right\}\)

\(= E({X^2}) - 2E(X).E(X) + {\left[ {E(X)} \right]^2} = {\left[ {E({X^2}) - E(X)} \right]^2}\)

Thí dụ: Cho đại lượng ngẫu nhiên X có phân phối xác suất như sau:

X                 1                  3                 4
P                0,1              0,5              0,4

Tìm phương sai của X?

Giải

Theo định nghĩa kỳ vọng toán ta có:

\(E(X)=1x0,1+3x0,5+4x0,4=3,2\)

\(E(X^2)=1^2x0,1+3^2x0,5+4^2x0,4=11\)

Vậy \(Var(X)=11-(3,2)^2=0,76\)

Các tính chất của phương sai

Tính chất 1: Phương sai của hằng số bao giờ của bằng 0.

Tức là: Var(C) = 0      (với C là hằng số)

Tính chất 2: \(V{\rm{ar}}(CX) = {C^2}V{\rm{ar}}(X)\)    (với C là hằng số)

Dựa vào định nghĩa của phương sai, bạn đọc có thể tự chứng minh hai tính chất trên.

Tính chất 3: Nếu X, Y là hai đại lượng ngẫu nhiên độc lập thì:

Var(X + Y) = Var(X) +  Var(Y)

Chứng minh: Theo công thức tính phương sai ta có:

\(V{\rm{ar}}(X + Y) = E\left[ {{{(X + Y)}^2}} \right] - \left[ {E{{(X + Y)}^2}} \right] = E({X^2} + 2X.Y + {Y^2}) - {\left[ {E(X) + E(Y)} \right]^2}\)

\( = E({X^2}) + 2E(XY) + E({Y^2}) - {\left[ {E(X)} \right]^2} - {\left[ {E(Y)} \right]^2} - 2E(X).E(Y)\)

Vì X, Y độc lập nên: E(XY) = E(X).E(Y)

Vậy \(V{\rm{ar}}(X + Y) = E({X^2}) - {\left[ {E(X)} \right]^2} + E({Y^2}) - {\left[ {E(Y)} \right]^2}\)

Hay: Var(X + Y) = Var(X) + Var(Y)

Trường hợp tổng quát, nếu X1, X2,....Xn là n đại lượng ngẫu nhiên độc lập thì:

\(V{\rm{ar}}({X_1} + {X_2} + ... + {X_n}) = V{\rm{ar}}({X_1}) + V{\rm{ar}}({X_2}) + ... + V{\rm{ar}}({X_n})\)

Bằng phương pháp quy nạp bạn đọc có thể chứng minh kết luận trên.

Từ tính chất 3 ta có thể chứng minh được các hệ quả sau:

Hệ quả 1: Var(X - Y) = Var(X) + Var(Y)     Nếu X, Y độc lập

Chứng minh: Thật vậy. theo tính chất của phương sai ta có:

\(V{\rm{ar}}(X - Y) = V{\rm{ar}}\left[ {X + ( - Y)} \right] = V{\rm{ar}}(X) + V{\rm{ar}}( - Y) = V{\rm{ar}}(X) + {( - 1)^2}V{\rm{ar}}(Y) = V{\rm{ar}}(X) + V{\rm{ar}}(Y)\)

Hệ quả 2: Var(C + X) = Var(X)   (với C là hằng số)

Bản chất và ý nghĩa của phương sai

Ta thấy, kỳ vọng toán của một đại lượng ngẫu nhiên là giá trị trung bình của đại lượng ngẫu nhiên đó (trong sản xuất công nghiệp, kỳ vọng toán thường là giá trị qui định. Chẳng hạn như: đường kính qui định, trọng lượng qui định,... ) Còn thực tế sản xuất ra những sản phẩm có đường kính, họng lượng, .... sai lệch so với qui định. Độ sai lệch này được đặc trưng bởi đại lượng ngẫu nhiên: [X - E(X)]. Mà phương sai được định nghĩa bởi công thức:

Var(X) = E{[X-E(X)]2}

Như vậy, thực chất của phương sai là:" kỳ vọng toán của bình phương các sai lệch” hay nói một cách khác" Phương sai là sai lệch bình phương trung bình", nó phản ánh mức độ phân tán các giá trị của đại lượng ngẫu nhiên xung quanh giá trị trung bình. Đại lượng nào có nhiều giá trị sai lệch lớn so với giá trị trung bình thì phương sai sẽ lớn; Đại lượng nào có nhiều giá trị sai lệch ít so với giá trị trung bình thì phương sai sẽ nhỏ.

Trong sản xuất công nghiệp, phương sai thường biểu thị độ chính xác của sản xuất. Trong chăn nuôi, phương sai biểu thị mức độ đồng đều của đàn gia súc. Trong ưồng trọt, phương sai biểu thị mức độ ổn định của năng suất cây trồng....