Bài 1: Khái niệm và phân phối xác suất của đại lượng ngẫu nhiên 2 chiều


Nội dung bài giảng Bài 1: Khái niệm và phân phối xác suất của đại lượng ngẫu nhiên 2 chiều sau đây sẽ giúp các bạn tìm hiểu về khái niệm về đại lượng ngẫu nhiên hai chiều, phân phối xác suất của đại lượng ngẫu nhiên hai chiều.

Tóm tắt lý thuyết

1. Khái niệm về đại lượng ngẫu nhiên hai chiều

Ở các chương trước, chúng ta đã xét những đại lượng ngẫu nhiên mà các giá trị nó có thể nhận được biểu thị bằng một số. Các đại lượng ngẫu nhiên như vậy được gọi là đại lượng ngẫu nhiên một chiều. Ngoài những đại lượng ngẫu nhiên một chiều, trong thực tế ta còn gặp những đại lượng ngẫu nhiên mà các giá trị nó có thể nhận được biểu thị bằng 2, hoặc 3,..., hoặc n số.

Những đại lượng ngẫu nhiên mà các giá trị nó có thể nhận là những véctơ 2 chiều được gọi là đại lượng ngẫu nhiên 2 chiều.

Tổng quát: Những đại lượng ngẫu nhiên mà các giá trị nó có thể nhận là một véctơ n chiều được gọi là đại lượng ngẫu nhiên n chiều.

Ta ký hiệu đại lượng ngẫu nhiên 2 chiều là (X, Y). Trong đó X và Y được gọi là các thành phần của đại lượng ngẫu nhiên 2 chiều, cả hai đại lượng ngẫu nhiên X và Y được xét một cách đồng thời tạo nên đại lượng ngẫu nhiên 2 chiều. Tương tự, n đại lượng ngẫu nhiên được xét một cách đồng thời tạo nên đại lượng ngẫu nhiên n chiều.

Thí dụ 1: Khi nghiên cứu về thể lực của những học sinh tiểu học có cùng độ tuổi, người ta thường quan sát đồng thời cả chiều cao (X) và trọng lượng (Y) của các học sinh đó, như vậy ta có đại lượng ngẫu nhiên hai chiều (X, Y). Còn nếu ta quan tâm cả vòng ngực (Z) thì ta sẽ có đại lượng ngẫu nhiên 3 chiều (X, Y, Z).

Thí dụ 2: Khi khảo sát các siêu thị, nếu ta quan tâm đến doanh số bán (X1) và lượng vốn (X2) ta sẽ có đại lượng ngẫu nhiên hai chiều (X1, X2). Còn nếu ta quan tâm cả chi phí quảng cáo (X3) thì ta sẽ có đại lượng ngẫu nhiên 3 chiều (X1, X2, X3).

Trong thực tế người ta cũng phân chia đại lượng ngẫu nhiên nhiều chiều thành hai loại: rời rạc và liên tục.

Các đại lượng ngẫu nhiên nhiều chiều được gọi là rời rạc nếu các thành phần của nó là các đại lượng ngẫu nhiên rời rạc.

Các đại lượng ngẫu nhiên nhiều chiều được gọi là liên tục nếu các thành phần của nó là các đại lượng ngẫu nhiên liên tục.

2. Phân phối xác suất của đại lượng ngẫu nhiên hai chiều

Đối với đại lượng ngẫu nhiên hai chiều người ta cũng dùng bảng phân phối xác suất hoặc hàm phân phối xác suất hoặc hàm mật độ xác suất để thiết lập phối xác suất của chúng.

2.1 Bảng phân phối xác suất của đại lượng ngẫu nhiên 2 chiều

Bảng phân phối xác suất của đại lượng ngẫu nhiên 2 chiều rời rạc có dạng:

Y y1 y2 .... ym
X
x1 P(x1,y1) P(x1,y2) .... P(x1,ym)
x2 P(x2,y1) P(x2,y2) .... P(x2,ym)
.... .... .... .... ....
xn P(xn,y1) P(xn,y2) .... P(xn,ym)


Trong đó:

x(i = 1, 2,..., n) là các giá trị có thể nhận của thành phần X.

yj (i = 1, 2,..., m) là các giá trị có thể nhận của thành phần Y

P(xi, yj) (i = 1, 2, . . . n; j = 1, 2, . . . , m) là xác suất để đại lượng ngẫu nhiên 2 chiều (X, Y) nhận giá trị (xi, yj)

\(\sum\limits_{i = 1}^n {\sum\limits_{j = 1}^m {P({x_i},{{\rm{y}}_{\rm{j}}}} } ) = 1\)

Ký hiệu:

\(P({x_i},{y_j}) = P\left[ {\left( {X = {x_i}} \right)\left( {Y = {y_j}} \right)} \right] = {p_{{\rm{ij}}}} = P(X = {x_i}).P(Y = {y_j}/X = {x_i})\)

\(= P(Y = {y_j}).P(X = {x_i}/Y = {{\rm{y}}_{\rm{j}}})\)

\(P(X = {x_i}) = \sum\limits_{j = 1}^m {P({x_i},{y_j}) = \sum\limits_{j = 1}^m {{p_{{\rm{ij}}}} = {p_i}} } \)

\(P(Y = {y_i}) = \sum\limits_{i = 1}^n {P({x_i},{y_j}) = \sum\limits_{i = 1}^n {{p_{{\rm{ij}}}} = {q_i}} } \)

Nếu \({p_{{\rm{ij}}}} = {p_i}.{q_j}\,(\forall i,j)\) thì X,  Y độc lập

Ta luôn có: \(\sum\limits_{i = 1}^n {{p_i}} = \sum\limits_{j = 1}^m {{q_j} = 1} \)

Với các ký hiệu trên, ta có thể biểu diễn bảng phân phối xác suất của đại lượng ngẫu nhiên 2 chiều dưới dạng sau:

Y y1 y2 ....... ym Px
X
x1 p11 p12 .... p1m p1
x2 p21 p22 .... p2m p2
.... .... .... .... ....  
xn pn1 pn2   pnm pn
PY q1 q2 .... qm 1

Biết được phân phối xác suất của đại lượng ngẫu nhiên 2 chiều ta có thể tìm được bảng phân phối xác suất của các thành phần.

Bảng phân phối xác suất của thành phần X có dạng:

X x1 x2 .... xm
PX p1 p2 .... pm

Từ bảng phân phối xác suất của X với các công thức đã biết ở chương 2 ta có thể tính được E(X), Var(X), Mod(X),.. .

Tương tự ta có bảng phân phối xác suất của thành phần Y có dạng:

Y y1 y2 .... ym
PY q1 q2 .... qm

Từ bảng phân phối xác suất của Y ta cũng có thể tính được E(Y), Var(Y), Mod(Y),...

Thí dụ: Cho biết bảng phân phối xác suất của đại lượng ngẫu nhiên 2 chiều (X, Y), trong đó X là doanh thu và Y là chi phí quảng cáo của các công ty tư nhân kinh doanh cùng một mặt hàng như sau (đơn vị tính của X và Y đều là triệu đồng/tháng):

X 100 150 200 PY
Y
0 0,1 0,05 0,05 0,2
1 0,05 0,2 0,15 0,4
2 0 0,1 0,3 0,4
PX 0,15 0,35 0,5 0,1

Từ bảng phân phối xác suất của (X, Y) ở trên, ta có:

Bảng phân phối xác suất của X:

X 100 150 200
PX 0,15 0,35 0,5

Từ đó ta dễ dàng tính được:

\(E(X) = 100 x 0,15 + 150x 0,35 + 200x 0,5 = 167,5 \)

Tức doanh thu trung bình của một công ty tư nhân là 167,5 triệu đ/tháng.

\(E(X^2) = 100^2x 0,15 + 150^2 x 0,35 + 200^2 x 0,5 = 29375\)

\(Var(X) = E(X^2) -[E(X)]^2 = 29375 - (167,5)^2 = 1318,75 \)

\( \Rightarrow \sigma (X) = \sqrt {1318,75} = 36,3146\)

Tức là mức chênh lệch trung bình về doanh thu của các công ty vào khoảng 36,3 triệu đồng/tháng.

Bảng phân phôi xác suất của Y:

Y 0 1 2
PY 0,2 0,4 0,4

\(E(Y) = 0x 0,2 + 1x 0,4 + 2x 0,4 = 1,2\)

Tức chi phí quảng cáo trung bình của một công ty tư nhân là 1,2 triệu đ/tháng.

\(Var(Y) = E(Y^2) -[E(Y)]^2 = 2- (1,2)^2 = 0,56\)

\( \Rightarrow \sigma (Y) = \sqrt {0,56} = 0,74833\)

Tức là mức chênh lệch trung bình về chi phí quảng cáo của các công ty vào khoảng 0,748 triệu đồng/tháng.

2.2 Hàm phân phối xác suất của đại lượng ngẫu nhiên 2 chiều

Định nghĩa: Hàm phân phối xác suất của đại lượng ngẫu nhiên hai chiều (X, Y) [ký hiệu là F(x, y)]

Như vậy hàm phân phối F(x, y) có miền xác định là R2 và miền giá trị là [0,1]

Tính chất:

Từ định nghĩa, ta có thể chứng minh được các tính chất sau đây của hàm phân phối:

(i)  \(0 \le F(x;y) \le 1\)

(ii) F(x, y) là hàm không giảm theo từng đối số

(iii) \(F(x, - \infty ) = F( - \infty ,y) = 0;\,\,\,F( + \infty , + \infty ) = 1\)

(iv) \(\forall {x_1} < {x_2}\,và\,{y_1} < {y_2}\) ta có:

\(P\left[ {({x_1} \le X < {x_2})({y_1} \le Y < {y_2})} \right] = F({x_2},{y_2}) - F({x_2},{y_1}) - F({x_1},{y_2}) + F({x_2},{y_2})\)

(v)

  \(\begin{array}{l} F(x, + \infty ) = P\left[ {(X < x)(Y < \infty )} \right] = P(X < x) = {F_1}(x)\\ F( + \infty ,y) = P\left[ {\left( {X < \infty } \right)\left( {Y < y} \right)} \right] = P(Y < y) = {F_2}(y) \end{array}\)

trong đó F1(x), F2(y) tương ứng là hàm phân phối riêng của X và Y

Hệ quả:

  • X, Y độc lập khi và chỉ khi: F(x, y) = F1(x).F2 (y)
  • Với véc tơ ngẫu nhiên 2 chiều (X, Y) rời rạc, ta có:
    • \(F(x,y) = \sum\limits_{{x_i} < x} {\sum\limits_{{y_j} < y} {P\left[ {(X = {x_i})(Y = {y_j})} \right]} } \)
    • \(P\left[ {({x_1} < X < {x_2})({y_1} < Y < {y_2})} \right] \)

Trên R2 biến cố [(x1 < X < x2)(y1 < Y < y2)] có thể biểu diễn là các điểm trong hình chữ nhật ABCD (hình vẽ)

2.3 Hàm mật độ xác suất của đại lượng ngẫu nhiên hai chiều

Định nghĩa: Hàm mật độ xác suất của đại lượng ngẫu nhiên hai chiều liên tục (X, Y) [ký hiệu là f(x, y)] thỏa mãn các điều kiện sau:

\(f(x,y) \ge 0\,\,\,\forall (x,y) \in {R^2}\)

\(\int\limits_{ - \infty }^{ + \infty } {\int\limits_{ - \infty }^{ + \infty } {f(x,y)dxdy = 1} } \)

\(P\left[ {({x_1} < X < x{}_2)({y_1} < Y < y{}_2)} \right] = \int\limits_{{x_1}}^{{x_2}} {\int\limits_{{y_1}}^{{y_2}} {f(x,y)dxdy} } \)

Các tính chất:

\(F(x,y) = \int\limits_{ - \infty }^x {\int\limits_{ - \infty }^y {f(u,v)du,dv} } \)

\({F_1}(x) = \int\limits_{ - \infty }^x {\int\limits_{ - \infty }^{ + \infty } {f(x,y)dy} } ;\,\,{F_2}(x) = \int\limits_{ - \infty }^y {\int\limits_{ - \infty }^{ + \infty } {f(x,y)dx} } \)

\(\begin{array}{l} {f_1}(x) = \frac{{\partial {F_1}(x)}}{{\partial x}} = \int\limits_{ - \infty }^{ + \infty } {f(x,y)dy} \\ {f_2}(x) = \frac{{\partial {F_2}(x)}}{{\partial x}} = \int\limits_{ - \infty }^{ + \infty } {f(x,y)dx} \end{array}\)

Trong đó:

f1(x) và f2(y) tương ứng là hàm mật độ xác suất của X và Y (hàm mật độ xác suất biên)

Hệ quả: X, Y độc lập khi và chỉ khi f(x, y) = f1(x).f2(y)