第二章 随机变量及其分布
第一章种学习了随机现象、随机试验、随机事件等概念,讨论了随机事件的关系、运算以及概率;且只考虑了个别事件下的频率问题。接下来,进一步第需要建立随机试验结果与实数的对应关系,这类似于函数的映射,我们称之为随机变量,以便使用高等数学的方法来研究随机试验。
1 离散型随机变量
1.1 随机变量的概念
随机变量的数学定义:
**定义1:**设 E E E为随机试验, Ω \Omega Ω为其样本空间,若对于每一个结果(样本点) ω ∈ Ω \omega \in \Omega ω∈Ω,都有一个实数 X ( ω ) X(\omega) X(ω)与之对应;这样就得到一个定义在 Ω \Omega Ω上的实值函数 X = X ( ω ) X = X(\omega) X=X(ω),称为随机变量;随机变量通常用 X 、 Y 、 Z X、Y、Z X、Y、Z或者 X 1 , X 2 , . . . X_1,X_2,... X1,X2,...来表示。
注意:对于一个随机试验可以有与之关联的多个随机变量,而不是仅有一个;随着不同研究的需要,我们可以定义不同的随机变量。
我们可以试验随机变量描述事件,例如:在掷硬币试验中 { X = 1 } \{X=1\} {X=1}表示"出现正面", { X = 0 } \{X=0\} {X=0}表示"出现反面"且 P { X = 1 } = 1 2 P\{X=1\} = \frac{1}{2} P{X=1}=21。
当然: { X = 1 } 、 { X = 0 } \{X=1\}、\{X=0\} {X=1}、{X=0}只是习惯的、相对较为普遍的用法并不是唯一的用法;我们使用 { X = 100 } \{X=100\} {X=100}表示"出现正面", { X = 200 } \{X=200\} {X=200}表示"出现反面"是完全没有问题且正确的,只是不那么习惯而已。
在掷骰子试验中,我们可以使用 { X = 6 } \{X=6\} {X=6}表示"出现6点", P { X = 6 } = 1 6 P\{X=6\} = \frac{1}{6} P{X=6}=61;使用 { X ≥ 4 } \{X \ge 4\} {X≥4}表示"出现4/5/6点", { X ≥ 4 } = { X = 4 , 5 , 6 } \{X \ge 4\} = \{X = 4,5,6\} {X≥4}={X=4,5,6}, P { X ≥ 4 } = 1 2 P\{X \ge 4\} = \frac{1}{2} P{X≥4}=21。
1.2 离散型随机变量及其分布律
随机变量的取值可能是有限个,也可能是无限个。
**定义2:**若随机变量 X X X只取有限多个或可列的无限多个值(可以枚举表示的),则称 X X X为离散型随机变量。
大白话就是值是一个个的,颗粒状的,不连续的。
定义 设 X X X为离散型随机变量,可能的取值为 X 1 , X 2 , . . . , X k , . . . X_1,X_2,...,X_k,... X1,X2,...,Xk,...,且 P { X = x k } = P k , k = 1 , 2 , 3 , . . . P\{X=x_k\} = P_k,\ \ k=1,2,3,... P{X=xk}=Pk, k=1,2,3,...,则称其为** X X X的分布律或分布列或者概率分布**。
分布律也可以使用表格形式表达:
X | X 1 X_1 X1 | X 2 X_2 X2 | X 3 X_3 X3 | … | X k X_k Xk | … |
---|---|---|---|---|---|---|
P | p 1 p_1 p1 | p 2 p_2 p2 | p 3 p_3 p3 | … | p k p_k pk | … |
分布律 { p k } \{p_k\} {pk}具有以下性质:
(1) p k , k = 1 , 2 , . . . p_k, \ \ \ k=1,2,... pk, k=1,2,...; # p k p_k pk是概率嘛
(2) ∑ k = 1 ∞ p k = 1 \sum_{k=1}^{\infin} p_k = 1 ∑k=1∞pk=1; # { X = X k } , k = 1 , 2 , . . . \{X=X_k\},\ \ k=1,2,... {X=Xk}, k=1,2,...之间是互不相容的事件,且 ∪ k = 1 ∞ { X = X k } = Ω \cup_{k=1}^{\infin} \{X=X_k\} = \Omega ∪k=1∞{X=Xk}=Ω。
反之,若某数列 { p k } \{p_k\} {pk}具有以上两条性质,则他们必可作为某随机变量的分布律。
例1:设离散型随机变量 X X X的分布律为:
X | 0 | 1 | 2 |
---|---|---|---|
P | 0.2 | c | 0.5 |
求常数c。
解:由分布律的性质知: 0.2 + c + 0.5 = 1 ; ∴ c = 0.3 0.2+c+0.5 = 1 ;\ \ \ \ \therefore c=0.3 0.2+c+0.5=1; ∴c=0.3。
例2:掷一枚质地均匀的骰子,这 X X X为出现的点数,求 X X X的分布律。
解: X X X全部可能的取值为"1, 2, 3, 4, 5, 6",且 p k = p { X = k } = 1 6 , k = 1 , 2 , 3 , 4 , 5 , 6 p_k = p\{X=k\} = \frac{1}{6},\ \ \ \ k=1,2,3,4,5,6 pk=p{X=k}=61, k=1,2,3,4,5,6;则 X X X的分布律为:
X | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
P | 1 6 \frac{1}{6} 61 | 1 6 \frac{1}{6} 61 | 1 6 \frac{1}{6} 61 | 1 6 \frac{1}{6} 61 | 1 6 \frac{1}{6} 61 | 1 6 \frac{1}{6} 61 |
**技巧:**首先找出随机变量所有可能的取值,然后求出每个取值对应的概率,做成表格即可。
$\bigstar \bigstar ∗ ∗ 例 3 :袋中由编号 1 5 的 5 个球,从中取 3 个,这 **例3:袋中由编号1~5的5个球,从中取3个,这 ∗∗例3:袋中由编号1 5的5个球,从中取3个,这X 为取出的球中的最大编号,求 为取出的球中的最大编号,求 为取出的球中的最大编号,求X$的分布律。**
解: X X X全部可能的取值为"3, 4, 5";用古典概型计算概率:
P { X = 3 } = C 2 2 C 5 3 = 1 10 P\{X=3\} = \frac{C_2^2}{C_5^3} = \frac{1}{10} P{X=3}=C53C22=101 # 分母:全部5个球中取3个;分子:如果最大球是3,3已经确定取出,只有从1,2这2球中取另外2个。
P { X = 4 } = C 3 2 C 5 3 = 3 10 P\{X = 4\} = \frac{C_3^2}{C_5^3} = \frac{3}{10} P{X=4}=C53C32=103
P { X = 5 } = C 4 2 C 5 3 = 6 10 P\{X=5\} = \frac{C_4^2}{C_5^3} = \frac{6}{10} P{X=5}=C53C42=106
因此 X X X的分布律如下:
X | 3 | 4 | 5 |
---|---|---|---|
P | 1 10 \frac{1}{10} 101 | 3 10 \frac{3}{10} 103 | 6 10 \frac{6}{10} 106 |
★ ★ \bigstar \bigstar ★★ 例4:已知一批零件10个,其中3个不合格,今任取一个,若取到不合格的就丢掉,再重新取一个,如此下去,试求取到合格零件之前取出的不合格零件个数 X X X的分布律。
解: X X X可能的取值是:“0, 1, 2, 3”;设 A i A_i Ai表示"第 i i i次取出的零件不合格, i = 1 , 2 , 3 , 4 i=1,2,3,4 i=1,2,3,4"。
P { X = 0 } = P ( A 1 ‾ ) = 7 10 P\{X=0\} = P(\overline{A_1}) = \frac{7}{10} P{X=0}=P(A1)=107
P { X = 1 } = P ( A 1 A 2 ‾ ) = P ( A 1 ) P ( A 2 ‾ ∣ A 1 ) = 3 10 × 7 9 = 7 30 P\{X=1\}=P(A_1 \overline{A_2}) = P(A_1)P(\overline{A_2} | A_1) = \frac{3}{10} \times \frac{7}{9} = \frac{7}{30} P{X=1}=P(A1A2)=P(A1)P(A2∣A1)=103×97=307
P { X = 2 } = P ( A 1 A 3 A 3 ‾ ) = P ( A 1 ) P ( A 2 ∣ A 1 ) P ( A 3 ‾ ∣ A 1 A 2 ) = 3 10 × 2 9 × 7 8 = 7 120 P\{X=2\} = P(A_1 A_3 \overline{A_3}) = P(A_1)P(A2|A_1)P(\overline{A_3} | A_1 A_2) = \frac{3}{10} \times \frac{2}{9} \times \frac{7}{8} = \frac{7}{120} P{X=2}=P(A1A3A3)=P(A1)P(A2∣A1)P(A3∣A1A2)=103×92×87=1207
P { X = 3 } = P ( A 1 A 2 A 3 A 4 ‾ ) = P ( A 1 ) P ( A 2 ∣ A 1 ) P ( A 3 ∣ A 1 A 2 ) P ( A 4 ‾ ∣ A 1 A 2 A 3 ) = 3 10 × 2 9 × 1 8 × 7 7 = 1 120 P\{X=3\} = P(A_1 A_2 A_3 \overline{A_4}) = P(A_1)P(A_2| A_1)P(A_3|A_1 A_2)P(\overline{A_4} | A_1 A_2 A_3) = \frac{3}{10} \times \frac{2}{9} \times \frac{1}{8} \times \frac{7}{7} = \frac{1}{120} P{X=3}=P(A1A2A3A4)=P(A1)P(A2∣A1)P(A3∣A1A2)P(A4∣A1A2A3)=103×92×81×77=1201
故 X X X的分布律为:
X | 0 | 1 | 2 | 3 |
---|---|---|---|---|
P | 7 10 \frac{7}{10} 107 | 7 30 \frac{7}{30} 307 | 7 120 \frac{7}{120} 1207 | 1 120 \frac{1}{120} 1201 |
若需要求 X X X满足某一条件这样的事件概率,例如例2中要求掷出的点数是奇数的概率,则应将满足条件的所有 X X X对应的概率相加即可。
1.3 0-1分布与二项分布
下面介绍三种重要的常用离散型随机变量,它们是: 0 − 1 0-1 0−1分布、二项分布和泊松分布。
定义4:若随机变量 X X X只取两个可能的值0,1;且 P { X = 1 } = p , P { X = 0 } = q P\{X=1\} = p,\ \ P\{X=0\}=q P{X=1}=p, P{X=0}=q,其中 0 < p < 1 , q = 1 − p 0 \lt p \lt 1,\ \ q=1-p 0<p<1, q=1−p;则称 X X X服从 0 − 1 0-1 0−1分布; X X X的分布律为:
X | 0 | 1 |
---|---|---|
P | q q q | p p p |
在 n n n重伯努利试验中,每轮试验只观察 A A A是否发生,定义随机变量 X X X:
X = { 0 , 当 A 发生 1 , 当 A 不发生 X = \begin{cases} 0 , &当A发生\\ 1 , &当A不发生 \end{cases} X={0,1,当A发生当A不发生
大白话:任何只有两种结果是试验,或者说我们研究的结果只有两种的试验;比如:掷硬币,研究结果的正反面;掷骰子,但只研究结果的奇数还是偶数等。
定义5: 若随机变量 X X X的可能值为0,1,…,n;n为正整数,而 X X X的分布律为: p k = P { X = k } = C n k p k q n − k , k = 0 , 1 , . . . , n p_k = P\{X=k\} = C_n^k p^k q^{n-k}, \ \ k=0,1,...,n pk=P{X=k}=Cnkpkqn−k, k=0,1,...,n;其中, 0 < p < 1 , q = 1 − p 0 \lt p \lt 1,\ q = 1 - p 0<p<1, q=1−p,则称 X X X服从参数为 n , p n,p n,p的二项分布,记作: X ∼ B ( n , p ) X \sim B(n, p) X∼B(n,p)</u>。
显然,当 n = 1 n=1 n=1时, X X X服从 0 − 1 0-1 0−1分布,即 X ∼ B ( 1 , p ) X \sim B(1, p) X∼B(1,p);【满足 0 − 1 0-1 0−1分布每次试验都只可能有0、1两个结果,p并不一定非要是1/2】;即 0 − 1 0-1 0−1分布是二项分布的一种特例。
但是满足二项分布的每次试验结果不止2个。这是本质区别!!
在 n n n重伯努利试验中,令 X X X代表 A A A的发生次数,则 P { X = k } = P n ( k ) = C n k p k q n − k , k = 0 , 1 , 2 , . . . , n P\{X=k\} = P_n(k) = C_n^k p^k q^{n-k},\ \ k=0,1,2,...,n P{X=k}=Pn(k)=Cnkpkqn−k, k=0,1,2,...,n;即 X X X服从参数为 n , p n, p n,p的二项分布。
这里特别特别要注意:“随机变量 X X X的可能值为0,1,…,n;n为正整数"中 X X X的取值个数从0开始计算一共有 n + 1 n+1 n+1个;注意这里不要犯迷糊, n n n代表的是"最大可能取值个数-1”!!
二项分布名称的由来:(补充下数学知识!!)
二项式 ( p + q ) n (p+q)^n (p+q)n的展开式中:
$$
\begin{aligned}
(p + q)^n = C_n^0 q^0 p^n + C_n^1 q^1 p^{n-1} + C_n^2 q^2 p^{n-2} + … + C_n^n q^n p^0 = \sum_{k=0}^n C_n^k q^k p^{n-k} \
\end{aligned}
$$
由于 p + q = q + p p+q = q+p p+q=q+p;因此上述的二项式展开式等价于:(而且: C n k = C n n − k C_n^k = C_n^{n-k} Cnk=Cnn−k的)
( p + q ) n = ( q + p ) n = C n 0 p 0 q n + C n 1 p 1 q n − 1 + C n 2 p 2 q n − 2 + . . . + C n n p n q 0 = ∑ k = 0 n C n k p k q n − k (p + q)^n = (q + p)^n = C_n^0 p^0 q^n + C_n^1 p^1 q^{n-1} + C_n^2 p^2 q^{n-2} + ... + C_n^n p^n q^0 = \sum_{k=0}^n C_n^k p^k q^{n-k} (p+q)n=(q+p)n=Cn0p0qn+Cn1p1qn−1+Cn2p2qn−2+...+Cnnpnq0=k=0∑nCnkpkqn−k
其中的第 k + 1 k+1 k+1项( C n 0 p 0 q n C_n^0 p^0 q^n Cn0p0qn是第1项)恰好是 C n k p k q n − k C_n^k p^k q^{n-k} Cnkpkqn−k,这与 P { X = k } P\{X=k\} P{X=k}正好相同,因此称为符合二项分布。
因为 P { X = k } = C n k p k q n − k , k = 0 , 1 , . . . , n P\{X=k\} = C_n^k p^k q^{n-k}, \ \ k=0,1,...,n P{X=k}=Cnkpkqn−k, k=0,1,...,n的所有取值的概率之和为1,即 ∑ k = 0 n p k = ∑ k = 0 n P { X = k } = ∑ k = 0 n C n k p k q n − k = ( p + q ) n = 1 \sum_{k=0}^n p_k = \sum_{k=0}^n P\{X=k\} = \sum_{k=0}^n C_n^k p^k q^{n-k} = (p + q)^n = 1 ∑k=0npk=∑k=0nP{X=k}=∑k=0nCnkpkqn−k=(p+q)n=1,这满足分布律的基本性质。
大白话:由以上描述可见,任何有确定个数结果的试验,都可以视为满足二项分布。这就包含的范围非常广泛了!!
无限个可能结果的试验,我们先不考虑!!
对于任意的正整数 n n n, ( a + b ) n = ∑ k = 0 n C n k a n b n − k (a + b)^n = \sum_{k=0}^n C_n^k a^n b^{n-k} (a+b)n=∑k=0nCnkanbn−k,其中 C n k C_n^k Cnk称为二项式系数; C n k = n ! k ! ( n − k ) ! C_n^k = \frac{n!}{k!(n-k)!} Cnk=k!(n−k)!n!。
★ ★ \bigstar \bigstar ★★ 例5:某特效药临床有效率为0.95,今10人服用,问至少有8人被治愈的概率?
解:设 X X X为"10人中治愈的人数",由题目知 X ∼ B ( 10 , 0.95 ) X \sim B(10, 0.95) X∼B(10,0.95) ## X可能的值有10个,每次独立试验的有效率0.95
这里再次特别提醒,不要嫌我啰嗦;这个 n = 10 n=10 n=10是指X可能取值为"有0,1,2,3,4,5,6,7,8,9,10个人被治愈"的11个可能值中的最后一个值,因为从0开始计数,千万不要把 n n n理解为11了!!!
P { X ≥ 8 } = P { X = 8 } + P { X = 9 } + P { X = 10 } = C 10 8 ( 0.95 ) 8 ( 0.05 ) 2 + C 10 9 ( 0.95 ) 9 ( 0.05 ) 1 + C 10 10 ( 0.95 ) 1 0 ( 0.05 ) 0 = 0.9885 P\{X \ge 8\} = P\{X=8\} + P\{X=9\} + P\{X=10\} = C_{10}^8(0.95)^8(0.05)^2 + C_{10}^9(0.95)^9(0.05)^1 + C_{10}^{10}(0.95)^10(0.05)^0 = 0.9885 P{X≥8}=P{X=8}+P{X=9}+P{X=10}=C108(0.95)8(0.05)2+C109(0.95)9(0.05)1+C1010(0.95)10(0.05)0=0.9885
★ ★ \bigstar \bigstar ★★ 例6:设 X ∼ B ( 2 , p ) , Y ∼ B ( 3 , p ) X \sim B(2,p),\ Y \sim B(3, p) X∼B(2,p), Y∼B(3,p);设 p { X ≥ 1 } = 5 9 p\{X \ge 1\} = \frac{5}{9} p{X≥1}=95,求 P { Y ≥ 1 } P\{Y \ge 1\} P{Y≥1}。
解:由 P { X ≥ 1 } = 5 9 P\{X \ge 1\} = \frac{5}{9} P{X≥1}=95知 X X X可能的取值有"0,1,2"三种可能,因此, P { X = 0 } = 1 − P { X ≥ 1 } = 4 9 P\{X=0\} = 1 - P\{X \ge 1\} = \frac{4}{9} P{X=0}=1−P{X≥1}=94;
∴ P { X = 0 } = C 2 0 p 0 ( 1 − p ) 2 = 4 9 \therefore \ P\{X=0\} = C_2^0 p^0 (1-p)^2 = \frac{4}{9} ∴ P{X=0}=C20p0(1−p)2=94; 又 ∵ C 2 0 = 1 ; p 0 = 1 \because C_2^0 = 1 ;\ \ p^0 = 1 ∵C20=1; p0=1 ;
∴ ( 1 − p ) 2 = 4 9 \therefore \ (1-p)^2 = \frac{4}{9} ∴ (1−p)2=94;
∴ p = 1 3 \therefore \ p = \frac{1}{3} ∴ p=31
由 Y ∼ B ( 3 , p ) Y \sim B(3, p) Y∼B(3,p)可知 Y Y Y可能的取值有"0,1,2,3"四种可能,因此, P { Y ≥ 1 } = 1 − P { Y = 0 } = 1 − C 3 0 p 0 ( 1 − p ) 3 = 1 − 8 27 = 19 27 P\{Y \ge 1\} = 1 - P\{Y = 0\} = 1 - C_3^0 p^0 (1-p)^3 = 1 - \frac{8}{27} = \frac{19}{27} P{Y≥1}=1−P{Y=0}=1−C30p0(1−p)3=1−278=2719。
由此可见,二项分布的计算很繁琐,尤其是出现例如: n = 1000 , p = 0.05 n=1000,\ p=0.05 n=1000, p=0.05时; C 1000 10 ( 0.05 ) 1 0 ( 0.95 ) 990 C_{1000}^{10}(0.05)^10(0.95)^{990} C100010(0.05)10(0.95)990这类的计算,因此,需要寻求近似计算的方法;下面给给出一个 n n n很大, p p p很小的近似计算公式,这就是著名的二项分布的泊松逼近。
**泊松(Possion)定理:**设 λ > 0 \lambda \gt 0 λ>0是常数, n n n为任意正整数,在 n n n重伯努利试验中,假设事件 A A A在一次试验中发生的概率是 p n p_n pn,当 n → + ∞ n \to +\infty n→+∞时,有 n p n → λ np_n \to \lambda npn→λ,则对于任意取定的非负整数 k k k,有: lim n → + ∞ C n k p n k ( 1 − p k ) n − k = λ k k ! e − λ \lim_{n \to +\infty} C_n^k p_n^k (1-p_k)^{n-k} = \frac{\lambda^k}{k!} e^{-\lambda} limn→+∞Cnkpnk(1−pk)n−k=k!λke−λ。
这里只给出结论,不给出证明过程;有兴趣的可以查阅相关资料。
由泊松定理知,当 n n n很大, p p p很小时由近似公式:
C n k p k q n − k ≈ λ k k ! e − λ , 其中, λ = n p , q = 1 − p C_n^k p^k q^{n-k} \approx \frac{\lambda^k}{k!} e^{-\lambda}, \ \ 其中,\lambda = np, q = 1-p Cnkpkqn−k≈k!λke−λ, 其中,λ=np,q=1−p。
在实际中,当 n ≥ 20 , p ≤ 0.05 n \ge 20,\ p \le 0.05 n≥20, p≤0.05时使用该近似公式的效果更佳。
λ k k ! e − λ \frac{\lambda^k}{k!} e^{-\lambda} k!λke−λ的值可以通过泊松表查询;泊松表给出了已知 λ \lambda λ和 k k k值对应的 ∑ k + ∞ λ k k ! e − λ \sum_{k}^{+\infty} \frac{\lambda^k}{k!} e^{-\lambda} ∑k+∞k!λke−λ值查询。 ## 特别注意:表里的值是从 k k k开始到 + ∞ +\infty +∞的累加和哦,下线不一定是0,但上限一定是 + ∞ +\infty +∞。
例7:一个工厂的产品废品率为0.005,任取1000件,计算:
(1) 至少有2件废品的概率
(2) 不超过5件废品的概率
解:设 X X X表示"取出1000件中包含的废品总数",则 X ∼ B ( 1000 , 0.005 ) X \sim B(1000, 0.005) X∼B(1000,0.005);利用近似公式: λ = n p = 5 \lambda = np = 5 λ=np=5;
(1) $P{X \ge 2} = 1 - P{X=0} - P{X=1} = 1- C_{1000}^{0} (0.005)0(0.995){1000} - C_{1000}^{1} (0.005)1(0.995){999} $
≈ 1 − λ 0 0 ! e − λ − λ 1 1 ! e − λ = 1 − 5 0 0 ! e − 5 − 5 1 1 ! e − 5 = 0.9596 \approx 1- \frac{\lambda^0}{0!} e^{-\lambda} - \frac{\lambda^1}{1!} e^{-\lambda} = 1- \frac{5^0}{0!} e^{-5} - \frac{5^1}{1!} e^{-5} = 0.9596 ≈1−0!λ0e−λ−1!λ1e−λ=1−0!50e−5−1!51e−5=0.9596
(2) P { X ≤ 5 } = ∑ k = 0 5 P { X = k } = ∑ k = 0 5 C 1000 k ( 0.005 ) k ( 0.995 ) 1000 − k P\{X \le 5\} = \sum_{k=0}^5 P\{X=k\} = \sum_{k=0}^{5} C_{1000}^k (0.005)^k (0.995)^{1000-k} P{X≤5}=∑k=05P{X=k}=∑k=05C1000k(0.005)k(0.995)1000−k
≈ ∑ k = 0 5 λ k k ! e − λ = 1 − ∑ k = 6 ∞ λ k k ! e − λ \approx \sum_{k=0}^5 \frac{\lambda^k}{k!} e^{-\lambda} = 1 - \sum_{k=6}^{\infty} \frac{\lambda^k}{k!} e^{-\lambda} ≈∑k=05k!λke−λ=1−∑k=6∞k!λke−λ ## 这里有个转换关系需要特别注意。转换后才可以查泊松表,按照 λ = 5 , k = 6 \lambda = 5, k = 6 λ=5,k=6查询!!
= 0.6160 = 0.6160 =0.6160
1.4 泊松分布
定义6: 随机变量 X X X的可能取值"0,1,2,…,n,…";而 X X X的分布律为:
p k = P { X = k } = λ k k ! e − λ , k = 0 , 1 , 2 , . . . p_k = P\{X=k\} = \frac{\lambda^k}{k!} e^{-\lambda},\ \ \ \ k=0,1,2,... pk=P{X=k}=k!λke−λ, k=0,1,2,...
其中, λ > 0 \lambda \gt 0 λ>0,则称** X X X服从参数为 λ \lambda λ的泊松分布**,简记为: X ∼ P ( λ ) X \sim P(\lambda) X∼P(λ)。
大白话,与二项分布相比, S S S的取值变成的无限个(当然仍旧是离散型的);因此 n → ∞ n \to \infty n→∞;导致符合泊松定理的近似计算公式,从而产生常数 λ = n p \lambda = np λ=np;使得概率仅与 λ 和 k \lambda和k λ和k有关。
由 ∑ k = 0 ∞ p k = ∑ k = 0 ∞ λ k k ! e − λ = e − λ ∑ k = 0 ∞ λ k k ! = e − λ e λ = 1 \sum_{k=0}^{\infty} p_k = \sum_{k=0}^{\infty} \frac{\lambda^k}{k!} e^{-\lambda} = e^{-\lambda} \sum_{k=0}^{\infty} \frac{\lambda^k}{k!} = e^{-\lambda} e^{\lambda} = 1 ∑k=0∞pk=∑k=0∞k!λke−λ=e−λ∑k=0∞k!λk=e−λeλ=1可知 { p k } \{p_k\} {pk}满足分布律的基本性质。
泊松分布是二项分布的极限分布( n → ∞ n \to \infty n→∞的情况下),非常重要!!
例8:设随机变量 X X X服从参数为5的泊松分布,求:
(1) P { X = 10 } P\{X=10\} P{X=10}
(2) P { X ≤ 10 } P\{X \le 10\} P{X≤10}
解:(1) 查询泊松表,找 λ = 5 列 , X = 10 行 \lambda = 5列,\ X=10行 λ=5列, X=10行对应的值;和 λ = 5 列 , X = 11 行 \lambda = 5列,\ X=11行 λ=5列, X=11行对应的值:
P { X = 10 } = P { X ≥ 10 } − P { X ≥ 11 } = ∑ k = 10 ∞ λ k k ! e − λ − ∑ k = 11 ∞ λ k k ! e − λ ≈ 0.018133 P\{X=10\} = P\{X \ge 10\} - P\{X \ge 11\} = \sum_{k=10}^{\infty} \frac{\lambda^k}{k!} e^{-\lambda} -\sum_{k=11}^{\infty} \frac{\lambda^k}{k!} e^{-\lambda} \approx 0.018133 P{X=10}=P{X≥10}−P{X≥11}=∑k=10∞k!λke−λ−∑k=11∞k!λke−λ≈0.018133
(2) P { X ≤ 10 } = 1 − P { X ≥ 11 } = 1 − ∑ k = 11 ∞ λ k k ! e − λ ≈ 0.986305 P\{X \le 10\} = 1- P\{X \ge 11\} = 1 - \sum_{k=11}^{\infty} \frac{\lambda^k}{k!} e^{-\lambda} \approx 0.986305 P{X≤10}=1−P{X≥11}=1−∑k=11∞k!λke−λ≈0.986305
例9:设 X X X服从泊松分布,且已知 P { X = 1 } = P { X = 2 } P\{X=1\} = P\{X=2\} P{X=1}=P{X=2};求 P { X = 4 } P\{X=4\} P{X=4}。
解:设参数为 λ \lambda λ,则:
P { X = 1 } = λ 1 1 ! e − λ = λ e − λ P\{X=1\} = \frac{\lambda^1}{1!} e^{-\lambda} = \lambda e^{-\lambda} P{X=1}=1!λ1e−λ=λe−λ
P { X = 2 } = λ 2 2 ! e − λ = λ 2 2 e − λ P\{X=2\} = \frac{\lambda^2}{2!} e^{-\lambda} = \frac{\lambda^2}{2} e^{-\lambda} P{X=2}=2!λ2e−λ=2λ2e−λ
由题目知: P { X = 1 } = P { X = 2 } P\{X=1\} = P\{X=2\} P{X=1}=P{X=2} 得 λ = 2 \lambda = 2 λ=2
∴ P { X = 4 } = λ 4 4 ! e − λ = 2 4 4 ! e − 2 = 2 3 e − 2 \therefore \ P\{X=4\} = \frac{\lambda^4}{4!} e^{-\lambda} = \frac{2^4}{4!} e^{-2} = \frac{2}{3} e^{-2} ∴ P{X=4}=4!λ4e−λ=4!24e−2=32e−2