第一章 随机时间与概率
1. 随机事件及其运算
1.1 随机现象
确定性现象:只有一个结果的现象
确定性现象:结果不止一个,且哪一个结果出现,人们事先并不知道
1.2 样本空间
样本空间:随机现象的一切可能基本结果组成的集合,记为 Ω = { ω } \Omega = \{\omega\} Ω={ω},其中 ω \omega ω表示基本结果,又称为样本点。
1.3 随机事件
随机事件:随机现象的某些基本样本点组成的集合称为随机时间,简称事件,常用大写字母 A , B , C , ⋯ A,B,C,\cdots A,B,C,⋯表示。
维恩(Venn)图:类似图1的图形
由样本空间 Ω \Omega Ω中的单个元素组成的子集称为基本事件
,而样本空间 Ω \Omega Ω的最大子集(即 Ω \Omega Ω本身)称为必然事件
,样本空间 Ω \Omega Ω的最小子集(即空集$\varnothing $)称为不可能事件
。
1.4 随机变量
随机变量:用来表示随机现象结果的变量,常用大写字母X,Y,Z表示,很多时间都可用随机变量表示,表示时应写明随机变量的含义。
1.5 事件间的关系
包含关系:如果属于A的样本点必属于B,则称A被包含在B中,或称B包含A,记为 A ⊂ B A\subset B A⊂B
相等关系:属于A的样本点必属于B,属于B的样本点必属于A,即 A ⊂ B A\subset B A⊂B 且 B ⊂ A B\subset A B⊂A,则称事件A与B相等,记为A=B
互不相容:如果A与B没有相同的样本点,则称A与B互不相容。
2.概率的定义及其确定方法
1933年苏联数学家柯尔莫戈洛夫首次提出了概率的公理化定义。
2.1 概率的公理化定义
定义2.1 概率
设 Ω \Omega Ω为一个样本空间, F F F为 Ω \Omega Ω的某些子集组成的一个事件域,如果对于任一事件 A ∈ F A\in F A∈F,定义在 F F F上的一个实值函数 P ( A ) P(A) P(A)满足:
-
非负性公理 若 A ∈ F A\in F A∈F,则 P ( A ) ≥ 0 ; P(A)\ge 0; P(A)≥0;
-
正则性公理 P ( Ω ) = 1 P(\Omega)=1 P(Ω)=1;
-
可列可加性公理 若 A 1 , A 2 , ⋯ , A n , ⋯ A_1,A_2,\cdots,A_n,\cdots A1,A2,⋯,An,⋯互不相容,则:
P ( ⋃ i = 1 ∞ A i ) = ∑ i = 1 ∞ P ( A i ) P(\bigcup_{i=1}^{\infty} A_i )=\sum_{i=1}^\infty P(A_i) P(i=1⋃∞Ai)=i=1∑∞P(Ai)
称 P ( A ) P(A) P(A)为事件 A A A的概率,称三元素 ( Ω , F , P ) (\Omega,F,P) (Ω,F,P)为概率空间。
排列和组合: p13
抽样模型 p16
放回抽样 p18
额,全看一下吧,从p12 的1.2.2 排列与组合公式开始。
3.概率的性质
性质3.1 $P(\varnothing)= 0 $
3.1 概率的可加性
性质3.2 有限可加性
若有限个时间 A 1 , A 2 , ⋯ , A n A_1,A_2,\cdots,A_n A1,A2,⋯,An互不相容,则有
P ( ⋃ i = 1 n A i ) = ∑ i = 1 n P ( A i ) P(\bigcup_{i=1}^n A_i)=\sum_{i=1}^n P(A_i) P(i=1⋃nAi)=i=1∑nP(Ai)
性质3.3 对立事件的概率
对任意时间 A A A,有:
P ( A ‾ ) = 1 − P ( A ) P(\overline{A}) = 1- P(A) P(A)=1−P(A)
例题:甲乙抛硬币,甲抛 n + 1 n+1 n+1次,乙抛 n n n次,求甲抛出正面次数大于乙抛出正面次数的概率 P ( A ) P(A) P(A)
解:
事件A定义为 甲 正 > 乙 正 甲_正>乙_正 甲正>乙正,则 A ‾ = 甲 正 ≤ 乙 正 \overline{A}=甲_正\le 乙_正 A=甲正≤乙正
P ( A ) = P ( 甲 正 > 乙 正 ) = P ( n + 1 − 甲 反 > n − 乙 反 ) = P ( 甲 反 < 乙 反 + 1 ) = P ( 甲 反 ≤ 乙 反 ) = P ( 甲 正 ≤ 乙 正 ) = P ( A ‾ ) P(A)=P(甲_正>乙_正)=P(n+1 - 甲_反 >n - 乙_反)=P(甲_反 < 乙_反 +1)=P(甲_反\le 乙_反)=P(甲_正\le 乙_正)=P(\overline{A}) P(A)=P(甲正>乙正)=P(n+1−甲反>n−乙反)=P(甲反<乙反+1)=P(甲反≤乙反)=P(甲正≤乙正)=P(A)
则 P ( A ) = P ( A ‾ ) = 1 2 P(A)=P(\overline{A})=\frac 12 P(A)=P(A)=21
3.2 概率的单调性
性质 3.4 包含关系的性质
若 B ⊂ A B\subset A B⊂A,则
P ( A − B ) = P ( A ) − P ( B ) P(A-B) = P(A)-P(B) P(A−B)=P(A)−P(B)
推论(单调性) 若 B ⊂ A B\subset A B⊂A ,则 P ( A ) ≥ P ( B ) P(A)\ge P(B) P(A)≥P(B)
性质3.5 概率差 p30
对任意两个事件 A , B A,B A,B,有
P ( A − B ) = P ( A ) − P ( A B ) P(A-B) = P(A)-P(AB) P(A−B)=P(A)−P(AB)
3.3 概率的加法公式
性质3.6 加法公式 p31
对任意两个事件 A , B A,B A,B有
P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A B ) P(A\cup B) = P(A)+P(B)-P(AB) P(A∪B)=P(A)+P(B)−P(AB)
对任意n个时间 A 1 , A 2 , ⋯ , A n A_1,A_2,\cdots,A_n A1,A2,⋯,An,有:
P ( ⋃ i = 1 n A i ) = ∑ i = 1 n P ( A − i ) − ∑ 1 ≤ i < j ≤ n P ( A i A j ) + ∑ 1 ≤ i < j < k ≤ n P ( A i A j A k ) + ⋯ + ( − 1 ) n − 1 P ( A 1 A 2 ⋯ A n ) P(\bigcup_{i=1}^n A_i) =\sum_{i=1}^n P(A-i) - \sum_{1\le i<j \le n}P(A_iA_j) +\sum_{1\le i < j <k\le n}P(A_iA_jA_k)+\cdots+(-1)^{n-1}P(A_1A_2\cdots A_n) P(i=1⋃nAi)=i=1∑nP(A−i)−1≤i<j≤n∑P(AiAj)+1≤i<j<k≤n∑P(AiAjAk)+⋯+(−1)n−1P(A1A2⋯An)
推论(半可加性) 对任意两个事件 A , B A,B A,B,有
P ( A ∪ B ) ≤ P ( A ) + P ( B ) P(A\cup B)\le P(A)+P(B) P(A∪B)≤P(A)+P(B)
对任意 n n n个事件 A 1 , A 2 , ⋯ , A n A_1,A_2,\cdots,A_n A1,A2,⋯,An有
P ( ⋃ i = 1 n A i ) ≤ ∑ i = 1 n P ( A i ) P(\bigcup_{i=1}^n A_i) \le \sum_{i=1}^n P(A_i) P(i=1⋃nAi)≤i=1∑nP(Ai)
p32 的配对问题,很重要
3.4 概率的连续性
定义3.1 极限事件
-
对 F F F中任一单调不减的事件序列 F 1 ⊂ F 2 ⊂ ⋯ ⊂ F n ⊂ ⋯ F_1\subset F_2 \subset\cdots \subset F_n \subset \cdots F1⊂F2⊂⋯⊂Fn⊂⋯,称可列并 ⋃ n = 1 ∞ F n \bigcup_{n=1}^\infty F_n ⋃n=1∞Fn为 { F n } \{F_n\} {Fn}的极限事件,记为
l i m n → ∞ F n = ⋃ n = 1 ∞ F n lim_{n\rightarrow \infty}F_n = \bigcup_{n=1}^\infty F_n limn→∞Fn=n=1⋃∞Fn -
对 F F F中任一单调不增的事件序列 E 1 ⊃ E 2 ⊃ ⋯ ⊃ E n ⊃ ⋯ E_1\supset E_2 \supset\cdots \supset E_n \supset \cdots E1⊃E2⊃⋯⊃En⊃⋯,称可列并 ⋂ n = 1 ∞ E n \bigcap_{n=1}^\infty E_n ⋂n=1∞En为 { E n } \{E_n\} {En}的极限事件,记为
l i m n → ∞ E n = ⋂ n = 1 ∞ E n lim_{n\rightarrow \infty}E_n = \bigcap_{n=1}^\infty E_n limn→∞En=n=1⋂∞En
定义3.2 连续,上连续,下连续
对F上的一个概率P
-
若它对F中任一单调不减的事件序列 { F n } \{F_n\} {Fn}均成立
l i m n → ∞ P ( F n ) = P ( l i m n → ∞ F n ) lim_{n\rightarrow \infty} P(F_n) = P(lim_{n\rightarrow \infty}F_n) limn→∞P(Fn)=P(limn→∞Fn)
则称概率 P P P是下连续的,(左连续,P从小变大) -
若它对F中任一单调不增的事件序列 { E n } \{E_n\} {En}均成立
l i m n → ∞ P ( E n ) = P ( l i m n → ∞ E n ) lim_{n\rightarrow \infty} P(E_n) = P(lim_{n\rightarrow \infty}E_n) limn→∞P(En)=P(limn→∞En)
则称概率 P P P是上连续的,(右连续,P从大变小)
性质3.7 概率的连续性 p33
若P为事件域F上的概率,则P既是下连续的,又是上连续的。
性质3.8 可列可加性的条件 p34
若P是F上满足 P ( Ω ) = 1 P(\Omega) = 1 P(Ω)=1的非负集合函数,则它具有可列可加性的充要条件是:
- 它是有限可加的
- 它是下连续的
4.条件概率
4.1条件概率的定义 p37
定义4.1 条件概率
设A与B是样本空间 Ω \Omega Ω中的两事件,若$P(B)\gt 0 $,则称:
P ( A ∣ B ) = P ( A B ) P ( B ) P(A|B) = \frac{P(AB)}{P(B)} P(A∣B)=P(B)P(AB)
为在B发生下A的条件概率,简称条件概率
性质4.1 条件概率的性质
条件概率是概率,即若设 P ( B ) > 0 P(B)\gt 0 P(B)>0,则:
- P ( A ∣ B ) ≥ 0 , A ∈ F P(A|B)\ge 0,A\in F P(A∣B)≥0,A∈F
- P ( Ω ∣ B ) = 1 P(\Omega|B) = 1 P(Ω∣B)=1
- 若F中的 A 1 , A 2 , ⋯ , A n , ⋯ A_1,A_2,\cdots,A_n,\cdots A1,A2,⋯,An,⋯互不相容,则
P ( ⋃ n = 1 ∞ A n ∣ B ) = ∑ n − 1 ∞ P ( A n ∣ B ) P(\bigcup_{n=1}^\infty A_n |B) =\sum_{n-1}^\infty P(A_n|B) P(n=1⋃∞An∣B)=n−1∑∞P(An∣B)
4.2 乘法公式
-
若 P ( B ) > 0 P(B)\gt 0 P(B)>0,则
P ( A B ) = P ( B ) P ( A ∣ B ) P(AB) = P(B)P(A|B) P(AB)=P(B)P(A∣B) -
若 P ( A 1 A 2 ⋯ A n − 1 ) > 0 P(A_1A_2\cdots A_{n-1})\gt 0 P(A1A2⋯An−1)>0,则
P ( A 1 A 2 ⋯ A n ) = P ( A 1 ) P ( A 2 ∣ A 1 ) P ( A 3 ∣ A 1 A 2 ) ⋯ P ( A n ∣ A 1 A 2 ⋯ A n − 1 ) P(A_1A_2\cdots A_n) = P(A_1)P(A_2|A_1)P(A_3|A_1A_2)\cdots P(A_n|A_1A_2\cdots A_{n-1}) P(A1A2⋯An)=P(A1)P(A2∣A1)P(A3∣A1A2)⋯P(An∣A1A2⋯An−1)
罐子模型 p39
4.3 全概率公式 p40
设 B 1 , B 2 , ⋯ , B n B_1,B_2,\cdots,B_n B1,B2,⋯,Bn为样本空间 Ω \Omega Ω的一个分割,即 B 1 , B 2 , ⋯ , B n B_1,B_2,\cdots,B_n B1,B2,⋯,Bn互不相容,且 ⋃ i = 1 n B i = Ω \bigcup_{i=1}^n B_i=\Omega ⋃i=1nBi=Ω,如果 P ( B i ) > 0 , i = 1 , 2 , ⋯ , n P(B_i)\gt 0,i=1,2,\cdots,n P(Bi)>0,i=1,2,⋯,n,则对任一事件有:
P ( A ) = ∑ i = 1 n P ( B i ) P ( A ∣ B i ) P(A) =\sum_{i=1}^n P(B_i)P(A|B_i) P(A)=i=1∑nP(Bi)P(A∣Bi)
4.4 贝叶斯公式 p43
设 B 1 , B 2 , ⋯ , B n B_1,B_2,\cdots,B_n B1,B2,⋯,Bn是样本空间 Ω \Omega Ω的一个分割,即 B 1 , B 2 , ⋯ , B n B_1,B_2,\cdots,B_n B1,B2,⋯,Bn互不相容,且 ⋃ i = 1 n B i = Ω \bigcup_{i=1} ^n B_i = \Omega ⋃i=1nBi=Ω,如果 P ( A ) > 0 , P ( B i ) > 0 , i = 1 , 2 , ⋯ , n P(A)>0,P(B_i)>0,i=1,2,\cdots,n P(A)>0,P(Bi)>0,i=1,2,⋯,n,则
P ( B i ∣ A ) = P ( A B i ) P ( A ) = P ( B i ) P ( A ∣ B i ) ∑ j = 1 n P ( B j ) P ( A ∣ B j ) , i = 1 , 2 , ⋯ , n P(B_i|A)=\cfrac{P(AB_i)}{P(A)}=\cfrac{P(B_i)P(A|B_i)}{\sum_{j=1}^{n}P(B_j)P(A|B_j)},i=1,2,\cdots,n P(Bi∣A)=P(A)P(ABi)=∑j=1nP(Bj)P(A∣Bj)P(Bi)P(A∣Bi),i=1,2,⋯,n
分子用乘法公式,分母用全概率公式
贝叶斯分类器 p43
肝癌的例子p43
5.独立性
5.1 两个事件的独立性
独立性:一个事件的发生不影响另一个事件的发生:
P ( A B ) = P ( A ) P ( B ) P(AB)=P(A)P(B) P(AB)=P(A)P(B)
若 P ( A ) = 0 ∣ ∣ P ( B ) = 0 P(A)=0||P(B)=0 P(A)=0∣∣P(B)=0,等式依然成立。
定义5.1 独立
如果 P ( A B ) = P ( A ) P ( B ) P(AB)=P(A)P(B) P(AB)=P(A)P(B),则称 A A A与 B B B相互独立,简称 A A A与 B B B独立,否则成不独立或相依
独立的性质
若事件 A A A与 B B B独立,则 A A A与 B ‾ \overline{B} B独立, A ‾ \overline{A} A与 B B B独立, A ‾ \overline{A} A与 B ‾ \overline{B} B独立
证明:P48,由补的性质可以推出
5.2 多个事件的相互独立性
定义 5.2 三个事件的独立
设 A , B , C A,B,C A,B,C是三个事件,如果有:
{ P ( A B ) = P ( A ) P ( B ) P ( A B ) = P ( A ) P ( C ) P ( A B ) = P ( B ) P ( C ) \left\{ \begin{aligned} P(AB) & = P(A)P(B)\\ P(AB) & = P(A)P(C)\\ P(AB) & = P(B)P(C) \end{aligned} \right. ⎩ ⎨ ⎧P(AB)P(AB)P(AB)=P(A)P(B)=P(A)P(C)=P(B)P(C)
则称 A , B , C A,B,C A,B,C两两独立,若还有:
P ( A B C ) = P ( A ) P ( B ) P ( C ) P(ABC) = P(A)P(B)P(C) P(ABC)=P(A)P(B)P(C)
则称 A , B , C A,B,C A,B,C相互独立
定义 5.3 相互独立
设有 n n n个事件 A 1 , A 2 , ⋯ , A n A_1,A_2,\cdots,A_n A1,A2,⋯,An,对任意的 1 ≤ i < j < k < ⋯ ≤ n 1\le i \lt j \lt k \lt \cdots \le n 1≤i<j<k<⋯≤n,如果以下等式均成立:
{ P ( A i A j ) = P ( A i ) P ( A j ) , P ( A i A j A k ) = P ( A i ) P ( A j ) P ( A k ) , ⋯ ⋯ ⋯ P ( A 1 A 2 ⋯ A n ) = P ( A 1 ) P ( A 2 ) ⋯ P ( A n ) , \left\{ \begin{aligned} P(A_i A_j) & =P(A_i)P(A_j),\\ P(A_i A_j A_k) & =P(A_i)P(A_j)P(A_k),\\ &\cdots\cdots\cdots\\ P(A_1 A_2\cdots A_n) & =P(A_1)P(A_2)\cdots P(A_n), \end{aligned} \right. ⎩ ⎨ ⎧P(AiAj)P(AiAjAk)P(A1A2⋯An)=P(Ai)P(Aj),=P(Ai)P(Aj)P(Ak),⋯⋯⋯=P(A1)P(A2)⋯P(An),
则称这 n n n个事件相互独立
例1.5.5 p50 ,甲乙比赛射击
例1.5.6 p51 ,桥式电路
5.3 试验的独立性
利用事件的独立性可以定义两个或更多个试验的独立性
定义5.4 试验相互独立
设有两个试验 E 1 E_1 E1和 E 2 E_2 E2,假如试验 E 1 E_1 E1的任一结果(事件)与试验 E 2 E_2 E2的任一结果(事件)都是相互独立的事件,则称这两个试验相互独立
类似的可推广定义到n个试验,如果n个试验的任一结果都是相互独立的事件,则称这n个试验相互独立,如果这 n n n个独立试验还是相同的,则称其为n重独立重复试验,如果在 n n n重独立重复试验中,每次试验的可能结果为两个: A A A或 A ‾ \overline{A} A,则称这种试验为n重伯努利(Bernoulli)试验。