概率论
作者名称: 不同平台账号名称不同, 统一
AutumnWhisper
版权声明: 本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
前置介绍
建议没看过README的朋友先看一下, 链接
vscode
编辑, 采用markdown
高级数学公式,ChatGPT-o1排版
。 保证观感🥰🥰🥰.
觉得有帮助的话, 请点个赞鼓励一下作者吧🥹。 🙂↔️🙂↔️🙂↔️
以下是本篇内容介绍
概率的基础概念以及常用公式,基本模型。
重点:
- 随机变量分布函数
- 常见离散型随机变量分布函数(0-1分布,二项分布,泊松分布…)
- 连续随机变量,概率密度函数
- 常见连续性随机变量分布函数
- 离散型连续性函数分布
1. 随机变量及其分布函数
1.1 定义
-
随机变量:在样本空间上的实单值函数,记为
X = X ( ω ) X = X(\omega) X=X(ω)
其中, ω \omega ω 为样本点。随机变量实际上就是一个函数。
抽象量化复杂的随机事件, 引入高等数学的知识来解决实际问题。 -
分布函数:记函数
F ( x ) = P { X ≤ x } , ∀ ( − ∞ < x < ∞ ) F(x) = P\{X \leq x\},\forall ({-\infty <x<\infty}) F(x)=P{X≤x},∀(−∞<x<∞)
为随机变量 X X X 的分布函数。
分布函数本质是概率, 因此满足下列概率的性质。
1.2 分布函数的性质
-
取值范围:
0 ≤ F ( x ) ≤ 1 0 \leq F(x) \leq 1 0≤F(x)≤1 -
边界条件:
F ( − ∞ ) = 0 , F ( + ∞ ) = 1 F(-\infty) = 0, \quad F(+\infty) = 1 F(−∞)=0,F(+∞)=1 -
单调性:
如果 x 1 < x 2 x_1 < x_2 x1<x2,则
F ( x 1 ) ≤ F ( x 2 ) F(x_1) \leq F(x_2) F(x1)≤F(x2) -
右连续性:
F ( x + ) = F ( x ) F(x^+) = F(x) F(x+)=F(x) -
概率计算:
对任意 x 1 < x 2 x_1 < x_2 x1<x2,有
P { x 1 < X ≤ x 2 } = F ( x 2 ) − F ( x 1 ) P\{x_1 < X \leq x_2\} = F(x_2) - F(x_1) P{x1<X≤x2}=F(x2)−F(x1) -
点概率:
对任意 x x x,有
P { X = x } = F ( x ) − F ( x − ) P\{X = x\} = F(x) - F(x^-) P{X=x}=F(x)−F(x−) -
分布函数的充分性:
满足以上条件的函数才能成为一个有效的分布函数。
1~4条件判定是否可以成为分布函数。 -
基本关系:
P { X ≤ x } = F ( x ) , P { X < x } = F ( x − ) P\{X \leq x\} = F(x), \quad P\{X < x\} = F(x^-) P{X≤x}=F(x),P{X<x}=F(x−)
2. 随机变量的类型
随机变量分为离散型随机变量和连续型随机变量两大类。
2.1 离散型随机变量
2.1.1 定义
离散型随机变量是指其可能取值为有限个或可列无限个离散点的随机变量。设离散型随机变量 X X X 的可能取值为 x 1 , x 2 , … , x n , … x_1, x_2, \dots, x_n, \dots x1,x2,…,xn,…,则 X X X 取各可能值的概率为
P { X = x k } = p k , k = 1 , 2 , … P\{X = x_k\} = p_k, \quad k = 1, 2, \dots P{X=xk}=pk,k=1,2,…
称为离散型随机变量的概率分布或分布律。
2.1.2 分布律的表示
分布律可以通过表格形式表示:
X X X | x 1 x_1 x1 | x 2 x_2 x2 | ⋯ \cdots ⋯ | x n x_n xn | ⋯ \cdots ⋯ |
---|---|---|---|---|---|
P P P | p 1 p_1 p1 | p 2 p_2 p2 | ⋯ \cdots ⋯ | p n p_n pn | ⋯ \cdots ⋯ |
满足如下性质:
p k ≥ 0 , k = 1 , 2 , … p_k \geq 0, \quad k = 1, 2, \dots pk≥0,k=1,2,…
∑ k = 1 ∞ p k = 1 \sum_{k=1}^{\infty} p_k = 1 k=1∑∞pk=1
2.1.3 常用离散分布
-
伯努利分布(Bernoulli Distribution)
:- 定义:
X ∼ Bernoulli ( p ) X \sim \text{Bernoulli}(p) X∼Bernoulli(p) - 概率质量函数:
P { X = 1 } = p , P { X = 0 } = 1 − p P\{X = 1\} = p, \quad P\{X = 0\} = 1 - p P{X=1}=p,P{X=0}=1−p
二项分布的特例, 因为其只有两种可能的结果(成功或失败
), 它又名0-1分布
。
- 定义:
-
二项分布(Binomial Distribution)
:- 定义:
X ∼ B ( n , p ) X \sim B(n, p) X∼B(n,p)
读作X服从参数为 λ \lambda λ的泊松分布。 - 概率质量函数:
P { X = k } = C n k p k ( 1 − p ) n − k , k = 0 , 1 , 2 , … , n P\{X = k\} = C_n^k p^k (1 - p)^{n - k}, \quad k = 0, 1, 2, \dots, n P{X=k}=Cnkpk(1−p)n−k,k=0,1,2,…,n
- 定义:
-
泊松分布(Poisson Distribution)
:- 定义:
X ∼ P ( λ ) X \sim P(\lambda) X∼P(λ)
读作X服从参数为 λ \lambda λ的泊松分布。 - 概率质量函数:
P { X = k } = λ k k ! e − λ , k = 0 , 1 , 2 , … P\{X = k\} = \frac{\lambda^k}{k!} e^{-\lambda}, \quad k = 0, 1, 2, \dots P{X=k}=k!λke−λ,k=0,1,2,… - 泊松定理:在伯努利实验中,若 lim n → ∞ n p n = λ \lim_{n \to \infty} np_n = \lambda limn→∞npn=λ,则
lim n → ∞ C n k p n k ( 1 − p n ) n − k = λ k k ! e − λ \lim_{n \to \infty} C_n^k p_n^k (1 - p_n)^{n - k} = \frac{\lambda^k}{k!} e^{-\lambda} n→∞limCnkpnk(1−pn)n−k=k!λke−λ
- 定义:
-
几何分布(Geometric Distribution)
:- 定义:
X ∼ G e ( p ) X \sim G_e(p) X∼Ge(p) - 概率质量函数:
P { X = k } = p ( 1 − p ) k − 1 , k = 1 , 2 , … P\{X = k\} = p (1 - p)^{k - 1}, \quad k = 1, 2, \dots P{X=k}=p(1−p)k−1,k=1,2,…
- 定义:
-
超几何分布(Hypergeometric Distribution)
:- 定义:
X ∼ H ( N , M , n ) X \sim H(N, M, n) X∼H(N,M,n) - 概率质量函数:
P { X = k } = C k M C n − k N − M C n N , k = l 1 , … , l 2 P\{X = k\} = \frac{C_k^M C_{n - k}^{N - M}}{C_n^N}, \quad k = l_1, \dots, l_2 P{X=k}=CnNCkMCn−kN−M,k=l1,…,l2
其中,
l 1 = max ( 0 , n − N + M ) , l 2 = min ( M , n ) l_1 = \max(0, n - N + M), \quad l_2 = \min(M, n) l1=max(0,n−N+M),l2=min(M,n) - 应用实例:若 N N N 件产品中包含 M M M 件次品,从中任取 n n n 件,令 X X X 等于抽取的 n n n 件产品中的次品数,则 X X X 服从超几何分布。
- 定义:
2.2 连续型随机变量
2.2.1 定义
连续型随机变量是指其取值为某一区间内的任意实数的随机变量。对于分布函数 F ( x ) F(x) F(x),若存在一个非负可积函数 f ( x ) f(x) f(x),使得对任意实数 x x x 都有
F ( x ) = ∫ − ∞ x f ( t ) d t , − ∞ < x < + ∞ F(x) = \int_{-\infty}^{x} f(t) \, dt, \quad -\infty < x < +\infty F(x)=∫−∞xf(t)dt,−∞<x<+∞
则称函数 f ( x ) f(x) f(x) 为连续型随机变量 X X X 的概率密度。
2.2.2 概率密度的性质
-
非负性:
f ( x ) ≥ 0 , ∀ x f(x) \geq 0, \quad \forall x f(x)≥0,∀x -
归一性:
∫ − ∞ + ∞ f ( x ) d x = 1 \int_{-\infty}^{+\infty} f(x) \, dx = 1 ∫−∞+∞f(x)dx=1 -
概率计算:
对任意实数 x 1 < x 2 x_1 < x_2 x1<x2,有
P { x 1 < X < x 2 } = P { x 1 < X ≤ x 2 } = P { x 1 ≤ X < x 2 } = P { x 1 ≤ X ≤ x 2 } = ∫ x 1 x 2 f ( t ) d t = F ( x 2 ) − F ( x 1 ) P\{x_1 < X < x_2\} = P\{x_1 < X \leq x_2\} = P\{x_1 \leq X < x_2\} = P\{x_1 \leq X \leq x_2\} = \int_{x_1}^{x_2} f(t) \, dt = F(x_2) - F(x_1) P{x1<X<x2}=P{x1<X≤x2}=P{x1≤X<x2}=P{x1≤X≤x2}=∫x1x2f(t)dt=F(x2)−F(x1) -
导数关系:
在 f ( x ) f(x) f(x) 的连续点处,分布函数的导数满足
F ′ ( x ) = f ( x ) F'(x) = f(x) F′(x)=f(x)
2.2.3 常用连续分布
-
均匀分布(Uniform Distribution):
- 定义:
X ∼ U ( a , b ) X \sim U(a, b) X∼U(a,b) - 概率密度函数:
f ( x ) = { 1 b − a , a < x < b 0 , 其他 f(x) = \begin{cases} \frac{1}{b - a}, & a < x < b \\ 0, & \text{其他} \end{cases} f(x)={b−a1,0,a<x<b其他 - 概率计算:
对于 a ≤ c < d ≤ b a \leq c < d \leq b a≤c<d≤b,有
P { c < X ≤ d } = d − c b − a P\{c < X \leq d\} = \frac{d - c}{b - a} P{c<X≤d}=b−ad−c
- 定义:
-
指数分布(Exponential Distribution):
- 定义:
X ∼ E ( λ ) X \sim E(\lambda) X∼E(λ) - 概率密度函数:
f ( x ) = { λ e − λ x , x > 0 0 , x ≤ 0 f(x) = \begin{cases} \lambda e^{-\lambda x}, & x > 0 \\ 0, & x \leq 0 \end{cases} f(x)={λe−λx,0,x>0x≤0 - 分布函数:
F ( x ) = { 1 − e − λ x , x > 0 0 , x ≤ 0 F(x) = \begin{cases} 1 - e^{-\lambda x}, & x > 0 \\ 0, & x \leq 0 \end{cases} F(x)={1−e−λx,0,x>0x≤0
- 定义:
-
正态分布(Normal Distribution):
- 定义:
X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2) - 概率密度函数:
f ( x ) = 1 2 π ⋅ σ e − ( x − μ ) 2 2 σ 2 , − ∞ < x < + ∞ f(x) = \frac{1}{\sqrt{2\pi} \cdot \sigma} e^{-\frac{(x - \mu)^2}{2\sigma^2}}, \quad -\infty < x < +\infty f(x)=2π⋅σ1e−2σ2(x−μ)2,−∞<x<+∞ - 标准正态分布:
当 X ∼ N ( 0 , 1 ) X \sim N(0, 1) X∼N(0,1) 时,分布函数为
Φ ( x ) = 1 2 π ∫ − ∞ x e − t 2 2 d t \Phi(x) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{x} e^{-\frac{t^2}{2}} \, dt Φ(x)=2π1∫−∞xe−2t2dt - 分布函数:
当 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2) 时,
F ( x ) = Φ ( x − μ σ ) F(x) = \Phi\left(\frac{x - \mu}{\sigma}\right) F(x)=Φ(σx−μ) - 概率计算:
P { a < X < b } = Φ ( b − μ σ ) − Φ ( a − μ σ ) , a < b P\{a < X < b\} = \Phi\left(\frac{b - \mu}{\sigma}\right) - \Phi\left(\frac{a - \mu}{\sigma}\right), \quad a < b P{a<X<b}=Φ(σb−μ)−Φ(σa−μ),a<b - 概率密度的对称性:
f ( x ) 关于 x = μ 对称 f(x) \text{ 关于 } x = \mu \text{ 对称} f(x) 关于 x=μ 对称 - 标准正态分布的性质:
Φ ( − x ) = 1 − Φ ( x ) , Φ ( 0 ) = 1 2 \Phi(-x) = 1 - \Phi(x), \quad \Phi(0) = \frac{1}{2} Φ(−x)=1−Φ(x),Φ(0)=21
P { ∣ X ∣ ≤ a } = 2 Φ ( a ) − 1 P\{ |X| \leq a \} = 2\Phi(a) - 1 P{∣X∣≤a}=2Φ(a)−1 - 备注:根据正态分布的概率密度,可以计算形如
∫ − ∞ + ∞ e − t 2 d x \int_{-\infty}^{+\infty} e^{-t^2} \, dx ∫−∞+∞e−t2dx
的积分。
- 定义:
3. 随机变量的函数的分布
随机变量的函数的分布分为离散型和连续型两种情况。
3.1 离散型随机变量
3.1.1 分布律的确定
设随机变量 X X X 的分布律为
P { X = x k } = p k , k = 1 , 2 , … P\{X = x_k\} = p_k, \quad k = 1, 2, \dots P{X=xk}=pk,k=1,2,…
则随机变量 Y = g ( X ) Y = g(X) Y=g(X) 的分布律为
P { Y = g ( x k ) } = p k , k = 1 , 2 , … P\{Y = g(x_k)\} = p_k, \quad k = 1, 2, \dots P{Y=g(xk)}=pk,k=1,2,…
如果在 g ( x k ) g(x_k) g(xk) 中有相同的数值,则将它们相应的概率和作为 Y Y Y 取该值的概率。
3.1.2 示例
假设 X X X 取值为 1 , 2 , 3 1, 2, 3 1,2,3,对应的概率分别为 0.2 , 0.5 , 0.3 0.2, 0.5, 0.3 0.2,0.5,0.3。定义函数 Y = X 2 Y = X^2 Y=X2,则 Y Y Y 的取值为 1 , 4 , 9 1, 4, 9 1,4,9,对应的概率分别为 0.2 , 0.5 , 0.3 0.2, 0.5, 0.3 0.2,0.5,0.3。
3.2 连续型随机变量
3.2.1 公式法
设随机变量 X X X 的概率密度为 f X ( x ) f_X(x) fX(x),且 y = g ( x ) y = g(x) y=g(x) 是单调、可导且导数不为零的函数, h ( y ) h(y) h(y) 是 g ( x ) g(x) g(x) 的反函数,则随机变量 Y = g ( X ) Y = g(X) Y=g(X) 的概率密度为
f Y ( y ) = { ∣ h ′ ( y ) ∣ f X ( h ( y ) ) , α < y < β 0 , 其他 f_Y(y) = \begin{cases} \left| h'(y) \right| f_X(h(y)), & \alpha < y < \beta \\ 0, & \text{其他} \end{cases} fY(y)={∣h′(y)∣fX(h(y)),0,α<y<β其他
其中, α \alpha α 和 β \beta β 为 Y Y Y 的取值范围。
3.2.2 定义法
通过分布函数确定概率密度。
-
分布函数:
F Y ( y ) = P { Y ≤ y } = P { g ( X ) ≤ y } = ∫ g ( x ) ≤ y f X ( x ) d x F_Y(y) = P\{Y \leq y\} = P\{g(X) \leq y\} = \int_{g(x) \leq y} f_X(x) \, dx FY(y)=P{Y≤y}=P{g(X)≤y}=∫g(x)≤yfX(x)dx -
概率密度:
f Y ( y ) = d d y F Y ( y ) = F Y ′ ( y ) f_Y(y) = \frac{d}{dy} F_Y(y) = F_Y'(y) fY(y)=dydFY(y)=FY′(y)
3.2.3 示例
设 X ∼ U ( a , b ) X \sim U(a, b) X∼U(a,b),定义 Y = X 2 Y = X^2 Y=X2,则
[ f Y ( y ) = ∣ d d y y ∣ f X ( y ) + ∣ d d y ( − y ) ∣ f X ( − y ) = 1 2 y ⋅ 1 b − a + 1 2 y ⋅ 1 b − a = 1 ( b − a ) y ] [ f_Y(y) = \left| \frac{d}{dy} \sqrt{y} \right| f_X(\sqrt{y}) + \left| \frac{d}{dy} (-\sqrt{y}) \right| f_X(-\sqrt{y}) = \frac{1}{2\sqrt{y}} \cdot \frac{1}{b - a} + \frac{1}{2\sqrt{y}} \cdot \frac{1}{b - a} = \frac{1}{(b - a)\sqrt{y}} ] [fY(y)= dydy fX(y)+ dyd(−y) fX(−y)=2y1⋅b−a1+2y1⋅b−a1=(b−a)y1]
适用于 y ∈ [ a 2 , b 2 ] y \in [a^2, b^2] y∈[a2,b2]。
结尾
サムライハート:链接是QQ音乐银魂(Gintama)202集片头曲武士之心。🛏