泊松分布
简介
泊松分布常用于理解在预定时间段内连续发生的各种事件。泊松分布是一个离散函数,因此变量只能取自一个(可能是无限的)数字列表。泊松分布用于数学中的概率和统计概念。它是一个离散概率分布,用于概率论和统计学,以表达在给定时间段内发生给定数量事件的可能性,而不管自上次结果以来经过了多少时间。
定义
离散泊松分布确定了在特定时间段内发生特定数量事件的概率。
金融专业人士可以使用泊松分布来模拟新的买入或卖出订单进入市场,以及预期订单到达特定交易场所或暗池的情况。
在这些情况下,泊松分布预测了预期订单到达率周围的置信区间。
在算法交易和智能订单路由器中,泊松分布特别有用。
公式
泊松分布公式用于计算事件在特定时间段内独立、离散地发生的可能性,其中平均发生率随时间保持恒定。当存在许多潜在结果时,使用泊松分布公式。假设 X 是一个具有泊松分布的离散随机变量,并且是值的平均速率,则 X 的概率表示如下。
$$\mathrm{f(x)\:=\:P(X\:=\:x)\:=\:\frac{e^{-\lambda\:}\:\lambda\:^{x}}{x!}}$$
其中
$$\mathrm{x\:=\:0\:,\:1\:,\:2\:,\:3\:.....}$$
𝑒 是欧拉数
𝜆 是预期值的平均速率,并且 $\mathrm{\lambda\:=\:方差\:,\:\lambda\:>\:0}$
表格
下表显示了平均值为 𝜆 的泊松随机变量 𝑋 小于或等于 𝑥 的概率。因此,该表提供了
𝜆 = | 0.1 | 0.2 | 0.3 | 0.4 | 0.5 | 0.6 | 0.7 | 0.8 | 0.9 | 1.0 |
𝑥 = 0 | 0.904 8 |
0.818 7 |
0.740 8 |
0.670 3 |
0.606 5 |
0.548 8 |
0.496 6 |
0.449 3 |
0.406 6 |
0.367 9 |
1 | 0.995 3 |
0.982 5 |
0.963 1 |
0.938 4 |
0.909 8 |
0.878 1 |
0.844 2 |
0.808 8 |
0.772 5 |
0.735 8 |
2 | 0.999 8 |
0.998 9 |
0.996 4 |
0.992 1 |
0.985 6 |
0.976 9 |
0.965 9 |
0.952 6 |
0.937 1 |
0.919 7 |
3 | 1.000 0 |
0.999 9 |
0.999 7 |
0.999 2 |
0.998 2 |
0.996 6 |
0.994 2 |
0.990 9 |
0.986 5 |
0.981 0 |
4 | 1.000 0 |
1.000 0 |
1.000 0 |
0.999 9 |
0.999 8 |
0.999 6 |
0.999 2 |
0.998 6 |
0.997 7 |
0.996 3 |
5 | 1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
0.999 9 |
0.999 8 |
0.999 7 |
0.999 4 |
6 | 1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
0.999 9 |
7 | 1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
8 | 1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
9 | 1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
1.000 0 |
均值和方差
考虑一个泊松实验,其中在范围内成功的平均次数被选为 𝜆。在泊松分布中,𝑒 是常数,大约等于 2.71828,表示分布的均值。以下是泊松概率 -
$$\mathrm{P(X\:,\:\lambda)\:=\:\frac{e^{-\lambda\:}\:\lambda\:^{x}}{x!}}$$
泊松分布的均值由方程 $\mathrm{E(x)\:=\:\lambda}$ 表示。泊松分布的均值和方差相同。因此,$\mathrm{E(x)\:=\:V(x)\:.\:Where\:,\:the\:variance\:is\:V(x)}$
泊松分布期望值
如果将 𝜆 视为分布的期望值,则称随机变量具有参数 𝜆 的泊松分布。泊松分布的期望值表示如下 -
$\mathrm{E(x)\:=\:\mu\:=\:\frac{d(e^{\lambda\:(t\:-\:1)})}{dt}\:,\:at\:t\:=\:1}$
$$\mathrm{E(x)\:=\lambda}$$
因此,泊松分布的期望值(均值)和方差都等于 $\mathrm{\lambda}$
示例
1. 一家汽车拖车公司平均每天(每 24 小时)接到 30 个电话。在确定每小时的平均电话次数后,找出在随机选择的时段内将会有三个电话的可能性。
解决方案 -
已知汽车拖车公司平均每天(每 24 小时)接到 30 个电话。
因此,汽车拖车服务通常在给定的时间内接到 $\mathrm{\frac{30}{24}\:=\:1.25}$ 个电话。
可以使用泊松分布确定在特定时间范围内最有可能发生的事件实例数。
因此,X 服从均值为 1.25 的泊松分布。
在随机选择的时段内将会有两个电话的可能性如下 -
$$\mathrm{P(x\:=\:3)\:=\frac{e^{-1.25(1.25)^{3}}}{3!}\:=\:\frac{1.953125}{6\:\times\:3.490}\:=\:\frac{1.953125}{20.94}\:=\:0.09327\:=\:0.09}$$
随机变量 𝑋 服从参数为 𝜆 的泊松分布,使得 $\mathrm{P(X\:=\:3)\:=\:0.1P(X\:=\:4)}$ 找到 $\mathrm{P(X\:=\:1)}$
解决方案 -
我们知道 $\mathrm{P(X\:=\:x)\:=\:\frac{e^{\lambda}\lambda^{x}}{x!}}$
$$\mathrm{P(X\:=\:3)\:=\:0.1P(X\:=\:4)}$$
$$\mathrm{\frac{e^{-\lambda}\lambda^{3}}{3!}\:=\:0.1\:\times\:\frac{e^{-\lambda}\lambda^{4}}{4!}}$$
$$\mathrm{4\:=\:0.1\:\times\:\lambda}$$
$$\mathrm{\lambda\:=\:40}$$
$$\mathrm{P(X\:=\:1)\:=\:\frac{e^{-40}40^{2}}{0!}\:=\:1600e^{-40}}$$
常见问题
1. 使用泊松分布时,考虑哪种类型的数据?
法国数学家西美翁·丹尼斯·泊松以他的名字命名了泊松分布,以描述在“X”时间段内事件发生的频率。当感兴趣的变量是离散计数变量时,使用泊松分布。
2. 泊松是离散的还是连续的?
称为泊松分布的离散分布计算了在特定时间范围内发生一定数量事件的可能性。
3. 什么是泊松 λ?
在泊松分布公式中,希腊字母 λ 表示特定时间段或空间内事件的平均数量。
4. 泊松分布可能是正偏态还是负偏态?
但是,对于较小的均值和较高的均值的对称性,泊松分布和负二项分布都是正偏态的。您的数据是负偏态且均值较高。
5. 泊松分布:它是正确偏态的吗?
泊松分布始终向右偏斜,因为它是不对称的。考虑到它在左侧受到零出现障碍的限制(不存在“负一”拍),而在另一侧不受限制。随着它的增长,图形看起来更像正态分布
6. 泊松分布与高斯分布有什么区别?
由于其离散结构,泊松分布取 0、1、2、3 等的值,但高斯函数在所有可能的值中连续变化,甚至如果均值较小则小于零的值。