微商小程序制作_云南网站设计_潍坊网站收录_seo建站网络公司

文章目录

1. 序列模型

序列信息是带顺序的数据。
循环神经网络可以更好地处理序列信息。它通过引入状态变量存储过去的信息和当前的输入，从而可以确定当前的输出。

1. 序列模型

问题模型：根据历史值 $x_{t-1},\dots,x_1$ 预测 $x_t$ 的值，即
$x_t\sim P(x_t|x_{t-1},\dots,x_1)$
为了实现这个预测，可以使用回归模型。但存在一个主要问题：输入数据( $x_{t-1},\dots,x_1$ )的数量与 $t$ 有关，即输入数据的数量随着数据量的增加而增加。有以下2种策略可以进行近似处理：
- 自回归模型：假设在现实情况下相当长的序列 $x_{t-1},\dots,x_1$ 是不必要的，我们只需要满足某个长度为 $\tau$ 的时间跨度，即使用观测序列 $x_{t-1},\dots,x_{t-\tau}$ 。这样获得的最直接的好处就是参数的数量总是不变的。
- 隐变量自回归模型：保留一些对过去观测的总结 $h_{t-1}$ ，并且同时更新预测 $\hat{x}_t$ 和总结 $h_{t}$ ，即
  $\hat{x}_t=P(x_t|h_t),~~~h_t=g(h_{t-1},x_{t-1})$
如何生成训练数据？经典方法是使用历史观测来预测下一个未来观测。这种方法基于以下假设：虽然特定值 $x_t$ 可能会改变，但是序列产生逻辑不变。即
$P(x_1,\dots,x_T)=\prod_{t=1}^T P(x_t|x_{t-1},\dots,x_1)$
这种假设是合理的，因为新的序列产生逻辑一定受新的数据影响，而我们不可能用目前所掌握的数据来预测新的序列产生逻辑。
如果使用 $x_{t-1},\dots,x_{t-\tau}$ 来估计 $x_t$ 是近似精确的，则称序列满足马尔可夫条件。特别地，如果 $\tau=1$ ，得到一个 一阶马尔可夫模型
$P(x_1,\dots,x_T)=\prod_{t=1}^T P(x_t|x_{t-1}),P(x_1|x_0)=P(x_1)$
当假设 $x_t$ 仅是离散值时，可以使用动态规划沿着马尔可夫链精确地计算结果，简而言之，可以利用临近值的概率求解跨距离值的概率，由此我们只需要考虑历史临近值。比如
$\begin{aligned} P(x_{t+1}|x_{t-1})&=\frac{\sum_{x_t}P(x_{t+1},x_t,x_{t-1})}{P(x_{t-1})}\\ &=\frac{\sum_{x_t}P(x_{t+1}|x_t,x_{t-1})P(x_t,x_{t-1})}{P(x_{t-1})}\\ &=\frac{\sum_{x_t}P(x_{t+1}|x_t)P(x_t,x_{t-1})}{P(x_{t-1})}(马尔可夫条件)\\ &=\sum_{x_t}P(x_{t+1}|x_t)P(x_t|x_{t-1}) \end{aligned}$
在许多情况下，序列数据存在一个自然的方向，在时间上是前进的，未来的事件不能影响过去，因而序列数据具有因果性。
下一时间步的预测称为单步预测，下 $k$ 时间步的预测称为k步预测。k步预测必须使用我们自己的预测（而不是原始数据）来进行，由于预测错误累积，可能会相当快地偏离真实的观测结果。因此当我们试图预测更远的未来时，一旦超过某个跨度，任何预测几乎都是无用的。

微商小程序制作_云南网站设计_潍坊网站收录_seo建站网络公司

文章目录

1. 序列模型

最新新闻

热搜词