随机过程在数据科学和深度学习中有哪些应用？

作者：雷锋字幕组时间：2019-08-20来源：雷锋网收藏

编者按：机器学习的主要应用之一是对随机过程建模。

隐马尔科夫模型

本文引用地址：http://www.eepw.com.cn/article/201908/403911.htm

隐马尔可夫模型都是关于认识序列信号的。它们在数据科学领域有大量应用，例如：

●计算生物学。

●写作/语音识别。

●自然语言处理(NLP)。

●强化学习

HMMs是一种概率图形模型，用于从一组可观察状态预测隐藏（未知）状态序列。

这类模型遵循马尔可夫过程假设：

“鉴于我们知道现在，所以未来是独立于过去的"

因此，在处理隐马尔可夫模型时，我们只需要知道我们的当前状态，以便预测下一个状态(我们不需要任何关于前一个状态的信息)。

要使用HMMs进行预测，我们只需要计算隐藏状态的联合概率，然后选择产生最高概率(最有可能发生)的序列。

为了计算联合概率，我们需要以下三种信息：

●初始状态：任意一个隐藏状态下开始序列的初始概率。

●转移概率：从一个隐藏状态转移到另一个隐藏状态的概率。

●发射概率：从隐藏状态移动到观测状态的概率

举个简单的例子，假设我们正试图根据一群人的穿着来预测明天的天气是什么（图5）。

在这种例子中，不同类型的天气将成为我们的隐藏状态。晴天刮风下雨和穿的衣服类型将是我们可以观察到的状态（如，t恤、长裤和夹克）。初始状态是这个序列的起点。转换概率，表示的是从一种天气转换到另一种天气的可能性。最后，发射概率是根据前一天的天气，某人穿某件衣服的概率。

图5：隐马尔可夫模型示例^[6]

使用隐马尔可夫模型的一个主要问题是，随着状态数的增加，概率和可能状态的数量呈指数增长。为了解决这个问题，可以使用维特比算法。

如果您对使用HMMs和生物学中的Viterbi算法的实际代码示例感兴趣，可以在我的Github代码库中找到它。

从机器学习的角度来看，观察值组成了我们的训练数据，隐藏状态的数量组成了我们要调优的超参数。

机器学习中HMMs最常见的应用之一是agent-based情景，如强化学习（图6）。

图6：强化学习^[7]中的HMMs

高斯过程

高斯过程是一类完全依赖自协方差函数的平稳零均值随机过程。这类模型可用于回归和分类任务。

高斯过程最大的优点之一是，它们可以提供关于不确定性的估计，例如，给我们一个算法确定某个项是否属于某个类的确定性估计。

为了处理嵌入一定程度上的不确定性的情况，通常使用概率分布。

一个离散概率分布的简单例子是掷骰子。

想象一下，现在你的一个朋友挑战你掷骰子，你掷了50个trows。在掷骰子公平的情况下，我们期望6个面中每个面出现的概率相同（各为1/6）。如图7所示。

图7：掷骰子公平的概率分布

无论如何，你玩得越多，你就越可以看到到骰子总是落在相同的面上。此时，您开始考虑骰子可能是不公平的，因此您改变了关于概率分布的最初信念（图8）。

图8：不公平骰子的概率分布

这个过程被称为贝叶斯推理。

贝叶斯推理是我们在获得新证据的基础上更新自己对世界的认知的过程。

我们从一个先前的信念开始，一旦我们用全新的信息更新它，我们就构建了一个后验信念。这种推理同样适用于离散分布和连续分布。

因此，高斯过程允许我们描述概率分布，一旦我们收集到新的训练数据，我们就可以使用贝叶斯法则（图9）更新分布。

图9：贝叶斯法则^[8]

自回归移动平均过程

自回归移动平均(ARMA)过程是一类非常重要的分析时间序列的随机过程。ARMA模型的特点是它们的自协方差函数只依赖于有限数量的未知参数(对于高斯过程是不可能的)。

缩略词ARMA可以分为两个主要部分：

●自回归=模型利用了预先定义的滞后观测值与当前滞后观测值之间的联系。

●移动平均=模型利用了残差与观测值之间的关系。

ARMA模型利用两个主要参数(p, q)，分别为：

●p=滞后观测次数。

●q=移动平均窗口的大小。

ARMA过程假设一个时间序列在一个常数均值附近均匀波动。如果我们试图分析一个不遵循这种模式的时间序列，那么这个序列将需要被差分，直到分割后的序列具有平稳性。

参考文献

[1] M C Escher, “Smaller and Smaller” — 1956. https://www.etsy.com/listing/288848445/m-c-escher-print-escher-art-smaller-and

[2] 机器学习中大数定律的简要介绍。Machine Learning Mastery, Jason Brownlee. https://machinelearningmastery.com/a-gentle-introduction-to-the-law-of-large-numbers-in-machine-learning/

[3] 正态分布，二项分布，泊松分布 , Make Me Analyst. http://makemeanalyst.com/wp-content/uploads/2017/05/Poisson-Distribution-Formula.png

[4] 通用维基百科. Accessed at: https://commons.wikimedia.org/wiki/File:Random_walk_25000.gif

[5] 数轴是什么?Mathematics Monste. https://www.mathematics-monster.com/lessons/number_line.html

[6] 机器学习算法: SD (σ)- 贝叶斯算法. Sagi Shaier, Medium. https://towardsdatascience.com/ml-algorithms-one-sd-%CF%83-bayesian-algorithms-b59785da792a

[7] DeepMind的人工智能正在自学跑酷，结果非常令人惊讶。The Verge, James Vincent. https://www.theverge.com/tldr/2017/7/10/15946542/deepmind-parkour-agent-reinforcement-learning

[8] 为数据科学专业人员写的强大的贝叶斯定理介绍。KHYATI MAHENDRU, Analytics Vidhya. Accessed at: https://www.analyticsvidhya.com/blog/2019/06/introduction-powerful-bayes-theorem-data-science/

via https://towardsdatascience.com/stochastic-processes-analysis-f0a116999e4

本文转自雷锋网，如需转载请至雷锋网官网申请授权。

原文章地址为随机过程在数据科学和深度学习中有哪些应用？