基础统计概念
由基础的统计知识可知:
P(X)=P(x1)⋅P(x2∣x1)⋅P(x3∣x1,x2)⋅…⋅P(xT∣x1,…xT−1)
=P(xT)⋅P(xT−1∣xT)⋅P(xT−2∣xT−1,xT)⋅…⋅P(x1∣x2,…,xT)
其中X为x1到xn构成的序列。
马尔科夫假设
马尔科夫假设当前数据值与n个过去数据点有关,那么:
P(xt∣x1,…,xt−1)=P(xt∣xt−n,…,xt−1)
马尔科夫链
马尔科夫链的核心假设是,未来状态的概率分布只依赖于当前状态,与过去状态无关。这就意味着在给定当前状态的情况下,过去状态的信息对未来状态的预测没有影响。
假设马尔可夫链有n个离散状态,可以用S = {s₁, s₂, …, sₙ}表示。
则认为:
P(Xn+1=sj∣X0=si0,X1=si1,…,Xn=sin)=P(Xn+1=sj∣Xn=sin)
其中,X₀, X₁, …, Xₙ, Xₙ₊₁是马尔可夫链在不同时间步骤的状态。
潜变量模型
引入ht来表示过去信息ht = f(x1,…xt-1)
则:
xt=P(xt∣ht)
则需要建立两个模型,一个为如何建立潜变量ht,还有一个为如何通过潜变量和当前状态计算下一状态。