基础统计概念

由基础的统计知识可知:
P(X)=P(x1)P(x2x1)P(x3x1,x2)P(xTx1,xT1) P(X) = P(x_1) \cdot P(x_2 \,|\, x_1) \cdot P(x_3 \,|\, x_1,x_2) \cdot \ldots \cdot P(x_T \,|\, x_1, \ldots x_{T-1})
=P(xT)P(xT1xT)P(xT2xT1,xT)P(x1x2,,xT) = P(x_T) \cdot P(x_{T-1} \,|\, x_T) \cdot P(x_{T-2} \,|\, x_{T-1},x_T) \cdot \ldots \cdot P(x_1 \,|\, x_2, \ldots ,x_T)
其中X为x1到xn构成的序列。

马尔科夫假设

马尔科夫假设当前数据值与n个过去数据点有关,那么:
P(xtx1,,xt1)=P(xtxtn,,xt1) P(x_t \,|\, x_1, \ldots ,x_{t-1}) = P(x_t \,|\, x_{t-n}, \ldots ,x_{t-1})

马尔科夫链

马尔科夫链的核心假设是,未来状态的概率分布只依赖于当前状态,与过去状态无关。这就意味着在给定当前状态的情况下,过去状态的信息对未来状态的预测没有影响。

假设马尔可夫链有n个离散状态,可以用S = {s₁, s₂, …, sₙ}表示。
则认为:
P(Xn+1=sjX0=si0,X1=si1,,Xn=sin)=P(Xn+1=sjXn=sin) P(X_{n+1} = s_j \,|\, X_0 = s_{i0}, X_1 = s_{i1}, \ldots, X_n = s_{in}) = P(X_{n+1} = s_j \,|\, X_n = s_{in})
其中,X₀, X₁, …, Xₙ, Xₙ₊₁是马尔可夫链在不同时间步骤的状态。

潜变量模型

引入ht来表示过去信息ht = f(x1,…xt-1)
则:
xt=P(xtht) x_t = P(x_t \,|\, h_t)
则需要建立两个模型,一个为如何建立潜变量ht,还有一个为如何通过潜变量和当前状态计算下一状态。