马尔科夫链

3.1 马氏链的概念

3.1.1 马尔科夫链的定义

定义 随机序列 {Xn,n0} 若满足

i0,i1,,in,in+1S=N+,nN,P{X0=i0,X1=i1,,Xn=in}>0:
P{Xn+1=in+1X0=i0,,Xn=in}=P{Xn+1=in+1Xn=in}.

则称为 马尔科夫链 (M.C., Markov, Chains), 且上述性质称为马尔可夫性或无后效性.

定义 对于 i,jS, 称 P{Xn+1=jXn=i}pij(n)n 时刻的 一步转移概率. 若还有 pij(n)pij, 则称 {Xn,n0}齐次马氏链. 记 P=(pij) 为一步概率转移矩阵, 简称 转移矩阵 (Transition matrix).

3.1.1 独立随机变量和的序列

iN 时, 令 ai0, 其它情况下均为零, 且 i=0ai=1.

设独立同分布随机变量序列 {ρnN,n0} 满足 P{ρn=i}=ai, 则其为马氏链.

X0=0, Xn=k=1nρk, 则 {Xn,n0} 也是一马氏链, 且 pij=aji.

3.1.2 直线上的随机游动

1 无限制的随机游动

X0=0, 且 XnXn1 相互独立, 并满足

XnXn1110Ppqr

{Xn,n0} 是一个马氏链.

状态的分类见第三节.

2 带吸收壁的随机游动

在无限制的随机游动基础上, 修改条件 p00=pbb=1, 则为带两个吸收壁 0b 的随机游动, 是一有限状态马氏链.

3 带反射壁的随机游动

在无限制的随机游动基础上, 修改条件 p01=pb,b1=1, 则为带反射壁 0b 的随机游动.

4 艾伦费斯特模型

S={a,a+1,,1,0,1,,a}, 转移概率为

{pi,i1=12(1+ia),a+1ia1,pi,i+1=12(1ia),a+1ia1,pa,a1=1,pa,a+1=1,pij=0.

3.1.3 排队模型

1 离散排队系统

设独立同分布随机变量序列 {ξnN,n1} 表示第 n 个周期到达的顾客数, 服务台每个周期完成一个顾客的服务. 记第 n 周期开始的顾客数为 Xn, 且 a+=max{a,0}, 则

Xn+1=(Xn1)++ξn,

{Xn,n0} 是一个马氏链. 设 P{ξn=k}=ak0, k=0ak=1, 则转移概率为

{pij=aj,i=0,1;j0,pij=aj+1i,i>1,ji1,pij=0,i>1,j<i1.
2 G/M/1 排队系统

只有一个服务员, 顾客到达服务台的时间间隔独立同分布 G(x),

服务时间 M 独立同 E(μ), 且与顾客到达过程独立. 则 (0,t] 内服务完的顾客数服从 P(μ).

Xn 表示第 n 个顾客到达服务台时系统内的顾客数, Tn 表示第 n 个顾客到达时刻, 则 {Xn,n1} 为马氏链.

A={Xn=i,Xn+1=i+1j} (0ji), 则

pi,i+1j=P{AXn=i}=0+P{AXn=i,Tn+1Tn=t}dG(t)=0+eμt(μt)jj!dG(t).

服务台由 i 个顾客转为空闲的概率, 则

pi0=0+k=i+1eμt(μt)kk!dG(t).

3.1.4 离散分支过程

设群体某一代的每个个体产生的下一代个体数为相互独立的随机变量 ξN,

P{ξ=k}=ak0,k0,k=0ak=1, 记 Xn 表示第 n 代个体的数目, 则

Xn+1={0,Xn=0,ξ1+ξ2++ξn,Xn1.

于是 {Xn,n1} 是马氏链, 且

pij=P{Xn+1=jXn=i}=P{ξ1+ξ2++ξXnXn=i}=P{ξ1+ξ2++ξi=j}=j(k=0akxk)jj!xj|x=0.

最后一步由母函数得到.

3.1.5 马尔科夫链的检验

定理 3.1.1 设随机过程 {Xn,n0} 满足

  1. 独立同分布随机变量 {ξn,n1}X0 也独立.

  2. f:S×SS,(Xn1,ξn)Xn.

{Xn,n0} 是马尔科夫链, 且 pij=P{f(i,ξ1)=j}.

证明

 

3.2 转移概率矩阵

3.2.1 随机矩阵与初始分布

定义 称矩阵 A=(aij)S×S随机矩阵, 如果

  1. i,jS:aij0,

  2. iS:jSaij=1.

定义 定义马氏链的概率分布向量为

πi(n)=P{Xn=i},π(n)=(π1(n),,πi(n)).

并称 π(0) 为马氏链的初始分布.

备注 马氏链的特性完全由它的一步转移概率矩阵 P 与初始分布向量 π(0) 决定, 且

P{X0=i0,,Xn=in}=πi0(0)pi0i1pi1i2pin1in.

定理 3.2.1

π(n+1)=π(n)P=π(0)Pn.
证明

3.2.2 CK 方程

定义 pij(m)=P{Xn+m=jXn=i}m 步转移概率, P(m)=(pij(m))m 步转移概率矩阵. 约定 pii(0)=0.

定理 3.2.2 (Chapman-Kolmogorov 方程)

P(m+n)=Pm+n=PmPn=P(m)P(n).
证明

 

3.3 状态的分类

3.3.1 状态相关定义

定义

MATLAB 马氏链分析工具_matlab asymptotics_leida_wt的博客-CSDN博客

3.3.2 吸收态的性质

定理 3.3.0 设从状态 iS 落入吸收态 kA 的概率为 qik, 则 qik 及其期望 μi 由下列方程组给出 (求和号表示方程的联立)

  1. iT:qik=pik+jTpijqjk.

  2. iT:μi=1+jTpijμj.

证明

3.3.3 可达与首达

定理 3.3.1 对于 i,jS,nN+, 有

  1. pij(n)=k=1fij(k)pjj(nk).

  2. fij(n)={kjfkj(n1)pik,n>1pij,n=1.

  3. ijfij>0.

证明

引理 1 {pii(n)}{fii(n)} 的母函数分别为 P(ρ)=n=0pii(n)ρnF(ρ)=n=0fii(n)ρn, 则

P(ρ)=11F(ρ),0ρ<1.
证明

3.3.4 常返与非常返

定理 3.3.2

  1. 状态 i 为常返态, 当且仅当 n=0pii(n)=.

  2. 状态 i 为非常返态, 当且仅当 n=0pii(n)=11fii<.

证明

备注 S(i)=n=0I{Xn=i} 表示马氏链到达 i 的次数, 于是 E[S(i)X0=i]=n=0pii(n).

推论 1 j 非常返, 则对于 iS,

  1. n=1pij(n)<.

  2. limnpij(n)=0.

证明

推论 2 j 为常返态, 则

  1. ij 时, n=1pij(n)=.

  2. ij 时, n=1pij(n)=0.

证明

3.3.5 无穷多次到达

定理 3.3.3

Sm(j)=n=mI{Xn=j},gij=P{S1(j)=+X0=i}=P{Sm+1(j)=+Xm=i},

i,jS:gij=fijI{j }.
证明

定理 3.3.4 由定理 3.3.3 即得:

  1. 状态 i 常返 gii=1.

  2. 状态 i 非常返 gii=0.

备注

3.3.6 平均到达时间

引理 设正项级数 A(z)=n=0anzn[0,1) 收敛, 则

limna1+a2++ann=limz1(1z)A(z).

备注 该引理为实分析中的结果, 由 Hardy 与 Littlewood 给出.

定理 3.3.5 {Xn,n0} 是一常返的马氏链, 即状态空间 S 是单一的常返类, 则对于 i,jS, 有

limn1n+1k=0npij(k)=1μij.
证明

方法 计算平均到达时间, 有如下思路

  1. 计算 μij 的分布, 从而求得期望.

  2. 计算 limnP(n), 从而由定理 3.3.5 和下一节的引理得到.

  3. 由递推式, 对于有 n 个元素的状态空间, 列出 n2 个方程的线性方程组.

3.3.7 平均回转时间

引理 若极限 limnan 存在, 则

limnan=limn1nk=1nan.
证明

定理 3.3.6 i 常返且周期为 d, 则

limnpii(nd)=dμi,

其中 μii 的平均回转时间. 当 μi=+ 时, 右式理解为 0.

证明

3.3.8 零常返与遍历

定理 3.3.7 i 常返, 则

  1. i 零常返, 当且仅当 limnpii(n)=0.

  2. i 为遍历, 当且仅当 limnpii(n)=1μi>0.

证明

3.3.9 相通与不可约链

性质 相通关系 '' 为等价关系, 即

  1. 自反性: ii.

  2. 对称性: ijji.

  3. 传递性: ijjkik.

定义 若一马氏链的所有状态属于同一等价类, 则称它是 不可约链.

定理 3.3.8 i 常返, 且 ij, 则 j 常返, 且 fji=1.

证明

定理 3.3.9 ij, 则

  1. ij 同为非常返, 或同为正常返, 或同为零常返.

  2. ij 同为非周期, 或有相同的周期.

证明

3.3.10 常返态等价命题

定理 3.3.10 下列命题等价:

  1. i 为常返态 (即 fii=1).

  2. P{n=1{Xn=i}X0=i}=1.

  3. P{S1(i)=+X0=i}=1.

  4. n=1pii(n)=+.

  5. E{S1(i)X0=i}=+.

证明

马氏链状态分类的总结

3.3.11 直线上随机游动

直线上年无限制的随机游动的定义.

命题 3.3.11 直线上的随机游动构成马氏链, 并且是周期为 2 的不可约链. 该马氏链中 Z 构成一个等价类, 当 p=12 时为常返类, 否则为非常返类.

证明

3.3.12 高维的随机游动

定义 X0=(0,0), 且 XnXn1 相互独立, 并满足

XnXn1(1,0)(0,1)(1,0)(0,1)P0.250.250.250.25

{Xn,n0} 称为平面上的对称随机游动. 高维对称随机游动类似定义.

命题 3.3.12 高维对称随机游动构成马氏链, 并且是周期为 2 的不可约链.

引理 3.3.13 k=0n(nk)2=(2nn).

证明

命题 3.3.13 在平面对称随机游动中, Z2 构成一个常返类.

证明

定理 3.3.14 (Polya 定理) d 维空间对称随机游动中, Zd 构成一个非常返类.

证明

 

3.4 状态空间的分解

3.4.1 闭集与不可约

定义 iCS,jC:ij, 则称 C闭集. 若 i,jC:ij, 则称该闭集 不可约.

引理 C 是闭集的充要条件为, iC,jC,nN+:pij(n)=0.

证明

定理 3.4.1 所有常返状态构成一闭集.

证明

备注 之后用 C 表示所有常返态的闭集, 用 T 表示所有非常返态的集合.

推论 不可约马氏链全为非常返态, 或全为零常返态, 或全为正常返态. (也可以由定理 3.3.9 得到)

3.4.2 常返态的分解

定理 3.4.2 C, 则存在不交闭集序列 {Cn}, 使得 C=C1C2, 且有

  1. Cn 中任两状态相通.

  2. ChCl=,hl.

其中 Cn (nN+) 均为互不相通闭集, 称为基本常返闭集.

证明

推论 状态空间 S 可分解为

S=TC=TC1C2,

其中 {Ch} 为基本常返闭集, T 不一定是闭集.

备注 若系统从某非常返状态出发, 则可能一直在非常返集 T 中运动, 也可能进入某一基本常返闭集 Ch 中并一直在其中运动.

定理 3.4.3 S 为有限集, 则 T 一定是非闭集.

证明

推论 有限不可约马氏链的状态都是常返的, 即 T=,S=C.

3.4.3 分解概率矩阵

引理 1 ChS 为闭集, 则 Ch 上的转移子矩阵 Pn(m)=(pij(m)),i,jCh 为随机矩阵.

证明

引理 2 若将转移概率矩阵分解为 S=C1C2ChTh+1Tn, 其中任一等价类中的状态可达且仅可达该等价类或前面的等价类中的状态. 于是, 转移概率矩阵可分解为

P=[P100000P200000Ph00Rh+1,1Rh+1,2Rh+1,hQh+10Rn,1Rn,2Rn,hRn,h+1Qn]=[PC0RQT].

定理 3.4.4 若转移概率矩阵按上述形式分解, 则

  1. Pl(1lh) 是局限在 Cl 上的随机矩阵.

  2. Pn=[PCn0RnQTn], 其中 R1=R, Rn=Rn1PC+QTn1R.

  3. limnQTn=0.

证明

 

3.5 Pn 的极限性态与平稳分布

3.5.1 Pn 的极限形态

欲求 limnP{Xn=i}limnπi(n), 可研究 limnpij(n).

1 j 非常返或零常返

定理 3.5.1 j 非常返或零常返, 则

iS:limnpij(n)=0.
证明

推论 1 有限马氏链没有零常返状态, 并且总存在正常返状态.

证明

推论 2 不可约的有限马氏链的状态都是正常返的.

证明

推论 3 若马氏链有一零常返态, 则必有无穷多个零常返态.

证明
2 j 为正常返态

定理 3.5.2 j 正常返, 且周期为 d, 则对于 iS,0rd1, 有

limnpij(nd+r)=fij(r)dμj,

其中 fij(r)=m=0fij(md+r),0rd1.

证明 略.

推论 1 j 遍历, 则对 iS, 有

limnpij(n)=fijμj.

推论 2 对于不可约的遍历链 (即所有状态遍历), 对 i,jS, 有

limnpij(n)=1μj.

定理 3.5.3 j 常返, 则 iS, 有

limn1nk=1npij(k)=fijμj.

备注 定理 3.5.2 的推论 1 是定理 3.5.3 的特例.

推论 如不可约马氏链的状态是常返的, 则 i,jS, 有

limn1nk=1npij(k)=1μj.

定理 3.5.4 若对于不可约的遍历链, {πi=1μi} 是方程组

xj=iSxipij

满足条件 xj0,jS,jSxj=1 的唯一解.

证明

3.5.2 平稳分布

定义 若定义在 S 上的概率分布 π={π1,π2,} 满足 π=πP, 即

πj=iSπipij,

则称为 马氏链的平稳分布 (或不变概率测度).

备注 对于一个平稳分布, 有 π=πPn.

定理 3.5.5 {Xn,n0} 是马氏链, 则其为平稳过程的充要条件是 π(0)={πi(0),iS} 是平稳分布, 即 π(0)=π(0)P.

证明

定理 3.5.6 不可约遍历链恒有唯一的平稳分布 {πi=1μi}, 且 πj=limnpij(n).

证明

定理 3.5.7 C+ 为马氏链中全体正常返态构成的集合, 于是有

  1. 不存在平稳分布 C+=.

  2. 平稳分布唯一存在 只有一个基本正常返闭集 C+.

  3. 有限状态马氏链的平稳分布总存在.

  4. 有限不可约非周期马氏链存在唯一的平稳分布.

证明

备注 由证明过程可知, 若存在 n 个基本正常返闭集, 则存在 2n1 个平稳分布.

3.5.3 limnπj(n) 的存在性

定义 jS,limnπj(n)=πj 存在, 则称 π={π1,,πj,} 为马氏链的 极限分布.

备注 limnπ(0)Pn=π, 于是 π=πP, 因此极限分布是平稳分布.

定理 3.5.8 非周期不可约链是正常返的充要条件是它存在平稳分布, 且此时平稳分布就是极限分布.

证明

备注 不可约遍历链的极限分布是平稳分布, 且当 n 充分大时,

P{Xn=j}πj=1μj.

例 1 S={1,2},P=[34145838], 求其平稳分布与极限分布 limnPn.

例 2 {Xn,n0}艾伦费斯特链, 不过 S={0,1,2,,2N}, 转移概率为

{pii=0,0i2N,pi,i+1=2Ni2N,0i2N1,pi,i1=i2N,1i2N.

求此链的 πjμj.

3.5.4 求和或积分与极限交换

定理 3.5.9 (Levy 单调收敛定理) 设行向量 π 的分量非负, 若列向量序列

{f(n)=(f1(n),f2(n),,fi(n),)T}

满足 0f(1)f(n), 且 limnf(n)=f, 则 πf=limnπf(n), 即

iSπilimnfi(n)=limniSπifi(n).

定理 3.5.10 (Fatou 定理) 设行向量 π 的分量非负, 若列向量序列 {f(n)} 满足

πlimninff(n)limninfπf(n),

limnf(n)f 存在, 则

πflimninfπf(n).

定理 3.5.11 (Lebesgue 控制收敛定理) 设行向量 π 的分量非负, 若列向量序列 {f(n)0} 满足

|f(n)|=(|f1(n)|,|f2(n)|,)T(c,c,)T,

其中 c>0 为常数, 且 limnf(n)f 存在, 则

πf=limnπf(n).

 

3.6 离散时间的 Phase-Type 分布

3.6.1 Phase-Type 分布与记号

定义 {Xn,n0} 是马氏链 (M.C.),

  1. 状态空间 S~=SS0, 其中

    1. S={1,2,,p} 为瞬时态集 (非常返态集),

    2. S0=0 为吸收态 (常返闭集).

  2. 一步转移概率矩阵 P~=[PP001], 其中

    1. P 为瞬时态集的转移矩阵,

    2. P0=(IP)e, 其中

    3. e=(1,1,,1)T.

  3. 记从瞬时态集到吸收态集的首达时间为 τ=inf{n:n>0,XnS0}.

则称 τ 的分布为 Phase-Type 分布, 简称 PH 分布.

记号

3.6.2 概率分布及其母函数

引理 若矩阵 Q 满足 limnQn=0, 则 (IQ)1 存在, 且

(IQ)1=k=0Qk.
证明

推论 {S=1,2,,m} 有限, 令 pij(0)=I{i=j}, 定义转移概率母函数 ϕij(z)=n=0pij(n)zn, 其中 |z|<1i,jS, 母函数矩阵 Φ(z)=(ϕij(z)), 则

Φ(z)=(IzP)1=I+zP+z2P2++znPn+.
证明

定理 3.6.1

  1. gk={α0,k=0,αPk1P0,k1.

  2. gk={e,k=0,Pk1P0,k1.

  3. g(λ)=α0+λα(IλP)1P0.

  4. g(λ)=e+λ(IλP)1P0.

证明

3.6.3 PH 分布的反问题

定理 3.6.2 B(k,p)=(gk,gk+1,,gk+p1)p×p 矩阵, 称之为该马氏链首达时间 τ 的条件分布向量矩阵, 则

  1. 对于 kN+, 有

gk=Pgk1,B(k,p)=PB(k1,p).
  1. rankB(0,p)=p, 则

P=B(1,p)B1(0,p),P0=(IB(1,p))B1(0,p)e.
  1. rankB(0,p)=p, 则

gk=B(1,p)B1(0,p)gk1.
证明

备注 rankB(0,p)=0, 则 τ 的条件分布向量序列和 P,P0 均由 B(1,p) 唯一确定.

3.6.4 PH 分布的性质

性质 1 τ1,τ2 为 PH 分布, 则 τ1+τ2,τ1τ2,τ1τ2 均为 PH 分布.

性质 2 若离散型随机变量 ξ 与 PH 分布 τ1,,τn 独立, 且 P{ξ=k}=pk,1kn, 则 k=1nτkI{ξ=k} 为 PH 分布.

性质 3 设 PH 分布 τ 的分布函数为 F, 则

r(0,1):n=0(1r)rn1Fn

为 PH 分布, 其中 Fn 表示 n 重卷积.

 

3.7 首达目标模型及其他模型

3.7.1 首达目标模型的定义

定义 对于定义在有限集状态空间 S 上的马氏链 {Xn,n0},

  1. HS 为目标集, H=SH 为工作集.

  2. 定义在 S 上的函数 r(i)ri(0,+) 称为系统在 i 状态的单位时段报酬 (或性能指标函数), 并规定 iH:r(i)=0.

  3. 记首达目标集的时间为

    τH={min{n:n0,XnH},{n:n0,XnH},,{n:n0,XnH}=.
  4. 记从 0 时刻和 1 时刻进入目标集之前的总报酬 (或性能指标) 为

    W0=n=0τHr(Xn),W1=n=1τHr(Xn).

    于是 W0 是定义于 {Xn,n0} 上的可加泛函, 且 W0W1 都是非负随机变量.

  5. 原点矩、分布函数、矩母函数

    μi(k)=E{W0kX0=i},k0,iH.Fi(t)=P{W0tX0=i},t0,iH.ϕi(λ)=0+eλtdFi(t),λ0,iH.ri(k)={1,k=0,l=0k1(1)k1l(kl)riklμi(l),k1.

    并令 r(k),μ(k),ϕ(λ) 分别为 ri(k),μi(k),ϕi(λ) (iH) 的列向量. 于是 ri(k)=ri.

3.7.2 总报酬的期望与方程

定理 3.7.1 P=(pij)H×H,i,jH, 则

kN+:μ(k)=r(k)+Pμ(k).
证明

定理 3.7.2 Y=(y1,y2,,yp)TH 上的未知列向量, 则 μ(k) (k1)

Y=r(k)+PY

唯一非负有界解, 且

μ(k)=n=0P(n)r(k).
证明

推论 1 μ(1)=maxi|μi(1)|, r=maxi|ri|, 则

μ(1)r.

3.7.3 首达时间的矩母函数

定义

  1. Pλ=(pijeλri),i,jH.

  2. bi(λ)=jHpijeλri.

  3. b(λ)=(b1(λ),b2(λ),,bp(λ))T.

定理 3.7.3 对于 λ0, 矩母函数 ϕ(λ) 是方程组

Y=b(λ)+PλY

唯一的非负有界解.

证明

推论 对于 λ0, 有

ϕ(λ)=n=0Pλnb(λ).
证明

3.7.4 折扣依赖于历史模型

定义 对于马氏链 X={Xn,n0},

  1. 设状态空间 S={1,2,,m} 一步转移概率矩阵为 P=(pij).

  2. 系统的性能指标为 r:SR+, 折扣因子为 β:S[0,1).

  3. β(i)=eβ(i), 其中 iS:β(i)>0.

  4. 折扣依赖于历史的可加性能泛函为

{ξk=n=kl=kn1β(Xl)r(Xn)=n=kexp(l=kn1β(Xl))r(Xn),mk(i)=E{ξ0kX0=i},mk=(mk(i),iS)T,rk(i)={r(i),k=1,l=0k1(kl)(1)k+1lrkl(i)ml(i),k2.rk=(rk(i),iS)T,pij(k)=βk(i)pij,P(k)=(pij(k))i,jS.

并约定 l=01β(Xl)=1.

3.7.5 平均报酬期望的方程

定理 3.7.4 对于 k1, 有

mk=rk+P(k)mk.
证明

推论 mk 是下列非负方程

X=rk+P(k)X

的唯一非负最小解, 且

mk=n=0Pn(k)rk.
证明

定理 3.7.5 对于上述马氏链折扣依赖于历史模型的 k 阶矩向量 mk, 必可构造一相应的首达目标模型, 使得该模型的一阶矩向量恰好等于 mk.

证明