离散鞅引论

4.1 鞅的定义与例子

4.1.1 定义与基本性质

约定

  1. 用 a.e. (almost everywhere) 表示命题几乎处处成立, 即不成立的点的测度为 0

  2. 用 a.s. (almost sure) 表示命题以概率 1 成立.

定义 随机过程 {Xn,n0}, 如果对于 n0, 有

  1. E|Xn|<.

  2. E(Xn+1X0,X1,,Xn)=Xn, a.s..

定义 设有二过程 {Xn,n0}{Yn,n0}, 称前者关于后者是鞅, 如果

  1. E|Xn|<.

  2. E(Xn+1Y0,Y1,,Yn)=Xn, a.s..

备注

  1. Xn=E(Xn+1Y0,,Yn) 作为 (Y0,,Yn) 的函数, 在给定 (Y0,,Yn) 时是定值, 因此 E(XnY0,,Yn)=Xn.

  2. 于是有 E(Xn+1)=E[E(Xn+1Y0,,Yn)]=E(Xn)=E(X0).

4.1.2 鞅的典型例子

例 1 (i.i.d. r.v. 之和) Y0=0,{Yn,n1} 独立同分布, EYn=0,E|Yn|<, 令 X0=0, 记 Xn=i=1nYi, 则 {Xn,n0} 关于 {Yn,n0} 是鞅.

证明

例 2 (和的方差) Y0=0,{Yn,n1} 独立同分布, EYn=0,EYn2=σ2, X0=0,Xn=(k=1nYk)2nσ2, 则 {Xn,n0} 关于 {Yn,n0} 是鞅.

证明

例 3 (一般和) {Yn,n0} 为随机序列, Zi=gi(Y0,,Yi), 函数 f 满足 E[f(Zk)]<, 有界实函数 ak(y0,,yk1) 满足 |ak|Ak, 约定 E[f(Z0)Y1]=E[f(Z0)], 则

{Xn=k=0n(f(Zk)E[f(Zk)Y0,,Yk1])ak(Y0,,Yk1),n0}

关于 {Yn,n0} 是鞅.

证明

例 4 (马氏链导出的鞅)

例 5 (转移概率特征向量导出的鞅)

例 6 (分支过程构成的鞅)

例 7 (Wald 鞅)

例 8 (似然比构成的鞅)

例 9 (Doob 鞅过程)

例 10 (随机 Radon-Nikodym 导数构成的鞅)

 

4.2 上下鞅与分解定理

4.2.1 定义与例子

约定

  1. x=min(x,0).

  2. x+=max(x,0).

定义 若随机过程 {Xn,n0}{Yn,n0} 满足

  1. E(Xn)>.

  2. E(Xn+1Y0,,Yn)Xn.

  3. XnY0,,Yn 的函数.

则称 {Xn,n0} 关于 {Yn,n0}上鞅.

定义 若随机过程 {Xn,n0}{Yn,n0} 满足

  1. E(Xn+)<+.

  2. E(Xn+1Y0,,Yn)Xn.

  3. XnY0,,Yn 的函数.

则称 {Xn,n0} 关于 {Yn,n0}下鞅.

备注 由于 XnY0,,Yn 的函数, 对于上下鞅均有 Xn=E(XnY0,,Yn).

例 1 {Yn,n0} 是马氏链, P=(pij), fP 的有界 右超正则函数, 即

  1. jSpijf(j)f(i).

  2. |f(i)|M.

{Xn=f(Yn),n0} 关于 {Yn,n0} 是上鞅.

证明

4.2.2 上下鞅的性质

引理 1 (Jensen 不等式) ϕ 是下凸函数, X 是随机变量, 则

E[ϕ(X)]ϕ(EX).

引理 2 如果 {Xn,n0} 关于 {Yn,n0} 是鞅, ϕ 是下凸函数, 且 nN:E[ϕ(Xn)+]<, 则 {ϕ(Xn),n0} 关于 {Yn,n0} 是一个下鞅.

证明

推论 {Xn,n0} 关于 {Yn,n0} 是鞅, 且 E(Xn2)<, 则 {|Xn|,n0}{Xn2,n0} 关于 {Yn,n0} 是下鞅.

证明

性质 1 {Xn,n0} 关于 {Yn,n0} 是 (上) 鞅, 则

kN:E(Xn+kY0,,Yn)()=Xn.
证明

性质 2 {Xn,n0} 关于 {Yn,n0} 是 (上) 鞅, 则对 0kn

E(Xn)()=E(Xk)()=E(X0).
证明

性质 3 {Xn,n0} 关于 {Yn,n0} 是 (上) 鞅, g=g(Y0,,Yn)0, 则

k0:E[g(Y0,,Yn)Xn+kY0,,Yn]()=g(Y0,,Yn)Xn.
证明

4.2.3 上下鞅分解定理

定理 4.2.1 {Xn,n0} 关于 {Yn,n0} 是下鞅, 则唯一存在过程 {Mn,n1}{Zn,n1}, 使得

  1. {Mn,n1} 关于 {Yn,n1} 是鞅.

  2. Zn=Zn(Y1,,Yn1), 且 Z1=0,ZnZn+1,EZn<+.

  3. nN+:Xn=Mn+Zn .

证明

推论 {Xn,n1} 关于 {Yn,n1} 是上鞅, 则唯一存在过程 {Mn,n1}{Zn,n1}, 使得

  1. {Mn,n1} 关于 {Yn,n1} 是鞅.

  2. Zn=Zn(Y1,,Yn1), 且 Z1=0,ZnZn+1,EZn<+.

  3. nN+:Xn=MnZn .

4.2.4 序贯决策模型

定义 记状态空间 S={1,2,,p} 有限, 行动集 (或 决策空间) A={a,b,,l} 有限, 每经单位时间观察即使的系统状态 i, 然后从 A 中选取一个行动 a, 并

  1. 得到一个报酬 (或能量) r(i,a).

  2. 在现时段状态为 i 且采取行动为 a 的条件下, 系统下一时刻转移到状态 j 的概率为 q(ji,a).

于是该可控随机动态系统称为 序贯决策模型.

定义

  1. YkΔk 分别表示 k 时段系统的状态和采取的行动.

  2. hn1={i0,a0,i1,a1,,in1,an1} 称为 n1 之前的 历史.

  3. an=πn(hn1,in), 其中 πn 称为 n 时刻的 决策函数.

  4. 决策函数序列 π={π0,π1,,πN1} 称为一个 决策.

  5. 期望总报酬 V(π,i)=Eπ{k=0N1r(Yk,Δk)Y0=i}.

  6. 最优策略 π:iS:V(π,i)=maxπV(π,i).

  7. Vk(i)={0,k=N,iS,maxaA{r(i,a)+jSq(ji,a)Vk+1(j)},1k<N,iS.

  8. Xn=k=1n{Vk(Yk)E[Vk(Yk)Y0,Δ0,,Yk1,Δk1]}.

问题 序贯决策模型的最优决策.

4.1.2 例 3 (一般和){Xn,n1} 关于 {(Yn,Δn),n0} 是鞅, 于是

EXn=EX1=0,

并且

iS,aA:Vk1(i)r(i,a)+jSq(ji,a)Vk(j),

从而由马氏性得

Vk1(Yk1)r(Yk1,Δk1)+jSq(jYk1,Δk1)Vk(j)=r(Yk1,Δk1)+E{Vk(Yk)Yk1,Δk1}r(Yk1,Δk1)+E{Vk(Yk)Y0,Δ0,,Yk1,Δ(k1)},

根据此不等式, 于是有

0=EXN=E{k=1N[Vk(Yk)E(Vk(Yk)Y0,Δ0,,Yk1,Δk1)]}E{k=1N[Vk(Yk)+r(Yk1,Δk1)Vk1(Yk1)]}=E{k=0N1r(Yk,Δk)+VN(YN)V0(Y0)},

E(V0(Y0))E{k=0N1r(Yk,Δk)+VN(YN)}Eπ{k=0N1r(Yk,Δk)Y0},

Y0=i, 则有

π,iS:V0(i)Eπ{k=0N1r(Yk,Δk)Y0=i}=V(π,i),

若选取 ak1A, 使得 ak1(i)=πk1(i0,a0,,ik1) 满足上述第 7 点定义, 即

iS:Vk1(i)=r(i,ak1(i))+jSq(ji,ak1(i))Vk(j)=maxa{r(i,a)+jq(ji,a)Vk(j)},

π={π0,π1,,πN1} 是最优策略.

 

4.3 停时与停时定理

4.3.1 严谨定义与例子

记号

  1. σ(X) 为由 X 生成的事件 σ 域.

  2. Fn=σ(Yk,0kn).

定义 设随机变量 TN{+}, 随机序列 {Yn,n0}, 且 Fn=σ(Yk,0kn), 若对 n0, 有 {T=n}Fn, 则称 T{Yn,n0}停时 (stopping time) (或马氏时间).

例子

4.3.2 鞅的期望与停时

引理 1 {Xn,n0}{Yn,n0} 的 (上) 鞅, T 是关于 {Yn,n0} 的停时, 则

nk:E(XnI{T=k})()=E(XkI{T=k}).
证明

引理 2 {Xn,n0}{Yn,n0} 的 (上) 鞅, T 是关于 {Yn,n0} 的停时, 则

n1:EX0()=EXTn()=EXn.
证明

引理 3 设随机变量 X 满足 E|X|<, T 是关于 {Yn,n0} 的停时, 且 P(T<)=1, 则

limnE(XI{T>n})=0,limnE(XI{Tn})=EX.
证明

定理 4.3.1 {Xn,n0} 是鞅, T 是停时, 若 P{T<}=1, 且 E(supn0|XTn|)<, 则 EXT=EX0.

证明

推论 {Xn,n0} 是鞅, T 是停时, 且 ET<. 若

b<,n<T:E(|Xn+1Xn|Y0,,Yn)b,

EX0=EXT.

证明

4.3.3 停时定理与推论

定理 4.3.2 (停时定理) {Xn,n0} 是鞅, T 是停时, 若

  1. P(T<)=1.

  2. E|XT|<.

  3. limnE|XnI{T>n}|=0.

EXT=EX0.

证明

推论 1 {Xn,n0} 是鞅, T 是停时, 若

  1. P{T<}=1.

  2. k<,n0:E(XTn2)k.

EXT=EX0.

证明

推论 2

  1. Y0=0, {Yk,k1} 独立同分布.

  2. EYk=μ,DYk=σ2<.

  3. S0=0,Sn=k=1nYk,Xn=Snnμ.

  4. T 为停时, ET<.

E|XT|<, 且 EXT=ESTμET=0.

证明

4.3.4 停时与随机游动

记号

  1. Y0=0,{Yk,k1} 独立同分布, 且

    P{Yk=1}=p0, P{Yk=1}=q=1p0.

  2. X0=0,Xn=k=1nYk.

  3. T0j=min{n:X0=0,Xn=j}.

  4. T=min{n:(Xn=a)(Xn=b)},bN+,aZN.

  5. Tab=min{n:X0=0,Xlb,1ln1,Xn=a}.

  6. Va=P{Tab<X0=0} 表示从 0 出发先到达 a 的概率.

    于是 P{Tba<X0=0}=1Va.

实例 设甲乙两人赌博, |a| 表示甲原有的资金 (注意 a 为负数), Yn 表示甲第 n 次得到的钱, b 表示乙原有的资金, Va 表示甲先输光的概率.

情况 1 p=q=12 时, 即公平赌博时,

  1. 甲先输光的概率为 Va=b|a|+b,

  2. 任何一方输光的平均时间为 ET=|a|b.

证明

情况 2 μ=pq>0 时, 即不公平赌博时,

  1. 甲先输光的概率为 Va=1(qp)b(qp)a(qp)b.

  2. 任何一方输光的平均时间为 ET=ab+b(qp)aa(qp)b(pq)[(qp)a(qp)b].

证明

 

4.4 鞅收敛定理

4.4.1 上穿不等式

引理 1 {Xn,n0} 关于 {Yn,n0} 是下鞅, S, T 关于 {Yn} 是停时, 且 0STN, 则

EXSEXT.
证明

定义 {Xn} 是随机序列, 令

  1. V(n)(a,b)(ω){X0(ω),X1(ω),,Xn(ω)} 向上穿越 (a,b) 的次数.

  2. 若干次首达 (,a][b,+) 的时间为

αm={0,m=0,min{n:nαm1,Xna},m=2k1,kN+,min{n:n>αm1,Xnb},m=2k,kN+.
  1. a+a0max(a,0).

备注 V(n)(a,b)(ω)=kkN+:α2kn<α2k+2.

引理 2 (上穿不等式) {Xn,n0} 关于 {Yn,n0} 是下鞅, 则

E[V(n)(a,b)]E[(Xna)+]E[(X0a)+]baE(Xn+)+|a|ba.
证明

 

推论 {Xn,n0} 关于 {Yn,n0} 是上鞅, V(n)(a,b)Xn 下穿 (a,b) 的次数, 则

E[V(n)(a,b)]E(bX0)E(Xnb)ba,

如果 Xn0,0a<b, 则

E[V(n)(a,b)]bba.

4.4.2 鞅收敛定理

定理 4.4.1 {Xn,n0} 是一个下鞅, 且 supnE|Xn|<, 则存在一随机变量 X, 使得 {Xn} 以概率 1 收敛于 X, 即

P{limnXn=X}=1,

E|X|<.

证明

4.4.3 最大值不等式

引理 1 (Kolmogorov 不等式) {Xn} 独立且 iN:E|Xi|<+, 令 Sn=i=1nXi, 则

ε>0:P{max1kn|SkESk|ε}DSnε2.

证明

推论 1 (Chebyshev 不等式) EX2<+, 则

ε>0:P{|XEX|ε}DXε2.

推论 2 (最大值不等式) {Yn,n0} 独立同分布, 且 EYi=0,EYi2=σ2 (i0), X0=0,Xn=i=1nYi, 则

ε>0:P{max0kn|Xk|>ε}nσ2ε2.

4.4.4 另一收敛定理

引理 2 {Xn0,n0} 是下鞅, 则

λ>0:λP{max0knXk>λ}EXn.
证明

推论 1 (Markov 不等式) Y0, 则

ε>0:P{Xε}EXε.

推论 2 {Xn,n0} 是鞅, 则

λ>0:λP{max0kn|Xk|>λ}E|Xn|.
证明

定理 4.4.2 {Xn} 关于 {Yn} 是鞅, 且 k,nN:EXn2k<, 则存在一有限随机变量 X, 使得

  1. P{limnXn=X}=1.

  2. limnE|XnX|2=0.

  3. nN:EXn=EX.

证明 略.

 

4.5 连续参数鞅

定义 {X(t),t0} 是一随机过程, 记 Ft=σ(X(s),0st), 若满足下述条件

  1. t0:E|X(t)|<.

  2. s,t0:E[X(t+s)Ft]=X(t), a.s..

  3. t0:X(t) 关于 F 是可测的. (参考笔记).

则过程 {X(t),t0} 称为 .

定义 (离散化等价定义) 随机过程 {X(t),t0} 称为 , 如果满足

  1. t0:E|X(t)|<.

  2. 0t0<<tn+1:E[X(tn+1)X(t1),,X(tn)]=X(tn), a.s..

备注 连续参数的上下鞅类似定义.

定义 设随机序列 {X(t),t0} 和非负随机变量 T, 记 Ft=σ(X(s),0st), 若

t0:{Tt}Ft,

则称 T{X(t),t0}停时.

定理 4.5.1 (停时定理) {X(t),t0} 是鞅, T 是停时, 若

  1. P{T<}=1.

  2. E(supt0|X(Tt)|)<.

EX(T)=EX(0).

证明