离散鞅引论
4.1 鞅的定义与例子
4.1.1 定义与基本性质
约定
用 a.e. (almost everywhere) 表示命题几乎处处成立, 即不成立的点的测度为 0
用 a.s. (almost sure) 表示命题以概率 1 成立.
定义 随机过程 是 鞅, 如果对于 , 有
.
, a.s..
定义 设有二过程 和 , 称前者关于后者是鞅, 如果
.
, a.s..
备注
作为 的函数, 在给定 时是定值, 因此 .
于是有 .
4.1.2 鞅的典型例子
例 1 (i.i.d. r.v. 之和) 设 独立同分布, , 令 , 记 , 则 关于 是鞅.
证明
例 2 (和的方差) 设 独立同分布, , , 则 关于 是鞅.
证明
例 3 (一般和) 设 为随机序列, , 函数 满足 , 有界实函数 满足 , 约定 , 则
关于 是鞅.
证明
例 4 (马氏链导出的鞅)
例 5 (转移概率特征向量导出的鞅)
例 6 (分支过程构成的鞅)
例 7 (Wald 鞅)
例 8 (似然比构成的鞅)
例 9 (Doob 鞅过程)
例 10 (随机 Radon-Nikodym 导数构成的鞅)
4.2 上下鞅与分解定理
4.2.1 定义与例子
约定
.
.
定义 若随机过程 和 满足
.
.
是 的函数.
则称 关于 是 上鞅.
定义 若随机过程 和 满足
.
.
是 的函数.
则称 关于 是 下鞅.
备注 由于 是 的函数, 对于上下鞅均有 .
例 1 设 是马氏链, , 是 的有界 右超正则函数, 即
.
.
则 关于 是上鞅.
证明
4.2.2 上下鞅的性质
引理 1 (Jensen 不等式) 若 是下凸函数, 是随机变量, 则
引理 2 如果 关于 是鞅, 是下凸函数, 且 , 则 关于 是一个下鞅.
证明
推论 若 关于 是鞅, 且 , 则 与 关于 是下鞅.
证明
性质 1 若 关于 是 (上) 鞅, 则
证明
性质 2 若 关于 是 (上) 鞅, 则对 有
证明
性质 3 若 关于 是 (上) 鞅, , 则
证明
4.2.3 上下鞅分解定理
定理 4.2.1 若 关于 是下鞅, 则唯一存在过程 与 , 使得
关于 是鞅.
, 且 .
.
证明
推论 若 关于 是上鞅, 则唯一存在过程 与 , 使得
关于 是鞅.
, 且 .
.
4.2.4 序贯决策模型
定义 记状态空间 有限, 行动集 (或 决策空间) 有限, 每经单位时间观察即使的系统状态 , 然后从 中选取一个行动 , 并
得到一个报酬 (或能量) .
在现时段状态为 且采取行动为 的条件下, 系统下一时刻转移到状态 的概率为 .
于是该可控随机动态系统称为 序贯决策模型.
定义
和 分别表示 时段系统的状态和采取的行动.
称为 之前的 历史.
, 其中 称为 时刻的 决策函数.
决策函数序列 称为一个 决策.
期望总报酬 .
最优策略 .
.
问题 序贯决策模型的最优决策.
解
由 4.1.2 例 3 (一般和) 知 关于 是鞅, 于是
并且
从而由马氏性得
根据此不等式, 于是有
即
令 , 则有
若选取 , 使得 满足上述第 7 点定义, 即
则 是最优策略.
4.3 停时与停时定理
4.3.1 严谨定义与例子
记号
为由 生成的事件 σ 域.
.
定义 设随机变量 , 随机序列 , 且 , 若对 , 有 , 则称 是 的 停时 (stopping time) (或马氏时间).
例子
对于随机过程 , 首达时间 是停时.
对于时齐 Poisson 过程 ,
关于 不是停时.
关于 是停时.
4.3.2 鞅的期望与停时
引理 1 若 是 的 (上) 鞅, 是关于 的停时, 则
证明
引理 2 若 是 的 (上) 鞅, 是关于 的停时, 则
证明
引理 3 设随机变量 满足 , 是关于 的停时, 且 , 则
证明
定理 4.3.1 设 是鞅, 是停时, 若 , 且 , 则 .
证明
推论 设 是鞅, 是停时, 且 . 若
则 .
证明
4.3.3 停时定理与推论
定理 4.3.2 (停时定理) 设 是鞅, 是停时, 若
.
.
.
则 .
证明
推论 1 设 是鞅, 是停时, 若
.
.
则 .
证明
推论 2 若
, 独立同分布.
.
.
为停时, .
则 , 且 .
证明
4.3.4 停时与随机游动
记号
独立同分布, 且
, .
.
.
.
.
表示从 0 出发先到达 的概率.
于是 .
实例 设甲乙两人赌博, 表示甲原有的资金 (注意 为负数), 表示甲第 次得到的钱, 表示乙原有的资金, 表示甲先输光的概率.
情况 1 当 时, 即公平赌博时,
甲先输光的概率为 ,
任何一方输光的平均时间为 .
证明
情况 2 当 时, 即不公平赌博时,
甲先输光的概率为 .
任何一方输光的平均时间为 .
证明
4.4 鞅收敛定理
4.4.1 上穿不等式
引理 1 设 关于 是下鞅, , 关于 是停时, 且 , 则
证明
定义 设 是随机序列, 令
是 向上穿越 的次数.
若干次首达 和 的时间为
.
备注 .
引理 2 (上穿不等式) 设 关于 是下鞅, 则
证明
推论 若 关于 是上鞅, 是 下穿 的次数, 则
如果 , 则
4.4.2 鞅收敛定理
定理 4.4.1 设 是一个下鞅, 且 , 则存在一随机变量 , 使得 以概率 1 收敛于 , 即
且 .
证明
4.4.3 最大值不等式
引理 1 (Kolmogorov 不等式) 设 独立且 , 令 , 则
证明
推论 1 (Chebyshev 不等式) 设 , 则
推论 2 (最大值不等式) 设 独立同分布, 且 , , 则
4.4.4 另一收敛定理
引理 2 设 是下鞅, 则
证明
推论 1 (Markov 不等式) 设 , 则
推论 2 设 是鞅, 则
证明
定理 4.4.2 设 关于 是鞅, 且 , 则存在一有限随机变量 , 使得
.
.
.
证明 略.
4.5 连续参数鞅
定义 设 是一随机过程, 记 , 若满足下述条件
.
, a.s..
关于 是可测的. (参考笔记).
则过程 称为 鞅.
定义 (离散化等价定义) 随机过程 称为 鞅, 如果满足
.
, a.s..
备注 连续参数的上下鞅类似定义.
定义 设随机序列 和非负随机变量 , 记 , 若
则称 是 的 停时.
定理 4.5.1 (停时定理) 设 是鞅, 是停时, 若
.
.
则 .
证明