概统笔记附录
附录
A.1 常用积分
特殊函数的性质 伽马函数与贝塔函数.
更多内容可以参考 Euler 积分笔记.
特殊函数的应用
一般的
或或 特殊的
注意积分限
注意积分限
有关 Catalan 常数的积分.
A.2 常用分布
定义说明
期望 .
方差 .
阶原点矩 .
阶中心距 .
偏度系数 .
峰度系数 .
变异系数 .
A.2.1 一维离散型
1 二项分布
1.1 基础概念
.
理解: 事件发生的概率为 , 则重复 次试验, 事件发生的次数为 .
概率分布: .
1.2 数字特征
最可能数: .
期望: .
方差: .
母函数: .
特征函数: .
1.3 其它性质
二项分布和的函数
.
发生偶数次的概率为 .
记 , 则 , 并且
1.4 参数估计
2 泊松分布
2.1 基础概念
.
理解: 单位时间内事件平均发生 次, 则某一段单位时间内发生的次数为 .
概率分布: .
当二项分布满足 时, 用泊松分布近似效果较好.
2.2 数字特征
2.3 其它性质
泊松分布和的函数 (可加性)
.
记 , 则 , 并且 .
注: 上式可用于参数检验.
. (卡方分布函数)
若 , 则 .
若有一批零件寿命服从指数分布, 固定一个时间 , 让一个元件从时刻 0 开始工作, 每当这个元件坏了的时候马上用一个新的替换, 则到 时替换的次数 , 即 .
泊松分布的一个应用见特殊函数笔记中的 Dobinski 公式.
2.4 参数估计
矩估计
极大似然估计: .
贝叶斯估计: 见第四章第五题.
区间估计
3 超几何分布
3.1 基础概念
3.2 数字特征
3.3 其它性质
3.4 参数估计
已知 估计 .
4 负二项分布
4.1 基础概念
, 又称为正整数形式帕斯卡分布.
理解: 合格率为 , 抽取到 个合格产品时, 抽到的不合格产品的个数 .
概率分布: .
4.2 数字特征
数学期望: .
方差: .
4.3 其它性质
4.4 参数估计
注: .
矩估计: .
极大似然估计: .
贝叶斯估计: .
5 几何分布
5.1 基础概念
.
理解: 合格率为 , 抽取到第一个合格产品时, 抽到的不合格产品的个数 .
概率分布: .
累积分布函数: .
互补累积分布函数: .
5.2 数字特征
5.3 其它性质
几何分布具有无记忆性.
若 独立同分布 , 则 .
若 和 独立, 则
更一般的, 若 , 则 .
5' 几何分布
5'.1 基础概念
5'.2 数字特征
数学期望: .
方差: .
母函数
.
.
特征函数: .
5'.3 其它性质
几何分布具有无记忆性.
若 独立同分布 , 则 .
6 泽塔分布
6.1 基础概念
.
Riemann Zeta 函数: .
概率密度函数: .
6.2 数字特征
阶矩: .
对数期望: .
信息熵: .
6.3 其它性质
问题 1 (最大熵分布)
对于取值为正整数的概率分布, 求给定对数期望的条件下熵最大的分布, 即
由 Lagrange 乘数法解得此分布即为 Zeta 分布.
性质 1
设 , 则素因数分解中素数 的指数满足:
证明
性质 2
设 , 若 和 是两个互素的素数, 则 和 独立.
证明
性质 3
设 是全体素数的集合, 是一组相互独立的随机变量, 其中 , 则
证明 由 Euler 乘积公式 得:
性质 4
若 和 独立, 则
证明
问题 2 (两个随机的正整数互素的概率)
和 互素 .
正整数集上的均匀分布 .
注: 这并非严格的证明.
A.2.2 一维连续型
1 正态分布
或直接打开
网页链接
1.1 基础概念
正态分布又称高斯分布.
.
概率密度函数: .
标准正态分布: .
原则: 0.6826,09544,9.9974.
上 分位数: .
1.2 数字特征
1.3 其它性质
.
若 和 独立同分布 , 则将 化为极坐标 后, 与 独立.
相互独立的正态分布的函数
分布之和
若 相互独立, 则 .
若 且相互独立, 则 .
分布之差
若 相互独立, 则 .
分布之商
若 和 独立同分布 , 则 (柯西分布).
分布之积
若 , 则 (修正贝塞尔函数; 暂时未学)
平方之和
若 独立同分布 , 则 .
统计量的分布
与 独立.
均值已知, 标准差已知
.
.
.
均值已知, 标准差未知
均值未知, 标准差已知
两份相互独立的样本
.
.
.
.
当 时,
注: 利用 和 , 由 t 分布的定义即得.
1.4 参数估计
单个正态总体 均值 与方差 的估计.
已知 , 估计 .
已知 , 估计 .
估计 和 .
矩估计
极大似然估计
. (MVU 估计)
. (非 MVU 估计)
区间估计 (枢轴变量法)
无偏估计 (通过调整系数而得)
两个正态总体 和 的均值差 与方差比 的区间估计.
估计 .
方差 和 已知.
方差 未知.
方差 和 未知.
即贝伦斯 - 费歇尔问题, 目前还没有较好的处理方法.
不过可以利用大样本法, 近似同方差已知的情况处理.
严格的近似的
估计 .
均值 和 已知.
均值 和 未知.
估计变异系数 .
估计 的 .
2 指数分布
或直接打开
网页链接
2.1 基础概念
指数分布又称为负指数分布.
.
概率密度函数:
分布函数:
2.2 数字特征
数学期望: .
方差: .
阶原点矩: .
特征函数: .
矩量母函数: .
2.3 其它性质
.
指数分布具有无记忆性,即 .
若有一批元件寿命 , 让一个元件开始工作, 每当这个元件坏了就用一个新的替换, 则到经历时间 后替换的次数 .
若 独立同分布 , 则
若 相互独立, 则
2.4 参数估计
矩估计: . (MVU 估计)
极大似然估计: .
贝叶斯估计: 若先验密度为 , 其它值为零, 则 .
区间估计
枢轴变量法
估计 .
由 , 知
估计 .
由 , 知
若 独立同分布 , 独立同分布 , 估计 .
3 混合指数分布
3.1 基础概念
混合指数分布又称为 超指数分布 (Hyperexponential Distribution).
理解: 设有 个平行的服务台 , 若顾客有 的概率选取第 个服务台, 则这样顾客的服务时间分布服从 阶超指数分布.
概率密度函数 .
其中 .
累积分布函数 .
3.2 数字特征
3.3 其它性质
无记忆性.
若 , 则 .
3.4 参数估计
4 均匀分布
4.1 基础概念
.
概率密度函数: 或
分布函数:
4.2 数字特征
数学期望: .
方差: .
阶原点矩: .
阶中心距: 为偶数为奇数
偏度系数: .
峰度系数: .
特征函数:
4.3 其它性质
.
若 独立同分布 , 则
若 , 则 .
4.4 参数估计
估计 的参数.
估计 的参数.
极大似然估计: .
无偏估计
区间估计
由 ,
的置信系数为 .
5 对数正态分布
或直接打开
网页链接
5.1 基础概念
.
概率密度函数:
5.2 数字特征
期望: .
方差: .
阶原点矩: .
偏度系数: .
峰度系数: .
5.3 其它性质
5.4 参数估计
矩估计
.
.
6 柯西分布
或直接打开
网页链接
6.1 基础概念
.
概率密度函数: .
累积分布函数: .
标准柯西分布: .
广义柯西分布: .
6.2 数字特征
6.3 其它性质
可加性: 若 独立同分布 , 则 .
若 和 独立同分布 , 则 .
若 , 则 .
6.4 参数估计
7 拉普拉斯分布
或直接打开
网页链接
7.1 基础概念
.
概率密度函数: .
累积分布函数:
参数说明
7.2 数字特征
7.3 其它性质
.
.
注意到 Laplace 分布与指数分布的关系, 可以立即得到如下平凡的结论
对于 , 有 .
若 和 独立同分布于 , 则 .
若 独立同分布于 , 则 .
与稳健性的联系
古典回归分析中, 用偏差平方和的大小作为标准, 这种回归不具有稳健性.
而改成偏差的绝对值和作为标准, 却具有稳健性 (尽管求解更加困难).
标准 Laplace 分布
概率密度: .
特征函数: .
7.4 参数估计
估计 .
矩估计: .
极大似然估计: (中位数).
估计 .
矩估计: (标准差).
类似矩估计的估计:
8 卡方分布
或直接打开
网页链接
8.1 基础概念
8.2 数字特征
.
.
注意到方差是均值的两倍,可以以此检验是否为卡方分布.
.
.
特征函数: .
矩量母函数: .
8.3 其它性质
若 独立同分布 , 则
若 与 独立, 则
若 独立同分布 , 则
若 独立同分布 , 则
9 t 分布
或直接打开
网页链接
9.1 基础概念
9.2 数字特征
9.3 其它性质
若 , 则 .
若 与 独立, 则
若 独立同分布 , 则
设 独立同分布 , 独立同分布 , 且 独立, 则
10 F 分布
或直接打开
网页链接
10.1 基础概念
自由度为 的 F 分布 .
概率密度函数
若 , 则 .
第一自由度为 , 第二自由度为 的 分布的上 分位数 .
.
10.2 数字特征
.
.
.
10.3 其它性质
设 独立, , 则
设 独立同分布 , 独立同分布 , 且 独立, 则
.
11 贝塔分布
或直接打开
网页链接
11.1 基础概念
.
概率密度函数 .
累积分布函数 .
不完全 Beta 函数 .
正则不完全 Beta 函数 .
11.2 数字特征
常用统计量
众数 . (伯努利分布参数的极大似然估计)
期望 . (伯努利分布参数的贝叶斯估计 & 同等无知原则)
方差 .
矩及相关量
阶矩 .
偏度 .
峰度 .
11.3 其它性质
Beta 分布即伯努利分布的共轭先验分布.
.
.
.
.
Beta 分布与 Gamma 分布的关系.
12 伽马分布
或直接打开
网页链接
12.1 基础概念
.
概率密度函数 .
累积分布函数 .
其中 为下不完全 Gamma 函数.
此外 为上不完全 Gamma 函数.
注意区分
Gamma 分布 或 , 其累积分布函数如上所示.
Gamma 分布的另一种定义 , 其累积分布函数为 .
上述定义的密度函数 或 .
上不完全 Gamma 函数 和 Gamma 函数 .
当 时, 退化为埃尔朗分布.
12.2 数字特征
12.3 其它性质
变化趋势
当 时, 递减.
当 时, 先增后减, 为单峰函数.
无量纲参数与图像形状仅与 有关, 故 称为形状参数.
特殊情况
指数分布 .
另一定义 . (此外也有一种定义, 使得 , 问就是别用)
卡方分布 .
另一定义 .
函数运算
数乘
若 , 则 .
因此 称为尺度参数或逆尺度参数, 即 越大, 曲线越窄, 图像越接近 y 轴.
可加性
若 和 独立, 则 .
特例 1 (卡方分布): 若 独立, 则 .
特例 2 (正态分布): 独立同分布 , 则 .
特例 3 (指数分布): 若 独立同分布 , 则 .
13 威布尔分布
或直接打开
网页链接
13.1 基础概念
概率密度函数:
累积分布函数:
13.2 数字特征
14 瑞利分布
14.1 基础概念
概率密度函数: .
累积分布函数: .
14.2 数字特征
15 帕累托分布
15.1 基础概念
帕累托分布 (Pareto Distribution) 又称布拉德福分布, 与幂律分布形式相同. 参考齐夫定律.
概率密度函数:
互补累积分布函数:
互补累积分布函数又称为生存函数, 残存函数 或可靠性函数.
大致服从帕累托分布的例子
个人财富或资源的分布.
人类居住区的大小.
对百科条目的访问.
龙卷风带来的灾难的数量.
15.2 数字特征
方便起见, 改变记号如下: .
阶矩: .
期望: .
方差: .
16 逻辑斯蒂分布
16.1 基础概念
.
Logistic 分布属于位置-尺度参数族.
累积分布函数: .
概率密度函数: .
参数说明
是位置参数, 称为 散布中心.
是尺度参数, 称为 散布程度.
当 时, 的分布相同.
标准 Logistic 分布 .
16.2 数字特征
期望 .
方差 .
16.3 其它性质
17 广义贝塔分布
不贴 Geogebra 图像的链接了, 给个 mathematica 绘图代码:

17.1 基础概念
. (随便命的名, 不知道有没有人研究过这东西)
参数定义域
概率密度函数
其中示性函数
作变量代换 , 则可验证 .
17.2 数字特征
.
其中上升阶乘幂定义为 .
17.3 其它性质
其它分布
超指数分布
Dirichlet 分布
广义 Dirichlet 分布
组合 Dirichlet 分布
刘维尔分布
威布尔分布
埃尔朗分布
帕累托分布

A.2.3 多维离散型
1 多项分布
.
多项分布的边缘分布是二项分布.
.
A.2.4 多维连续型
1 矩形均匀分布
2 二维正态分布
2.1 基础概念
.
2.2 数字特征
2.3 其它性质
二维正态分布的边缘分布是正态分布.
二维正态分布的条件分布是正态分布.
若 , 则给定 时 的条件分布为
二维正态分布的边缘分布的和仍为正态分布
若 , 则 .
独立的正态分布的联合分布是正态分布.
正态分布的联合分布不一定是二维正态分布.
若 服从正态分布, 独立, 则 也是正态分布. ⭐️
3 多元正态分布
3.1 基础概念
设 为 元随机变量, 令
其中 为协方差矩阵, .
如果 的概率密度函数为
则称 是参数为 的 元正态变量.
3.2 数字特征
3.3 其它性质
n 维正态分布的边缘分布是正态分布.
n 维正态分布的条件分布是正态分布.
n 维正态分布的边缘分布的和是正态分布.
n 维随机变量 服从 n 维正态分布的充要条件是:
若 都是 n 维正态分布分量 的线性函数, 则 服从 m 维正态分布.
n 维正态分布各分量相互对立充要条件是它们两两不相关.
4 狄利克雷分布
4.1 基础概念
.
Dirichlet 分布又称为多元 Beta 分布, 属于指数族分布.
多元 Beta 函数与 Gamma 函数的 Dirichlet 公式
其中 维积分域是一个开放的 维正单纯形, 由顶点 围成.
概率密度函数
其中 是无量纲的 分布参数, 为随机变量的维度.
备注:
对称 Dirichlet 分布
概率密度函数 .
对称 Dirichlet 分布在每个概率密度相等, 即分布参数 在所有维度相同, 取值也被称为 浓度参数.
当浓度参数为 1 时, 维 Dirichlet 分布退化为 维正单纯形上的均匀分布, 也被称为 平 Dirichlet 分布.
当浓度参数大于 1 时, 对称 Dirichlet 分布是一个集中分布, 此时浓度参数越大, 概率密度越集中.
当浓度参数小于 1 时, 对称 Dirichlet 分布是一个稀疏分布, 此时浓度参数越接近于 0, Giallo密度越稀疏.
累积分布函数
4.2 数字特征
4.3 其它性质
相关分布
作为概率分布的性质
共轭性: 多项分布的共轭先验是 Dirichlet 分布 (同等无知原则).
聚合性: 不懂.
中立性
任意的 都与归一化后的 相互独立:
Dirichlet 是服从 Gamma 分布的 维 iid 随机变量 归一化后的联合分布:
信息测度
A.3 常用分布统计表
A.3.1 标准正态分布表

A.3.2 卡方分布表

A.3.3 t 分布表

A.3.4 F 分布表
1 上 0.1 分位数
.png)
2 上 0.05 分位数
.png)
3 上 0.025 分位数
.png)
4 上 0.01 分位数
.png)
5 上 0.005 分位数
.png)
A.3.5 二项分布表
A.3.6 泊松分布表
A.4 数列和常数
A.4.1 数列
卡特兰数
Catalan 数又称明安图数.
递归定义
.
.
前几项值: 1, 1, 2, 5, 14, 43, 132, 429, 1439, 4862, 16796...
生成函数
由 知 , 故
通项公式
.
.
.
证明
由生成函数泰勒展开即得.
由组合数定义即得.
对比 两边系数, 即得 .
递推公式: .
证明 由通项公式即得.
例题
满足通项关系 的场景.
在 网格中, 一开始在 处, 每次可以向上走一格或向右走一格, 在任一时刻, 向右的次数不少于向上的次数, 则合法的路径有 种.
有 对括号, 则长度为 的括号序列中合法的序列有 种. (入栈出栈)
一个圆周上有 个点, 两两配对并连线, 则所有弦不相交的连法有 种.
满足递归定义 的场景.
把一个 层的矩形阶梯分为 个矩形的方法有 种.
凸 边形按顶点连线划分为 个三角形的方法有 种.
A.4.2 常数
卡特兰常数
级数定义与积分定义
常用积分
.
对数与三角
正余弦 (区间再现后相加)
.
.
正余切 (卡特兰常数定义)
.
.
正余弦 (由半角公式即得)
正余切 (分区间利用结论)
幂与三角 (分布积分用结论)
.
.
.
.
.
对数与三角
正余弦 (相加减后解方程)
正余切 (区间再现后展开)
.
.
.
.
正余弦和差 (平方之后二倍角)
幂与三角
正余切 (分布积分用结论)
.
.
其它区间
幂与对数 (三角换元用结论)
.
.
.