August
13th,
2021
数理统计
根据实验或观察得到的数据来研究随机现象,并对研究对象的客观规律做出合理的估计和判断。
在数理统计中,可用的资源是有限的数据集合,这个有限的数据集合称为样本
。
相应的,观察对象的所有取值被称为总体
。数理统计的任务就是
根据样本推断总体的数字特征。
推断的工具是统计量,统计量是样本的函数,是个随机变量。两个最重要的统计量是样本均值
和样本方差
:
- 样本均值:$\overline{X} = \frac{1}{n}\sum_{i=1}^nX_i$
- 样本方差:$S^2 = \frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2$
统计推断的基本问题分为两大类:参数估计
和假设检验
参数估计通过随机抽取样本来估计部分分布的未知参数,包括点估计和区间估计
假设检验通过随机抽取样本来接受或拒绝关于总体的某个判断,常用于估计机器学习模型的泛化错误率