数理统计根据实验或观察得到的数据来研究随机现象,并对研究对象的客观规律做出合理的估计和判断。

在数理统计中,可用的资源是有限的数据集合,这个有限的数据集合称为样本。 相应的,观察对象的所有取值被称为总体。数理统计的任务就是 根据样本推断总体的数字特征。

推断的工具是统计量,统计量是样本的函数,是个随机变量。两个最重要的统计量是样本均值样本方差

  • 样本均值:$\overline{X} = \frac{1}{n}\sum_{i=1}^nX_i$
  • 样本方差:$S^2 = \frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2$

统计推断的基本问题分为两大类:参数估计假设检验

参数估计通过随机抽取样本来估计部分分布的未知参数,包括点估计和区间估计

假设检验通过随机抽取样本来接受或拒绝关于总体的某个判断,常用于估计机器学习模型的泛化错误率


大宝


乌托邦

xl

Stay hungry, Stay foolish.