stastics tips

frequentist statistics 或者 bayesian statstics 都认为事件(或者观测数据 ) 是以概率的形式发生的,这种概率的出发点导致后续几乎所有的概率解释,即对模型结果对概率解释(统计学解释),比如:

  • 对于观测数据 ,通常认为 满足独立同分布,且服从概率
  • 对于观测数据 ,通常认为存在映射函数 使得 ;这里使用 同样源于 服从某种概率分布

假设观测数据集如下:

均值和方差

同时我们定义

那么变量 的均值和方差满足

无偏/有偏估计(biased/unbiased)

如果 $x~N(\mu, \sigma^2)$,根据最大似然估计

根据定义,估计值的偏差为

证明如下:

根据 $\mu_n = \frac{1}{n} \sum_i x_i$ ,可得 因此替换上式中的第二项可得

证明如下:

如果 $x_i$, $x_j$ ($i != j$) 满足独立同分布 (i.i.d.),则:

因此