【统计学】假设检验(hypothesis testing)
(本文未经许可禁止转载)
背景
统计学中分析数据的一种经典大致流程为:
- 提出假设
- 统计数据
- 定结论
这里统计学约定:通过实验数据认为某个假设是“真理”是不正确的——取而代之地,我们使用“接收”、“拒绝”两个字眼对假设下结论。也由此诞生了
假设
我们用下面的模式推断结论:
H_0: 想要拒绝的假设\\
H_1: 想要接收的假设
为什么统计者想要拒绝的假设放在原假设呢?因为原假设备被拒绝如果出错的话,只能犯第I类错误,而犯第I类错误的概率已经被规定的显著性水平所控制。摘自这里
我们需要做的决策是:是否要拒绝H0
一些本地化翻译
符号 | 中文 | 英语 | 日语 |
---|---|---|---|
H_0 |
无效假设 | Null hypothesis | 帰無仮説 |
H_1 |
备择假设 | Alternative hypothesis | 対立仮説 |
两类错误
这里的错误不是指人为的计算错误或者理解错误,而是这类推断本身存在的客观错误。
- 弃真错误: H0成立但拒绝H0
- 取伪错误: H0不成立但接收H0
p值
統計学における「仮説検定」(自分が設定した仮説が正しいかどうかを統計的に判定する方法)において、元データの指標が、サンプルから観察された値と等しいか、それよりも大きな(小さな)値をとる確率のこと。P値のPは確率を表すProbabilityのP。(摘自野村研究所的技术论坛)
同时,p值在不同检验中定义不同。例如:\chi^2
-检验中的p值定义为:\mathrm{Pr}\{\chi^2检验量\geq 由实际数据计算的\chi^2\}
一般p值小于5%(或1%)时拒绝H_0
,接收H_1