(本文未经许可禁止转载)

           

背景

统计学中分析数据的一种经典大致流程为:

  1. 提出假设
  2. 统计数据
  3. 定结论

这里统计学约定:通过实验数据认为某个假设是“真理”是不正确的——取而代之地,我们使用“接收”、“拒绝”两个字眼对假设下结论。也由此诞生了

假设

我们用下面的模式推断结论:

H_0: 想要拒绝的假设\\
H_1: 想要接收的假设

为什么统计者想要拒绝的假设放在原假设呢?因为原假设备被拒绝如果出错的话,只能犯第I类错误,而犯第I类错误的概率已经被规定的显著性水平所控制。摘自这里

我们需要做的决策是:是否要拒绝H0

一些本地化翻译

符号 中文 英语 日语
H_0 无效假设 Null hypothesis 帰無仮説
H_1 备择假设 Alternative hypothesis 対立仮説

两类错误

这里的错误不是指人为的计算错误或者理解错误,而是这类推断本身存在的客观错误。

  1. 弃真错误: H0成立但拒绝H0
  2. 取伪错误: H0不成立但接收H0

p值

統計学における「仮説検定」(自分が設定した仮説が正しいかどうかを統計的に判定する方法)において、元データの指標が、サンプルから観察された値と等しいか、それよりも大きな(小さな)値をとる確率のこと。P値のPは確率を表すProbabilityのP。(摘自野村研究所的技术论坛

同时,p值在不同检验中定义不同。例如:\chi^2-检验中的p值定义为:\mathrm{Pr}\{\chi^2检验量\geq 由实际数据计算的\chi^2\}

一般p值小于5%(或1%)时拒绝H_0,接收H_1

       

(本文未经许可禁止转载)

   

发表回复