Rumia's blog

What is T 检验?

T检验,亦称student t检验(Student’s t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布。t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。T检验可用于比较均值,检查抽样样本是否来自一已知总体。要详细解释t检验,首先引入一些统计学的基本原理知识。


假设检验

对提出的一些总体假设进行分析判断,做出统计决策。

Why 检验?

通过获得随机样本来实施抽样研究的例子很多,但此时研究中直接获取的只是样本的情况,而研究者关心的并不仅仅是样本,更希望了解相应的总体特征

原理

基本步骤

  1. 建立假设:
    • 根据统计推断的目的而提出的对总体特征的假设。统计学中的假设有两方面的内容:
    • 一是检验假设(hypothesis to be tested),亦称原假设或无效假设(null hypothesis),记为H0
    • 二是与H0相对立的备择假设(alternative hypothesis),记为H1 。后者的意义在于当H0 被拒绝时供采用。两者是互斥的,非此即彼。 H0:μ =μ0, H1:μ≠0; H0:μ =7.4, H1:μ≠7.4。
  2. 确定检验水准
    • 实际上就是确定拒绝H0时的最大允许误差的概率。检验水准(size of test),常用α表示,是指检验假设H0本来是成立的,而根据样本信息拒绝H0的可能性大小的度量,换言之,α是拒绝了实际上成立的H0的概率
    • 常用的检验水准为α = 0.05,其意义是:在所设H0的总体中随机抽得一个样本,其均数比手头样本均数更偏离总体均数的概率不超过5%
  3. 计算检验统计量和P值
    • 实际上在此之前还有一步叫做进行试验,所需的样本数据即从此得来
    • 统计量只是工具,概率值才是目的,它可以客观衡量样本对假设总体偏离程度
      • 从H0假设的总体中抽出现有样本(及更极端情况)的概率,即P值
      • 例如600次赢100次是H0假设的情况,只赢1次就是现有样本情况,更极端的情况就是连一次也没有赢
    • 检验统计量的特点
      • 该统计量应当服从某种已知分布,从而可以计算出P值
      • 各种检验方法所利用的分布及计算原理不同,从而检验统计量也不同
  4. 得出推断结论
    • 按照事先确定的检验水准α界定上面得到的P值,并按小概率原理认定对H0的取舍,作出推断结论
    • if (p<α)
      • 基于H0假设的总体情况出现了小概率事件
      • 则拒绝H0,接受H1,可以认为样本与总体的差别不仅仅是抽样误差 造成的 ,可能存在本质上的差别,属“非偶然的(significant)”,因此,可以认为两者的差别有统计学意义
    • else
      • 基于H0出现了很常见的事件
      • 则样本与总体间的差别尚不能排除纯粹由抽样误差造成可能的确属“偶然的(non-significant)”,故尚不能拒绝H0
      • 因此,认为两者的差别无统计学意义,但这并不意味着可以接受H0
  5. 应该注意的一些问题
    • 结论不能绝对化
      • 本身就保留了犯错误的可能性
      • 样本量导致的检验效能问题
        • 样本量太小,导致检验效能不足,从而无法检出可能存在的差异
        • 样本量太大,得出的有统计学意义的结论可能根本就没有实际意义

单样本t检验

单样本t检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计量呈t分布。

​ x :样本平均数

​ μ : 已知总体平均数

​ s :标准误

适用条件

完全随机的两样本t检验

配对t检验

参考资料

张文彤《SPSS20.0统计分析基础教程第2版》