数学中国

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 1812|回复: 1

统计学实验之一:比 t 检验功效更高的检验

[复制链接]
发表于 2020-7-28 00:28 | 显示全部楼层 |阅读模式
本帖最后由 Ysu2008 于 2020-8-1 15:36 编辑

对于来自正态分布的小样本(样本量 < 50),如果总体方差已知,用正态分布即 z 检验推断其总体均值最佳(检验功效 power 最高);如果总体方差未知,则用戈塞特的 t 检验。多数情况下总体方差未知,所以 t 检验常用,一般统计学软件只提供 t 检验。

但,小样本下 t 检验功效比 z 检验低。这是因为标准正态分布比 t 分布的尾部概率小,所以在相同检验水平下,z 检验的拒绝域更宽。

那么,是否存在比 t 检验功效更高、且不必知道总体方差的检验方法呢?

考虑检验问题:已知总体 Normal(0.6 , 1),从该总体抽取容量 n = 15 的样本,基于样本推断总体均值是否等于 0 ,
即 \(H_0:\;\mu=0\;,\;H_1:\;\mu\neq0\)

上述零假设为假,检验要尽可能拒绝 \(H_0\),拒绝率越高,功效越高,检验方法越好。

假如总体方差已知,可用 z 检验,可算得此时 z 检验受伪概率 \(\beta = 0.36\),检验功效 = 1-0.36 = 64% ;
如果总体方差未知,则用 t 检验,可算得 t 检验受伪概率 \(\beta = 0.42\),检验功效 = 1-0.42 = 58% .

除了上述常规检验方法外,我发现还可以用随机投点法处理该检验问题。

通过模拟实验比较 随机投点法 与 t 检验的检验功效

模拟检验 1000 次,每抽完一个样本(n=15),分别用随机投点法和 t 检验作推断,随机投点法拒绝了632次,t 检验拒绝了600次,两种方法共同拒绝了583次。这可以整理为一个配对设计的四格表:
t检验拒绝t检验接受
随机投点拒绝58349
随机投点接受17351


对上述四格表作 McNemar 检验,比较两个拒绝率是否相等;
算得卡方值 = 15.5152 ,p-value = 0.0002,拒绝两率相等的零假设,随机投点法拒绝率(检验功效)显著高于 t 检验。

随机投点法检验功效 = (583+49)/1000 = 63.2%,不显著偏离 64% 的 z 检验功效;
   模拟 t 检验功效 = (583+17)/1000 = 60.0%,不显著偏离 58% 的 t 检验功效理论值.

结论:随机投点法不需要知道总体方差,但其检验功效却相当于方差已知的 z 检验 .

[注一] 我暂时不能公布随机投点法作假设检验的计算细节,这是盗版软件上没有的方法,请理解。
[注二] 所谓“实验统计学”,就是用统计学的方法研究统计学,用假设检验检验假设检验。
 楼主| 发表于 2020-7-28 00:51 | 显示全部楼层
本帖最后由 Ysu2008 于 2020-7-28 00:55 编辑

还要特别说明一点。通过模拟实验比较统计学方法的优劣,存在两种模拟体系的问题。一种不妨叫做“频率学派式模拟”,另一种则是“贝叶斯式模拟”。区别在于对总体参数是否使用随机数发生器,使用随机数发生器的就是“贝叶斯式模拟”。

为什么要区别?
因为在频率学派式模拟下,频率学派的方法占优;贝叶斯式模拟下则贝叶斯方法占优。

目前学术界似乎并未对这个问题加以区别,几乎所有的论文都是采用频率学派式模拟。

我主楼中的模拟实验,随机投点法与 t 检验的对比,结论是在贝叶斯模拟下作出的。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|数学中国 ( 京ICP备05040119号 )

GMT+8, 2024-3-29 19:59 , Processed in 0.068360 second(s), 15 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表