Loading [MathJax]/jax/output/HTML-CSS/jax.js

概率论与数理统计笔记(8)——假设检验(续)

概率论与数理统计笔记(8)——假设检验(续)

Chapter 6:假设检验(续)

7、列联表检验

独立性检验

e.g. (独立性检验)啤酒口味偏好与饮酒者性别是否独立。

样本见下:

合计
20402080
30301070
合计507030150

H0: 独立(H1: 不独立)。

Pi+,P+j 为边际概率。
χ2=i,j(OijEij)2Eij,Eij=nPij


H0:Pij=Pi+P+j(1i2,1j3)

  1. 极大似然估计 PijH0 为真前提下)。
    Pij=Pi+P+j=jOijniOijn

    消耗自由度为 (a1)+(b1)=a+b2

  2. Eij=nPijnPijχ206.12

  3. 自由度为 ab1(a+b2)=(a1)(b1)=(21)(31)=2

  4. P=P(χ2χ20)0.0469

齐性检验

e.g. (齐性检验)Jane Austen:

Sense & SensibilityEmmaSandition I小计Sandition II
a14718610143483
an2526116229
this3239158615
that941053723622
with59742816143
without181010384
总计3754402021017196
  1. 检验 Austen 不同作品的单词用法的一致性:H0:Pi1=Pi2=Pi3(i=1,,6)
    1. H0 下,记 Pi1=Pi2=Pi3=Pi,估计 Pi,极大似然估计 Pi=jOijne.g. P1=4341017
    2. Eij=njPinjPie.g. E32=440×86101737.2
    3. χ2012.27,自由度为 b(a1)(a1)=(a1)(b1)=(61)(31)=10
    4. P 值介于 0.250.30 之间 不拒绝 H0
  2. 检验 Austen 的崇拜者模仿是否成功(单词用法角度)。

    H0:Pi1=Pi2(i=1,,6)(用后两列)。

    类似可得 χ2032.81,自由度 =(a1)(b1)=(61)(21)=5

    P<103 拒绝 H0

  1. 逐个单元检查 χ2 统计量的贡献,“an”,“that”用法不同。
  2. 独立性检验与齐性检验的差别:
    1. 假设不同。
    2. 抽样方案不同。

8、似然比检验

实例

e.g. 硬币例子,n=10x 次正面向上,H0:P=0.5,H1:P=0.7,则:
P(x|H0)P(x|H1)


称为似然比,当其 C 时拒绝 H0

H0,H1 皆为简单假设时,似然比检验是最优的(最大功效,Neyman-Pearson),不是简单的假设时,一般不最优,通常表现也不错。

H0:θΘ0,H1:θΘ1,样本 X1,,Xn iid。

广义似然比

Λ=supθΘ0L(θ)supθΘ1L(θ)

基于技术原因,检验统计量为:
Λ=supθΘ0L(θ)supθΘ0Θ1L(θ)Λ=min(Λ,1)


临界值检验 选择 λ0s.t. P(Λλ0|H0)α

:若 Λ 分布可求,则可直接计算 P(Λλ0|H0)α

定理

在一定条件下(光滑性),n 时,在 H0 假设下,2lnΛ 的分布 χ2 分布,其自由度为:
dim(Θ0Θ1)dim(Θ0)


dim——自由参数个数)

H0:p1=p,p2=1p,k=2

χ2 统计量为:
(O1np)2np(1p)


由于 E(O1)=np,Var(O1)=np(1p),因此:
(O1np)2np(1p)χ2(1)

e.g.(多项分布)H0:p1=p10,pk=pk0,n1++nk=n
L(p1,,pk)=(nn1,,nk)pn11pnkkΛ=pn110pnkk0p1n1pknk,pi=nin=ki=1(pi0pi)ni2lnΛ=2ki=1nilnpi0pi=2ki=1nilnnpi0ni=2ki=1OilnOiEi,Oi=ni=npi,Ei=npi0

根据 xlnxx0 的泰勒展开,可得:
2lnΛ=2ki=1(OiEi)+ki=1(OiEi)2Ei+=ki=1(OiEi)2Ei+

第一项确实与卡方统计量相同。

9、两个总体的比较

两独立总体比较

总体均值方差样本
Xμ1σ21X1,,Xn
Yμ2σ22Y1,,Yn

可知:
E(¯X¯Y)=μ1μ2Var(¯X¯Y)=σ21n+σ22m

  1. X,Y 皆为正态分布,且 σ21=σ22=σ2,则:
    (¯X¯Y)(μ1μ2)σ1n+1mN(0,1)(¯X¯Y)(μ1μ2)S1n+1mt(n+m2),S2=(n1)S21+(m1)S22n+m2

  2. 一般地:
    (¯X¯Y)(μ1μ2)σ21n+σ22mN(0,1)(¯X¯Y)(μ1μ2)S21n+S22mN(0,1)

e.g.(比较成功率/失败率)

阿司匹林对于降低心脏病发病率的有效性(五年)。

样本信息:

心脏病发作未发作合计发作率
安慰剂23910795110340.0217
阿司匹林13910898110370.0126

(P1P2)(p1p2)se(P1P2)N(0,1)

考虑:
E(P1P2)=p1p2,Var(P1P2)=Var(P1)+Var(P2)=p1(1p1)n1+p2(1p2)n2


假设检验:H0: 无效(p1=p2),H1: 有效(p1>p2)。

H0 为真前提下,p 的极大似然估计为 p:=k1+k2n1+n2,因此:
p1=p2Var(P1P2)=p(1p)(1n1+1n2)p(1p)(1n1+1n2)0.001752


可得 P 值约为:
P(Z0.009100.001755.20)107

因此拒绝 H0

  1. 随机分组。
  2. 单盲/双盲试验。
  3. n 足够大。

两相关总体比较

e.g. 某大型出租车公司,比较汽油 AB 的行驶里程。

100 辆车分为两组:

样本容量平均里程标准差
汽油 A50255.00
汽油 B50264.00

假设检验:H0:μA=μBH1:μAμB
se(¯X¯Y)S21n1+S22n2=25+1650=0.905


P 值约为:
PμA=μB(|Z|252600.9051.1)0.1357×20.27

因此不拒绝 H0,也就是有利于任何一种汽油的证据都是不充分的。

改进

同一辆车(司机)不同日子分配不同的汽油,n=10

车号汽油 A汽油 B差异
127.0126.950.06
220.0020.440.44
1025.2226.010.79
平均值25.2025.800.60
标准差4.274.100.61

:可发现差异列的标准差变小了,消除了汽车(司机)之间的差异性。
¯d=1nni=1di=¯X¯Y,E(¯d)=μaμb=:μd


假设 d=XY 服从正态分布,则:
¯dμdSdnt(n1)

假设检验 H0:μd=0(μa=μb)H1:μd0

可知 P 值约为 0.006×2=0.012,拒绝 H0α=0.05)。

10、多个正态总体均值的比较

具体案例

H0:μ1=μ2==μkH1: 至少存在一组 μiμj,1i<jn

:假设 k=3,则 H0 化为三个检验:
H(1)0:μ2=μ3,H(2)0:μ3=μ1,H(3)0:μ1=μ2


每个检验水平都设为 α=0.05,则 H0 的检验水平 >0.05

E1μ2=μ3 但拒绝 H(1)0E2,E3 类似定义。

Eμ1=μ2=μ3 但拒绝 H0P(Ei)=0.05

E=E1+E2+E3,故:
P(E)=P(E1+E2+E3)>0.05

方差分析:ANOVA

Xij 表示第 i 组第 j 个观测,ni 为第 i 组样本容量,n=n1++nk
¯Xi=1ninij=1Xij


为第 i 组的样本均值。
¯X=1ni,jXij=1nki=1(ni¯Xi)

则:
ij(Xij¯X)2=ki=1nij=1(Xij¯Xi)2+ki=1ni(¯Xi¯X)2

左侧称为 SST,右侧分别为 SSWSSB

总离差平方和 = 组内离差平方和 + 组间离差平方和。

检验统计量:
F=SSB/(k1)SSW/(nk)


F 值越大,说明组间差异相对于组内波动来说越明显,反对 H0

F 检验

H0:μ1=μ2==μk 成立时,统计量 F 服从自由度为 (k1,nk)F 分布(由卡方分布生成),且 FFα(k1,nk) 时拒绝 H0

方差分析表

方差来源平方和自由度均方
组间SSBk1SSB/(k1)
组内SSWnkSSW/(nk)
总计SSTn1

最后得出:
F=SSB/(k1)SSW/(nk)

理论框架

Xij=μ+αi+ξij

第一项为总平均水平,第二项为第 i 组的不同效应,第三项为随机误差(独立,服从 N(0,σ2))。(μi=μ+αi
ki=1αi=0


为规范。
E(SSW)=σ2ki=1(ni1)=σ2(nk)

可得:
SSWσ2χ2(nk)

而:
E(SSB)=σ2(k1)+ki=1niα2i

如果 αi0,则:
SSBσ2χ2(k1)

且相互独立。

若一些 αi0,则 SSB 就会膨胀。

重要假设

  1. ξij 正态(Xij 正态),类似 t 检验,对于来自适度的非正态大样本,F 检验是近似合理的。
  2. σ2 为常数(方差相同)。
  3. ξij 独立。

k=2F=t2,F(1,n2)=t2(n2)F 检验与 t 检验一致。

11、显著性的思考

  1. 结果显著吗?
  2. 数据窥探。
  3. 结果是否重要?
  4. 检验不解释原因。

12、非参数检验

不依赖于总体分布的统计推断。

在可以使用参数检验时,一般使用参数检验。

参数检验问题

e.g. 服务满意度回访,管理层要求:平均满意度必须高于 4 分。

非常满意满意一般不满意非常不满意合计
分数54321
人数111230228

尝试做法:H0:μ4,H1:μ>4

¯x4.07,s21.0862

检验统计量的观测值为(t 检验):
¯xμ0sn4.0741.086280.341


P 值大约介于 0.350.40,因此不拒绝 H0

:判决结果有失公允,t 检验不恰当:

  1. t 检验条件:近似正态(或至少表现为单峰且关于均值基本对称),方差未知,n 较小(一般小于 30)。

    而数据明显严重左偏。

  2. 两个 1 分为离群值,中位数描述数据中心更恰当。

  3. t 检验处理数值型数据,此处赋值合理性值得商榷。

因此综合来看,严重有偏,存在离群值,属性变量都是几个关键问题。

符号检验

e.g. 房地产股价已回落到 6 元水平?

编号12345678910
股价13.033.947.242.895.954.656.345.865.963.93
St67.032.061.243.110.051.350.340.140.042.07
符号+++

H0: 中位数 =6H1: 中位数 6

H0:+ 出现概率 p=0.5,H1:p0.5

¯X=+ 出现的个数,H0 为真时,XB(10,0.5)

P=2P(X3)0.344>0.1=α 不拒绝 H0

:这是总体中位数的符号检验,但也同样可以检验其他分位数。

e.g.(配对比较)

若能证明一半以上客户都偏好新网站,则启用新网站。

客户评分之差(di符号
1752+3.5
2844+6
35611.5
4853+5
5660剔除
6835+7
7871+1.5
8936+8
95723.5

H0: 没有偏好新网站(+ 出现概率 p0.5),H1: 偏好新网站(p>0.5)。

X=+ 出现的次数,H0 为真时 XB(8,p),p0.5

P=supp0.5P(X6)Pp=0.5(X6)0.109+0.031+0.004>0.1=α(符号检验功效低,比较保守) 不拒绝 H0

未考虑到评分差绝对值的影响。

符号秩和检验(Wilcoxon, 1945)

e.g. 上例续。

由画图表可知,其分布大致对称。

|di| 从小到大排序,Ti= 其序号称为秩,当 |di| 有重复时,Ti= 其平均序号。

T+——正秩和,T——负秩和。(都是正数)

T++T=1+2++n=n(n+1)2

H0: 中位数 Md0H1: 中位数 Md>0

检验统计量 T=T(越小越支持 H1)。

观测值 T=5T=5T0.05(8)=5


T={TH1:Md>0T+H1:Md<0min(T+,T)H1:Md0

为检验统计量。

n>20 时,H0 为真时,TN(μT,σ2T)μT=n(n+1)4,σ2T=n(n+1)(2n+1)24

 

点赞 1

No Comments

Add your comment