资讯详情

统计学习笔记:假设检验基本概念及U检验、T检验、F检验

文章目录

  • 1. 假设检验
    • 原假设和备选假设
    • 第一类错误和第二类错误
    • p值
  • 2. U检验
    • 单样本U检验
    • 双样本U检验
  • 3. T检验
    • 单样本T检验
    • 双样本T检验( σ 1 2 = σ 2 2 = σ 2 \sigma_1^2=\sigma_2^2=\sigma^2 σ12=σ22=σ2未知时)
  • 3. F检验
    • 单样本正常,总体方差检验
    • 双样本正态整体方差检验(方差齐检验)

1. 假设检验

这里只讨论双侧参数假设检验,不包括单侧和非参数假设检验。

原假设和备选假设

在参数假设检验中,已知了整体分布类型,假设检验的目的是检验整体参数。因此,研究人员需要提前提出假设,以确定假设是否真实。在参数假设检验中,假设是对总参数具体值的陈述。为了使样本统计作为证据不可避免地支持和只支持一个假设,建立一对逻辑上完全排斥整体参数的假设,即原始假设(null hypothesis,记为 H 0 H_0 H0),备择假设(alternative hypothesis,记为 H 1 H_1 H1​)。 原假设(又称零假设),是假定总体参数未发生变化;备择假设(又称对立假设),是假定总体参数发生变化。实际建立假设时,原假设与备择假设方向不同,会导致不同的结论,为此,在选择原假设和备择假设时,我们通常根据研究者是希望收集证据予以支持还是拒绝的判断作为选择依据。 例如某产品质量标准为100g,我们想验证某一批产品是否合格,研究者通常想找出不合格产品,所以 H 0 : μ = 100 H_0: \mu=100 H0​:μ=100, H 1 : μ ≠ 100 H_1: \mu\neq100 H1​:μ=100。

第一类错误和第二类错误

第一类错误:原假设是正确的,却拒绝了原假设。 第二类错误:原假设是错误的,却没有拒绝原假设。 我们分别称之为拒真和纳伪。

决策 H0为真 H1为真
接受H0 正确 Type2
拒绝H0 Type1 正确

我们想要在检验中尽可能地使两种错误概率同时减小,但实际上。所以通常的做法就是仅限制第一类错误的概率,为其找到一个阈值 α \alpha α,称之为显著性水平。

p值

在假设检验中我们做出判断有两种方式:

  1. 计算检验统计量,与临界值比较,如U检验中的 U ( X ) U(X) U(X)与 u α / 2 u_{\alpha/2} uα/2​比较
  2. 计算p值,与显著水平 α \alpha α进行比较

p值计算方式: 用Z表示检验的统计量,ZC表示根据样本数据计算得到的检验统计量值 以双侧检验U检验为例, x 0 x_0 x0​为样本数据 H 0 : μ = μ 0 H_0: \mu=\mu_0 H0​:μ=μ0​, H 1 : μ ≠ μ 0 H_1: \mu\neq\mu_0 H1​:μ=μ0​ p v a l u e = P H 0 ( ∣ U ( X ) ∣ > U ( x 0 ) ) pvalue=P_{H_0}(|U(X)|>U(x_0)) pvalue=PH0​​(∣U(X)∣>U(x0​))

2. U检验

U检验又称Z检验,U检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法()。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。

单样本U检验

  • 假设: H 0 : μ = μ 0 H_0: \mu=\mu_0 H0​:μ=μ0​, H 1 : μ ≠ μ 0 H_1: \mu\neq\mu_0 H1​:μ=μ0​
  • 检验统计量: U ( X ) = n ( X ‾ − μ 0 ) σ 0 U(X)=\frac{\sqrt n(\overline{X}-\mu_0)}{\sigma_0} U(X)=σ0​n ​(X−μ0​)​
  • 拒绝域: { x : ∣ U ( x ) ∣ > u α / 2 } \{x:|U(x)|>u_{\alpha/2}\} { x:∣U(x)∣>uα/2​}

推导: X ‾ ∼ N ( μ , σ 0 2 n ) \overline{X}\sim N(\mu,\frac{\sigma_0^2}{n}) X∼N(μ,nσ02​​),得到 n ( X ‾ − μ ) σ ∼ N ( 0 , 1 ) \frac{\sqrt n(\overline{X}-\mu)}{\sigma}\sim N(0,1) σn ​(X−μ)​∼N(0,1)。第一类错误概率 P H 0 ( ∣ n ( X ‾ − μ ) σ 0 ∣ > c ) ≤ α P_{H_0}(|\frac{\sqrt n(\overline{X}-\mu)}{\sigma_0}|>c)\leq \alpha PH0​​(∣σ0​n ​(X−μ)​∣>c)≤α,所以 c = u α / 2 c=u_{\alpha/2} c=uα/2​,当 ∣ U ( x ) ∣ > u α / 2 |U(x)|>u_{\alpha/2} ∣U(x)∣>uα/2​时拒绝原假设。

双样本U检验

  • 假设: H 0 : μ 1 = μ 2 H_0: \mu_1=\mu_2 H0​:μ1​=μ2​, H 1 : μ 1 ≠ μ 2 H_1: \mu_1\neq\mu_2 H1​:μ1​=μ2​
  • 检验统计量: U = ( X 1 ‾ − X 2 ‾ ) σ 1 2 n 1 + σ 2 2 n 2 U=\frac{(\overline{X_1}-\overline{X_2})}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} U=n1​σ12​​+n2​σ22​​ ​(X1​​−X2​​)​
  • 拒绝域: { x : ∣ U ∣ > u α / 2 } \{x:|U|>u_{\alpha/2}\} { x:∣U∣>uα/2​}

推导: X 1 ‾ ∼ N ( μ 1 , σ 1 2 n 1 ) \overline{X_1}\sim N(\mu_1,\frac{\sigma_1^2}{n_1}) X1​​∼N(μ1​,n1​σ12​​), X 1 ‾ ∼ N ( μ 2 , σ 2 2 n 2 ) \overline{X_1}\sim N(\mu_2,\frac{\sigma_2^2}{n_2}) X1​​∼N(μ2​,n2​σ22​​),所以 X 1 ‾ − X 2 ‾ ∼ N ( μ 1 − μ 2 , σ 1 2 n 1 + σ 2 2 n 2 ) \overline{X_1}-\overline{X_2}\sim N(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}) X1​​−X2​​∼N(μ1​−μ2​,n1​σ12​​+n2​σ22​​),得到 X 1 ‾ − X 2 ‾ − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) \frac{\overline{X_1}-\overline{X_2}-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1) n1​σ12​​+n2​σ22​​ ​X1​​−X2​​−(μ1​−μ2​)​∼N(0,1)。第一类错误概率 P H 0 ( ∣ ( X 1 ‾ − X 2 ‾ ) σ 1 2 n 1 + σ 2 2 n 2 ∣ > c ) ≤ α P_{H_0}(|\frac{(\overline{X_1}-\overline{X_2})}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}|>c)\leq \alpha PH0​​(∣n1​σ12​​+n2​σ22​​ ​(X1​​−X2​​)​∣>c)≤α,所以 c = u α / 2 c=u_{\alpha/2} c=uα/2​,当 ∣ U ∣ > u α / 2 |U|>u_{\alpha/2} ∣U∣>uα/2​时拒绝原假设。

3. T检验

T检验又称student t检验,T检验是一般用于小样本(即样本容量小于30)平均值差异性检验的方法()。所以T分布中用样本方差 S n 2 S_n^2 Sn2​作为总体方差 σ 2 \sigma^2 σ2一个点估计进行计算。

单样本T检验

  • 假设: H 0 : μ = μ 0 H_0: \mu=\mu_0 H0​:μ=μ0​, H 1 : μ ≠ μ 0 H_1: \mu\neq\mu_0 H1​:μ=μ0​
  • 检验统计量: T ( X ) = n ( X ‾ − μ 0 ) S n T(X)=\frac{\sqrt n(\overline{X}-\mu_0)}{S_n} T(X)=Sn​n ​(X−μ0​)​
  • 拒绝域: { x : ∣ T ( x ) ∣ > t α / 2 ( n − 1 ) } \{x:|T(x)|>t_{\alpha/2}(n-1)\} { x:∣T(x)∣>tα/2​(n−1)}

推导: 首先引入一个定理, X 1 , . . . , X n ∼ i i d N ( μ , σ 2 ) X_1,...,X_n\sim_{iid}N(\mu,\sigma^2) X1​,...,Xn​∼iid​N(μ,σ2), S n 2 = 1 n − 1 ∑ i = 1 n ( X − X ‾ ) 2 S_n^2=\frac{1}{n-1}\sum_{i=1}^{n}(X-\overline{X})^2 Sn2​=n−11​∑i=1n​(X−X)2为样本方差,则

  • X ‾ ∼ N ( μ , σ 2 n ) \overline X\sim N(\mu,\frac{\sigma^2}{n}) X∼N(μ,nσ2​)
  • ( n − 1 ) S n 2 / σ 2 ∼ X 2 ( n − 1 ) (n-1)S_n^2/\sigma^2\sim \mathcal{X}^2(n-1) (n−1)Sn2​/σ2∼X2(n−1)。

根据t分布的定义: T = ξ η / n T=\frac{\xi}{\sqrt{\eta/n}} T=η/n ​ξ​,其中 ξ ∼ N ( 0 , 1 ) \xi\sim N(0,1) ξ∼N(0,1), η ∼ X 2 ( n ) \eta\sim\mathcal{X}^2(n) η∼X2(n),则记为 T ∼ t ( n ) T\sim t(n) T∼t(n)。 所以检验统计量 T ( X ) = n ( X ‾ − μ 0 ) S n T(X)=\frac{\sqrt n(\overline{X}-\mu_0)}{S_n} T(X)=Sn​n ​(X−μ0​)​是满足 t ( n − 1 ) t(n-1) t(n−1)分布的,在 ∣ T ( x ) ∣ > t α / 2 ( n − 1 ) |T(x)|>t_{\alpha/2}(n-1) ∣T(x)∣>tα/2​(n−1)情况下拒绝原假设。

双样本T检验( σ 1 2 = σ 2 2 = σ 2 \sigma_1^2=\sigma_2^2=\sigma^2 σ12​=σ22​=σ2未知时)

  • 假设: H 0 : μ 1 = μ 2 H_0: \mu_1=\mu_2 H0​:μ1​=μ2​, H 1 : μ 1 ≠ μ 2 H_1: \mu_1\neq\mu_2 H1​:μ1​=μ2​
  • 检验统计量: T = ( X ‾ − Y ‾ [ σ ( m + n ) / ( m n ) ] ) ( m + n − 2 ) S m n ∗ 2 / [ σ 2 ( m + n − 2 ) ] = m n m + n X ‾ − Y ‾ S m n ∗ 2 T=\frac{(\overline{X}-\overline{Y}[\sigma\sqrt{(m+n)/(mn)}])}{\sqrt{(m+n-2)S_{mn}^{*2}/[\sigma^2(m+n-2)]}}=\sqrt{\frac{mn}{m+n}}\frac{\overline{X}-\overline{Y}}{S_{mn}^{*2}} T=(m+n−2)Smn∗2​/[σ2(m+n−2)] ​(X−Y[σ(m+n)/(mn) ​])​=m+nmn​ ​Smn∗2​X−Y​
  • 拒绝域: { x : ∣ T ∣ > t α / 2 ( n − 1 ) } \{x:|T|>t_{\alpha/2}(n-1)\} { x:∣T∣>tα/2​(n−1)}

推导: 总样本方差 S m n ∗ 2 = ∑ i = 1 m ( X i − X ‾ ) 2 + ∑ i = 1 m ( Y i − Y ‾ ) 2 m + n − 2 S_{mn}^{*2}=\frac{\sum_{i=1}^m(X_i-\overline X)^2+\sum_{i=1}^m(Y_i-\overline Y)^2}{m+n-2} Smn∗2​=m+n−2∑i=1m​(Xi​−X)2+∑i=1m​(Yi​−Y)2​,在 H 0 H_0 H0​成立时, ( m + n − 2 ) S m n ∗ 2 ∼ X 2 ( m + n − 2 ) (m+n-2)S_{mn}^{*2}\sim \mathcal{X}^2(m+n-2) (m+n−2)Smn∗2​∼X2(m+n−2),所以 T ∼ t ( m + n − 2 ) T\sim t(m+n-2) T∼t(m+n−2), ∣ T ∣ > t α / 2 ( n − 1 ) |T|>t_{\alpha/2}(n-1) ∣T∣>tα/2​(n−1)时拒绝原假设。

3. F检验

不同的前面的内容,F检验的内容更多也更复杂,先看一下百科上的介绍:

F检验(F-test),最常用的别名叫做联合假设检验(英语:joint hypotheses test),此外也称方差比率检验、方差齐性检验。它是一种在零假设(null hypothesis, H0)之下,统计值服从F-分布的检验。其通常是用来分析用了超过一个参数的统计模型,以判断该模型中的全部或一部分参数是否适合用来估计母体。

在实际应用中F检验有如下用途:

  • 方差齐性检验(F-test of equality of variances)
  • 方差分析(Analysis of Variance, ANOVA)
  • 线性回归方程整体的显著性检验

方差齐性检验是其最原始的用途,也与我们前面内容一脉相承,其他的用途在本文不过多介绍。在此之前我们先思考一个问题,前面的U和T检验都是对正态总体的均值进行假设,区别是方差是否已知,那么正态总体方差的检验又是什么样呢?

单样本正态总体方差检验

内容 μ = μ 0 \mu=\mu_0 μ=μ0​已知 μ \mu μ未知
假设 H 0 : σ = σ 0 H_0: \sigma=\sigma_0 H0​:σ=σ0​, H 1 : σ ≠ σ 0 H_1: \sigma\neq\sigma_0 H1​:σ=σ0​ H 0 : σ = σ 0 H_0: \sigma=\sigma_0 H0​:σ=σ0​, H 1 : σ ≠ σ 0 H_1: \sigma\neq\sigma_0 H1​:σ=σ0​
满足分布 ∑ i = 1 n ( X i − μ 0 ) 2 σ 2 ∼ X 2 ( n ) \frac{\sum_{i=1}^n(X_i-\mu_0)^2}{\sigma^2}\sim\mathcal{X}^2(n) σ2∑i=1n​(Xi​−μ0​)2​∼X2(n) ∑ i = 1 n ( X i − X ‾ ) 2 σ 2 ∼ X 2 ( n − 1 ) \frac{\sum_{i=1}^n(X_i-\overline X)^2}{\sigma^2}\sim\mathcal{X}^2(n-1) σ2∑i=1n​(Xi​−X)2​∼X2(n−1)
检验统计量 X 2 = ∑ i = 1 n ( X i − μ 0 ) 2 σ 0 2 \mathcal{X}^2=\frac{\sum_{i=1}^n(X_i-\mu_0)^2}{\sigma_0^2} X2=σ02​∑i=1n​(Xi​−μ0​)2​ X 2 = ∑ i = 1 n ( X i − X ‾ ) 2 σ 0 2 \mathcal{X}^2=\frac{\sum_{i=1}^n(X_i-\overline X)^2}{\sigma_0^2} X2=σ02​∑i=1n​(Xi​−X)2​
拒绝域 { X 2 < X 1 − α / 2 2 ( n ) } ∪ { X 2 > X α / 2 2 ( n ) } \{\mathcal{X}^2<\mathcal{X}_{1-\alpha/2}^2(n)\}\cup\{\mathcal{X}^2>\mathcal{X}_{\alpha/2}^2(n)\} { X2<X1−α/22​(n)}∪{ X2>Xα/22​(n)} { X 2 < X 1 − α / 2 2 ( n − 1 ) } ∪ { X 2 > X α / 2 2 ( n − 1 ) } \{\mathcal{X}^2<\mathcal{X}_{1-\alpha/2}^2(n-1)\}\cup\{\mathcal{X}^2>\mathcal{X}_{\alpha/2}^2(n-1)\} { X2<X1−α/22​(n−1)}∪{ X2>Xα/22​(n−1)}

双样本正态总体方差检验(方差齐性检验)

内容 μ 1 \mu_1 μ1​, μ 2 \mu_2 μ2​已知 μ 1 \mu_1 μ1​, μ 2 \mu_2 μ2​未知
假设 H 0 : σ 1 = σ 2 H_0: \sigma_1=\sigma_2 H0​:σ1​=σ2​, H 1 : σ 1 ≠ σ 2 H_1: \sigma_1\neq\sigma_2 H1​:σ1​=σ2​ H 0 : σ 1 = σ 2 H_0: \sigma_1=\sigma_2 H0​:σ1​=σ2​, H 1 : σ 1 ≠ σ 2 H_1: \sigma_1\neq\sigma_2 H1​:σ1​=σ2​
满足分布 ∑ i = 1 n ( X i − μ 1 ) 2 / m ∑ i = 1 n ( Y i − μ 2 ) 2 / n ∼ F ( m , n ) \frac{\sum_{i=1}^n(X_i-\mu_1)^2/m}{\sum_{i=1}^n(Y_i-\mu_2)^2/n}\sim F(m,n) ∑i=1n​(Yi​−μ2​)2/n∑i=1n​(Xi​−μ1​)2/m​∼F(m,n) ∑ i = 1 n ( X i − X ‾ ) 2 / ( m − 1 ) ∑ i = 1 n ( Y i − Y ‾ ) 2 / ( n − 1 ) ∼ F ( m − 1 , n − 1 ) \frac{\sum_{i=1}^n(X_i-\overline X)^2/(m-1)}{\sum_{i=1}^n(Y_i-\overline Y)^2/(n-1)}\sim F(m-1,n-1) ∑i=1n​(Yi​−Y)2/(n−1)∑i=1n​(Xi​−X)2/(m−1)​∼F(m−1,n−1)
检验统计量 F = ∑ i = 1 n ( X i − μ 1 ) 2 / m ∑ i = 1 n ( Y i − μ 2 ) 2 / n F=\frac{\sum_{i=1}^n(X_i-\mu_1)^2/m}{\sum_{i=1}^n(Y_i-\mu_2)^2/n} F=∑i=1n​(Yi​−μ2​)2/n∑i=1n​(Xi​−μ1​)2/m​ F = ∑ i = 1 n ( X i − X ‾ ) 2 / ( m − 1 ) ∑ i = 1 n ( Y i − Y ‾ ) 2 / ( n − 1 ) F=\frac{\sum_{i=1}^n(X_i-\overline X)^2/(m-1)}{\sum_{i=1}^n(Y_i-\overline Y)^2/(n-1)} F=∑i=1n​(Yi​−Y)2/(n−1)∑i=1n​(Xi​−X)2/(m−1)​
拒绝域 { F < F 1 − α / 2 2 ( m , n ) } ∪ { F > F α / 2 2 ( m , n ) } \{F<F_{1-\alpha/2}^2(m,n)\}\cup\{F>F_{\alpha/2}^2(m,n)\} { F<F1−α/22​(m,n)}∪{ F>Fα/22​(m,n)} { F < F 1 − α / 2 2 ( m − 1 , n − 1 ) } ∪ { F > F α / 2 2 ( m − 1 , n − 1 ) } \{F<F_{1-\alpha/2}^2(m-1,n-1)\}\cup\{F>F_{\alpha/2}^2(m-1,n-1)\} { F<F1−α/22​(m−1,n−1)}∪{ F>Fα/22​(m−1,n−1)}

标签: 韩国cas传感器型号smn

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台