司徒頓t檢定

司徒頓t 檢定（英語：Student's t-test）是指虛無假說成立時的任一檢定統計有司徒頓t分布的統計假說檢定，屬於母數統計。學生t檢驗常作為檢驗一群來自常態分配母體的獨立樣本之期望值是否為某一實數，或是二（两）群來自常態分配母體的獨立樣本之期望值的差是否為某一實數。舉個簡單的例子，在某個學校中我們可以從某個年級中隨機抽樣一群男生，以檢驗該年級男生與全校男生之身高差異程度是否如我們所假設的某個值。

由來

司徒頓t檢定是威廉·戈塞為了觀測釀酒品質於1908年所提出的，「司徒頓 (student)」則是他的筆名。^[1]^[2]^[3]^[4] 基於克勞德·健力士（Claude Guinness）聘用從牛津大學和劍橋大學出來的最好的畢業生，^[2]以將生物化學及統計學應用到健力士工業流程的創新政策，戈塞受雇於都柏林的健力士釀酒廠擔任統計學家。戈塞提出了t检验以降低啤酒重量监控的成本。戈塞於1908年在《Biometrika（英语：Biometrika）》期刊上公布t檢驗，但因其老闆認為其為商業機密而被迫使用筆名，統計學論文內容也跟釀酒無關。實際上，其他统计学家是知道戈塞真實身份的。

應用

常見的應用有：

单样本检验：检验一个正态分布的总体的均值是否在满足零假设的值之内，例如檢驗一群軍校男生的身高的平均是否符合全國標準的170公分界線。
獨立樣本 $t$ 檢定（双样本）：其零假设为两个正态分布的总体的均值之差為某實數，例如檢定二群人之平均身高是否相等。若两母體的變異數是相等的情况下（同質變異數），自由度為兩樣本數相加再減二；若為異質變異數（母體變異數不相等），自由度則為Welch自由度，此情況下有时被称为Welch检验。
配对樣本 $t$ 檢定（成對樣本 $t$ 檢定）：檢定自同一母體抽出的成對樣本間差异是否为零。例如，檢测一位病人接受治疗前和治疗后的肿瘤尺寸大小。若治疗是有效的，我们可以推定多数病人接受治疗后，肿瘤尺寸將縮小。
检验一迴歸模型的偏迴歸係數是否显著不为零，即檢定解釋變數 $X$ 是否存在對被解釋變數Y的解釋能力，其檢定統計量稱之為t-比例（t-ratio）。

前提假設

大多數的 $t$ 檢定之統計量具有 $t={\frac {Z}{s}}$ 的形式，其中 $Z$ 與 $s$ 是已知資料的函數。 $Z$ 通常被設計成對於對立假說有關的形式，而 $s$ 是一個比例母數使 $t$ 服從於 $t$ 分佈。以單樣本 $t$ 檢驗為例， $Z={\frac {\bar {X}}{\frac {\sigma }{\sqrt {n}}}}$ ，其中 ${\bar {X}}$ 為樣本平均數， $n$ 為樣本數， $\sigma$ 為总体標準差。至於 $s$ 在單樣本 $t$ 檢驗中為 ${\frac {\hat {\sigma }}{\sigma }}$ ，其中 ${\hat {\sigma }}$ 為樣本的標準差。在符合零假說的條件下， $t$ 檢定有以下前提：

$Z$ 服從標準常態分佈
$(n-1)s^{2}$ 服從自由度 $(n-1)$ 的卡方分佈
$Z$ 與 $s$ 互相獨立

計算

單樣本 $t$ 檢驗

檢驗虛無假說為一群來自常態分配獨立樣本 $x_{i}$ 之母體期望值 $\mu$ 為 $\mu _{0}$ 可利用以下統計量

t={\frac {{\overline {x}}-\mu _{0}}{\frac {s}{\sqrt {n}}}}

其中 $i=1\ldots n$ ， ${\overline {x}}={\frac {\sum _{i=1}^{n}x_{i}}{n}}$ 為樣本平均數， $s={\sqrt {\frac {\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}{n-1}}}$ 為樣本標準差， $n$ 為樣本數。該統計量 $t$ 在虛無假說： $\mu =\mu _{0}$ 為真的條件下服從自由度為 $n-1$ 的t分佈。

配對樣本 $t$ 檢驗

配對樣本 $t$ 檢驗可視為單樣本 $t$ 檢驗的擴展，不過檢驗的對象由一群來自常態分配獨立樣本更改為兩配對樣本之觀測值之差。

若兩配對樣本 $x_{1i}$ 與 $x_{2i}$ 之差為 $d_{i}=x_{1i}-x_{2i}$ 獨立且來自常態分配，則 $d_{i}$ 之母體期望值 $\mu$ 是否為 $\mu _{0}$ 可利用以下統計量

t={\frac {{\overline {d}}-\mu _{0}}{s_{d}/{\sqrt {n}}}}

其中 $i=1\ldots n$ ， ${\overline {d}}={\frac {\sum _{i=1}^{n}d_{i}}{n}}$ 為配對樣本差值之平均數， $s_{d}={\sqrt {\frac {\sum _{i=1}^{n}(d_{i}-{\overline {d}})^{2}}{n-1}}}$ 為配對樣本差值之標準差， $n$ 為配對樣本數。該統計量 $t$ 在虛無假說： $\mu =\mu _{0}$ 為真的條件下服從自由度為 $n-1$ 的t分布。

獨立雙樣本t檢驗

同質變異數假設 (Homoscedasticity)、樣本數相等

若兩獨立樣本 $x_{1i}$ 與 $x_{2i}$ 具有相同之樣本數 $n$ ，且來自兩個母體變異數相同（同質變異數假設）的常態分配，則兩母體之期望值差 $\mu _{1}-\mu _{2}$ 是否為 $\mu _{0}$ 可利用以下統計量

t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {\frac {2s_{p}^{2}}{n}}}}

其中 $i=1\ldots n$ ， ${\overline {x}}_{1}=(\sum _{i=1}^{n}x_{1i})/n$ 及 ${\overline {x}}_{2}={\frac {\sum _{i=1}^{n}x_{2i}}{n}}$ 為兩樣本各自的平均數， $s_{p}^{2}={\frac {\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2}+\sum _{i=1}^{n}(x_{2i}-{\overline {x}}_{2})^{2}}{2n-2}}$ 為樣本之共同方差。該統計量 $t$ 在虛無假說： $\mu _{1}-\mu _{2}=\mu _{0}$ 為真的條件下服從自由度為 $2n-2$ 的t分佈。

同質變異數假設 (Homoscedasticity)、樣本數不相等

若兩獨立樣本 $x_{1i}$ 與 $x_{2j}$ 具有不相同之樣本數 $n_{1}$ 與 $n_{2}$ ，且來自兩個母體變異數相同（同質變異數假設）的常態分配，則兩母體之期望值之差 $\mu _{1}-\mu _{2}$ 是否為 $\mu _{0}$ 可利用以下統計量

t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {{\frac {s_{p}^{2}}{n_{1}}}+{\frac {s_{p}^{2}}{n_{2}}}}}}

其中 $i=1\ldots n_{1}$ ，其中 $j=1\ldots n_{2}$ ， ${\overline {x}}_{1}={\frac {\sum _{i=1}^{n}x_{1i}}{n}}$ 及 ${\overline {x}}_{2}={\frac {\sum _{i=1}^{n}x_{2i}}{n}}$ 為兩樣本各自的平均數， $s_{p}^{2}={\frac {(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2}+\sum _{j=1}^{n}(x_{2j}-{\overline {x}}_{2})^{2}}{n_{1}+n_{2}-2}}$ 為兩樣本共同之方差。該統計量 $t$ 在虛無假說： $\mu _{1}-\mu _{2}=\mu _{0}$ 為真的條件下服從自由度為 $n_{1}+n_{2}-2$ 的t分佈。

異質變異數假設 (Heteroscedasticity)

若兩獨立樣本 $x_{1i}$ 與 $x_{2j}$ 具有相同或不相同之樣本數 $n_{1}$ 與 $n_{2}$ ，且兩者母體變異數不相等（異質變異數假設）的常態分配，則兩母體之期望值之差 $\mu _{1}-\mu _{2}$ 是否為 $\mu _{0}$ 可利用以下統計量

t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {{\frac {s_{1}^{2}}{n_{1}}}+{\frac {s_{2}^{2}}{n_{2}}}}}}

其中 $i=1\ldots n_{1}$ ，其中 $j=1\ldots n_{2}$ ， ${\overline {x}}_{1}={\frac {\sum _{i=1}^{n_{1}}x_{1i}}{n_{1}}}$ 及 ${\overline {x}}_{2}={\frac {\sum _{j=1}^{n_{2}}x_{2j}}{n}}$ 為兩樣本各自的平均數， $s_{1}^{2}={\frac {\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2}}{n_{1}-1}}$ 及 $s_{2}^{2}={\frac {\sum _{j=1}^{n}(x_{2j}-{\overline {x}}_{2})^{2}}{n_{2}-1}}$ 分別為兩樣本之方差。該統計量t在虛無假說： $\mu _{1}-\mu _{2}=\mu _{0}$ 為真的條件下服從自由度為

df={\frac {({\frac {s_{1}^{2}}{n_{1}}}+{\frac {s_{2}^{2}}{n_{2}}})^{2}}{{\frac {({\frac {s_{1}^{2}}{n_{1}}})^{2}}{n_{1}-1}}+{\frac {({\frac {s_{2}^{2}}{n_{2}}})^{2}}{n_{2}-1}}}}

之t分布。這種方法又常稱為Welch檢驗。

其它相關檢驗

偏迴歸係數是否為零之檢定

以簡單線性迴歸為例

模型假設：

y_{i}=\alpha +\beta x_{i}+\varepsilon _{i},

其中 $x_{i}$ ， $i=1,\cdots ,n$ 為已知， $\alpha$ 與 $\beta$ 為未知係數， $\varepsilon _{i}$ 為殘差獨立且服從期望值0且方差 $\sigma ^{2}$ 未知的常態分佈， $y_{i}$ ， $i=1,\cdots ,n$ 為觀測值。我們可以檢驗迴歸係數 $\beta$ 是否相等於特定的 $\beta _{0}$ ，通常使 $\beta _{0}=0$ 以檢定 $x_{i}$ 對 $y_{i}$ 是否存在解釋能力，在此例（簡單線性迴歸模型）即為檢定迴歸式之斜率是否為零。

令 ${\widehat {\alpha }}$ 與 ${\widehat {\beta }}$ 為最小平方法之估計值， $SE_{\widehat {\alpha }}$ 與 $SE_{\widehat {\beta }}$ 為最小平方法估計值之標準誤差，則

t={\frac {{\widehat {\beta }}-\beta _{0}}{SE_{\widehat {\beta }}}}\sim {\mathcal {T}}_{n-2}

在虛無假說為 $\beta =\beta _{0}$ 的情況下服從自由度為 $n-2$ 之 $t$ 分布，此檢定統計量被稱作「t比率 (t-ratio)」，其中

SE_{\widehat {\beta }}={\frac {\sqrt {{\frac {1}{n-2}}\sum _{i=1}^{n}(y_{i}-{\widehat {y}}_{i})^{2}}}{\sqrt {\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}}}

由於 ${\widehat {\varepsilon }}_{i}=y_{i}-{\widehat {y}}_{i}=y_{i}-({\widehat {\alpha }}+{\widehat {\beta }}x_{i})$ 為殘差（即估計誤差），而 ${\text{SSR}}=\sum _{i=1}^{n}{\widehat {\varepsilon }}_{i}^{\;2}$ 為殘差之離均平方和，我們可改寫t為

t={\frac {({\widehat {\beta }}-\beta _{0}){\sqrt {n-2}}}{\sqrt {\frac {\text{SSR}}{\sum _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}}}}}

另请参阅：F检验

電腦軟體

大多數的試算表軟體及統計軟體，諸如QtiPlot、OpenOffice.org Calc、LibreOffice Calc、Microsoft Excel、SAS、SPSS、Stata、DAP、gretl、R、Python ([1]（页面存档备份，存于互联网档案馆）)、PSPP、Minitab等，都可以進行t檢驗運算。

编程语言/软件程序	函数	注释
Microsoft Excel 2010 之前的版本	`TTEST(array1, array2, tails, type)`	参见 [2]
Microsoft Excel 2010 及更高版本	`T.TEST(array1, array2, tails, type)`	参见 [3]（页面存档备份，存于互联网档案馆）
LibreOffice	`TTEST(Data1; Data2; Mode; Type)`	参见 [4]（页面存档备份，存于互联网档案馆）
Google Sheets	`TTEST(range1, range2, tails, type)`	参见 [5]（页面存档备份，存于互联网档案馆）
Python	`scipy.stats.ttest_ind(a, b, axis=0, equal_var=True)`	参见 [6]（页面存档备份，存于互联网档案馆）
Matlab	`ttest(data1, data2)`	参见 [7]（页面存档备份，存于互联网档案馆）
Mathematica	`TTest[{data1,data2}]`	参见 [8]（页面存档备份，存于互联网档案馆）
R	`t.test(data1, data2)`
SAS	`PROC TTEST`	参见 [9]
Java	`tTest(sample1, sample2)`	参见 [10]（页面存档备份，存于互联网档案馆）
Julia	`EqualVarianceTTest(sample1, sample2)`	参见 [11]
Stata	`ttest data1 == data2`	See [12]（页面存档备份，存于互联网档案馆）

參見

參考文獻

^ Richard Mankiewicz, The Story of Mathematics (Princeton University Press), p.158.
^ ^2.0 ^2.1 約翰·J·奧康納; 埃德蒙·F·羅伯遜, Gosset, MacTutor数学史档案（英语）
^ Fisher Box, Joan. Guinness, Gosset, Fisher, and Small Samples. Statistical Science. 1987, 2 (1): 45–52. JSTOR 2245613. doi:10.1214/ss/1177013437.
^ 存档副本 (PDF). [2013-08-10]. （原始内容 (PDF)存档于2017-05-16）.

[1] Richard Mankiewicz, The Story of Mathematics (Princeton University Press), p.158.

[Gossett-2] 2.0 ^2.1 約翰·J·奧康納; 埃德蒙·F·羅伯遜, Gosset, MacTutor数学史档案（英语）

[3] Fisher Box, Joan. Guinness, Gosset, Fisher, and Small Samples. Statistical Science. 1987, 2 (1): 45–52. JSTOR 2245613. doi:10.1214/ss/1177013437.

[4] 存档副本 (PDF). [2013-08-10]. （原始内容 (PDF)存档于2017-05-16）.

[1]

[2]

[3]

[4]

由來

應用