卡方分布
機率密度函數 ![](//upload.wikimedia.org/wikipedia/commons/thumb/2/21/Chi-square_distributionPDF.png/325px-Chi-square_distributionPDF.png) |
累積分布函數 ![](//upload.wikimedia.org/wikipedia/commons/thumb/c/cb/Chi-square_distributionCDF.png/325px-Chi-square_distributionCDF.png) |
參數 |
自由度 |
---|
值域 |
, |
---|
機率密度函數 |
![{\displaystyle {\frac {1}{2^{\frac {k}{2}}\Gamma \left({\frac {k}{2}}\right)}}\;x^{{\frac {k}{2}}-1}e^{-{\frac {x}{2}}}\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/846f8111d6b4bae031edd73522f5a55437e5bb2c) |
---|
累積分布函數 |
![{\displaystyle {\frac {1}{\Gamma \left({\frac {k}{2}}\right)}}\;\gamma \left({\frac {k}{2}},\,{\frac {x}{2}}\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/29be6d36250f57f007ebff550b9b49a7f412f94d) |
---|
期望值 |
![{\displaystyle k}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c3c9a2c7b599b37105512c5d570edc034056dd40) |
---|
中位數 |
![{\displaystyle \approx k{\bigg (}1-{\frac {2}{9k}}{\bigg )}^{3}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d0d9d3cbb5fdbb1ad7c4642e6bca9cac449b553a) |
---|
眾數 |
max{ k − 2, 0 } |
---|
變異數 |
![{\displaystyle 2k}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ab358eb7defb4d2b0fc1f9e8a4e2d189fe600eb6) |
---|
偏度 |
![{\displaystyle \scriptstyle {\sqrt {8/k}}\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b153b226deb8255bbe12704015a73bb6610aa187) |
---|
峰度 |
![{\displaystyle 12/k}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a69c8e818cdc83079cc238bc28c4c04675d087d4) |
---|
熵 |
![{\displaystyle {\begin{aligned}{\frac {k}{2}}&+\ln(2\Gamma (k/2))\\&\!+(1-k/2)\psi (k/2)\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6c8a0590a94767ed01049fd2a9f9b65192999829) |
---|
動差母函數 |
,![{\displaystyle 2\,t<1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6bcf126ab3972e8f5e00b957964923f812738ef2) |
---|
特徵函數 |
[1] |
---|
卡方分布(英語:chi-square distribution[2], χ²-distribution,或寫作χ²分布)是概率論與統計學中常用的一種概率分布。k個獨立的標準正態分布變量的平方和服從自由度為k的卡方分布。卡方分布是一種特殊的伽瑪分布,是統計推論中應用最為廣泛的概率分布之一,例如假說檢定和置信區間的計算。
由卡方分布延伸出來皮爾森卡方檢定常用於:
- 樣本某性質的比例分布與母體理論分布的擬合優度(例如某行政機關男女比是否符合該機關所在城鎮的男女比);
- 同一母體的兩個隨機變量是否獨立(例如人的身高與交通違規的關聯性);
- 二或多個母體同一屬性的同質性檢定(義大利麵店和壽司店的營業額有沒有差距)。(詳見皮爾森卡方檢定)
數學定義[編輯]
若k個隨機變量
、……、
是相互獨立且符合標準正態分布的隨機變量(數學期望為0、方差為1),則隨機變量Z的平方和
![{\displaystyle X=\sum _{i=1}^{k}Z_{i}^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5248fb0830a7e66ab3075b6a694d962b1468b5f7)
被稱為服從自由度為 k 的卡方分布,記作
![{\displaystyle X\ \sim \ \chi ^{2}(k)\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7674f8f53c0f1a36bf753fba2ae52fe8160d9f5c)
![{\displaystyle \ X\ \sim \ \chi _{k}^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1d984cc4b04e09948ab6334deb9d2f54050bc64b)
可以在文章右上角的表中看到更多卡方分布的性質。
概率密度函數[編輯]
卡方分布的概率密度函數為:
![{\displaystyle f_{k}(x)={\frac {1}{2^{\frac {k}{2}}\Gamma ({\frac {k}{2}})}}x^{{\frac {k}{2}}-1}e^{\frac {-x}{2}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e1cf7ec6e88df8a9501490e85e76040fd2a51dda)
其中
,當
時
。這裡Γ代表Gamma函數。
累積分布函數[編輯]
卡方分布的累積分布函數為:
,
其中γ(k,z)為不完全Γ函數
在大多數涉及卡方分布的書中都會提供它的累積分布函數的對照表。此外許多表格計算軟件如OpenOffice.org Calc和Microsoft Excel中都包括卡方分布函數。
自由度為k的卡方變量的平均值是k,方差是2k。
卡方分布是伽瑪分布的一個特例,它的熵為:
![{\displaystyle H=\int _{-\infty }^{\infty }f(x)\ln(f(x))dx={\frac {k}{2}}+\ln \left(2\Gamma \left({\frac {k}{2}}\right)\right)+\left(1-{\frac {k}{2}}\right)\psi (k/2)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c7b00a2611c938a63f179db608405c7adfe073f3)
其中
是雙伽瑪函數。
卡方變數與Gamma變數的關系[編輯]
當Gamma變數 頻率(λ)為1/2時,α的2倍為卡方變數之自由度。
即:
![{\displaystyle r.v.Y=\chi ^{2}\left(U\right)=\Gamma \left(\alpha ={\frac {U}{2}},\lambda ={\frac {1}{2}}\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9a7675e7364edf25e2584e5541e7823b5830f9f2)
![{\displaystyle \operatorname {E} \left(\chi ^{2}\left(U\right)\right)=\operatorname {E} \left(Y\right)={\frac {\alpha }{\lambda }}={\frac {\frac {U}{2}}{\frac {1}{2}}}=U}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6658b3b9cb61817574167b9cd8fe8b9562c66619)
![{\displaystyle \operatorname {Var} \left(\chi ^{2}\left(U\right)\right)=\operatorname {Var} \left(Y\right)={\frac {\alpha }{\lambda ^{2}}}={\frac {\frac {U}{2}}{\left({\frac {1}{2}}\right)^{2}}}=2U}](https://wikimedia.org/api/rest_v1/media/math/render/svg/14098510d186dfd4794737ff5d68ba373d303b18)
卡方變數之期望值=自由度
卡方變數之方差=兩倍自由度
可加性[編輯]
由定義可得,獨立卡方變量之和同樣服從卡方分布。特別地,若
分別獨立服從自由度為
的卡方分布,那麼它們的和
服從自由度為
的卡方分布。
偏差的平方和[編輯]
若k個隨機變量
、……、
是相互獨立,符合標準正態分布的隨機變量,則它們與均值之間偏差的平方和
其中均值
它的平方正比於自由度為1的卡方分布,即
卡方分布表[編輯]
p-value = 1- p_CDF.
χ2越大,p-value越小,則可信度越高。通常用p=0.05作為閾值,即95%的可信度。
常用的χ2與p-value表如下:
自由度k \ P value (概率)
|
0.95
|
0.90
|
0.80
|
0.70
|
0.50
|
0.30
|
0.20
|
0.10
|
0.05
|
0.01
|
0.001
|
1
|
0.004
|
0.02
|
0.06
|
0.15
|
0.46
|
1.07
|
1.64
|
2.71
|
3.84
|
6.64
|
10.83
|
2
|
0.10
|
0.21
|
0.45
|
0.71
|
1.39
|
2.41
|
3.22
|
4.60
|
5.99
|
9.21
|
13.82
|
3
|
0.35
|
0.58
|
1.01
|
1.42
|
2.37
|
3.66
|
4.64
|
6.25
|
7.82
|
11.34
|
16.27
|
4
|
0.71
|
1.06
|
1.65
|
2.20
|
3.36
|
4.88
|
5.99
|
7.78
|
9.49
|
13.28
|
18.47
|
5
|
1.14
|
1.61
|
2.34
|
3.00
|
4.35
|
6.06
|
7.29
|
9.24
|
11.07
|
15.09
|
20.52
|
6
|
1.63
|
2.20
|
3.07
|
3.83
|
5.35
|
7.23
|
8.56
|
10.64
|
12.59
|
16.81
|
22.46
|
7
|
2.17
|
2.83
|
3.82
|
4.67
|
6.35
|
8.38
|
9.80
|
12.02
|
14.07
|
18.48
|
24.32
|
8
|
2.73
|
3.49
|
4.59
|
5.53
|
7.34
|
9.52
|
11.03
|
13.36
|
15.51
|
20.09
|
26.12
|
9
|
3.32
|
4.17
|
5.38
|
6.39
|
8.34
|
10.66
|
12.24
|
14.68
|
16.92
|
21.67
|
27.88
|
10
|
3.94
|
4.86
|
6.18
|
7.27
|
9.34
|
11.78
|
13.44
|
15.99
|
18.31
|
23.21
|
29.59
|
參考文獻[編輯]
外部連結[編輯]