威沙特参数 |
自由度 (实数)
尺度矩阵 (正定) |
---|
值域 |
是正定的 |
---|
概率密度函数 |
![{\displaystyle {\frac {\left|\mathbf {W} \right|^{\frac {n-p-1}{2}}}{2^{\frac {np}{2}}\left|{\mathbf {V} }\right|^{\frac {n}{2}}\Gamma _{p}({\frac {n}{2}})}}\exp \left(-{\frac {1}{2}}{\rm {Tr}}({\mathbf {V} }^{-1}\mathbf {W} )\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/96eb771bb38b605e2417e8c71865cf5f91ae0db7) |
---|
期望值 |
![{\displaystyle n\mathbf {V} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/0f2c7c59629576bca4b074c0c11af842712aed43) |
---|
众数 |
![{\displaystyle (n-p-1)\mathbf {V} {\text{ for }}n\geq p+1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d6ae276483ecddd694aead182e41ad126b77a9d7) |
---|
特征函数 |
![{\displaystyle \Theta \mapsto \left|{\mathbf {I} }-2i\,{\mathbf {\Theta } }{\mathbf {V} }\right|^{-n/2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/dfc9deb8ba5cd288301865a28f49633215ccbbd2) |
---|
以统计学家约翰·威沙特为名的威沙特分布是统计学上的一种半正定矩阵随机分布。[1]这个分布在多变量分析的协方差矩阵估计上相当重要。
假设X为一n × p矩阵,其各行(row)来自同一均值向量为
的
维多变量常态分布且彼此独立。
![{\displaystyle X_{(i)}{=}(x_{i}^{1},\dots ,x_{i}^{p})^{T}\sim N_{p}(0,V),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e91fcfc766dcaca18742cc86b149a443f7145eb5)
则威沙特分布为
散异矩阵
![{\displaystyle S=X^{T}X=\sum _{i=1}^{n}X_{(i)}X_{(i)}^{T},\,\!}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6348a956d86b0fbf76a67b55bdd67216e8b81b13)
的机率分布。
有该机率分布通常记为
![{\displaystyle \mathbf {S} \sim W_{p}(\mathbf {V} ,n).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/de036c60d22f688fbdf8ebc768da15786c3231b9)
其中正整数
为自由度。有时亦记号为
。若
且
则该分布退化为一自由度为
的单变量卡方分布。
常见应用[编辑]
威沙特分布常用于多变量的概似比检定,亦用于随机矩阵的频谱理论中。
机率密度函数[编辑]
威沙特分布具有下述的机率密度函数:
令'
为一
正定对称随机变数矩阵。令
为一特定正定
矩阵。
如此,若
,则
服从于一具自由度n的威沙特分布且有机率度函数
![{\displaystyle f_{\mathbf {W} }(w)={\frac {\left|w\right|^{(n-p-1)/2}\exp \left[-{\rm {trace}}({\mathbf {V} }^{-1}w/2)\right]}{2^{np/2}\left|{\mathbf {V} }\right|^{n/2}\Gamma _{p}(n/2)}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c7dddb1cc3dbc9ff2a31f2c05100fe894905a7ff)
其中
为多变量Gamma分布,其定义为
![{\displaystyle \Gamma _{p}(n/2)=\pi ^{p(p-1)/4}\Pi _{j=1}^{p}\Gamma \left[(n+1-j)/2\right].}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9cb4f0fa47cd6030ff7a6d89c9e3479d1114e435)
上述定义可推广至任一实数
[2]
特征函数[编辑]
威沙特分布的特征函数为
![{\displaystyle \Theta \mapsto \left|{\mathbf {I} }-2i\,{\mathbf {\Theta } }{\mathbf {V} }\right|^{-n/2}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d052458ed7f0068c665a85990589efd80c450113)
也就是说
![{\displaystyle \Theta \mapsto {\mathcal {E}}\left\{\mathrm {exp} \left[i\cdot \mathrm {trace} ({\mathbf {W} }{\mathbf {\Theta } })\right]\right\}=\left|{\mathbf {I} }-2i{\mathbf {\Theta } }{\mathbf {V} }\right|^{-n/2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1fb9e92018939434e2075e7269c7c1d52367e85d)
其中
为期望值
(这里的
及
皆为与
维度相同的矩阵。(
为单位矩阵,而
为-1的平方根).[3]
理论架构[编辑]
若
为一自由度为m,共变异矩阵为
的威沙特分布,记为—
—其中
为一
的q秩矩阵,则[4]
![{\displaystyle {\mathbf {C} }{\mathbf {W} }{\mathbf {C} '}\sim {\mathbf {W} }_{q}\left({\mathbf {C} }{\mathbf {V} }{\mathbf {C} '},m\right).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a3d41de78cbb221b19b38f8a9020fbe4e93d324c)
推论1[编辑]
若
为一非负
常数向量,则[4]
.
则在此情形下,
为一卡方分布且
(因
为正定,所以
为一正常数)。
推论2[编辑]
在
的情形下(亦即第j个元素为1其他为0),推论1可导出
![{\displaystyle w_{jj}\sim \sigma _{jj}\chi _{m}^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5579700bf7e1181ad78a596cf9ca2d485a08b641)
为矩阵的每一个对对角元素的边际分布。
统计学家George Seber曾论证威沙特分布并非多变量卡方分布,这是因为非对角元素的边际分布并非卡方分布,Seber倾向于将某某多变量分布此一遣词用于所有元素的边际分布皆相同的情形。[5]
多变量常态分布的估计[编辑]
由于威沙特分布可视为一多变量常态分布其共变异矩阵的最大概似估计量(MLE)的分布,其衍自MLE的计算可为令人惊喜地简约而优雅。[6] 基于频谱理论,可将一纯量视为一
矩阵的迹(trace)。请参考共变异矩阵的估计。
分布抽样[编辑]
以下的演算法取材自 Smith & Hocking (1972)。[7]一个来自自由度为n及共变异矩阵为
的威沙特分布的
(其中
)随机样本可以如下方式抽样而得:
- 生成一随机
下三角矩阵
使得:
,意即
为一
卡方分布随机样本的平方根。
其中
,为一
常态分布的随机样本。[8]
- 计算
的Cholesky分解。
- 计算
。此时,
为一
的随机样本。
若
,则因
,可以直接以
进行抽样。
参考条目[编辑]
参考资料[编辑]
- ^ Wishart, J. The generalised product moment distribution in samples from a normal multivariate population. Biometrika. 1928, 20A (1–2): 32–52. JFM 54.0565.02. JSTOR 2331939. doi:10.1093/biomet/20A.1-2.32.
- ^ Uhlig, H. On Singular Wishart and Singular Multivariate Beta Distributions. The Annals of Statistics. 1994, 22: 395–405. doi:10.1214/aos/1176325375.
- ^ Anderson, T. W. An Introduction to Multivariate Statistical Analysis 3rd. Hoboken, N. J.: Wiley Interscience. 2003: 259. ISBN 0-471-36091-0.
- ^ 4.0 4.1 Rao, C. R. Linear Statistical Inference and its Applications. Wiley. 1965: 535.
- ^ Seber, George A. F. Multivariate Observations. Wiley. 2004. ISBN 978-0471691211.
- ^ Chatfield, C.; Collins, A. J. Introduction to Multivariate Analysis. London: Chapman and Hall. 1980: 103–108. ISBN 0-412-16030-7.
- ^ Smith, W. B.; Hocking, R. R. Algorithm AS 53: Wishart Variate Generator. Journal of the Royal Statistical Society, Series C. 1972, 21 (3): 341–345. JSTOR 2346290.
- ^ Anderson, T. W. An Introduction to Multivariate Statistical Analysis 3rd. Hoboken, N. J.: Wiley Interscience. 2003: 257. ISBN 0-471-36091-0.
- Gelman, Andrew. Bayesian Data Analysis 2nd. Boca Raton, Fla.: Chapman & Hall. 2003: 582 [3 June 2015]. ISBN 158488388X. (原始内容存档于2021-02-17).
- Zanella, A.; Chiani, M.; Win, M.Z. On the marginal distribution of the eigenvalues of wishart matrices. IEEE Transactions on Communications. April 2009, 57 (4): 1050–1060. doi:10.1109/TCOMM.2009.04.070143.
- Bishop, C. M. Pattern Recognition and Machine Learning. Springer. 2006: 693.
- Pearson, Karl; Jeffery, G. B.; Elderton, Ethel M. On the Distribution of the First Product Moment-Coefficient, in Samples Drawn from an Indefinitely Large Normal Population. Biometrika (Biometrika Trust). December 1929, 21: 164–201. JSTOR 2332556. doi:10.2307/2332556.
- Craig, Cecil C. On the Frequency Function of xy. Ann. Math. Statist. 1936, 7: 1–15 [2016-05-02]. doi:10.1214/aoms/1177732541. (原始内容存档于2020-06-07).
- Peddada and Richards, Shyamal Das; Richards, Donald St. P. Proof of a Conjecture of M. L. Eaton on the Characteristic Function of the Wishart Distribution,. Annals of Probability. 1991, 19 (2): 868–874. doi:10.1214/aop/1176990455.
- Gindikin, S.G. Invariant generalized functions in homogeneous domains,. Funct. Anal. Appl. 1975, 9 (1): 50–52. doi:10.1007/BF01078179.
- Dwyer, Paul S. Some Applications of Matrix Derivatives in Multivariate Analysis. J. Amer. Statist. Assoc. 1967, 62 (318): 607–625. JSTOR 2283988.