箱形圖
外观
(重定向自箱線圖)

箱形圖[1][2](box plot,boxplot)或盒狀圖[3]、盒式圖,又稱盒鬚圖[4](box-and-whisker plot/diagram)、箱線圖[5],是一種用作顯示一組數據或資料的位置和分散情況的統計圖。因圖形如箱子,且在上下四分位數之外常有線條像鬍鬚延伸出去而得名。箱子或盒子本身含第1四分位數、中位數(第2四分位數)及第3四分位數,向兩端凸出的鬚狀線段分別連接最小值與第1四分位數,以及第3四分位數與最大值。
離群值(outlier)有時會畫成是個別的點。箱型圖是無母數的,他顯示樣品的特性,對於母體分佈並無任何假設。在各種領域也經常被使用,常見於品質管理。不過作法相對較繁瑣。
箱形圖於1977年由美國著名統計學家约翰·图基(John Tukey)發明。它能顯示出一組數據的最大值、最小值、中位數、及上下四分位数。
定義
[编辑]
- Q0/4:最小值(minimum)
- Q1/4:第1四分位数(lower quartile)
- Q2/4:中位數(第2四分位数、median)
- Q3/4:第3四分位数(upper quartile)
- Q4/4:最大值(maximum)
以第1四分位數(Q1/4)和第3四分位數(Q3/4)的數值作為箱型的上下限。
範例
[编辑]以下是箱形圖的具體例子:

這組數據顯示出:
- 下邊界=5
- 第1四分位數(Q1)=7
- 中位數、第2四分位數(median、Q2)=8.5
- 第3四分位數(Q3)=9
- 上邊界=10
- 四分位間距(interquartile range,簡稱IQR)==2 (即ΔQ)
當有數值與第1與第3四分位數的範圍差距1.5×IQR以上時,該值為離群值(outlier)。
數值位於範圍外1.5×IQR到3×IQR範圍的數值,稱作適度離群值(mild outlier)。
數值位於範圍外3×IQR以上的數值,稱作極端離群值(extreme outlier)。
因此該圖中的離群值有:
- 適度離群值(mild outlier) = 3.5
- 極端離群值(extreme outlier) = 0.5
參考
[编辑]- ^ 帕庆.管理与组织发展:通过箭形图,箱形图和圆形图看问题[M].经济管理出版社,2003.
- ^ 陳耀茂. 圖解品管統計方法. 五南圖書出版股份有限公司. 2021: 34. ISBN 9789865223748.
- ^ 譚克平(2007)。國中教導盒狀圖的建議及介紹如何用EXCEL製作盒狀圖。科學教育月刊,(305),20-34。https://doi.org/10.6216/SEM.200712_(305).0004
- ^ 盒狀圖;盒鬚圖. 樂詞網. 國家教育研究院 (中文(臺灣)).
- ^ 朱兵.箱线图及其在JCR网络版中的应用[J].农业图书情报学刊, 2011(08):15-18.DOI:10.3969/j.issn.1002-1248.2011.08.004.
外部链接
[编辑]- Visual Presentation of Data by Means of Box Plots (PDF)
- On-line box plot calculator with explanations and examples (页面存档备份,存于互联网档案馆)
- Box and Whisker Diagrams: getting Microsoft Excel to plot them for you
- Box and Whisker Plots in Microsoft Excel (页面存档备份,存于互联网档案馆)
- Box plot and whisker plots in Excel 2007 (页面存档备份,存于互联网档案馆)
- Box plot explanation, examples and a javascript/css-based box plot (页面存档备份,存于互联网档案馆)
- 台灣交通大學開放式課程 統計學(一) (页面存档备份,存于互联网档案馆):第四週課程 (youtube)