標準差 - 科學Online - 國立臺灣大學
文章推薦指數: 80 %
標準差(Standard Deviation) ... 這樣來看,這兩班的成績雖有相同的「中心」,即算術平均數,但它們整體的分散、分佈、變異情況大不相同。
Monday11thApril2022
11-Apr-2022
人工智慧
化學
物理
數學
生命科學
生命科學文章
植物圖鑑
地球科學
環境能源
科學繪圖
高瞻專區
第一期高瞻計畫
第二期高瞻計畫
第三期高瞻計畫
綠色奇蹟-中等學校探究課程發展計畫
關於我們
網站主選單
標準差(StandardDeviation)
臺北市立和平高中黃俊瑋教師
給定一筆資料\(x_1\)、\(x_2\)、\(\cdots\)、\(x_n\),算術平均數\(\mu=\frac{\sum_{i=1}^{n}x_i}{n}\) 一般用作為數據的代表值或衡量數據集中趨勢的統計量。
雖然,算術平均數是數據重要代表值,但是可能發生下列情況:甲班與乙班某次數學考試的平均數皆為\(50\)分,但甲班同學的成績皆分佈在\(40-60\)分之間,而乙班約一半的學生都是\(90\)分以上,另一半學生都是個位數。
這樣來看,這兩班的成績雖有相同的「中心」,即算術平均數,但它們整體的分散、分佈、變異情況大不相同。
此時「\(50\)分」這個數字之於兩班成績的意義以及可解釋數據的程度亦不同。
因此,統計學家進一步發展出衡量數據分散、變異情況的統計量。
國中階段介紹了全距或四分位距,然讀者或許會覺得,這兩種統計量皆僅使用了「\(2\)」個數值來衡量整體數據的分散情況,所能提供的訊息有限。
然而,該如何完整地用上 \(x_1\)、\(x_2\)、\(\cdots\)、\(x_n\)這\(n\) 筆資料來設計出更適當的統計量呢?
我們想像射箭比賽,參賽選手射出的各隻箭若離靶中心越接近,表示偏差越小,較集中,表現越穩定,越符合神射手的形象(如圖一所示)。
反之,若所射各隻箭偏離中心很遠,較分散,即表現不穩定且偏差大(如圖二所示)。
圖一各隻箭離中心近,較集中
圖二各隻箭離中心較遠,較分散
依此射箭與靶心所得到的靈感,我們進一步利用每一筆數據與「中心」間的分散情況來建立新統計量。
首先,如何定位這筆數據的中心呢?直觀地,大家會聯想到利用算術平均數作為中心,接著,我們開始評估各數據和中心間的差異。
首先,可能想到各數據與中心之差(離均差),然而,\(\displaystyle\frac{\sum_{i=1}^{n}(x_i-\mu)}{n}=0\),
意即所有數據之離均差和為\(0\),此統計量無用。
再者,讀者可能會想到,利用各數據與中心之「距離」,即加上絕對值的方式來處理。
如此一來,可得一新的統計量:\(\displaystyle\frac{\sum_{i=1}^{n}|x_i-\mu|}{n}\),
此統計量的意義即為各數據與中心(平均數)之距離的平均值,故簡稱為平均絕對離差。
然而,絕對值在相關理論推廣與計算上皆較不容易且麻煩(去絕對值需考慮正負或分段討論),特別是絕對值函數無法直接微分,因此,此統計量亦不用。
為了保持各項「皆正」的效果,這時統計學家想到了「平方」,
如此可造出新統計量 \(\displaystyle\frac{\sum_{i=1}^{n}(x_i-\mu)^2}{n}\),並稱之為變異數。
變異數的意義可看成各數據與中心距離平方的平均值。
如圖三所示,中心平衡點為\(A\)、\(B\)、\(C\)、\(D\)、\(E\)、\(F\)、\(G\)七筆數據之算術平均數。
利用各筆數據與平均數可造出正方形,而變異數的幾何意義則是圖三中各各個正方形面積的平均值。
然此變異數因平方後,數值放大效果或單位平方等因素為其缺點,因此,統計上我們常用的統計量為變異數的正平方根,即 \(\text{S.D}=\displaystyle\sqrt{\frac{\sum_{i=1}^{n}(x_i-\mu)^2}{n}}\),此即為標準差(一般教科書會使用\(\sigma\) 符號代表標準差)。
而此標準差公式,一方面兼顧了數據中各個資料點,也考量了資料中心點,它也是統計上用來衡量數據分散、變異情況時,最常用且重要的統計量。
圖三 變異數的幾何意義
另一方面,就上述圖三中\(A\)、\(B\)、\(C\)、\(D\)、\(E\)、\(F\)、\(G\)這七筆數據的標準差來看,其幾何意義即是「以圖中這些正方形面積平均值為面積的正方形邊長」。
一般而言,即是利用\(n\)筆數據與資料中心點─算術平均數─造出\(n\)個正方形,再求其平均面積,得一個「平均正方形」,再求其邊長得「平均邊長」,此值即為標準差。
在統計公式複雜且難記之餘,利用幾何上的直觀意義與想法,恰可提供一般讀者與中學生另類的記憶方式以及對複雜公式的數感。
Tags:幾何意義,數據分析,標準差
前一篇文章下一篇文章
您或許對這些文章有興趣
惠更斯(ChristiaanHuygens)專題
海芭夏(HypatiaofAlexandria)
泰勒多項式(2)(TaylorPolynomials(2))
發表迴響Cancelcommentreply
你的電子郵件位址並不會被公開。
必要欄位標記為*迴響名稱*
電子郵件*
個人網站
驗證問題*
−1=3
熱門文章
前列腺素(Prostaglandin)
母體變異數v.s.樣本變異數
轉動慣量
倍角公式
酸鹼滴定
點到直線的距離公式
混成軌域
可見光譜
定壓熱容量(Cp)和定容熱容量(Cv)的差別(下)
數學之旅:三角形面積公式(Ⅳ)
總點閱排行
點到直線的距離公式
細胞膜運輸物質的方式
比爾定律與吸收度
混成軌域
準確度和精確度
腎素-血管收縮素-醛固酮系統
穿透式電子顯微鏡
好站鏈接
科學online粉絲專頁
Insertmathas
Block
Inline
Additionalsettings
Formulacolor
Textcolor
#333333
FormulaID
Formulaclasses
TypemathusingLaTeX
Preview
\({}\)
Nothingtopreview
Insert
延伸文章資訊
- 1標準差- 维基百科,自由的百科全书
- 2標準差 - 科學Online - 國立臺灣大學
標準差(Standard Deviation) ... 這樣來看,這兩班的成績雖有相同的「中心」,即算術平均數,但它們整體的分散、分佈、變異情況大不相同。
- 3標準差_百度百科
所有數減去其平均值的平方和,所得結果除以該組數之個數(或個數減一,即變異數),再把所得值開根號,所得之數就是這組數據的標準差。 深藍區域是距平均值一個標準差之內 ...
- 4標準差(Standard Deviation),在概率統計中最常使用作為
所有數減去其平均值的平方和,所得結果除以該組數之個數(或個數減一,即變異數),再把所得值開根號,所得之數就是這組資料的標準差。 深藍區域是距平均值小于一個標準差之 ...
- 5單日營收低於平均營收,就表示今天業績不佳?不一定! - 經理人
標準差是用來判斷每日營業額和平均營業額之間的差異程度,必須分別算出每個數據與平均值之間的差額,將差額平方後再相加,接著除以個數,最後開根號。