標準差與標準偏差 - 中興大學生物系統工程研究室陳加忠
文章推薦指數: 80 %
在許多醫學研究數據中,標準差(standard deviation, SD)與標準偏差(the estimated standard error of ... 在醫學文獻,除了平均值(mean),還需要標準差與標準偏差值。
首頁
新增資料與公告
最新消息 :
媽媽,這次我又得到第一名,這次是世界第一
在投稿的論文中使用複製進行統計分析
誤導性統計示例。
如何發現在數字時代濫用統計和數據
標準差與標準偏差
中興大學生物系統工程研究室陳加忠
在許多醫學研究數據中,標準差(standard
deviation,SD)與標準偏差(the
estimatedstandarderrorofthemean,SEM),常常被使用以代表數據的特性與解釋統計分析結果。
然而後者常常被誤用。
Source:
Leeetal.,2015,Standarddeviationandstandarderrorofthemean,
KoreanJ.ofAnesthesiology,68(3):220-223.
一堆數據如果其沿著一個特定值而均勻分佈,此稱為常態分佈。
常態分佈是進行參數統計分析的基本條件。
代表數據有向中央集中之趨勢。
然而要代表這個分佈的形狀,只有一個"平均值"此數據還是不足。
在醫學文獻,除了平均值(mean),還需要標準差與標準偏差值。
醫學研究中對一個族群(population)進行研究,然後自此族群(母群)取出樣本以進行假設試驗。
只要取樣過程是不偏,而且有足夠的樣本數目,取樣樣本也是常態分佈。
對所有常態分佈的數據,樣本分佈特性可由平均值與變異量代表。
變異量之數值為標準差,代表觀察值與平均值之差異性。
如果數據的散佈都是接近平均值,代表此變異量減少。
但是變異數(Variance)其單位與平均值不同,因此以標準差與平均值比較是更有意義。
樣本:X1,X2,--Xn,根本數目n。
平均值=
/n
變異數(Variance)
=2/n-1
SD=
因此常態分佈以平均值與標準差表示是更有意義。
在常態分佈圖上,68.7%的觀察值是落在平均值±1個標準差值之範圍。
95.4%數據位於平均值±兩個標準差之範圍。
因此許多文獻都是報導平均值與標準差值。
在醫學研究文獻中,樣本代表一系列來自母群觀察的數值。
因為試驗過程無法對母群進行全面試驗,因此自母群中取樣進行試驗十分重要。
在研究進行之前,要針對研究計劃以估算所需樣本數目,所抽樣之樣本只是整體母群的一小部份,因此樣本平均值僅是母群平均值的一個評估值。
對母群內進行取樣研究,每次試驗此樣本群內的數據並不相同。
例如第一組取樣30個,第二組也取樣30個,第三組取樣30個。
自第一組至第三組,每組數據的平均值與標準差值都不相同。
不同組的樣本數值,稱為樣本分佈,也是一個常態分佈。
每一個樣本分佈其標準差可以加以計算,稱為標準偏差。
標準偏差值由母群的變異量與取樣的樣本數目所決定。
母群的變異量大,樣本分佈的變異量也大。
但是只要樣本數目增加,樣本平均值更接近母群平均值,標準偏差值更小。
標準偏差用來代表樣本平均值接近的程度。
但是實際上,往往每一次只有自母群取樣一個樣本。
因此標準偏差則由標準差與樣本數目加以估算。
標準偏差
=標準差/
一個母群平均值之評估方法往往使用信賴區間此概念。
最常使用為95%的信賴區間。
例如95%之信賴區間,為
EQ\x\to(X)
±1.96*標準偏差。
用來代表母群平均值95%機率下會出現在那些範圍。
換言之,平均值自100個樣本所計算之數值,有95個數據在此範圍,5個數據在範圍之外。
以統計方法比較不同組的數據群,研究人員估計各樣本之母群,並且檢查是否相同。
這個情況下,標準偏差用以代表樣本之變異,用以估計母群之平均值。
藉由預先設定之顯著水準(Pre-set
significatelevel),評估樣本在誤差範圍內能否代表母群。
標準偏差值一定小於標準差值,標準偏差值來自標準差值除以開根號之數據數目。
因此研究人員偏愛以標準偏差值描述其樣本。
如果兩組數據之數目相同,以標準偏差或標準差之比較結果是相同。
然而樣本數目十分重要。
合理的樣本數目才能得到合理之統計推論。
例如母群變異數如果極大,標準差值一定變大。
如果樣本數目增大,標準偏差值變小,此情況下使用標準偏差進行統計推定(descriptive
statistics),容易造成推論錯誤。
這在醫學研究上十分常見,因為醫學研究先天就存在內在與外在的個別差異。
本文作者檢查Korean
JournalofAnesthesiology第6卷1-6期共有36篇實驗研究,發現許多不當使用標準差與標準偏差之個案。
例如進行統計推論,只有一篇使用95%信賴區間,但未述明樣本數目。
36篇論文,只有一篇研究曾進行常態分配檢定。
所有36篇論文使用標準差值,樣本數目或百分比以描述統計結果。
但是在圖形(figures)並未標誌平均值,標準差或四分區間(interquartile
range),16篇論文使用樣本數或百分比,但是未使用信賴區間。
有兩篇論文使用信賴區間,有一篇論文是錯誤使用,作者建議在論文評審過程必需加留意,以免妨礙數據正確判讀。
《評論》
標準差反應了數據常態分配下之變異,標準偏差代表一個取樣樣本分配下樣本平均值之差異。
使用標準差與常態分配測試與描述樣本特性有相關。
但是使用標準偏差與信賴區間,只要樣本數目合理估計,更合理進行統計檢定。
以標準偏差配合樣本數目,對於統計結果之報導更為有用。
延伸文章資訊
- 1標準差與標準偏差 - 中興大學生物系統工程研究室陳加忠
在許多醫學研究數據中,標準差(standard deviation, SD)與標準偏差(the estimated standard error of ... 在醫學文獻,除了平均值(mean)...
- 2統計
)估計母體平均數(μ)。 4.3 標準差標準差(standard deviation)用於表示資料之離散程度,若由母體中抽取n個樣本,其 ...
- 3標準差- 维基百科,自由的百科全书
標準差與平均值之間的關係
- 4統計學平均差怎麼算? - 雅瑪知識
統計學平均差怎麼算? 問題一:統計學全距.平均差.標準差有什麼異同平均差是表示各個變量值之間差異程度的數值 ...
- 5Exploratory Data Analysis : 探索資料- 平均絕對偏差、變異數