標準差與標準偏差 - 中興大學生物系統工程研究室陳加忠

文章推薦指數: 80 %
投票人數:10人

在許多醫學研究數據中,標準差(standard deviation, SD)與標準偏差(the estimated standard error of ... 在醫學文獻,除了平均值(mean),還需要標準差與標準偏差值。

首頁          新增資料與公告     最新消息 : 媽媽,這次我又得到第一名,這次是世界第一 在投稿的論文中使用複製進行統計分析 誤導性統計示例。

如何發現在數字時代濫用統計和數據         標準差與標準偏差   中興大學生物系統工程研究室陳加忠     在許多醫學研究數據中,標準差(standard deviation,SD)與標準偏差(the estimatedstandarderrorofthemean,SEM),常常被使用以代表數據的特性與解釋統計分析結果。

然而後者常常被誤用。

Source: Leeetal.,2015,Standarddeviationandstandarderrorofthemean, KoreanJ.ofAnesthesiology,68(3):220-223.          一堆數據如果其沿著一個特定值而均勻分佈,此稱為常態分佈。

常態分佈是進行參數統計分析的基本條件。

代表數據有向中央集中之趨勢。

然而要代表這個分佈的形狀,只有一個"平均值"此數據還是不足。

在醫學文獻,除了平均值(mean),還需要標準差與標準偏差值。

        醫學研究中對一個族群(population)進行研究,然後自此族群(母群)取出樣本以進行假設試驗。

只要取樣過程是不偏,而且有足夠的樣本數目,取樣樣本也是常態分佈。

對所有常態分佈的數據,樣本分佈特性可由平均值與變異量代表。

變異量之數值為標準差,代表觀察值與平均值之差異性。

如果數據的散佈都是接近平均值,代表此變異量減少。

但是變異數(Variance)其單位與平均值不同,因此以標準差與平均值比較是更有意義。

        樣本:X1,X2,--Xn,根本數目n。

平均值= /n 變異數(Variance) =2/n-1 SD= 因此常態分佈以平均值與標準差表示是更有意義。

在常態分佈圖上,68.7%的觀察值是落在平均值±1個標準差值之範圍。

95.4%數據位於平均值±兩個標準差之範圍。

因此許多文獻都是報導平均值與標準差值。

在醫學研究文獻中,樣本代表一系列來自母群觀察的數值。

因為試驗過程無法對母群進行全面試驗,因此自母群中取樣進行試驗十分重要。

在研究進行之前,要針對研究計劃以估算所需樣本數目,所抽樣之樣本只是整體母群的一小部份,因此樣本平均值僅是母群平均值的一個評估值。

對母群內進行取樣研究,每次試驗此樣本群內的數據並不相同。

例如第一組取樣30個,第二組也取樣30個,第三組取樣30個。

自第一組至第三組,每組數據的平均值與標準差值都不相同。

不同組的樣本數值,稱為樣本分佈,也是一個常態分佈。

每一個樣本分佈其標準差可以加以計算,稱為標準偏差。

標準偏差值由母群的變異量與取樣的樣本數目所決定。

母群的變異量大,樣本分佈的變異量也大。

但是只要樣本數目增加,樣本平均值更接近母群平均值,標準偏差值更小。

標準偏差用來代表樣本平均值接近的程度。

但是實際上,往往每一次只有自母群取樣一個樣本。

因此標準偏差則由標準差與樣本數目加以估算。

標準偏差 =標準差/ 一個母群平均值之評估方法往往使用信賴區間此概念。

最常使用為95%的信賴區間。

例如95%之信賴區間,為 EQ\x\to(X)  ±1.96*標準偏差。

用來代表母群平均值95%機率下會出現在那些範圍。

換言之,平均值自100個樣本所計算之數值,有95個數據在此範圍,5個數據在範圍之外。

以統計方法比較不同組的數據群,研究人員估計各樣本之母群,並且檢查是否相同。

這個情況下,標準偏差用以代表樣本之變異,用以估計母群之平均值。

藉由預先設定之顯著水準(Pre-set significatelevel),評估樣本在誤差範圍內能否代表母群。

標準偏差值一定小於標準差值,標準偏差值來自標準差值除以開根號之數據數目。

因此研究人員偏愛以標準偏差值描述其樣本。

如果兩組數據之數目相同,以標準偏差或標準差之比較結果是相同。

然而樣本數目十分重要。

合理的樣本數目才能得到合理之統計推論。

例如母群變異數如果極大,標準差值一定變大。

如果樣本數目增大,標準偏差值變小,此情況下使用標準偏差進行統計推定(descriptive statistics),容易造成推論錯誤。

這在醫學研究上十分常見,因為醫學研究先天就存在內在與外在的個別差異。

本文作者檢查Korean JournalofAnesthesiology第6卷1-6期共有36篇實驗研究,發現許多不當使用標準差與標準偏差之個案。

例如進行統計推論,只有一篇使用95%信賴區間,但未述明樣本數目。

36篇論文,只有一篇研究曾進行常態分配檢定。

所有36篇論文使用標準差值,樣本數目或百分比以描述統計結果。

但是在圖形(figures)並未標誌平均值,標準差或四分區間(interquartile range),16篇論文使用樣本數或百分比,但是未使用信賴區間。

有兩篇論文使用信賴區間,有一篇論文是錯誤使用,作者建議在論文評審過程必需加留意,以免妨礙數據正確判讀。

《評論》 標準差反應了數據常態分配下之變異,標準偏差代表一個取樣樣本分配下樣本平均值之差異。

使用標準差與常態分配測試與描述樣本特性有相關。

但是使用標準偏差與信賴區間,只要樣本數目合理估計,更合理進行統計檢定。

以標準偏差配合樣本數目,對於統計結果之報導更為有用。

     



請為這篇文章評分?