離散程度- 維基百科,自由的百科全書
文章推薦指數: 80 %
衡量離散程度的值,通常是非負實數:當衡量值取零時,表示分布集中在同一個值上;隨著衡量值的增加,隨機變數的取值越來越分散。
部分描述離散程度的量是帶單位的,並且, ...
離散程度
維基百科,自由的百科全書
跳至導覽
跳至搜尋
本條目存在以下問題,請協助改善本條目或在討論頁針對議題發表看法。
此條目需要精通或熟悉相關主題的編者參與及協助編輯。
請邀請適合的人士改善本條目。
更多的細節與詳情請參見討論頁。
此條目需要補充更多來源。
(2019年12月10日)請協助補充多方面可靠來源以改善這篇條目,無法查證的內容可能會因為異議提出而移除。
致使用者:請搜尋一下條目的標題(來源搜尋:"離散程度"—網頁、新聞、書籍、學術、圖像),以檢查網路上是否存在該主題的更多可靠來源(判定指引)。
在統計學裡,離散程度(英語:statisticaldispersion)又稱變異或變差(variation),是指一個分布或隨機變數的壓縮和拉伸程度。
習慣上,離散程度更常用來描述分布,而變異更常用來描述隨機變數。
[來源請求]用以描述離散程度或變異的量主要有變異數、標準差、變異係數和四分位距等。
離散程度與集中趨勢相對。
衡量[編輯]
衡量離散程度的值,通常是非負實數:當衡量值取零時,表示分布集中在同一個值上;隨著衡量值的增加,隨機變數的取值越來越分散。
部分描述離散程度的量是帶單位的,並且,這些量的單位與隨機變數本身的單位相同。
也就是說,如果隨機變數的單位是公尺或秒,則這些量的單位也是公尺或秒。
這些量舉例如下:
標準差
四分位距
全距
平均絕對偏誤(英語:Mean_absolute_difference)
絕對差中位數(英語:Median_absolute_deviation)
平均差
間隔關係(英語:Distance_correlation)
此外,也有一些無因次量:
變異係數
四分位離散係數(英語:Quartile_coefficient_of_dispersion)
吉尼係數
熵
另外,還有一些帶單位的量,但是他們的單位和隨機變數本身的單位不同:
變異數
離散指數(英語:Index_of_dispersion)
可解釋性[編輯]
變差的可解釋性,通常是對於一個隨機變數而言的。
當觀測到隨機變數的一些取值(例如訓練集中的標籤可視作是一個隨機變數的一些觀測值),需要推斷隨機變數服從的分布時,就會遇到這個問題。
一般而言,推斷有限觀測值的隨機變數服從的分布的過程,即是建立模型的過程。
假設有隨機變數
X
{\displaystyle\mathbf{X}}
及其服從的真實分布
X
∼
D
{\displaystyle\mathbf{X}\simD}
。
則對於該隨機變數的觀測值,可計算其變差(以變異數表示)
SS
total
:=
Var
(
X
)
{\displaystyle{\text{SS}}_{\text{total}}:={\text{Var}}(\mathbf{X})}
;對於分布,亦可計算其變差
SS
distribution
:=
Var
(
D
)
{\displaystyle{\text{SS}}_{\text{distribution}}:={\text{Var}}(D)}
。
則
SS
distribution
{\displaystyle{\text{SS}}_{\text{distribution}}}
是相對該隨機變數的可解釋變異(英語:explainablevariation),其餘的部分則是不可解釋變異(英語:unexplainablevariation)。
為了衡量不可解釋變異,可引入不可解釋變異分數(英語:fractionofunexplainablevariation)
FUV
:=
1
−
SS
distribution
SS
total
{\displaystyle{\text{FUV}}:=1-{\tfrac{{\text{SS}}_{\text{distribution}}}{{\text{SS}}_{\text{total}}}}}
。
不可解釋變異亦稱為統計雜訊。
假設
D
′
{\displaystyleD'}
是模型給出的隨機變數的分布。
則對於該預測分布,我們可以計算器變異(以變異數表示)
SS
model
:=
Var
(
D
′
)
{\displaystyle{\text{SS}}_{\text{model}}:={\text{Var}}(D')}
。
則
SS
model
{\displaystyle{\text{SS}}_{\text{model}}}
是該模型相對該隨機變數的已解釋變異(英語:explainedvariation),其餘部分則是未解釋變異(英語:unexplainedvariation)。
同樣,為了衡量未解釋變異,可引入未解釋變異分數(英語:fractionofunexplainedvariation)
FUV
:=
1
−
SS
model
SS
total
{\displaystyle{\text{FUV}}:=1-{\tfrac{{\text{SS}}_{\text{model}}}{{\text{SS}}_{\text{total}}}}}
。
參考資料[編輯]
閱論編統計學敘述統計學連續變數機率分布集中趨勢平均數(平方 ·算術 ·幾何 ·調和 ·算術-幾何 ·幾何-調和 ·希羅/平均數不等式)·中位數·眾數離散程度全距·變異係數·百分位數·四分差·四分位數·標準差·變異數·平均差·標準分數·柴比雪夫不等式·吉尼係數分布形態(英語:Shapeofthedistribution)偏態·峰態離散變數機率分佈次數(英語:Countdata)·列聯表(英語:Contingencytable)推論統計學和假說檢定推論統計學信賴區間·區間估計(英語:Intervalestimation)·顯著性差異·元分析·貝氏推論實驗設計母體·抽樣·重抽樣(刀切法·自助法·交叉驗證)·重複(英語:Replication(statistics))·阻礙·靈敏度和特異度·區集(英語:Blocking(statistics))樣本量(英語:Samplesize)標準誤·虛無假說·對立假說·型一錯誤與型二錯誤·檢定力·效應值常規估計貝氏推論·區間估計(英語:Intervalestimation)·最大概似估計·最小距離估計(英語:Minimumdistanceestimation)·矩量法·最大間距特效檢定Z檢定·司徒頓t檢定·F檢定·卡方檢定·Wald檢定(英語:Waldtest)·曼-惠特尼檢定(英語:Mann–WhitneyUtest)·秩和檢定生存分析生存函數·乘積極限估計量·對數秩和檢定·失效率·危險比例模式相關及迴歸分析相關性混淆變項(英語:Confounding)·皮爾森積動差相關係數·等級相關(英語:Rankcorrelation)(斯皮爾曼等級相關係數·肯德等級相關係數(英語:Kendalltaurankcorrelationcoefficient))·自由度線性迴歸線性模式(英語:Linearmodel)·一般線性模式·廣義線性模式·變異數分析·共變異數分析(英語:Analysisofcovariance)非線性迴歸非參數迴歸模型(英語:Nonparametricregression)·半參數迴歸模型(英語:Semiparametricregression)·Logit模型統計圖形圓餅圖·長條圖·雙標圖·箱形圖·管制圖·森林圖(英語:Forestplot)·直方圖·分位圖·趨勢圖·散點圖(英語:Scatterplot)·莖葉圖(英語:Stem-and-leafdisplay)·雷達圖(英語:Radarchart)·示意地圖其他回應過程效度·統計誤用
分類
主題
共享資源
專題
取自「https://zh.wikipedia.org/w/index.php?title=离散程度&oldid=67497311」
分類:統計學隱藏分類:需要專業人士關注的頁面自2019年12月需補充來源的條目拒絕當選首頁新條目推薦欄目的條目含有多個問題的條目含有英語的條目有未列明來源語句的條目有藍鏈卻未移除內部連結助手模板的頁面
導覽選單
個人工具
沒有登入討論貢獻建立帳號登入
命名空間
條目討論
臺灣正體
不转换简体繁體大陆简体香港繁體澳門繁體大马简体新加坡简体臺灣正體
查看
閱讀編輯檢視歷史
更多
搜尋
導航
首頁分類索引特色內容新聞動態近期變更隨機條目資助維基百科
說明
說明維基社群方針與指引互助客棧知識問答字詞轉換IRC即時聊天聯絡我們關於維基百科
工具
連結至此的頁面相關變更上傳檔案特殊頁面靜態連結頁面資訊引用此頁面維基數據項目
列印/匯出
下載為PDF可列印版
其他專案
維基共享資源
其他語言
العربيةБеларускаяБългарскиCatalàکوردیČeštinaDeutschEnglishEspañolEuskaraفارسیSuomiFrançaisGalegoÍslenskaItaliano日本語한국어LatviešuМакедонскиBahasaMelayuNederlandsNorsknynorskNorskbokmålPolskiPortuguêsRomânăРусскийSlovenščinaSundaSvenskaKiswahiliTürkçeУкраїнськаOʻzbekcha/ўзбекча吴语粵語
編輯連結
延伸文章資訊
- 1離散度分析法 - 中文百科知識
離散度分析法是測度一組數據分散程度的方法。分散程度反映了一組數據遠離其中心值的程度,因此也稱為離中趨勢。從集中趨勢和分散程度兩個方面才能完整的說明一組數據的 ...
- 2離散程度- 維基百科,自由的百科全書
衡量離散程度的值,通常是非負實數:當衡量值取零時,表示分布集中在同一個值上;隨著衡量值的增加,隨機變數的取值越來越分散。 部分描述離散程度的量是帶單位的,並且, ...
- 3第三章敘述統計(II) 統計量數
分散趨勢(dispersion tendency):描述一組資料內,彼此間的差異程度。 3. 形狀參數(shape parameters):一組資料的分配形狀有很多樣態,大部分的情.
- 4單元四:資料的描述(二) ㄧ、集中趨勢統計量數二、分散程度 ...
因為取平均可避免資料個數多寡的效應,也就是說,若不取平均,則對個數較多的一組資料是種“懲罰”,因它的離差平方和會相對地較大,若不取平均將失去比較資料間分散程度的 ...
- 5243.描述資料分散程度的統計測量數 - 題庫堂
243.描述資料分散程度的統計測量數,稱為(A)平均數(B)標準差(C)以上皆是(D)以上皆可.