順序統計量
文章推薦指數: 80 %
稱為樣本全距(sample range), 或稱全距統計量(range statistic), 表最大值與最小值之差距。
譬如說班上身高最高與最矮的差距。
如果樣本數 $n$ 是很清楚的, 則為了簡便, ...
Next:Aboutthisdocument...
Up:隨機樣本及其他
Previous:隨機樣本及其他
順序統計量
在一組隨機樣本中,有時候最大值、最小值或中間值,
是我們較有興趣的。
例如,過去五十年最大降雨量,
幾次跑步最短的時間,台北市房價的中間值等,這些都涉及順序統計量(orderstatistics)。
定義1.1設
為一組隨機樣本,按照小至大排出,而得
,便稱順序統計量。
順序統計量滿足
。
特別地,
另外,
稱為樣本全距(samplerange),或稱全距統計量(range
statistic),表最大值與最小值之差距。
譬如說班上身高最高與最矮的差距。
如果樣本數是很清楚的,
則為了簡便,也可僅以
分別表及。
又表樣本中位數(sample
median)。
當為偶數時,
有些書對任意介於
與間的值,
皆稱為樣本中位數。
在美國,職業球隊裡,例如職棒、職籃,
極少數的球員薪水(或收入)很高,但大部分的球員薪水是很低的。
報紙上,有時會刊出某位球員與球隊簽下新的合約,五年薪水一億美元。
平均一年兩千萬美元,尚不包括廣告等收入!當球員抱怨薪水太低時,
老闆可能會想全隊平均年薪已有百萬美元了,
但球員會想有一半以上的球員年薪少於二十萬美元
(職業球員由於球齡短以及會因受傷而結束球員生涯,
所以薪水是較其他行業高)。
這兩個觀點都是正確的,只是一計算平均,
一計算中位數。
當討論到收入、價格等含有一些較極端的值
(過高或過低),中位數可能是一較合理的指標值。
若
為一由連續型的母體所產生之隨機樣本,
則任二隨機變數
,會相等的機率為0,
因此
。
下述定理給出任一順序統計量之分佈。
定理1.1設
為由連續分佈函數,且p.d.f.為,所產生之隨機樣本,
表其順序統計量。
則之p.d.f.為
(1.1)
證明.我們先求之分佈函數,然後微分而得p.d.f.。
事件
,等價於
中至少有
個小於或等於。
因此
(1.2)
將上式對微分,得
此處用到
證畢。
例1.1設
為由
分佈所產生隨機樣本。
則
。
利用定理5.1,得
因此有
分佈。
例1.2設
為由分佈函數所產生之隨機樣本。
則
當然在(5.2)式中令,也會得到上式。
若之p.d.f.為,
則經由對微分,得
(1.3)
與(5.1)式中令所得一致。
另外,
經由對微分,得
(1.4)
仍與在(5.1)式中令所得一致。
例如,若
之共同分佈為
,
則由(5.4)式,即得
,
仍有指數分佈,只是參數改為。
此為一有趣的結果。
定理1.2設
為由連續分佈函數,且
p.d.f.為,所產生之隨機樣本,
表其順序統計量。
則
,之聯合p.d.f.為
(1.5)
上定理的證明我們略去了。
三個或更多個順序統計量的聯合
p.d.f.亦可求出。
如設整數
,則
之聯合p.d.f.為
(1.6)
又
之聯合p.d.f.為
(1.7)
在(5.7)式中,的出現是很顯然的:對任一組
,
有組
,其順序統計量均對應
。
底下給幾個例子。
例1.3設為由p.d.f.,,
所產生之隨機樣本。
則
之聯合p.d.f.為
由此可得之邊際p.d.f.
(1.8)
又
之聯合p.d.f.為
(1.9)
可驗證(5.8)及(5.9)式,與利用(5.1)式及(5.5)式所得相同。
例1.4設
為由
分佈所產生之隨機樣本。
令全距
,半全距(midrange)
。
試求之聯合
p.d.f.,邊際p.d.f.,及。
解.首先
利用變數代換,得
由此又得之邊際p.d.f.為
可看出有
分佈。
又可求出
有了及之邊際p.d.f.,便可求出及。
如
但亦可如下得到:
此處用到
,
(見例5.1)。
例1.5某廠牌燈管宣稱可使用小時,
某辦公室最近安裝40支該廠牌的燈管,才使用1個月便壞了一支。
這是否合理呢?
解.為了便於計算,我們假設燈管的壽命有指數分佈。
即設燈管壽命
為i.i.d.之
分佈,
期望值
(小時)。
又設每月上班25天,
每天開燈10小時。
對一特定的燈管,使用1個月(250小時)內會壞的機率為
的確不大。
但40支燈管1個月內至少壞一支的機率,
相當於最小順序統計量
之機率。
此機率可利用例2.5,
有
分佈,
或直接求:
便不算太小了。
至於5個月(小時)內至少壞一支燈管的機率為
非常接近1。
但一特定的燈管,5個月內壞的機率依然不大:
雖平均壽命為小時,
但至少有一燈管10年(小時)後仍可使用的機率有多大呢?
即要求最大順序統計量要大於之機率:
此機率不小。
雖一特定的燈管使用10年以上的機率為
很小。
上述這些似令人驚訝的結果,
都是因燈管數較多所造成的。
底下我們來看一些關於順序統計量之極限結果。
例1.6設
為由
分佈所產生之隨機樣本,
。
令,
。
則對
,
且,若,,若。
故得
對應常數隨機變數
之分佈函數。
即證出
又由(2.22)式,得
(1.10)
也可依定義2.1,直接證明(5.10)式。
例1.7設
為由p.d.f.
,,
所產生之隨機樣本,
,。
令,
。
則對,
上述極限見第二章註2.3。
又,
。
故得
次令。
則可證明
,其中
,(習題第18題)。
Next:Aboutthisdocument...
Up:隨機樣本及其他
Previous:隨機樣本及其他
admnuk
2004-01-12
延伸文章資訊
- 1統計量
英文名稱:, statistic ; 定義:, 描述一變數或樣本之特徵的數值。 ; 補充:, - ; 範例:, 平均數、標準差等為敘述性統計中常用的統計量。 t 值、F值等為推論性統計中常用來做...
- 2敘述性統計量選項 - IBM
這些統計量包括標準差、變異數、範圍、最小值、最大直,以及平均數的標準誤。 標準差 。測量平均數四周的離散情形。 在常態分佈中,68% 的觀察值會落在 ...
- 3第一章緒論
【定義1.2.6 】樣本統計量(Sample Statistic). 統計量是由樣本中所計算出的量,其為隨機樣本觀察值的. 函數,用來推論未知母體參數。 ▫ 是描述樣本資料特性的統計測量 ...
- 4統計量- 維基百科,自由的百科全書
統計量或抽樣統計量是樣本測量的一種屬性(例如,計算樣本算術平均值)。 它計算的通過對數據集進行某種函數(統計算法)的運算後得到的值。 統計學定義一個統計量為一個 ...
- 5描述性統計量選項 - IBM
這些統計量包括標準差、變異數、範圍、最小值、最大直,以及平均數的標準誤。 標準差 。測量平均數四周的離散情形。在常態分配中,68% 的觀察值會落在 ...