順序統計量

文章推薦指數: 80 %
投票人數:10人

稱為樣本全距(sample range), 或稱全距統計量(range statistic), 表最大值與最小值之差距。

譬如說班上身高最高與最矮的差距。

如果樣本數 $n$ 是很清楚的, 則為了簡便, ... Next:Aboutthisdocument... Up:隨機樣本及其他 Previous:隨機樣本及其他 順序統計量 在一組隨機樣本中,有時候最大值、最小值或中間值, 是我們較有興趣的。

例如,過去五十年最大降雨量, 幾次跑步最短的時間,台北市房價的中間值等,這些都涉及順序統計量(orderstatistics)。

定義1.1設 為一組隨機樣本,按照小至大排出,而得 ,便稱順序統計量。

順序統計量滿足 。

特別地, 另外, 稱為樣本全距(samplerange),或稱全距統計量(range statistic),表最大值與最小值之差距。

譬如說班上身高最高與最矮的差距。

如果樣本數是很清楚的, 則為了簡便,也可僅以 分別表及。

又表樣本中位數(sample median)。

當為偶數時, 有些書對任意介於 與間的值, 皆稱為樣本中位數。

在美國,職業球隊裡,例如職棒、職籃, 極少數的球員薪水(或收入)很高,但大部分的球員薪水是很低的。

報紙上,有時會刊出某位球員與球隊簽下新的合約,五年薪水一億美元。

平均一年兩千萬美元,尚不包括廣告等收入!當球員抱怨薪水太低時, 老闆可能會想全隊平均年薪已有百萬美元了, 但球員會想有一半以上的球員年薪少於二十萬美元 (職業球員由於球齡短以及會因受傷而結束球員生涯, 所以薪水是較其他行業高)。

這兩個觀點都是正確的,只是一計算平均, 一計算中位數。

當討論到收入、價格等含有一些較極端的值 (過高或過低),中位數可能是一較合理的指標值。

若 為一由連續型的母體所產生之隨機樣本, 則任二隨機變數 ,會相等的機率為0, 因此 。

下述定理給出任一順序統計量之分佈。

定理1.1設 為由連續分佈函數,且p.d.f.為,所產生之隨機樣本, 表其順序統計量。

則之p.d.f.為     (1.1) 證明.我們先求之分佈函數,然後微分而得p.d.f.。

事件 ,等價於 中至少有 個小於或等於。

因此 (1.2)     將上式對微分,得 此處用到 證畢。

例1.1設 為由 分佈所產生隨機樣本。

則 。

利用定理5.1,得 因此有 分佈。

例1.2設 為由分佈函數所產生之隨機樣本。

則 當然在(5.2)式中令,也會得到上式。

若之p.d.f.為, 則經由對微分,得     (1.3) 與(5.1)式中令所得一致。

另外, 經由對微分,得     (1.4) 仍與在(5.1)式中令所得一致。

例如,若 之共同分佈為 , 則由(5.4)式,即得 , 仍有指數分佈,只是參數改為。

此為一有趣的結果。

定理1.2設 為由連續分佈函數,且 p.d.f.為,所產生之隨機樣本, 表其順序統計量。

則 ,之聯合p.d.f.為     (1.5)                  上定理的證明我們略去了。

三個或更多個順序統計量的聯合 p.d.f.亦可求出。

如設整數 ,則 之聯合p.d.f.為     (1.6)                   又 之聯合p.d.f.為     (1.7)       在(5.7)式中,的出現是很顯然的:對任一組 , 有組 ,其順序統計量均對應 。

底下給幾個例子。

例1.3設為由p.d.f.,, 所產生之隨機樣本。

則 之聯合p.d.f.為 由此可得之邊際p.d.f. (1.8)     又 之聯合p.d.f.為 (1.9)     可驗證(5.8)及(5.9)式,與利用(5.1)式及(5.5)式所得相同。

例1.4設 為由 分佈所產生之隨機樣本。

令全距 ,半全距(midrange) 。

試求之聯合 p.d.f.,邊際p.d.f.,及。

解.首先 利用變數代換,得 由此又得之邊際p.d.f.為 可看出有 分佈。

又可求出 有了及之邊際p.d.f.,便可求出及。

如 但亦可如下得到: 此處用到 , (見例5.1)。

例1.5某廠牌燈管宣稱可使用小時, 某辦公室最近安裝40支該廠牌的燈管,才使用1個月便壞了一支。

這是否合理呢? 解.為了便於計算,我們假設燈管的壽命有指數分佈。

即設燈管壽命 為i.i.d.之 分佈, 期望值 (小時)。

又設每月上班25天, 每天開燈10小時。

對一特定的燈管,使用1個月(250小時)內會壞的機率為 的確不大。

但40支燈管1個月內至少壞一支的機率, 相當於最小順序統計量 之機率。

此機率可利用例2.5, 有 分佈, 或直接求: 便不算太小了。

至於5個月(小時)內至少壞一支燈管的機率為 非常接近1。

但一特定的燈管,5個月內壞的機率依然不大: 雖平均壽命為小時, 但至少有一燈管10年(小時)後仍可使用的機率有多大呢? 即要求最大順序統計量要大於之機率: 此機率不小。

雖一特定的燈管使用10年以上的機率為 很小。

上述這些似令人驚訝的結果, 都是因燈管數較多所造成的。

底下我們來看一些關於順序統計量之極限結果。

例1.6設 為由 分佈所產生之隨機樣本, 。

令, 。

則對 , 且,若,,若。

故得 對應常數隨機變數 之分佈函數。

即證出 又由(2.22)式,得     (1.10) 也可依定義2.1,直接證明(5.10)式。

例1.7設 為由p.d.f. ,, 所產生之隨機樣本, ,。

令, 。

則對, 上述極限見第二章註2.3。

又, 。

故得 次令。

則可證明 ,其中 ,(習題第18題)。

Next:Aboutthisdocument... Up:隨機樣本及其他 Previous:隨機樣本及其他 admnuk 2004-01-12



請為這篇文章評分?