

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、<p> 著重探討統(tǒng)計以及統(tǒng)計量的穩(wěn)健性比較</p><p> 摘要:本文筆者對幾種常用的統(tǒng)計量進行著重探討,結合實踐提出穩(wěn)健性的不足。同時給出幾種穩(wěn)健統(tǒng)計量,并與傳統(tǒng)的統(tǒng)計量進行比較。通過比較來展現(xiàn)穩(wěn)健統(tǒng)計量的優(yōu)勢及其應用價值。 </p><p> 關鍵詞:穩(wěn)健統(tǒng)計;統(tǒng)計量 </p><p><b> 1、前言 </b>&l
2、t;/p><p> 統(tǒng)計學作為一套科學原理和技術,統(tǒng)計是從眾多數(shù)據(jù)中挖掘有用的信息,然后得出有關這個領域的某些特征或結論,進而用以指導實踐,來創(chuàng)造更好的數(shù)據(jù)的科學。然而,傳統(tǒng)的用以描述數(shù)據(jù)或數(shù)據(jù)分布特征的統(tǒng)計量在許多情況下都不具有很強的代表性,使得分析結果與實際不符,據(jù)此制定相關政策用于指導實踐時,必定會產(chǎn)生不利于社會經(jīng)濟發(fā)展的情況。由于穩(wěn)健統(tǒng)計方法不受實際數(shù)據(jù)是否服從正態(tài)分布條件的束縛,與傳統(tǒng)的統(tǒng)計方法相比,具有
3、更強的抵抗異常值影響的能力,更能夠反映實際情況,所以它一問世就有著很強的生命力,并逐漸地被廣泛應用于醫(yī)學、生物學、化學以及地質(zhì)學等領域,成為人們處理各種問題的重要思想和工具。 </p><p> 穩(wěn)健統(tǒng)計的內(nèi)容非常廣泛,任何涉及到與實際問題和假定條件有偏離有關的傳統(tǒng)統(tǒng)計方法中,都會有穩(wěn)健統(tǒng)計成長的空間,都會有待于對傳統(tǒng)統(tǒng)計方法進一步完善的必要。本文將主要分析幾種代表總體平均水平的穩(wěn)健統(tǒng)計量的穩(wěn)健性,并與傳統(tǒng)的統(tǒng)
4、計量如樣本平均數(shù)等進行比較,從而揭示穩(wěn)健統(tǒng)計量的優(yōu)勢所在。由于篇幅所限,對穩(wěn)健統(tǒng)計的其他方面的討論不在本文范圍之內(nèi)。 </p><p> 2、統(tǒng)計量的穩(wěn)健性比較分析 </p><p><b> 2.1傳統(tǒng)統(tǒng)計量 </b></p><p> 人們普遍會感覺官方公布的人均收入或人均工資之類的指標明顯偏高。進一步研究發(fā)現(xiàn),除了統(tǒng)計誤差和統(tǒng)計口徑
5、上的不同以外,對人均收入指標主觀上認為偏高的主要原因在于收入分布是一種偏態(tài)的分布,而且隨著貧富差異原因的增多,偏態(tài)有日益嚴重的態(tài)勢。同時收入分布中存在著異常極端的離群大值,也會導致收入平均值的不正常上升。舉一個極端一點的例子,如果收入數(shù)據(jù)中有一個值趨于無窮大,不管是由于操作失誤還是實際情況的真實反映,據(jù)此計算出來的平均收入也會趨于無窮大,由此可見,運用非常普遍的平均數(shù)絲毫不具有抵御離群值的能力。這也就意味著在正態(tài)假定下性能表現(xiàn)非常良好的
6、平均數(shù),當實際數(shù)據(jù)并不是呈正態(tài)分布時所表現(xiàn)出的代表性不強的缺陷。這就引發(fā)人們?nèi)ニ伎计渌慕y(tǒng)計量,要求這樣的統(tǒng)計量滿足以下兩個條件:第一,當實際分布未知或雖然已知但不是正態(tài)分布時,這樣的統(tǒng)計量應該能夠比較好地描述所研究現(xiàn)象的實際情況;第二,當數(shù)據(jù)中存在正常的或是非正常的離群值時,這樣的統(tǒng)計量不會偏離實際情況太遠,也即不會因為離群值的存在而對所要說明的問題以及想要得出的結論造成災害性的影響。 </p><p> 切
7、尾均值是對均值的一種變通方法。均值對異常值或離群值非常敏感,它會由于數(shù)據(jù)集合中的一個或多個異常值的出現(xiàn)而失真。在這種情況下,離群值會使均值偏向自己的一方以尋找平衡點,因而也就歪曲了均值作為平均水平度量的意義。這時就需要對均值的計算方法進行適當?shù)淖兺ǎ怪^為穩(wěn)健。通常用到的就是切尾均值,其做法是去掉最大的和最小的數(shù)據(jù),然后對其余的作平均。 </p><p> 2.2幾種穩(wěn)健統(tǒng)計量 </p><
8、;p> 從數(shù)理角度分析,許多統(tǒng)計量都是通過極小化某一目標函數(shù)而得到的結果。例如熟悉的樣本均值就是極小化目標函數(shù)Q(xi,t)=Eni=1(xi-t)2所得的t值,其中xi,i=1,,,n是某一獨立同分布的樣本,t是估計值,Q表示目標函數(shù)。解此問題的方法是先求Q關于t的導數(shù)7(在Q可導的情況下),7(xi,t)=Qc(xi,t)=Eni=1(xi-t)(去掉常數(shù)因子),然后求t,使之滿足Eni=1(xi-t)=0。通過求解得t=E
9、ni=1xiPn,也就是樣本均值。同樣,樣本中位數(shù)是最小化目標函數(shù)Q(xi,t)=Eni=1|xi-t|的解。已經(jīng)看到,基于殘差平方目標函數(shù)的樣本平均值的統(tǒng)計量對于離群值過于敏感,即由于經(jīng)過平方,使得數(shù)據(jù)分布的尾部有太大的權數(shù);而基于絕對殘差目標函數(shù)的樣本中位數(shù)雖然克服了樣本平均值對離群值敏感的缺陷,但卻對數(shù)據(jù)的中間估計值太敏感。于是,Huber(1964)提出了一種新的目標函數(shù),作為樣本平均值和樣本中位數(shù)的折衷。這個目標函數(shù)就是極小化
10、上述目標函數(shù)的解就是HuberM統(tǒng)計量。樣本中位數(shù)和平均數(shù)分別是HuberM統(tǒng)計量的極端情況,k稱作細調(diào)參數(shù),它決定著Huber統(tǒng)計量的</p><p> 根據(jù)M統(tǒng)計量7函數(shù)(即目標函數(shù)的導數(shù))的形狀,人們把Huber統(tǒng)計量稱作單調(diào)的,統(tǒng)計量,另外三種比較常見的M統(tǒng)計量:圖基(Tukey)雙權M統(tǒng)計量、漢佩爾(Hampel)回降M統(tǒng)計量和安德魯斯(Andrews)正弦波M統(tǒng)計量都是回降統(tǒng)計量。也就是說,Hube
11、rM統(tǒng)計量的7函數(shù)是單調(diào)遞增的,而后面三種M統(tǒng)計量的7函數(shù)最終都要回到水平軸,其函數(shù)形式均比較復雜,這里從略。需要強調(diào)指出的是,M統(tǒng)計量之所以較平均數(shù)穩(wěn)健,是因為相對于平均數(shù)對所有觀察值都賦權數(shù)以1的情形,M統(tǒng)計量最終的目標是根據(jù)觀察值離數(shù)據(jù)分布中心的遠近而賦大小不等的權數(shù),即觀測值距離數(shù)據(jù)分布中心越遠,賦予它的權數(shù)就越小,反之就越大。從而提高統(tǒng)計量的全局效率和整體耐抗性。不同的M統(tǒng)計量具有不同的加權體系。HampelM統(tǒng)計量和Andr
12、ews正弦波M估計量的權重函數(shù)的形狀與Tukey雙權M統(tǒng)計量大體上類似,都是中間部分權數(shù)較大,以后逐漸遞減,到兩側的某一點減小到零。所不同的是,如同HuberM統(tǒng)計量中的k一樣,不同的統(tǒng)計量具有不同的細調(diào)參數(shù),從而也決定了權重函數(shù)走勢變化的分界點。 </p><p> 表1 是筆者利用SPSS 軟件對某市近幾年的居民實際支出原始數(shù)據(jù)計算的四種M 統(tǒng)計量(為節(jié)省篇幅, 只列出每隔一年共6 年的計算結果) , 并列
13、出了平均支出和中位數(shù)支出以供比較。 </p><p> 表1 基于居民實際支出數(shù)據(jù)的四種M 統(tǒng)計量比較 </p><p> 通過上表對六種統(tǒng)計量的比較發(fā)現(xiàn),四種M統(tǒng)計量均低于平均實際支出,而與中位數(shù)實際支出的大小關系不固定。由于實際支出數(shù)據(jù)中有一定量的離群值存在,所以平均實際支出是對實際數(shù)據(jù)的一種偏高估計,這是毫無疑問的,又由于位數(shù)附近可能出現(xiàn)的分布離散性,使得中位數(shù)在整體上是對實際數(shù)
14、據(jù)的一種偏低估計。而M統(tǒng)計量反映了支出數(shù)據(jù)主體部分的更多信息,因而能夠更準確地體現(xiàn)實際支出的一般水平。 </p><p><b> 3、結束語 </b></p><p> 綜上所述,運用非常廣泛的樣本平均數(shù),雖然有其計算簡單的優(yōu)點,但卻在很多情況下不能夠很好地代表所研究現(xiàn)象總體的平均水平。因此,對更加穩(wěn)健的統(tǒng)計量的重視和應用,無論是對數(shù)據(jù)使用者還是對政策的制定者,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 條件順序統(tǒng)計量和樣本間隔的隨機比較以及應用.pdf
- 20501.基于an,guo,liu方法下的檢驗統(tǒng)計量穩(wěn)健性研究
- 廣義次序統(tǒng)計量的隨機比較.pdf
- 充分統(tǒng)計量
- 廣義次序統(tǒng)計量條件分布的隨機比較.pdf
- 基于Weibull分布的次序統(tǒng)計量的隨機比較.pdf
- 充分統(tǒng)計量_完備統(tǒng)計量_指數(shù)分布族
- 計量資料的統(tǒng)計推斷
- 13936.基于multipleoutlier模型次序統(tǒng)計量的隨機比較
- 異質(zhì)模型與順序統(tǒng)計量中的隨機比較.pdf
- 我國銀行體系穩(wěn)健性統(tǒng)計分析.pdf
- 13689.二維次序統(tǒng)計量的漸近性以及tp2性質(zhì)的研究
- 15_高階統(tǒng)計量與分數(shù)低階統(tǒng)計量信號處理.pdf
- 關于采油計量統(tǒng)計有效性的分析
- 實驗總時間序與次序統(tǒng)計量的隨機比較.pdf
- 31290.幾個常見分布次序統(tǒng)計量的隨機比較
- 離散型次序統(tǒng)計量的相關性.pdf
- 三種再分析資料基本統(tǒng)計量比較.pdf
- 統(tǒng)計學-計量資料
- 關于統(tǒng)計分布的次序統(tǒng)計量的隨機序.pdf
評論
0/150
提交評論