

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、,,統(tǒng) 計 學,Statistics,第三章 統(tǒng)計數據的整理與顯示,第一節(jié) 數據資料整理的意義與程序第二節(jié) 品質數據的整理與顯示第三節(jié) 數值數據的整理與顯示 第四節(jié) 統(tǒng)計表,★,統(tǒng)計整理,統(tǒng)計調查,客觀現象數量表現,統(tǒng)計總體數量特征,統(tǒng)計研究的程序,統(tǒng)計研究目的,統(tǒng)計設計,推斷分析描述分析,,,,,,,,,,,,,學習目標,了解數據預處理的內容和目的掌握分類和順序數據的整
2、理與顯示方法掌握數值型數據的整理與顯示方法合理使用統(tǒng)計表,一、數據資料整理的意義,★,統(tǒng)計調查的繼續(xù),統(tǒng)計分析的前提和基礎,意義和地位,統(tǒng)計整理是積累歷史資料的必要手段,數據整理是對調查資料進行科學加工,使之系統(tǒng)化,成為說明總體特征的綜合資料,分類數據整理—頻數分布表 (例題分析),,,,,,,【例】一家市場調查公司為研究不同品牌飲料的市場占有率,對隨機抽取的一家超市進行了調查。調查員在某天對50名顧客購買飲料的品牌進行了
3、記錄,如果一個顧客購買某一品牌的飲料,就將這一飲料的品牌名字記錄一次 。右邊就是記錄的原始數據,?用Excel制作頻數分布表,編制等距數列,適用于總體單位的標志值變動比較均勻的情況,實例,己知某地區(qū)某年50個商店商品銷售額的資料如下(單位:百萬元): 7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 18.7 15.5 12.8 26.0 17
4、.3 8.3 14.7 12.0 3.5 6.8 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 21.0 16.0 13.6 10.0 13.9 5.0 5.8
5、 10.5 16.3 22.0要求編制組距數列。,二、數據資料整理的內容和程序,統(tǒng)計數據的處理: 統(tǒng)計資料的分組、匯總及制表統(tǒng)計數據的管理: 數據的傳輸、貯存、更新及輸出,整理的內容,設計制定數據整理方案,對原始資料進行審核,數 據 處 理(篩選、排序),制作統(tǒng)計表或統(tǒng)計圖,,,,,統(tǒng)計整理的步驟,數據資料審核,第一,統(tǒng)計資料的完備性檢查應調查的單位或個體是否有遺漏所有的調查
6、項目或指標是否填寫齊全,數據審核內容,原始數據 (raw data)審核,第二,統(tǒng)計資料的及時性 第三,統(tǒng)計資料的準確性,從理論上或常識上檢查資料是否有悖常理、有無不切實際或不符合邏輯的地方。項目之間有無相互矛盾檢查各項指標的計算口徑、計量單位是否符合實際符合規(guī)定,檢查各指標間的數字是否相互銜接計算是否正確。,數據審核內容,邏輯檢查,計算檢查,二手數據(second hand data)審核,適用性審核弄
7、清楚數據的來源、數據的口徑以及有關的背景材料確定數據是否符合自己分析研究的需要時效性審核*盡可能使用最新的數據確認是否有必要做進一步的加工整理,數據的篩選,對審核過程中發(fā)現的錯誤應盡可能予以糾正當發(fā)現數據中的錯誤不能予以糾正,或者有些數據不符合調查的要求而又無法彌補時,需要對數據進行篩選數據篩選的內容包括:將某些不符合要求的數據或有明顯錯誤的數據予以剔除將符合某種特定條件的數據篩選出來,而不符合特定條件的數據予以剔出
8、,數據排序,按一定順序將數據排列,以發(fā)現一些明顯的特征或趨勢,找到解決問題的線索排序有助于對數據檢查糾錯,以及為重新歸類或分組等提供依據在某些場合,排序本身就是分析的目的之一排序可借助于計算機完成,數據排序方法,分類數據的排序字母型數據,排序有升序降序之分,但習慣上用升序漢字型數據,可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分數值型數據的排序遞增排序:設一組數據為x1,x2,…,xn,遞增
9、排序后可表示為:x(1)x(2)>…>x(n),三、數據分組與頻數分布,統(tǒng)計分組的作用:,總體經過分組,能夠突出組與組之間的差異而抽象掉組內各單位之間的差異,使數據變得條理化,便于進一步分析研究。,劃分社會經濟現象的類型反映社會經濟現象的內部結構和比例關系揭示社會經濟現象之間的相互依存關系,,,選擇分組標志,確定分組體系,總體單位歸類,,,科學性:組間差異大,組內差異小。,完備性和互斥性:每個單位均能且只能歸到某個組中。
10、,統(tǒng)計分組的程序與原則,對大學生月生活費支出情況進行分組研究:按家庭收入水平分組;按城鄉(xiāng)分組;按性別分組;按年齡分組。,統(tǒng)計分組的程序與原則,對父母親下崗情況進行分組研究:單親下崗; 雙親下崗; 雙親在崗。,不符合科學性,不符合完備性和互斥性,統(tǒng)計分組的程序與原則,各分組標志并列使用,各分組標志交叉結合使用,平行分組體系,對教師的分類,按性別分類,男性,女性,按職稱分類,按年齡分類,高級,中級,初級,青年,中年,,共計7組
11、2+3+2,復合分組體系,,按性別分類,按職稱分類,按年齡分類,,,男,女,,,,,高級,中級,初級,,,,,,青年,中年,共計12組2×3×2,對教師的分類,第三章 統(tǒng)計數據的整理與顯示,★,第一節(jié) 數據資料整理的意義與程序第二節(jié) 品質數據的整理與顯示第三節(jié) 數值數據的整理與顯示 第四節(jié) 統(tǒng)計表,★,分類數據的整理與圖示,分類數據的整理(基本過程),1.列出各類別,3. 制作頻數分布表4. 用圖形
12、顯示數據,分類數據的整理(可計算的統(tǒng)計量),頻數(frequency) :落在各類別中的數據個數比例(proportion) :某一類別數據占全部數據的比值百分比(percentage) :將對比的基數作為100而計算的比值比率(ratio) :不同類別數值的比值,分類數據整理—頻數分布表 (例題分析),,,,,,,【例】一家市場調查公司為研究不同品牌飲料的市場占有率,對隨機抽取的一家超市進行了調查。調查員在某天對50名顧客購買
13、飲料的品牌進行了記錄,如果一個顧客購買某一品牌的飲料,就將這一飲料的品牌名字記錄一次 。右邊就是記錄的原始數據,?用Excel制作頻數分布表,分類數據的圖示—條形圖,用寬度相同的條形的高度或長短來表示各類別數據的圖形有單式條形圖、復式條形圖等形式主要用于反映分類數據的頻數分布繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖,(bar Chart),分類數據的圖示—條形圖 (例題分析),分類數據的圖示—餅圖,也稱
14、圓形圖,是用圓形及圓內扇形的面積來表示數值大小的圖形主要用于表示總體或樣本中各組成部分所占的比例,對于研究結構性問題十分有用繪制圓形圖時,總體中各部分所占的百分比用圓內的各個扇形面積表示,這些扇形的中心角度,是按各部分數據百分比占3600的相應比例確定的,(pie Chart),分類數據的圖示—餅圖 (例題分析),,,定序數據的整理與圖示,定序數據的整理(可計算的統(tǒng)計量),1. 累積頻數(cumulative frequenc
15、ies):各類別頻數的逐級累加2. 累積頻率(cumulative percentages):各類別頻率(百分比)的逐級累加,順序數據的頻數分布表(例題分析),【例】在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調查300戶,其中的一個問題是:“您對您家庭目前的住房狀況是否滿意?1.非常不滿意2.不滿意3.一般4.滿意5.非常滿意。,順序數據的頻數分布表 (例題分析),順序數據的圖示—累計頻數分布圖 (例
16、題分析),甲城市家庭對住房狀況評價的累積頻數分布,環(huán)形圖(annular chart),環(huán)形圖中間有一個“空洞”,總體中的每一部分數據用環(huán)中的一段表示環(huán)形圖與圓形圖類似,但又有區(qū)別圓形圖只能顯示一個總體各部分所占的比例環(huán)形圖則可以同時繪制多個總體的數據系列,每一個總體的數據系列為一個環(huán)環(huán)形圖可用于結構比較研究 環(huán)形圖主要用于展示分類和順序數據,數值型數據的整理與圖示(定距數據與定比數據),分類,,同時具備,變量數列的
17、編制,【例】己知某車間有24名工人,他們的日產量(件)分別是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根據以上資料編制變量數列。,,編制結果如下:,,變量數列的編制,變量值變動區(qū)間的長度相等,變量值變動區(qū)間的長度不完全相等,,相關概念,(Class Width),(class midpoint),某地區(qū)100個百貨商店月銷售額與
18、流通費用情況,上組限U,下組限L,如:組距d=U-L=100-50=50(萬元),如:組中值x=(U+L)/2 =(100+200)/2=150(萬元),開口組距數列組中值的計算:,首組假定下限=首組上限-相鄰組組距 末組假定上限=末組下限+相鄰組組距,先計算開口組的假定上、下限:,因此有:,,編制等距數列,適用于總體單位的標志值變動比較均勻的情況,實例,己知某地區(qū)某年50個商店商品銷售額的資料如下(單位:百萬元):
19、7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 13.4 4.5 9.5
20、 20.0 15.7 6.0 11.4 23.0 14.2 16.7 21.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.0要求編制組距數列。,編制步驟:,⒈求變異全距,⒉確定組距及組數,R≤組距(d) ×組數(m),編制等距數列,計算組數(組數不宜過多,也不宜太少),上例中,取d=5,則有,編制等距數列,組數的確定應以能夠顯
21、示數據的分布特征和規(guī)律為目的。在實際分組時,可以按 Sturges 提出的經驗公式來確定組數K,組距分組(要點),將變量值的一個區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況必須遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組,⒊確定組限,編制等距數列,等距分組表(上下組限重疊),等距分組表(上下組限間斷離散變量),等距分組表(使用開口組),一個圖只用來顯示一種現象的數量特征,幾種常用的統(tǒng)計圖,幾種常用的統(tǒng)計圖
22、,條形圖(Bar),用于顯示離散型變量的次數分布,幾種常用的統(tǒng)計圖,條形圖(Bar),用于顯示離散型變量的次數分布,條形圖(Bar),用于顯示離散型變量的次數分布,直方圖,條形圖,,,數值型數據的圖示用Excel作圖,分組數據—直方圖(直方圖的繪制),,頻數(人),,,,,,15,12,9,6,3,日加工零件數(個),圖3-5 某車間工人日加工零件數的直方圖,,我一眼就看出來了,大多數人的日加工零件數在120~125之間!,
23、,分組數據—直方圖(直方圖與條形圖的區(qū)別),條形圖是用條形的長度(橫置時)表示各類別頻數的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數的多少,矩形的高度表示每一組的頻數或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列,分組數據—折線圖(折線圖的制作),折線圖也稱頻數多邊形圖(Frequency polygon)是在直方圖的基礎上,把直方圖頂部的中點(組中值)用
24、直線連接起來,再把原來的直方圖抹掉折線圖的兩個終點要與橫軸相交,具體的做法是第一個矩形的頂部中點通過豎邊中點(即該組頻數一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數分布是一致的,,,,,,,,,,15,12,9,6,3,,,,,,105,110,115,120,125,130,135,140,日加工零件數(個),,,,,,,頻數(人),,,分組數據—
25、折線圖(折線圖的繪制),圖3-6 某車間工人日加工零件數的折線圖,,未分組數據—箱線圖(箱線圖的制作),用于顯示未分組的原始數據或分組數據的分布箱線圖由一組數據的5個特征值繪制而成,它由一個箱子和兩條線段組成其繪制方法是:首先找出一組數據的5個特征值,即最大值、最小值、中位數Me 和兩個四分位數(下四分位數QL和上四分位數QU)連接兩個四分(位)數畫出箱子,再將兩個極值點與箱子相連接,未分組數據—單批數據箱線圖(箱線圖
26、的構成),分布的形狀與箱線圖,,不同分布的箱線圖,,未分組數據—多批數據箱線圖(實例),【例】 從某大學經濟管理專業(yè)二年級學生中隨機抽取11人,對8門主要課程的考試成績進行調查,所得結果如表。試繪制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征,未分組數據—多批數據箱線圖(由STATIATICA繪制的多批數據箱線圖),圖3-12 8門課程考試成績的箱線圖,圖3-13 11名學生8門課程考試成績的箱線圖,,,,,
27、Min-Max,,25%-75%,,Median value,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,45,55,65,75,85,95,105,,,,,,,,,,,,,,,學生1,學生2,學
28、生3,學生4,學生5,學生6,學生7,學生8,學生9,學生10,學生11,未分組數據—箱線圖(由STATIATICA繪制的多批數據箱線圖),時間序列數據(由 Excel 繪制的線圖),統(tǒng)計表,統(tǒng)計表的常用結構:,統(tǒng)計表的加工方法,(對主體進行分組),(選擇指標及對指標進行分組),,,,,統(tǒng)計表的編制規(guī)則,選擇合適的總標題;主詞欄與賓詞欄要各歸其位,相互對應;表的上、下端用粗線或雙線封口,左右兩端一般不封口;可在各列的文字標題下
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 大學應用統(tǒng)計學經典課件03——統(tǒng)計數據的整理和顯示
- 第三章 統(tǒng)計數據的整理
- 第三章 統(tǒng)計數據的整理
- 第三章統(tǒng)計數據的整理
- 第2章統(tǒng)計學統(tǒng)計數據收集
- 《統(tǒng)計數據的整理》ppt課件
- 統(tǒng)計數據的描述
- 統(tǒng)計數據處理
- 統(tǒng)計學第二章--統(tǒng)計數據的采集
- 統(tǒng)計數據質量淺析
- 3月金東區(qū)主要統(tǒng)計數據
- 3月金東區(qū)主要統(tǒng)計數據
- 艾滋病統(tǒng)計數據
- 如何提高統(tǒng)計數據質量
- 夯實統(tǒng)計數據基礎勢在必行
- 鎮(zhèn)賚縣情統(tǒng)計數據
- 對我國統(tǒng)計數據的思考
- 統(tǒng)計現代化如何完備統(tǒng)計信息和統(tǒng)計數據
- 提高統(tǒng)計數據質量的探討
- 基本情況和統(tǒng)計數據表
評論
0/150
提交評論