『壹』 中國人民大學出版社的《統計學》第四版,賈俊平、金勇進、何曉群編的,求課後習題答案
苦逼了,找不到答案。。
『貳』 賈俊平統計學怎麼樣
賈俊平版《統計學》內容簡介:統計作為數據分析的一種通用語言,為使用者提供了一套獲取數據、分析數據並從數據中得出結論的原則和方法。《統計學》包括描述統計、推斷統計、多元統計和非參數統計等主要方法。寫法上完全立足於統計應用,每種方法都從實際問題入手進行討論,盡可能避免過多統計公式的推導。書中例題的解答結合使用了SPSS和Excel兩個軟體,並給出每種方法的詳細操作步驟,使讀者能輕松完成統計計算。
《統計學》可作為高等院校經濟管理類專業本科生統計學課程的教材,也可作為研究生和MBA的教材或參考書,對廣大實際工作者也具有參考價值。
『叄』 《統計學(第四版)》epub下載在線閱讀全文,求百度網盤雲資源
《統計學(第四版)》(賈俊平//何曉群//金勇進)電子書網盤下載免費在線閱讀
鏈接: https://pan..com/s/1OASD_P09tHPwydd6KpVuRQ
書名:統計學(第四版)
作者:賈俊平//何曉群//金勇進
豆瓣評分:6.9
出版社:中國人民大學
出版年份:2009-11
頁數:453
內容簡介:
《普通高等教育"十一五"國家級規劃教材•教育部推薦教材•國家統計局優秀教材•21世紀統計學系列教材•統計學(第4版)》內容簡介:統計學是收集、分析、表述和解釋數據的科學。作為數據分析的一種有效工具,統計方法已廣泛應用於生產、生活和科學研究的各個領域,成為各學科領域研究者和實際工作者的必備知識。《普通高等教育"十一五"國家級規劃教材•教育部推薦教材•國家統計局優秀教材•21世紀統計學系列教材•統計學(第4版)》作者多年從事統計教學,具有豐富的教材編寫經驗。《統計學》(第四版)是在第三版的基礎上修改而成的,在保留第三版內容框架的基礎上,刪除了一些相對較難的內容,同時更加突出計算機的應用。
《普通高等教育"十一五"國家級規劃教材•教育部推薦教材•國家統計局優秀教材•21世紀統計學系列教材•統計學(第4版)》可作為高等院校經濟管理專業本科生統計學課程的教材,也可作為MBA的教材或參考書,對廣大實際工作者也極具參考價值。
作者簡介:
賈俊平,中國人民大學統計學院副教授。研究方向:統計方法在經濟各領域的應用、統計教學方式和方法。主要著作有:《統計學》、《描述統計》、《工商管理統計》、《市場調查與分析》等。主持研究的「非統計學專業本科公共基礎課——統計學教學改革」項目獲2001年國家級教學成果二等獎、2001年北京市教學成果一等然。2001年榮獲北京市經濟技術創新標兵稱號,2003年榮獲寶綱優秀教師獎等。
『肆』 《統計學》(賈俊平第七版)課後題及答案
weishi://feed?feed_id=70X1f5RYo1JjbLy3T&atype=1&logsour=2020020163&allow_interest=0&idx=8o1T8B3gD/JyiaAiZeWa6Q==
『伍』 我也求一份《統計學》第四版課後習題答案..賈俊平 何曉群 金勇進的..不勝感激。
第四章練習題答案
4.1 (1)眾數:M0=10; 中位數:中位數位置=n+1/2=5.5,Me=10;平均數:
(2)QL位置=n/4=2.5, QL=4+7/2=5.5;QU位置=3n/4=7.5,QU=12
(3)
(4)由於平均數小於中位數和眾數,所以汽車銷售量為左偏分布。
4.2 (1)從表中數據可以看出,年齡出現頻數最多的是19和23,故有個眾數,即M0=19和M0=23。
將原始數據排序後,計算中位數的位置為:中位數位置= n+1/2=13,第13個位置上的數值為23,所以中位數為Me=23
(2)QL位置=n/4=6.25, QL==19;QU位置=3n/4=18.75,QU=26.5
(3)平均數 600/25=24,標准差
(4)偏態系數SK=1.08,峰態系數K=0.77
(5)分析:從眾數、中位數和平均數來看,網民年齡在23-24歲的人數佔多數。由於標准差較大,說明網民年齡之間有較大差異。從偏態系數來看,年齡分布為右偏,由於偏態系數大於1,所以,偏斜程度很大。由於峰態系數為正值,所以為尖峰分布。
4.3 (1)莖葉圖如下:
莖 葉 頻數
5
6
7 5
6 7 8
1 3 4 8 8 1
3
5
(2) 63/9=7,
(3)由於兩種排隊方式的平均數不同,所以用離散系數進行比較。
第一種排隊方式:v1=1.97/7.2=0.274;v2=0.714/7=0.102.由於v1>v2,表明第一種排隊方式的離散程度大於第二種排隊方式。
(4)選方法二,因為第二種排隊方式的平均等待時間較短,且離散程度小於第一種排隊方式。
4.4 (1) 8223/30=274.1
中位數位置=n+1/2=15.5,Me=272+273/2=272.5
(2)QL位置=n/4=7.5, QL==(258+261)/2=259.5;QU位置=3n/4=22.5,QU=(284+291)/2=287.5
(3)
4.5 (1)甲企業的平均成本=總成本/總產量=
乙企業的平均成本=總成本/總產量=
原因:盡管兩個企業的單位成本相同,但單位成本較低的產品在乙企業的產量中所佔比重較大,因此拉低了總平均成本。
4.6 (1)(計算過程中的表略), 51200/120=426.67
SK=0.203 K=-0.688
4.7 (1)兩位調查人員所得到的平均身高應該差不多相同,因為均值的大小基本上不受樣本大小的影響。
(2)兩位調查人員所得到身高的標准差應該差不多相同,因為標准差的大小基本上不受樣本大小的影響。
(3)具有較大樣本的調查人員有更大的機會取得最高或最低者,因為樣本越大,變化的范圍就可能越大。
4.8 (1)要比較男女學生體重的離散程度應該採用離散系數。女生體重的離散系數為v女=5/50=0.1,男生體重的離散系數為v男=5/60=0.08,所以女生的體重差異大。
(2)男生: 60×2.2=132(磅),s=5×2.2=11(磅)
女生: 50×2.2=110(磅),s=5×2.2=11(磅)
(3)假定體重為對稱分布,根據經驗法則,在平均數加減1個標准差范圍內的數據個數大約為68%。因此,男生中大約有68%的人體重在55kg-65kg之間。
(4)假定體重為對稱分布,根據經驗法則,在平均數加減2個標准差范圍內的數據個數大約為95%。因此,男生中大約有95%的人體重在40kg-60kg之間。
4.9 通過計算標准分數來判斷:
該測試者在A項測試中比平均分數高出1個標准差,而在B項測試中只高出平均分數0.5個標准差,由於A項測試的標准分數高於B項測試,所以,A項測試比較理想。
4.10 通過標准分數來判斷,各天的標准分數如下表:
日期 周一 周二 周三 周四 周五 周六 周日
標准分數Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0
周一和周六兩天失去了控制。
4.11
(1)應該採用離散系數,因為它消除了不同組數據水平高低的影響。
(2)成年組身高的離散系數:
幼兒組身高的離散系數:
由於幼兒組身高的離散系數大於成年組身高的離散系數,說明幼兒組身高的離散程度相對較大。
4.12
(1)應該從平均數和標准差兩個方面進行評價。在對各種方法的離散程度進行比較時,應該採用離散系數。
(2)下表給出了各種方法的主要描述統計量。
方法A 方法B 方法C
平均 165.6
中位數 165
眾數 164
標准差 2.13
極差 8
最小值 162
最大值 170 平均 128.73
中位數 129
眾數 128
標准差 1.75
極差 7
最小值 125
最大值 132 平均 125.53
中位數 126
眾數 126
標准差 2.77
極差 12
最小值 116
最大值 128
從三種方法的集中趨勢來看,方法A的平均產量最高,中位數和眾數也都高於其他兩種方法。從離散程度來看,三種方法的離散系數分別為: , , 。方法A的離散程度最小,因此,應選擇方法A。
4.13
(1)用方差或標准差來評價投資的風險。
(2)從直方圖可以看出,商業類股票收益率的離散程度較小,說明投資風險也就較小。
(3)從投資風險角度看,應該選擇風險較小的商業類股票。當然,選擇哪類股票還與投資者的主觀判斷有很大關系。
第五章練習題答案
5.1 (1)平均分數是范圍在0-100之間的連續變數,Ω=[0,100]
(2)已經遇到的綠燈次數是從0開始的任意自然數,Ω=N
(3)之前生產的產品中可能無次品也可能有任意多個次品,Ω=[10,11,12,13…….]
5.2 設訂日報的集合為A,訂晚報的集合為B,至少訂一種報的集合為A∪B,同時訂兩種報的集合為A∩B。
P(A∩B)=P(A)+ P(B)-P(A∪B)=0.5+0.65-0.85=0.3
5.3 P(A∪B)=1/3,P(A∩ )=1/9, P(B)= P(A∪B)- P(A∩ )=2/9
5.4 P(AB)= P(B)P(A∣B)=1/3*1/6=1/18
P( ∪ )=P( )=1- P(AB)=17/18
P( )=1- P(B)=2/3
P( )=P( )+ P( )- P( ∪ )=7/18
P( ∣ )= P( )/P( )=7/12
5.5 設甲發芽為事件A,乙發芽為事件B。
(1)由於是兩批種子,所以兩個事件相互獨立,所以有:P(AB)= P(B)P(B)=0.56
(2)P(A∪B)=P(A)+P(B)-P(A∩B)=0.94
(3)P(A )+ P(B )= P(A)P( )+P(B)P( )=0.38
5.6 設合格為事件A,合格品中一級品為事件B
P(AB)= P(A)P(B∣A)=0.96*0.75=0.72
5.7 設前5000小時未壞為事件A,後5000小時未壞為事件B。
P(A)=1/3,P(AB)=1/2, P(B∣A)= P(AB)/ P(A)=2/3
5.8 設職工文化程度小學為事件A,職工文化程度初中為事件B,職工文化程度高中為事件C,職工年齡25歲以下為事件D。
P(A)=0.1 P(B)=0.5, P(C)=0.4
P(D∣A)=0.2, P(D∣B)=0.5, P(D∣C)=0.7
P(A∣D)=
同理P(B∣D)=5/11, P(C∣D)=28/55
5.9 設次品為D,由貝葉斯公式有:
P(A∣D)= =0.249
同理P(B∣D)=0.112
5.10 由二項式分布可得:P(x=0)=0.25, P(x=1)=0.5, P(x=2)=0.25
5.11 (1) P(x=100)=0.001, P(x=10)=0.01, P(x=1)=0.2, P(x=0)=0.789
(2)E(X)=100*0.001+10*0.01+1*0.2=0.4
5.13 答對至少四道題包含兩種情況,對四道錯一道,對五道。
C54 C65 =1/64
5.14 由泊松分布的性質有:
P(X=1)= ,P(X=2)= ,可得 =2
P(X=4)=2/3e
5.15
所以,當k= -1和k= 時P(x=k)最大。
5.16 (1)P( >2)= P(x>2)+ P(x<-2)= (0.5)+1- (2.5)=0.6977
由於N(3,4)關於均值3對稱,所以P(x>3)=0.5
5.17 P(120<x<200)=P(
,
5.18 (1)
(2)
第七章 練習題參考答案
7.1 (1)已知 =5,n=40, =25, =0.05, =1.96
樣本均值的抽樣標准差 = =
(2)估計誤差(也稱為邊際誤差)E= =1.96*0.79=1.55
7.2(1)已知 =15,n=49, =120, =0.05, =1.96
(2)樣本均值的抽樣標准差 = = 2.14
估計誤差E= =1.96* 4.2
(3)由於總體標准差已知,所以總體均值 的95%的置信區間為:
=120 1.96*2.14=120 4.2,即(115.8,124.2)
7.3(1)已知 =85414,n=100, =104560, =0.05, =1.96
由於總體標准差已知,所以總體均值 的95%的置信區間為:
=104560 1.96* 104560 16741.144即(87818.856,121301.144)
7.4(1)已知n=100, =81,s=12, =0.1, =1.645
由於n=100為大樣本,所以總體均值 的90%的置信區間為:
=81 1.645* 81 1.974,即(79.026,82.974)
(2)已知 =0.05, =1.96
由於n=100為大樣本,所以總體均值 的95%的置信區間為:
=81 1.96* 81 2.352,即(78.648,83.352)
(3)已知 =0.01, =2.58
由於n=100為大樣本,所以總體均值 的99%的置信區間為:
=81 2.58* 81 3.096,即(77.94,84.096)
7.5(1)已知 =3.5,n=60, =25, =0.05, =1.96
由於總體標准差已知,所以總體均值 的95%的置信區間為:
=25 1.96* 25 0.89,即(24.11,25.89)
(2)已知n=75, =119.6,s=23.89, =0.02, =2.33
由於n=75為大樣本,所以總體均值 的98%的置信區間為:
=119.6 2.33* 119.6 6.43,即(113.17,126.03)
(3)已知 =3.419,s=0.974,n=32, =0.1, =1.645
由於n=32為大樣本,所以總體均值 的90%的置信區間為:
=3.419 1.645* 3.419 0.283,即(3.136,3.702)
7.6(1)已知:總體服從正態分布, =500,n=15, =8900, =0.05, =1.96
由於總體服從正態分布,所以總體均值 的95%的置信區間為:
=8900 1.96* 8900 253.03,即(8646.97,9153.03)
(2)已知:總體不服從正態分布, =500,n=35, =8900, =0.05, =1.96
雖然總體不服從正態分布,但由於n=35為大樣本,所以總體均值 的95%的置信區間為:
=8900 1.96* 8900 165.65,即(8734.35,9065.65)
(3)已知:總體不服從正態分布, 未知, n=35, =8900,s=500, =0.1, =1.645
雖然總體不服從正態分布,但由於n=35為大樣本,所以總體均值 的90%的置信區間為:
=8900 1.645* 8900 139.03,即(8760.97,9039.03)
(4)已知:總體不服從正態分布, 未知, n=35, =8900,s=500, =0.01, =2.58
雖然總體不服從正態分布,但由於n=35為大樣本,所以總體均值 的99%的置信區間為:
=8900 2.58* 8900 218.05,即(8681.95,9118.05)
7.7 已知:n=36,當 =0.1,0.05,0.01時,相應的 =1.645, =1.96, =2.58
根據樣本數據計算得: =3.32,s=1.61
由於n=36為大樣本,所以平均上網時間的90%置信區間為:
=3.32 1.645* 3.32 0.44,即(2.88,3.76)
平均上網時間的95%置信區間為:
=3.32 1.96* 3.32 0.53,即(2.79,3.85)
平均上網時間的99%置信區間為:
=3.32 2.58* 3.32 0.69,即(2.63,4.01)
7.8 已知:總體服從正態分布,但 未知,n=8為小樣本, =0.05, =2.365
根據樣本數據計算得: =10,s=3.46
總體均值 的95%的置信區間為:
=10 2.365* 10 2.89,即(7.11,12.89)
7.9 已知:總體服從正態分布,但 未知,n=16為小樣本, =0.05, =2.131
根據樣本數據計算得: =9.375,s=4.113
從家裡到單位平均距離的95%的置信區間為:
=9.375 2.131* 9.375 2.191,即(7.18,11.57)
7.10 (1)已知:n=36, =149.5, =0.05, =1.96
由於n=36為大樣本,所以零件平均長度的95%的置信區間為:
=149.5 1.96* 149.5 0.63,即(148.87,150.13)
(2)在上面的估計中,使用了統計中的中心極限定理。該定理表明:從均值為 、方差為 的總體中,抽取了容量為n的隨機樣本,當n充分大時(通常要求 ),樣本均值的抽樣分布近似服從均值為 ,方差為 的正態分布。
7.12 (1)已知:總體服從正態分布,但 未知,n=25為小樣本, =0.01, =2.797
根據樣本數據計算得: =16.128,s=0.871
總體均值 的99%的置信區間為:
=16.128 2.797* 16.128 0.487,即(15.64,16.62)
7.13 已知:總體服從正態分布,但 未知,n=18為小樣本, =0.1, =1.74
根據樣本數據計算得: =13.56,s=7.8
網路公司員工平均每周加班時間的90%的置信區間為:
=13.56 1.74* 13.56 3.2,即(10.36,16.76)
7.14 (1)已知:n=44,p=0.51, =0.01, =2.58
總體比例 的99%的置信區間為:
=0.51 2.58 =0.51 0.19,即(0.32,0.7)
(2)已知:n=300,p=0.82, =0.05, =1.96
總體比例 的95%的置信區間為:
=0.82 1.96 =0.82 0.04,即(0.78,0.86)
(3)已知:n=1150,p=0.48, =0.1,, =1.645
總體比例 的90%的置信區間為:
=0.48 1.645 =0.48 0.02,即(0.46,0.5)
7.15 已知:n=200,p=0.23, 為0.1和0.05時,相應的 =1.645, =1.96
總體比例 的90%的置信區間為:
『陸』 誰有《應用統計學》電子書免費百度雲
《應用統計學》網路網盤txt 最新全集下載
鏈接: https://pan..com/s/1SOxtCI5f-NOO__U1HGmq5A
《應用統計學》是由賈俊平編著,高等教育出版社2014年出版的「十二五」國家重點出版物出版規劃項目教材。該教材既可作為高等學校經濟管理類專業本科生統計學課程教材,也可作為其他文科專業及部分理、工、農、林、醫葯專業的教材或參考書[1]。
《應用統計學》共10章,內容包括統計、數據和計算機,用圖表展示數據,用統計量描述數據,概率分布,參數估計,假設檢驗,類別變數分析,相關與回歸分析,時間序列預測,指數[1]。
『柒』 賈俊平統計學第八版和第七版區別
第八版是升級版。
七版在學習內容是寫的不錯的是很容易理解的,而八版是升級版在教程排版是比較復雜分析比較好的。
《統計學》是一本由賈俊平創作的圖書,2006年在清華大學出版社出版。《統計學》(第二版)一書結合了作者多年的教學實踐經驗和國外優秀統計學教材的成果,在內容上包括描述統計方法、推斷統計方法以及工商管理中常用的一些統計方法。
『捌』 《統計學》第四版課後答案 賈俊平、何曉群、金勇進編著的
3.1 為評價家電行業售後服務的質量,隨機抽取了由100個家庭構成的一個樣本。服務質量的等級分別表示為:A.好;B.較好;C一般;D.較差;E.差。調查結果如下:
B E C C A D C B A E
D A C B C D E C E E
A D B C C A E D C B
B A C D E A B D D C
C B C E D B C C B C
D A C B C D E C E B
B E C C A D C B A E
B A C E E A B D D C
A D B C C A E D C B
C B C E D B C C B C
要求:
(1)指出上面的數據屬於什麼類型。
順序數據
(2)用Excel製作一張頻數分布表。
用數據分析——直方圖製作:
接收 頻率
E 16
D 17
C 32
B 21
A 14
(3)繪制一張條形圖,反映評價等級的分布。
用數據分析——直方圖製作:
(4)繪制評價等級的帕累托圖。
逆序排序後,製作累計頻數分布表:
接收 頻數 頻率(%) 累計頻率(%)
C 32 32 32
B 21 21 53
D 17 17 70
E 16 16 86
A 14 14 100
3.2 某行業管理局所屬40個企業2002年的產品銷售收入數據如下:
152 124 129 116 100 103 92 95 127 104
105 119 114 115 87 103 118 142 135 125
117 108 105 110 107 137 120 136 117 108
97 88 123 115 119 138 112 146 113 126
要求:
(1)根據上面的數據進行適當的分組,編制頻數分布表,並計算出累積頻數和累積頻率。
1、確定組數:
,取k=6
2、確定組距:
組距=( 最大值 - 最小值)÷ 組數=(152-87)÷6=10.83,取10
3、分組頻數表
銷售收入 頻數 頻率% 累計頻數 累計頻率%
80.00 - 89.00 2 5.0 2 5.0
90.00 - 99.00 3 7.5 5 12.5
100.00 - 109.00 9 22.5 14 35.0
110.00 - 119.00 12 30.0 26 65.0
120.00 - 129.00 7 17.5 33 82.5
130.00 - 139.00 4 10.0 37 92.5
140.00 - 149.00 2 5.0 39 97.5
150.00+ 1 2.5 40 100.0
總和 40 100.0
(2)按規定,銷售收入在125萬元以上為先進企業,115~125萬元為良好企業,105~115 萬元為一般企業,105萬元以下為落後企業,按先進企業、良好企業、一般企業、落後企業進行分組。
頻數 頻率% 累計頻數 累計頻率%
先進企業 10 25.0 10 25.0
良好企業 12 30.0 22 55.0
一般企業 9 22.5 31 77.5
落後企業 9 22.5 40 100.0
總和 40 100.0
3.3 某百貨公司連續40天的商品銷售額如下:
單位:萬元
41 25 29 47 38 34 30 38 43 40
46 36 45 37 37 36 45 43 33 44
35 28 46 34 30 37 44 26 38 44
42 36 37 37 49 39 42 32 36 35
要求:根據上面的數據進行適當的分組,編制頻數分布表,並繪制直方圖。
1、確定組數:
,取k=6
2、確定組距:
組距=( 最大值 - 最小值)÷ 組數=(49-25)÷6=4,取5
3、分組頻數表
銷售收入(萬元) 頻數 頻率% 累計頻數 累計頻率%
<= 25 1 2.5 1 2.5
26 - 30 5 12.5 6 15.0
31 - 35 6 15.0 12 30.0
36 - 40 14 35.0 26 65.0
41 - 45 10 25.0 36 90.0
46+ 4 10.0 40 100.0
總和 40 100.0
3.4 利用下面的數據構建莖葉圖和箱線圖。
57 29 29 36 31
23 47 23 28 28
35 51 39 18 46
18 26 50 29 33
21 46 41 52 28
21 43 19 42 20
data Stem-and-Leaf Plo
Frequency Stem & Leaf
3.00 1 . 88
5.00 2 . 01133
7.00 2 . 6888999
2.00 3 . 13
3.00 3 . 569
3.00 4 . 123
3.00 4 . 667
3.00 5 . 012
1.00 5 . 7
Stem width: 10
Each leaf: 1 case(s)
3.6一種袋裝食品用生產線自動裝填,每袋重量大約為50g,但由於某些原因,每袋重量不會恰好是50g。下面是隨機抽取的100袋食品,測得的重量數據如下:
單位:g
57 46 49 54 55 58 49 61 51 49
51 60 52 54 51 55 60 56 47 47
53 51 48 53 50 52 40 45 57 53
52 51 46 48 47 53 47 53 44 47
50 52 53 47 45 48 54 52 48 46
49 52 59 53 50 43 53 46 57 49
49 44 57 52 42 49 43 47 46 48
51 59 45 45 46 52 55 47 49 50
54 47 48 44 57 47 53 58 52 48
55 53 57 49 56 56 57 53 41 48
要求:
(1)構建這些數據的頻數分布表。
(2)繪制頻數分布的直方圖。
(3)說明數據分布的特徵。
解:(1)根據上面的數據進行適當的分組,編制頻數分布表,並計算出累積頻數和累積頻率。
1、確定組數:
,取k=6或7
2、確定組距:
組距=( 最大值 - 最小值)÷ 組數=(61-40)÷6=3.5,取3或者4、5
組距=( 最大值 - 最小值)÷ 組數=(61-40)÷7=3,
3、分組頻數表
組距3,上限為小於
頻數 百分比 累計頻數 累積百分比
有效 40.00 - 42.00 3 3.0 3 3.0
43.00 - 45.00 9 9.0 12 12.0
46.00 - 48.00 24 24.0 36 36.0
49.00 - 51.00 19 19.0 55 55.0
52.00 - 54.00 24 24.0 79 79.0
55.00 - 57.00 14 14.0 93 93.0
58.00+ 7 7.0 100 100.0
合計 100 100.0
直方圖:
組距4,上限為小於等於
頻數 百分比 累計頻數 累積百分比
有效 <= 40.00 1 1.0 1 1.0
41.00 - 44.00 7 7.0 8 8.0
45.00 - 48.00 28 28.0 36 36.0
49.00 - 52.00 28 28.0 64 64.0
53.00 - 56.00 22 22.0 86 86.0
57.00 - 60.00 13 13.0 99 99.0
61.00+ 1 1.0 100 100.0
合計 100 100.0
直方圖:
組距5,上限為小於等於
頻數 百分比 累計頻數 累積百分比
有效 <= 45.00 12 12.0 12.0 12.0
46.00 - 50.00 37 37.0 49.0 49.0
51.00 - 55.00 34 34.0 83.0 83.0
56.00 - 60.00 16 16.0 99.0 99.0
61.00+ 1 1.0 100.0 100.0
合計 100 100.0
直方圖:
分布特徵:左偏鍾型。
3.8 下面是北方某城市1——2月份各天氣溫的記錄數據:
-3 2 -4 -7 -11 -1 7 8 9 -6
14 -18 -15 -9 -6 -1 0 5 -4 -9
6 -8 -12 -16 -19 -15 -22 -25 -24 -19
-8 -6 -15 -11 -12 -19 -25 -24 -18 -17
-14 -22 -13 -9 -6 0 -1 5 -4 -9
-3 2 -4 -4 -16 -1 7 5 -6 -5
要求:
(1)指出上面的數據屬於什麼類型。
數值型數據
(2)對上面的數據進行適當的分組。
1、確定組數:
,取k=7
2、確定組距:
組距=( 最大值 - 最小值)÷ 組數=(14-(-25))÷7=5.57,取5
3、分組頻數表
溫度 頻數 頻率% 累計頻數 累計頻率%
-25 - -21 6 10.0 6 10.0
-20 - -16 8 13.3 14 23.3
-15 - -11 9 15.0 23 38.3
-10 - -6 12 20.0 35 58.3
-5 - -1 12 20.0 47 78.3
0 - 4 4 6.7 51 85.0
5 - 9 8 13.3 59 98.3
10+ 1 1.7 60 100.0
合計 60 100.0
(3)繪制直方圖,說明該城市氣溫分布的特點。
3.11 對於下面的數據繪制散點圖。
x 2 3 4 1 8 7
y 25 25 20 30 16 18
解:
3.12 甲乙兩個班各有40名學生,期末統計學考試成績的分布如下:
考試成績 人數
甲班 乙班
優
良
中
及格
不及格 3
6
18
9
4 6
15
9
8
2
要求:
(1)根據上面的數據,畫出兩個班考試成績的對比條形圖和環形圖。
(2)比較兩個班考試成績分布的特點。
甲班成績中的人數較多,高分和低分人數比乙班多,乙班學習成績較甲班好,高分較多,而低分較少。
(3)畫出雷達圖,比較兩個班考試成績的分布是否相似。
分布不相似。
3.14 已知1995—2004年我國的國內生產總值數據如下(按當年價格計算):
單位:億元
年份 國內生產總值
第一產業 第二產業 第三產業
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004 58478.1
67884.6
74462.6
78345.2
82067.5
89468.1
97314.8
105172.3
117390.2
136875.9 11993
13844.2
14211.2
14552.4
14471.96
14628.2
15411.8
16117.3
16928.1
20768.07 28538
33613
37223
38619
40558
44935
48750
52980
61274
72387 17947
20428
23029
25174
27038
29905
33153
36075
39188
43721
要求:
(1)用Excel繪制國內生產總值的線圖。
(2)繪制第一、二、三產業國內生產總值的線圖。
(3)根據2004年的國內生產總值及其構成數據繪制餅圖。
第四章 統計數據的概括性描述
4.1 一家汽車零售店的10名銷售人員5月份銷售的汽車數量(單位:台)排序後如下:
2 4 7 10 10 10 12 12 14 15
要求:
(1)計算汽車銷售量的眾數、中位數和平均數。
(2)根據定義公式計算四分位數。
(3)計算銷售量的標准差。
(4)說明汽車銷售量分布的特徵。
解:
Statistics
汽車銷售數量
N Valid 10
Missing 0
Mean 9.60
Median 10.00
Mode 10
Std. Deviation 4.169
Percentiles 25 6.25
50 10.00
75 12.50
4.2 隨機抽取25個網路用戶,他們的年齡數據如下:
單位:周歲
19 15 29 25 24
23 21 38 22 18
30 20 19 19 16
23 27 22 34 24
41 20 31 17 23
要求;
(1)計算眾數、中位數:
1、排序形成單變數分值的頻數分布和累計頻數分布:
網路用戶的年齡
Frequency Percent Cumulative Frequency Cumulative Percent
Valid 15 1 4.0 1 4.0
16 1 4.0 2 8.0
17 1 4.0 3 12.0
18 1 4.0 4 16.0
19 3 12.0 7 28.0
20 2 8.0 9 36.0
21 1 4.0 10 40.0
22 2 8.0 12 48.0
23 3 12.0 15 60.0
24 2 8.0 17 68.0
25 1 4.0 18 72.0
27 1 4.0 19 76.0
29 1 4.0 20 80.0
30 1 4.0 21 84.0
31 1 4.0 22 88.0
34 1 4.0 23 92.0
38 1 4.0 24 96.0
41 1 4.0 25 100.0
Total 25 100.0
從頻數看出,眾數Mo有兩個:19、23;從累計頻數看,中位數Me=23。
(2)根據定義公式計算四分位數。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由於25和27都只有一個,因此Q3也可等於25+0.75×2=26.5。
(3)計算平均數和標准差;
Mean=24.00;Std. Deviation=6.652
(4)計算偏態系數和峰態系數:
Skewness=1.080;Kurtosis=0.773
(5)對網民年齡的分布特徵進行綜合分析:
分布,均值=24、標准差=6.652、呈右偏分布。如需看清楚分布形態,需要進行分組。
為分組情況下的直方圖:
為分組情況下的概率密度曲線:
分組:
1、確定組數:
,取k=6
2、確定組距:組距=( 最大值 - 最小值)÷ 組數=(41-15)÷6=4.3,取5
3、分組頻數表
網路用戶的年齡 (Binned)
Frequency Percent Cumulative Frequency Cumulative Percent
Valid <= 15 1 4.0 1 4.0
16 - 20 8 32.0 9 36.0
21 - 25 9 36.0 18 72.0
26 - 30 3 12.0 21 84.0
31 - 35 2 8.0 23 92.0
36 - 40 1 4.0 24 96.0
41+ 1 4.0 25 100.0
Total 25 100.0
分組後的均值與方差:
Mean 23.3000
Std. Deviation 7.02377
Variance 49.333
Skewness 1.163
Kurtosis 1.302
分組後的直方圖:
4.3 某銀行為縮短顧客到銀行辦理業務等待的時間。准備採用兩種排隊方式進行試驗:一種是所有頤客都進入一個等待隊列:另—種是顧客在三千業務窗口處列隊3排等待。為比較哪種排隊方式使顧客等待的時間更短.兩種排隊方式各隨機抽取9名顧客。得到第一種排隊方式的平均等待時間為7.2分鍾,標准差為1.97分鍾。第二種排隊方式的等待時間(單位:分鍾)如下:
5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8
要求:
(1)畫出第二種排隊方式等待時間的莖葉圖。
第二種排隊方式的等待時間(單位:分鍾) Stem-and-Leaf Plot
Frequency Stem & Leaf
1.00 Extremes (=<5.5)
3.00 6 . 678
3.00 7 . 134
2.00 7 . 88
Stem width: 1.00
Each leaf: 1 case(s)
(2)計算第二種排隊時間的平均數和標准差。
Mean 7
Std. Deviation 0.714143
Variance 0.51
(3)比較兩種排隊方式等待時間的離散程度。
第二種排隊方式的離散程度小。
(4)如果讓你選擇一種排隊方式,你會選擇哪—種?試說明理由。
選擇第二種,均值小,離散程度小。
4.4 某百貨公司6月份各天的銷售額數據如下:
單位:萬元
257 276 297 252 238 310 240 236 265 278
271 292 261 281 301 274 267 280 291 258
272 284 268 303 273 263 322 249 269 295
要求:
(1)計算該百貨公司日銷售額的平均數和中位數。
(2)按定義公式計算四分位數。
(3)計算日銷售額的標准差。
解:
Statistics
百貨公司每天的銷售額(萬元)
N Valid 30
Missing 0
Mean 274.1000
Median 272.5000
Std. Deviation 21.17472
Percentiles 25 260.2500
50 272.5000
75 291.2500
4.5 甲乙兩個企業生產三種產品的單位成本和總成本資料如下:
產品 單位成本 總成本(元)
名稱 (元) 甲企業 乙企業
A
B
C 15
20
30 2 100
3 000
1 500 3 255
1 500
1 500
要求:比較兩個企業的總平均成本,哪個高,並分析其原因。
產品名稱 單位成本(元) 甲企業 乙企業
總成本(元) 產品數 總成本(元) 產品數
A 15 2100 140 3255 217
B 20 3000 150 1500 75
C 30 1500 50 1500 50
平均成本(元) 19.41176471 18.28947368
調和平均數計算,得到甲的平均成本為19.41;乙的平均成本為18.29。甲的中間成本的產品多,乙的低成本的產品多。
4.6 在某地區抽取120家企業,按利潤額進行分組,結果如下:
按利潤額分組(萬元) 企業數(個)
200~300
300~400
400~500
500~600
600以上 19
30
42
18
11
合 計 120
要求:
(1)計算120家企業利潤額的平均數和標准差。
(2)計算分布的偏態系數和峰態系數。
解:
Statistics
企業利潤組中值Mi(萬元)
N Valid 120
Missing 0
Mean 426.6667
Std. Deviation 116.48445
Skewness 0.208
Std. Error of Skewness 0.221
Kurtosis -0.625
Std. Error of Kurtosis 0.438
4.7 為研究少年兒童的成長發育狀況,某研究所的一位調查人員在某城市抽取100名7~17歲的少年兒童作為樣本,另一位調查人員則抽取了1 000名7~17歲的少年兒童作為樣本。請回答下面的問題,並解釋其原因。
(1)兩位調查人員所得到的樣本的平均身高是否相同?如果不同,哪組樣本的平均身高較大?
(2)兩位調查人員所得到的樣本的標准差是否相同?如果不同,哪組樣本的標准差較大?
(3)兩位調查人員得到這l 100名少年兒童身高的最高者或最低者的機會是否相同?如果不同,哪位調查研究人員的機會較大?
解:(1)不一定相同,無法判斷哪一個更高,但可以判斷,樣本量大的更接近於總體平均身高。
(2)不一定相同,樣本量少的標准差大的可能性大。
(3)機會不相同,樣本量大的得到最高者和最低者的身高的機會大。
4.8 一項關於大學生體重狀況的研究發現.男生的平均體重為60kg,標准差為5kg;女生的平均體重為50kg,標准差為5kg。請回答下面的問題:
(1)是男生的體重差異大還是女生的體重差異大?為什麼?
女生,因為標准差一樣,而均值男生大,所以,離散系數是男生的小,離散程度是男生的小。
(2)以磅為單位(1ks=2.2lb),求體重的平均數和標准差。
都是各乘以2.21,男生的平均體重為60kg×2.21=132.6磅,標准差為5kg×2.21=11.05磅;女生的平均體重為50kg×2.21=110.5磅,標准差為5kg×2.21=11.05磅。
(3)粗略地估計一下,男生中有百分之幾的人體重在55kg一65kg之間?
計算標准分數:
Z1= = =-1;Z2= = =1,根據經驗規則,男生大約有68%的人體重在55kg一65kg之間。
(4)粗略地估計一下,女生中有百分之幾的人體重在40kg~60kg之間?
計算標准分數:
Z1= = =-2;Z2= = =2,根據經驗規則,女生大約有95%的人體重在40kg一60kg之間。
4.9 一家公司在招收職員時,首先要通過兩項能力測試。在A項測試中,其平均分數是100分,標准差是15分;在B項測試中,其平均分數是400分,標准差是50分。一位應試者在A項測試中得了115分,在B項測試中得了425分。與平均分數相比,該應試者哪一項測試更為理想?
解:應用標准分數來考慮問題,該應試者標准分數高的測試理想。
ZA= = =1;ZB= = =0.5
因此,A項測試結果理想。
4.10 一條產品生產線平均每天的產量為3 700件,標准差為50件。如果某一天的產量低於或高於平均產量,並落人士2個標准差的范圍之外,就認為該生產線「失去控制」。下面是一周各天的產量,該生產線哪幾天失去了控制?
時間 周一 周二 周三 周四 周五 周六 周日
產量(件) 3 850 3 670 3 690 3 720 3 610 3 590 3 700
時間 周一 周二 周三 周四 周五 周六 周日
產量(件) 3850 3670 3690 3720 3610 3590 3700
日平均產量 3700
日產量標准差 50
標准分數Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0
標准分數界限 -2 -2 -2 -2 -2 -2 -2
2 2 2 2 2 2 2
周六超出界限,失去控制。
『玖』 賈俊平統計學看誰的網課
看賈俊平的網課是學《統計學》的必備。
看過那麼幾個輔導機構的課程,講真,一丘之貉,無外乎照本宣科最多表情豐富一些。
《統計學》是一本非常基礎的統計學入門教材,賈俊平老師第七版的《統計學》的引言部分有一句說道,「適合非統計系學生進行學習」。所以,掌握基本的統計思想只需要多翻翻書就夠了;想深入學習,網課也講不到那個深度。
如果你是今年年底考研的話,我建議多看幾本市面上的統計學教材,比如賈俊平、黃良文、袁衛,順帶著買一本聖才的432統計學輔導教材,功夫下足120+不成問題。
432統計學也就這兩年才火起來的,不像金融學,國際商務,經濟學等培訓比較成熟的學科,可以搜到很多培訓視頻。目前432統計學主流還是以賈俊平的《統計學》為主,有的院校會加上茆詩松的《概率論與數理統計》。基本上這兩本就能覆蓋95%。
培訓機構的主流模式是花錢請高校老師做視頻,然後自己在市場上包裝成各種產品出售。授課老師因為掙的是課時費,所以對課程質量的用心度有限。這就是為什麼大部分機構的課程老師用的都是昵稱而不是真名。
不過也有一些用心講課的老師,你可以在B站搜一下「索瑜老師」,是我所知道的少數用真名的老師。
『拾』 賈俊平統計學需要概率論基礎嗎
賈俊平統計學需要概率論基礎,因為統計學可以說是以概率論為基礎的,需要概率論的知識。運籌學的隨機部分要用到概率論的知識。賈俊平版《統計學》內容簡介:
統計作為數據分析的一種通用語言,為使用者提供了一套獲取數據、分析數據並從數據中得出結論的原則和方法。《統計學》包括描述統計、推斷統計、多元統計和非參數統計等主要方法。寫法上完全立足於統計應用,每種方法都從實際問題入手進行討論,盡可能避免過多統計公式的推導。
統計學相關知識:
統計學專業能在企事業單位和經濟、金融和管理部門從事統計調查、統計信息管理、數量分析、市場研究、質量控制以及高新技術產品開發、研究、應用和管理工作,或在科研教育部門從事研究和教學工作的高級專門人才。
統計學不僅要注重與其它學科的結合,統計學自身在統計原理、統計技術、統計方法等領域也要謀求創新和突破。一直以來,政府統計、部門統計在統計學生的就業中佔有較高的比重。然而,隨著社會主義市場的完善,隨著中國全球化貿易的發展,民間統計越來越熱。
以上內容參考:網路--統計學