‘壹’ 中国人民大学出版社的《统计学》第四版,贾俊平、金勇进、何晓群编的,求课后习题答案
苦逼了,找不到答案。。
‘贰’ 贾俊平统计学怎么样
贾俊平版《统计学》内容简介:统计作为数据分析的一种通用语言,为使用者提供了一套获取数据、分析数据并从数据中得出结论的原则和方法。《统计学》包括描述统计、推断统计、多元统计和非参数统计等主要方法。写法上完全立足于统计应用,每种方法都从实际问题入手进行讨论,尽可能避免过多统计公式的推导。书中例题的解答结合使用了SPSS和Excel两个软件,并给出每种方法的详细操作步骤,使读者能轻松完成统计计算。
《统计学》可作为高等院校经济管理类专业本科生统计学课程的教材,也可作为研究生和MBA的教材或参考书,对广大实际工作者也具有参考价值。
‘叁’ 《统计学(第四版)》epub下载在线阅读全文,求百度网盘云资源
《统计学(第四版)》(贾俊平//何晓群//金勇进)电子书网盘下载免费在线阅读
链接: https://pan..com/s/1OASD_P09tHPwydd6KpVuRQ
书名:统计学(第四版)
作者:贾俊平//何晓群//金勇进
豆瓣评分:6.9
出版社:中国人民大学
出版年份:2009-11
页数:453
内容简介:
《普通高等教育"十一五"国家级规划教材•教育部推荐教材•国家统计局优秀教材•21世纪统计学系列教材•统计学(第4版)》内容简介:统计学是收集、分析、表述和解释数据的科学。作为数据分析的一种有效工具,统计方法已广泛应用于生产、生活和科学研究的各个领域,成为各学科领域研究者和实际工作者的必备知识。《普通高等教育"十一五"国家级规划教材•教育部推荐教材•国家统计局优秀教材•21世纪统计学系列教材•统计学(第4版)》作者多年从事统计教学,具有丰富的教材编写经验。《统计学》(第四版)是在第三版的基础上修改而成的,在保留第三版内容框架的基础上,删除了一些相对较难的内容,同时更加突出计算机的应用。
《普通高等教育"十一五"国家级规划教材•教育部推荐教材•国家统计局优秀教材•21世纪统计学系列教材•统计学(第4版)》可作为高等院校经济管理专业本科生统计学课程的教材,也可作为MBA的教材或参考书,对广大实际工作者也极具参考价值。
作者简介:
贾俊平,中国人民大学统计学院副教授。研究方向:统计方法在经济各领域的应用、统计教学方式和方法。主要着作有:《统计学》、《描述统计》、《工商管理统计》、《市场调查与分析》等。主持研究的“非统计学专业本科公共基础课——统计学教学改革”项目获2001年国家级教学成果二等奖、2001年北京市教学成果一等然。2001年荣获北京市经济技术创新标兵称号,2003年荣获宝纲优秀教师奖等。
‘肆’ 《统计学》(贾俊平第七版)课后题及答案
weishi://feed?feed_id=70X1f5RYo1JjbLy3T&atype=1&logsour=2020020163&allow_interest=0&idx=8o1T8B3gD/JyiaAiZeWa6Q==
‘伍’ 我也求一份《统计学》第四版课后习题答案..贾俊平 何晓群 金勇进的..不胜感激。
第四章练习题答案
4.1 (1)众数:M0=10; 中位数:中位数位置=n+1/2=5.5,Me=10;平均数:
(2)QL位置=n/4=2.5, QL=4+7/2=5.5;QU位置=3n/4=7.5,QU=12
(3)
(4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。
4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M0=19和M0=23。
将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为Me=23
(2)QL位置=n/4=6.25, QL==19;QU位置=3n/4=18.75,QU=26.5
(3)平均数 600/25=24,标准差
(4)偏态系数SK=1.08,峰态系数K=0.77
(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。由于峰态系数为正值,所以为尖峰分布。
4.3 (1)茎叶图如下:
茎 叶 频数
5
6
7 5
6 7 8
1 3 4 8 8 1
3
5
(2) 63/9=7,
(3)由于两种排队方式的平均数不同,所以用离散系数进行比较。
第一种排队方式:v1=1.97/7.2=0.274;v2=0.714/7=0.102.由于v1>v2,表明第一种排队方式的离散程度大于第二种排队方式。
(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。
4.4 (1) 8223/30=274.1
中位数位置=n+1/2=15.5,Me=272+273/2=272.5
(2)QL位置=n/4=7.5, QL==(258+261)/2=259.5;QU位置=3n/4=22.5,QU=(284+291)/2=287.5
(3)
4.5 (1)甲企业的平均成本=总成本/总产量=
乙企业的平均成本=总成本/总产量=
原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
4.6 (1)(计算过程中的表略), 51200/120=426.67
SK=0.203 K=-0.688
4.7 (1)两位调查人员所得到的平均身高应该差不多相同,因为均值的大小基本上不受样本大小的影响。
(2)两位调查人员所得到身高的标准差应该差不多相同,因为标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取得最高或最低者,因为样本越大,变化的范围就可能越大。
4.8 (1)要比较男女学生体重的离散程度应该采用离散系数。女生体重的离散系数为v女=5/50=0.1,男生体重的离散系数为v男=5/60=0.08,所以女生的体重差异大。
(2)男生: 60×2.2=132(磅),s=5×2.2=11(磅)
女生: 50×2.2=110(磅),s=5×2.2=11(磅)
(3)假定体重为对称分布,根据经验法则,在平均数加减1个标准差范围内的数据个数大约为68%。因此,男生中大约有68%的人体重在55kg-65kg之间。
(4)假定体重为对称分布,根据经验法则,在平均数加减2个标准差范围内的数据个数大约为95%。因此,男生中大约有95%的人体重在40kg-60kg之间。
4.9 通过计算标准分数来判断:
该测试者在A项测试中比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准分数高于B项测试,所以,A项测试比较理想。
4.10 通过标准分数来判断,各天的标准分数如下表:
日期 周一 周二 周三 周四 周五 周六 周日
标准分数Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0
周一和周六两天失去了控制。
4.11
(1)应该采用离散系数,因为它消除了不同组数据水平高低的影响。
(2)成年组身高的离散系数:
幼儿组身高的离散系数:
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
4.12
(1)应该从平均数和标准差两个方面进行评价。在对各种方法的离散程度进行比较时,应该采用离散系数。
(2)下表给出了各种方法的主要描述统计量。
方法A 方法B 方法C
平均 165.6
中位数 165
众数 164
标准差 2.13
极差 8
最小值 162
最大值 170 平均 128.73
中位数 129
众数 128
标准差 1.75
极差 7
最小值 125
最大值 132 平均 125.53
中位数 126
众数 126
标准差 2.77
极差 12
最小值 116
最大值 128
从三种方法的集中趋势来看,方法A的平均产量最高,中位数和众数也都高于其他两种方法。从离散程度来看,三种方法的离散系数分别为: , , 。方法A的离散程度最小,因此,应选择方法A。
4.13
(1)用方差或标准差来评价投资的风险。
(2)从直方图可以看出,商业类股票收益率的离散程度较小,说明投资风险也就较小。
(3)从投资风险角度看,应该选择风险较小的商业类股票。当然,选择哪类股票还与投资者的主观判断有很大关系。
第五章练习题答案
5.1 (1)平均分数是范围在0-100之间的连续变量,Ω=[0,100]
(2)已经遇到的绿灯次数是从0开始的任意自然数,Ω=N
(3)之前生产的产品中可能无次品也可能有任意多个次品,Ω=[10,11,12,13…….]
5.2 设订日报的集合为A,订晚报的集合为B,至少订一种报的集合为A∪B,同时订两种报的集合为A∩B。
P(A∩B)=P(A)+ P(B)-P(A∪B)=0.5+0.65-0.85=0.3
5.3 P(A∪B)=1/3,P(A∩ )=1/9, P(B)= P(A∪B)- P(A∩ )=2/9
5.4 P(AB)= P(B)P(A∣B)=1/3*1/6=1/18
P( ∪ )=P( )=1- P(AB)=17/18
P( )=1- P(B)=2/3
P( )=P( )+ P( )- P( ∪ )=7/18
P( ∣ )= P( )/P( )=7/12
5.5 设甲发芽为事件A,乙发芽为事件B。
(1)由于是两批种子,所以两个事件相互独立,所以有:P(AB)= P(B)P(B)=0.56
(2)P(A∪B)=P(A)+P(B)-P(A∩B)=0.94
(3)P(A )+ P(B )= P(A)P( )+P(B)P( )=0.38
5.6 设合格为事件A,合格品中一级品为事件B
P(AB)= P(A)P(B∣A)=0.96*0.75=0.72
5.7 设前5000小时未坏为事件A,后5000小时未坏为事件B。
P(A)=1/3,P(AB)=1/2, P(B∣A)= P(AB)/ P(A)=2/3
5.8 设职工文化程度小学为事件A,职工文化程度初中为事件B,职工文化程度高中为事件C,职工年龄25岁以下为事件D。
P(A)=0.1 P(B)=0.5, P(C)=0.4
P(D∣A)=0.2, P(D∣B)=0.5, P(D∣C)=0.7
P(A∣D)=
同理P(B∣D)=5/11, P(C∣D)=28/55
5.9 设次品为D,由贝叶斯公式有:
P(A∣D)= =0.249
同理P(B∣D)=0.112
5.10 由二项式分布可得:P(x=0)=0.25, P(x=1)=0.5, P(x=2)=0.25
5.11 (1) P(x=100)=0.001, P(x=10)=0.01, P(x=1)=0.2, P(x=0)=0.789
(2)E(X)=100*0.001+10*0.01+1*0.2=0.4
5.13 答对至少四道题包含两种情况,对四道错一道,对五道。
C54 C65 =1/64
5.14 由泊松分布的性质有:
P(X=1)= ,P(X=2)= ,可得 =2
P(X=4)=2/3e
5.15
所以,当k= -1和k= 时P(x=k)最大。
5.16 (1)P( >2)= P(x>2)+ P(x<-2)= (0.5)+1- (2.5)=0.6977
由于N(3,4)关于均值3对称,所以P(x>3)=0.5
5.17 P(120<x<200)=P(
,
5.18 (1)
(2)
第七章 练习题参考答案
7.1 (1)已知 =5,n=40, =25, =0.05, =1.96
样本均值的抽样标准差 = =
(2)估计误差(也称为边际误差)E= =1.96*0.79=1.55
7.2(1)已知 =15,n=49, =120, =0.05, =1.96
(2)样本均值的抽样标准差 = = 2.14
估计误差E= =1.96* 4.2
(3)由于总体标准差已知,所以总体均值 的95%的置信区间为:
=120 1.96*2.14=120 4.2,即(115.8,124.2)
7.3(1)已知 =85414,n=100, =104560, =0.05, =1.96
由于总体标准差已知,所以总体均值 的95%的置信区间为:
=104560 1.96* 104560 16741.144即(87818.856,121301.144)
7.4(1)已知n=100, =81,s=12, =0.1, =1.645
由于n=100为大样本,所以总体均值 的90%的置信区间为:
=81 1.645* 81 1.974,即(79.026,82.974)
(2)已知 =0.05, =1.96
由于n=100为大样本,所以总体均值 的95%的置信区间为:
=81 1.96* 81 2.352,即(78.648,83.352)
(3)已知 =0.01, =2.58
由于n=100为大样本,所以总体均值 的99%的置信区间为:
=81 2.58* 81 3.096,即(77.94,84.096)
7.5(1)已知 =3.5,n=60, =25, =0.05, =1.96
由于总体标准差已知,所以总体均值 的95%的置信区间为:
=25 1.96* 25 0.89,即(24.11,25.89)
(2)已知n=75, =119.6,s=23.89, =0.02, =2.33
由于n=75为大样本,所以总体均值 的98%的置信区间为:
=119.6 2.33* 119.6 6.43,即(113.17,126.03)
(3)已知 =3.419,s=0.974,n=32, =0.1, =1.645
由于n=32为大样本,所以总体均值 的90%的置信区间为:
=3.419 1.645* 3.419 0.283,即(3.136,3.702)
7.6(1)已知:总体服从正态分布, =500,n=15, =8900, =0.05, =1.96
由于总体服从正态分布,所以总体均值 的95%的置信区间为:
=8900 1.96* 8900 253.03,即(8646.97,9153.03)
(2)已知:总体不服从正态分布, =500,n=35, =8900, =0.05, =1.96
虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值 的95%的置信区间为:
=8900 1.96* 8900 165.65,即(8734.35,9065.65)
(3)已知:总体不服从正态分布, 未知, n=35, =8900,s=500, =0.1, =1.645
虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值 的90%的置信区间为:
=8900 1.645* 8900 139.03,即(8760.97,9039.03)
(4)已知:总体不服从正态分布, 未知, n=35, =8900,s=500, =0.01, =2.58
虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值 的99%的置信区间为:
=8900 2.58* 8900 218.05,即(8681.95,9118.05)
7.7 已知:n=36,当 =0.1,0.05,0.01时,相应的 =1.645, =1.96, =2.58
根据样本数据计算得: =3.32,s=1.61
由于n=36为大样本,所以平均上网时间的90%置信区间为:
=3.32 1.645* 3.32 0.44,即(2.88,3.76)
平均上网时间的95%置信区间为:
=3.32 1.96* 3.32 0.53,即(2.79,3.85)
平均上网时间的99%置信区间为:
=3.32 2.58* 3.32 0.69,即(2.63,4.01)
7.8 已知:总体服从正态分布,但 未知,n=8为小样本, =0.05, =2.365
根据样本数据计算得: =10,s=3.46
总体均值 的95%的置信区间为:
=10 2.365* 10 2.89,即(7.11,12.89)
7.9 已知:总体服从正态分布,但 未知,n=16为小样本, =0.05, =2.131
根据样本数据计算得: =9.375,s=4.113
从家里到单位平均距离的95%的置信区间为:
=9.375 2.131* 9.375 2.191,即(7.18,11.57)
7.10 (1)已知:n=36, =149.5, =0.05, =1.96
由于n=36为大样本,所以零件平均长度的95%的置信区间为:
=149.5 1.96* 149.5 0.63,即(148.87,150.13)
(2)在上面的估计中,使用了统计中的中心极限定理。该定理表明:从均值为 、方差为 的总体中,抽取了容量为n的随机样本,当n充分大时(通常要求 ),样本均值的抽样分布近似服从均值为 ,方差为 的正态分布。
7.12 (1)已知:总体服从正态分布,但 未知,n=25为小样本, =0.01, =2.797
根据样本数据计算得: =16.128,s=0.871
总体均值 的99%的置信区间为:
=16.128 2.797* 16.128 0.487,即(15.64,16.62)
7.13 已知:总体服从正态分布,但 未知,n=18为小样本, =0.1, =1.74
根据样本数据计算得: =13.56,s=7.8
网络公司员工平均每周加班时间的90%的置信区间为:
=13.56 1.74* 13.56 3.2,即(10.36,16.76)
7.14 (1)已知:n=44,p=0.51, =0.01, =2.58
总体比例 的99%的置信区间为:
=0.51 2.58 =0.51 0.19,即(0.32,0.7)
(2)已知:n=300,p=0.82, =0.05, =1.96
总体比例 的95%的置信区间为:
=0.82 1.96 =0.82 0.04,即(0.78,0.86)
(3)已知:n=1150,p=0.48, =0.1,, =1.645
总体比例 的90%的置信区间为:
=0.48 1.645 =0.48 0.02,即(0.46,0.5)
7.15 已知:n=200,p=0.23, 为0.1和0.05时,相应的 =1.645, =1.96
总体比例 的90%的置信区间为:
‘陆’ 谁有《应用统计学》电子书免费百度云
《应用统计学》网络网盘txt 最新全集下载
链接: https://pan..com/s/1SOxtCI5f-NOO__U1HGmq5A
《应用统计学》是由贾俊平编着,高等教育出版社2014年出版的“十二五”国家重点出版物出版规划项目教材。该教材既可作为高等学校经济管理类专业本科生统计学课程教材,也可作为其他文科专业及部分理、工、农、林、医药专业的教材或参考书[1]。
《应用统计学》共10章,内容包括统计、数据和计算机,用图表展示数据,用统计量描述数据,概率分布,参数估计,假设检验,类别变量分析,相关与回归分析,时间序列预测,指数[1]。
‘柒’ 贾俊平统计学第八版和第七版区别
第八版是升级版。
七版在学习内容是写的不错的是很容易理解的,而八版是升级版在教程排版是比较复杂分析比较好的。
《统计学》是一本由贾俊平创作的图书,2006年在清华大学出版社出版。《统计学》(第二版)一书结合了作者多年的教学实践经验和国外优秀统计学教材的成果,在内容上包括描述统计方法、推断统计方法以及工商管理中常用的一些统计方法。
‘捌’ 《统计学》第四版课后答案 贾俊平、何晓群、金勇进编着的
3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下:
B E C C A D C B A E
D A C B C D E C E E
A D B C C A E D C B
B A C D E A B D D C
C B C E D B C C B C
D A C B C D E C E B
B E C C A D C B A E
B A C E E A B D D C
A D B C C A E D C B
C B C E D B C C B C
要求:
(1)指出上面的数据属于什么类型。
顺序数据
(2)用Excel制作一张频数分布表。
用数据分析——直方图制作:
接收 频率
E 16
D 17
C 32
B 21
A 14
(3)绘制一张条形图,反映评价等级的分布。
用数据分析——直方图制作:
(4)绘制评价等级的帕累托图。
逆序排序后,制作累计频数分布表:
接收 频数 频率(%) 累计频率(%)
C 32 32 32
B 21 21 53
D 17 17 70
E 16 16 86
A 14 14 100
3.2 某行业管理局所属40个企业2002年的产品销售收入数据如下:
152 124 129 116 100 103 92 95 127 104
105 119 114 115 87 103 118 142 135 125
117 108 105 110 107 137 120 136 117 108
97 88 123 115 119 138 112 146 113 126
要求:
(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
1、确定组数:
,取k=6
2、确定组距:
组距=( 最大值 - 最小值)÷ 组数=(152-87)÷6=10.83,取10
3、分组频数表
销售收入 频数 频率% 累计频数 累计频率%
80.00 - 89.00 2 5.0 2 5.0
90.00 - 99.00 3 7.5 5 12.5
100.00 - 109.00 9 22.5 14 35.0
110.00 - 119.00 12 30.0 26 65.0
120.00 - 129.00 7 17.5 33 82.5
130.00 - 139.00 4 10.0 37 92.5
140.00 - 149.00 2 5.0 39 97.5
150.00+ 1 2.5 40 100.0
总和 40 100.0
(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
频数 频率% 累计频数 累计频率%
先进企业 10 25.0 10 25.0
良好企业 12 30.0 22 55.0
一般企业 9 22.5 31 77.5
落后企业 9 22.5 40 100.0
总和 40 100.0
3.3 某百货公司连续40天的商品销售额如下:
单位:万元
41 25 29 47 38 34 30 38 43 40
46 36 45 37 37 36 45 43 33 44
35 28 46 34 30 37 44 26 38 44
42 36 37 37 49 39 42 32 36 35
要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
1、确定组数:
,取k=6
2、确定组距:
组距=( 最大值 - 最小值)÷ 组数=(49-25)÷6=4,取5
3、分组频数表
销售收入(万元) 频数 频率% 累计频数 累计频率%
<= 25 1 2.5 1 2.5
26 - 30 5 12.5 6 15.0
31 - 35 6 15.0 12 30.0
36 - 40 14 35.0 26 65.0
41 - 45 10 25.0 36 90.0
46+ 4 10.0 40 100.0
总和 40 100.0
3.4 利用下面的数据构建茎叶图和箱线图。
57 29 29 36 31
23 47 23 28 28
35 51 39 18 46
18 26 50 29 33
21 46 41 52 28
21 43 19 42 20
data Stem-and-Leaf Plo
Frequency Stem & Leaf
3.00 1 . 88
5.00 2 . 01133
7.00 2 . 6888999
2.00 3 . 13
3.00 3 . 569
3.00 4 . 123
3.00 4 . 667
3.00 5 . 012
1.00 5 . 7
Stem width: 10
Each leaf: 1 case(s)
3.6一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重量不会恰好是50g。下面是随机抽取的100袋食品,测得的重量数据如下:
单位:g
57 46 49 54 55 58 49 61 51 49
51 60 52 54 51 55 60 56 47 47
53 51 48 53 50 52 40 45 57 53
52 51 46 48 47 53 47 53 44 47
50 52 53 47 45 48 54 52 48 46
49 52 59 53 50 43 53 46 57 49
49 44 57 52 42 49 43 47 46 48
51 59 45 45 46 52 55 47 49 50
54 47 48 44 57 47 53 58 52 48
55 53 57 49 56 56 57 53 41 48
要求:
(1)构建这些数据的频数分布表。
(2)绘制频数分布的直方图。
(3)说明数据分布的特征。
解:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
1、确定组数:
,取k=6或7
2、确定组距:
组距=( 最大值 - 最小值)÷ 组数=(61-40)÷6=3.5,取3或者4、5
组距=( 最大值 - 最小值)÷ 组数=(61-40)÷7=3,
3、分组频数表
组距3,上限为小于
频数 百分比 累计频数 累积百分比
有效 40.00 - 42.00 3 3.0 3 3.0
43.00 - 45.00 9 9.0 12 12.0
46.00 - 48.00 24 24.0 36 36.0
49.00 - 51.00 19 19.0 55 55.0
52.00 - 54.00 24 24.0 79 79.0
55.00 - 57.00 14 14.0 93 93.0
58.00+ 7 7.0 100 100.0
合计 100 100.0
直方图:
组距4,上限为小于等于
频数 百分比 累计频数 累积百分比
有效 <= 40.00 1 1.0 1 1.0
41.00 - 44.00 7 7.0 8 8.0
45.00 - 48.00 28 28.0 36 36.0
49.00 - 52.00 28 28.0 64 64.0
53.00 - 56.00 22 22.0 86 86.0
57.00 - 60.00 13 13.0 99 99.0
61.00+ 1 1.0 100 100.0
合计 100 100.0
直方图:
组距5,上限为小于等于
频数 百分比 累计频数 累积百分比
有效 <= 45.00 12 12.0 12.0 12.0
46.00 - 50.00 37 37.0 49.0 49.0
51.00 - 55.00 34 34.0 83.0 83.0
56.00 - 60.00 16 16.0 99.0 99.0
61.00+ 1 1.0 100.0 100.0
合计 100 100.0
直方图:
分布特征:左偏钟型。
3.8 下面是北方某城市1——2月份各天气温的记录数据:
-3 2 -4 -7 -11 -1 7 8 9 -6
14 -18 -15 -9 -6 -1 0 5 -4 -9
6 -8 -12 -16 -19 -15 -22 -25 -24 -19
-8 -6 -15 -11 -12 -19 -25 -24 -18 -17
-14 -22 -13 -9 -6 0 -1 5 -4 -9
-3 2 -4 -4 -16 -1 7 5 -6 -5
要求:
(1)指出上面的数据属于什么类型。
数值型数据
(2)对上面的数据进行适当的分组。
1、确定组数:
,取k=7
2、确定组距:
组距=( 最大值 - 最小值)÷ 组数=(14-(-25))÷7=5.57,取5
3、分组频数表
温度 频数 频率% 累计频数 累计频率%
-25 - -21 6 10.0 6 10.0
-20 - -16 8 13.3 14 23.3
-15 - -11 9 15.0 23 38.3
-10 - -6 12 20.0 35 58.3
-5 - -1 12 20.0 47 78.3
0 - 4 4 6.7 51 85.0
5 - 9 8 13.3 59 98.3
10+ 1 1.7 60 100.0
合计 60 100.0
(3)绘制直方图,说明该城市气温分布的特点。
3.11 对于下面的数据绘制散点图。
x 2 3 4 1 8 7
y 25 25 20 30 16 18
解:
3.12 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下:
考试成绩 人数
甲班 乙班
优
良
中
及格
不及格 3
6
18
9
4 6
15
9
8
2
要求:
(1)根据上面的数据,画出两个班考试成绩的对比条形图和环形图。
(2)比较两个班考试成绩分布的特点。
甲班成绩中的人数较多,高分和低分人数比乙班多,乙班学习成绩较甲班好,高分较多,而低分较少。
(3)画出雷达图,比较两个班考试成绩的分布是否相似。
分布不相似。
3.14 已知1995—2004年我国的国内生产总值数据如下(按当年价格计算):
单位:亿元
年份 国内生产总值
第一产业 第二产业 第三产业
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004 58478.1
67884.6
74462.6
78345.2
82067.5
89468.1
97314.8
105172.3
117390.2
136875.9 11993
13844.2
14211.2
14552.4
14471.96
14628.2
15411.8
16117.3
16928.1
20768.07 28538
33613
37223
38619
40558
44935
48750
52980
61274
72387 17947
20428
23029
25174
27038
29905
33153
36075
39188
43721
要求:
(1)用Excel绘制国内生产总值的线图。
(2)绘制第一、二、三产业国内生产总值的线图。
(3)根据2004年的国内生产总值及其构成数据绘制饼图。
第四章 统计数据的概括性描述
4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:
2 4 7 10 10 10 12 12 14 15
要求:
(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:
Statistics
汽车销售数量
N Valid 10
Missing 0
Mean 9.60
Median 10.00
Mode 10
Std. Deviation 4.169
Percentiles 25 6.25
50 10.00
75 12.50
4.2 随机抽取25个网络用户,他们的年龄数据如下:
单位:周岁
19 15 29 25 24
23 21 38 22 18
30 20 19 19 16
23 27 22 34 24
41 20 31 17 23
要求;
(1)计算众数、中位数:
1、排序形成单变量分值的频数分布和累计频数分布:
网络用户的年龄
Frequency Percent Cumulative Frequency Cumulative Percent
Valid 15 1 4.0 1 4.0
16 1 4.0 2 8.0
17 1 4.0 3 12.0
18 1 4.0 4 16.0
19 3 12.0 7 28.0
20 2 8.0 9 36.0
21 1 4.0 10 40.0
22 2 8.0 12 48.0
23 3 12.0 15 60.0
24 2 8.0 17 68.0
25 1 4.0 18 72.0
27 1 4.0 19 76.0
29 1 4.0 20 80.0
30 1 4.0 21 84.0
31 1 4.0 22 88.0
34 1 4.0 23 92.0
38 1 4.0 24 96.0
41 1 4.0 25 100.0
Total 25 100.0
从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;
Mean=24.00;Std. Deviation=6.652
(4)计算偏态系数和峰态系数:
Skewness=1.080;Kurtosis=0.773
(5)对网民年龄的分布特征进行综合分析:
分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:
为分组情况下的概率密度曲线:
分组:
1、确定组数:
,取k=6
2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取5
3、分组频数表
网络用户的年龄 (Binned)
Frequency Percent Cumulative Frequency Cumulative Percent
Valid <= 15 1 4.0 1 4.0
16 - 20 8 32.0 9 36.0
21 - 25 9 36.0 18 72.0
26 - 30 3 12.0 21 84.0
31 - 35 2 8.0 23 92.0
36 - 40 1 4.0 24 96.0
41+ 1 4.0 25 100.0
Total 25 100.0
分组后的均值与方差:
Mean 23.3000
Std. Deviation 7.02377
Variance 49.333
Skewness 1.163
Kurtosis 1.302
分组后的直方图:
4.3 某银行为缩短顾客到银行办理业务等待的时间。准备采用两种排队方式进行试验:一种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。第二种排队方式的等待时间(单位:分钟)如下:
5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8
要求:
(1)画出第二种排队方式等待时间的茎叶图。
第二种排队方式的等待时间(单位:分钟) Stem-and-Leaf Plot
Frequency Stem & Leaf
1.00 Extremes (=<5.5)
3.00 6 . 678
3.00 7 . 134
2.00 7 . 88
Stem width: 1.00
Each leaf: 1 case(s)
(2)计算第二种排队时间的平均数和标准差。
Mean 7
Std. Deviation 0.714143
Variance 0.51
(3)比较两种排队方式等待时间的离散程度。
第二种排队方式的离散程度小。
(4)如果让你选择一种排队方式,你会选择哪—种?试说明理由。
选择第二种,均值小,离散程度小。
4.4 某百货公司6月份各天的销售额数据如下:
单位:万元
257 276 297 252 238 310 240 236 265 278
271 292 261 281 301 274 267 280 291 258
272 284 268 303 273 263 322 249 269 295
要求:
(1)计算该百货公司日销售额的平均数和中位数。
(2)按定义公式计算四分位数。
(3)计算日销售额的标准差。
解:
Statistics
百货公司每天的销售额(万元)
N Valid 30
Missing 0
Mean 274.1000
Median 272.5000
Std. Deviation 21.17472
Percentiles 25 260.2500
50 272.5000
75 291.2500
4.5 甲乙两个企业生产三种产品的单位成本和总成本资料如下:
产品 单位成本 总成本(元)
名称 (元) 甲企业 乙企业
A
B
C 15
20
30 2 100
3 000
1 500 3 255
1 500
1 500
要求:比较两个企业的总平均成本,哪个高,并分析其原因。
产品名称 单位成本(元) 甲企业 乙企业
总成本(元) 产品数 总成本(元) 产品数
A 15 2100 140 3255 217
B 20 3000 150 1500 75
C 30 1500 50 1500 50
平均成本(元) 19.41176471 18.28947368
调和平均数计算,得到甲的平均成本为19.41;乙的平均成本为18.29。甲的中间成本的产品多,乙的低成本的产品多。
4.6 在某地区抽取120家企业,按利润额进行分组,结果如下:
按利润额分组(万元) 企业数(个)
200~300
300~400
400~500
500~600
600以上 19
30
42
18
11
合 计 120
要求:
(1)计算120家企业利润额的平均数和标准差。
(2)计算分布的偏态系数和峰态系数。
解:
Statistics
企业利润组中值Mi(万元)
N Valid 120
Missing 0
Mean 426.6667
Std. Deviation 116.48445
Skewness 0.208
Std. Error of Skewness 0.221
Kurtosis -0.625
Std. Error of Kurtosis 0.438
4.7 为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1 000名7~17岁的少年儿童作为样本。请回答下面的问题,并解释其原因。
(1)两位调查人员所得到的样本的平均身高是否相同?如果不同,哪组样本的平均身高较大?
(2)两位调查人员所得到的样本的标准差是否相同?如果不同,哪组样本的标准差较大?
(3)两位调查人员得到这l 100名少年儿童身高的最高者或最低者的机会是否相同?如果不同,哪位调查研究人员的机会较大?
解:(1)不一定相同,无法判断哪一个更高,但可以判断,样本量大的更接近于总体平均身高。
(2)不一定相同,样本量少的标准差大的可能性大。
(3)机会不相同,样本量大的得到最高者和最低者的身高的机会大。
4.8 一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。请回答下面的问题:
(1)是男生的体重差异大还是女生的体重差异大?为什么?
女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。
(2)以磅为单位(1ks=2.2lb),求体重的平均数和标准差。
都是各乘以2.21,男生的平均体重为60kg×2.21=132.6磅,标准差为5kg×2.21=11.05磅;女生的平均体重为50kg×2.21=110.5磅,标准差为5kg×2.21=11.05磅。
(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间?
计算标准分数:
Z1= = =-1;Z2= = =1,根据经验规则,男生大约有68%的人体重在55kg一65kg之间。
(4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间?
计算标准分数:
Z1= = =-2;Z2= = =2,根据经验规则,女生大约有95%的人体重在40kg一60kg之间。
4.9 一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该应试者哪一项测试更为理想?
解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。
ZA= = =1;ZB= = =0.5
因此,A项测试结果理想。
4.10 一条产品生产线平均每天的产量为3 700件,标准差为50件。如果某一天的产量低于或高于平均产量,并落人士2个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生产线哪几天失去了控制?
时间 周一 周二 周三 周四 周五 周六 周日
产量(件) 3 850 3 670 3 690 3 720 3 610 3 590 3 700
时间 周一 周二 周三 周四 周五 周六 周日
产量(件) 3850 3670 3690 3720 3610 3590 3700
日平均产量 3700
日产量标准差 50
标准分数Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0
标准分数界限 -2 -2 -2 -2 -2 -2 -2
2 2 2 2 2 2 2
周六超出界限,失去控制。
‘玖’ 贾俊平统计学看谁的网课
看贾俊平的网课是学《统计学》的必备。
看过那么几个辅导机构的课程,讲真,一丘之貉,无外乎照本宣科最多表情丰富一些。
《统计学》是一本非常基础的统计学入门教材,贾俊平老师第七版的《统计学》的引言部分有一句说道,“适合非统计系学生进行学习”。所以,掌握基本的统计思想只需要多翻翻书就够了;想深入学习,网课也讲不到那个深度。
如果你是今年年底考研的话,我建议多看几本市面上的统计学教材,比如贾俊平、黄良文、袁卫,顺带着买一本圣才的432统计学辅导教材,功夫下足120+不成问题。
432统计学也就这两年才火起来的,不像金融学,国际商务,经济学等培训比较成熟的学科,可以搜到很多培训视频。目前432统计学主流还是以贾俊平的《统计学》为主,有的院校会加上茆诗松的《概率论与数理统计》。基本上这两本就能覆盖95%。
培训机构的主流模式是花钱请高校老师做视频,然后自己在市场上包装成各种产品出售。授课老师因为挣的是课时费,所以对课程质量的用心度有限。这就是为什么大部分机构的课程老师用的都是昵称而不是真名。
不过也有一些用心讲课的老师,你可以在B站搜一下“索瑜老师”,是我所知道的少数用真名的老师。
‘拾’ 贾俊平统计学需要概率论基础吗
贾俊平统计学需要概率论基础,因为统计学可以说是以概率论为基础的,需要概率论的知识。运筹学的随机部分要用到概率论的知识。贾俊平版《统计学》内容简介:
统计作为数据分析的一种通用语言,为使用者提供了一套获取数据、分析数据并从数据中得出结论的原则和方法。《统计学》包括描述统计、推断统计、多元统计和非参数统计等主要方法。写法上完全立足于统计应用,每种方法都从实际问题入手进行讨论,尽可能避免过多统计公式的推导。
统计学相关知识:
统计学专业能在企事业单位和经济、金融和管理部门从事统计调查、统计信息管理、数量分析、市场研究、质量控制以及高新技术产品开发、研究、应用和管理工作,或在科研教育部门从事研究和教学工作的高级专门人才。
统计学不仅要注重与其它学科的结合,统计学自身在统计原理、统计技术、统计方法等领域也要谋求创新和突破。一直以来,政府统计、部门统计在统计学生的就业中占有较高的比重。然而,随着社会主义市场的完善,随着中国全球化贸易的发展,民间统计越来越热。
以上内容参考:网络--统计学