第一章 总论
2. 统计有几种涵义?各种涵义的关系如何?
统计的三种涵义是指统计工作、统计资料及统计学。统计工作是统计的实践活动,统计资料是统计工作的成果,统计学是统计实践活动的科学总结,反过来又指导统计实践。
8. 什么是统计总体、总体单位?总体和单位的关系如何?
统计总体是指客观存在的,在同一性质基础上结合起来的许多个别事物的整体。构成统计总体的每个基本单位或元素称为总体单位。总体和单位的关系:(1)总体是由单位构成的;(2)总体和总体单位不是固定不变的,而是随着统计任务的不同,可以变换位置;(3)统计总体与总体单位是互为存在条件地联结在一起的,没有总体单位,总体也就不存在了。
10. 什么是标志?标志有几种?分别举例说明。
标志是说明总体单位特征的名称。标志有品质标志与数量标志之分。品质标志表示事物的质的特征,是不能用数值表示的,如人的性别、工人的工种等。数量标志表示事物的量的特征,是可以用数值表示的,如人的年龄、企业的产值等。
第二章 统计调查
1. 调查对象、调查单位以及填报单位的关系是什么?试举例说明。
调查对象是需要调查的那些社会经济现象的总体。调查单位是调查对象中所要调查的具体单位,是调查项目的直接承担者,它可能是全部总体单位,也可能是其中的一部分。填报单位是负责向上报告调查内容的单位,又称报告单位。
调查对象和调查单位在同一次调查中是包含和被包含的关系。确定调查对象是要划清所要研究的总体界限,确定调查单位是要明确调查标志有谁来承担。填报单位和调查单位有联系也有区别,二者有时一致,有时不一致。
如工业企业设备普查,调查对象是工业企业设备,调查单位是每台设备,填报单位是每个工业企业。 2. 什么是统计调查?它有哪些分类?
统计调查是按照预定的统计任务,运用科学的调查方法,有计划有组织地向客观实际搜集统计资料的过程。 按调查对象包括范围的不同,可以分为全面调查和非全面调查;按调查登记时间的连续性,分为经常性调查和一次性调查;按调查组织方式分为统计报表制度和专门调查;按搜集资料的方法可分为直接观察法、报告法、采访法。
5. 普查和全面统计报表都是全面调查,两者能否互相代替?
普查和全面统计报表都是全面调查,但它们是两种不同的调查方式方法,各有不同的特点和作用。普查是一次性调查,它所包含的单位和指标可以更全面,分组更详细,能搜集到全面报表不能或不宜取得的资料。但是普查花费的人财物力和时间较多,不可能象全面报表那样经常进行。全面统计报表可以定期取得资料,以满足制定和检查政策、计划及日常管理的需要,它是我国目前取得统计资料的主要手段。普查一般在编制长期计划和采取重大决策前进行。可见二者是不能相互代替的。
第三章 统计整理
2. 统计整理应按什么原则进行?统计整理的步骤是什么?
将统计调查所得的原始资料进行科学的分类汇总,或对已经加工的次级资料进行再加工,为统计分析准备系统化、条理化的综合资料的工作过程。
统计数据整理的内容与程序主要包括以下几个方面: 首先是统计数据的预处理——调查资料的审核。
其次是统计数据的排序。
再次,是统计数据的分组和汇总。 最后,是编制统计表和绘制统计图。
3. 什么是统计分组?统计分组有什么作用?
统计分组是指根据事物内在的特点和统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。
统计分组的作用:(1)可以区分现象的类型;(2)可以分析内部结构和结构特征;(3)可以揭示现象之间的依存关系。
10. 第一步:计算全距
R=max(x )-min (x )=99-60=39 第二步:确定组数
根据:k=1+3.322LgN=1+3.322Lg40=6.3 取整数6组。 第三步:确定组距
理论组距:i=R/k=39/6=5 第四步:确定组限
初始值取数列最小值60。 第五步:分配各组次数 11.
15.
(1)第一步:计算全距R=max(x )-min (x )=92-60=32 第二步:确定组数
根据:k=1+3.322LgN=1+3.322Lg38=6.3 取整数6组。 第三步:确定组距
理论组距:i=R/k=32/6=5 (2)第一步:确定组限 初始值取数列最小值60。 第二步:分配各组次数 (3)画图:略
第四章 总量指标和相对指标
1. 计算和应用相对指标应注意的问题是什么? (1)注意统计分组和相对指标的结合运用; (2)注意相对指标和总量指标的结合运用; (3)注意多种相对指标结合运用。 4. 简述总量指标的种类。
总量指标是反映社会经济现象总体规模和水平的统计指标。按其反映现象总体的内容不同,分为总体单位总量和总体标志总量;按其反映的时间状况不同,分为时期指标和时点指标。 (五)计算题
1. 计划完成相对数=95.6%/95.8%=99.79% 成本计划降低的百分率:1-99.79%=0.21%
2. 劳动生产率计划完成程度=(1+10%)/(1+8%)=101.85% 3. (1)销售利润超额完成计划不是4%,而是3.7%; (2)劳动生产率计划完成程度不是110%,而是100.48%;
(3)产品单位成本实际比计划不是多下降0.5个百分点,而是0.52个百分点。 4.
8. 中位数、众数与算术平均数的关系是怎样的?
众数、中位数与算术平均数之间存在着一定的数量关系,这种关系取决于总体内部的分布情况。如果次数分布是对称的钟型分布,则三者相同,即=M e =M 0。
若次数分布是非对称的钟型分布,则算术平均数、中位数、众数就有一定的差别,这种差别取决于非对称程度。非对称程度愈大,它们之间差别愈大,反之愈小。如果存在极端变量值,变量分布就会偏斜。若分布左偏,众数最大、平均数最小,即M 0 M e ; 若分布右偏,则算术平均数最大,众数最小,即 M e M 0。
无论左偏还是右偏,中位数总是居于算术平均数和众数中间。之所以能形成这样的关系是由于三者受极端变量值的影响不同。众数是次数分布最多的变量值,它既不受变量值大小的影响,也不受变量值位置的影响;中位数仅受变量值位置的影响,不受变量值大小的影响;只有算术平均数是根据所有变量值计算的,故受极端变量值的影响最大。
根据经验,在偏斜适度的情况下,不论左偏还是右偏,中位数与算术平均数之差约等于众数与算术平均数之差的
,即: M e -=(M o -)
由此可得以下三个关系式:
3M e -M 0
2M +2M e =0
3
M 0=3M e -2=
可以利用这些关系,从已知的两个平均指标来估计另一个平均指标。 10.
甲地段的单位面积产量:=
60
x =35000=700斤/亩
乙地段的单位面积产量:=
n 50x 24000==600斤/亩 丙地段的单位面积产量:=n 40
x =107000=713. 33斤/亩
三个地段的平均单位面积产量:=
n 150
x =48000=800斤/亩
n
xf =1500⨯5+.... +1900⨯2=1634. 4元/人
50f
xf =0. 85⨯140+.... +1. 25⨯40=105. 7%
12. =
2850f
500+... +3002830m ===0. 96元/斤 13. H =
∑x 1. 1⨯500+... +0. 8⨯3002960. 43
11. =
14.
按单利计算的平均年利率:
=
7%+5%+4%+3%+2%
=4. 2%
5
按复利计算的平均年利率:
=1+7%)(1+5%)(1+4%)(1+3%)(1+2%)-1=1. 0419-1=4. 19%
15.
=. 056⨯1. 064=105. 4%
年平均利率=年平均本利率-100%=105.4%-100%=5.4% 16.
(1)众数:众数在50~60这一组。
M 0=L +
∆11200-300
⋅i =50+⨯10=56(百元)
∆1+∆2(1200-800) +(1200-300)
中位数:中位数所在的组3150/2=1575,故中位数在50~60这一组。
∑f
M e -L +
-S m -1f m
3150
-500i =⨯10=59(百元) 1200
第六章 变异指标
2. 全距、平均差和标准差各有什么特点?
全距测定标志变动程度虽然简单,但它容易受极端变量值的影响,测定结果不能充分反映现象实际离散程度。平均差指标虽然弥补了全距指标的不足,但它在数学处理上是用绝对值消除负离差,因而不适合代数方法的运算。而标准差除了具有平均差的优点外,它在数学处理上采用平方消除负号,最后开方还原的方法,符合代数运算法则,所以它用的最多。
7. 全距R =X max -X min =750-440=310元
8. 全距R =X max -X min =120%-80%=40% 9.
=
x =440+... +750=558元/人
n
5
A ⋅D =
10.
∑X
i =1
N
i
-X
=
N
440-+.... +750-=93. 6元/人
5
1
x 20+... +120===70元/人
n
6
20-70+.... +-70
=36元/人
N 6x 67+... +732===70元/人 n 6A ⋅D 1=
i =1
∑X
N
i
-X
=
A ⋅D 2=
11.
∑X
i =1
N
i
-X
=
N
67-70+.... +73-70
=2. 4元/人
6
=
A ⋅D =
xf =55*4+... +95*4=73. 8元/人
50f
∑X -X f -73. 8⨯4+... +95-73. 8⨯4
m
i
i
∑f
i =1
m
=
50
=7. 232分/人
i
12. =
N
x =440+... +750=558元/人
n
5
i
σ==
∑(X
-X ) 2
N
(440-558) 2+... +(750-558) 2==109. 62元/人
5
xf f
=
250*208+... +950*20
=522. 95元/人
2000
σ=
=
13.
250-522. 952⨯208+⋅⋅⋅+950-522. 952⨯20
2000
56386595. 01
=167. 9(元/人)
2000
V 甲=
3
=16. 67%
18σ3. 3V 乙===11. 38%
29
=
σ
由于甲的标准差大于乙的标准差,所以乙企业日产量更有代表性。 15.
甲品种的收获率:
jia =
∑m =2430=506. 25(公斤/亩) f 4. 8
m =2250=500(公斤/亩) f 4. 5
乙品种的收获率:
jia =
甲品种的标准差:σjia =21. 32(公斤) 乙品种的标准差:σyi =25. 98(公斤) 甲品种的标准差系数:V σjia =4. 2% 乙品种的标准差系数:V σyi =5. 2%
由于标准差系数甲品种的小于乙品种的,且亩产较高。所以,更具有推广价值。 16.
xf =
f
=
1900*30+... +2500*600
=2305. 56元/户
2160
σ=
2305. 56-19002⨯30+⋅⋅⋅+2305. 56-25002⨯600
2160
=148. 97(元/户)
17.
12*3+16*7+.... +40*4
=26
100
∆=42-10=32 =
-*3+⋅⋅⋅+40-26*4(12-26) 2*3+⋅⋅⋅+(40-26) 2*4AD ==5. 32σ==8. 58
100100
8. 58V σ==33%
26
18. 第一组:
20+40+60+70+80+100+120
=70
7
20-+40-70+60-70+70-+⋅⋅⋅+-180
∆=120-20=100AD ===25. 71
770=
(20-70) 2+(40-70) 2+(60-70) 2+⋅⋅⋅+(120-70) 2
σ==100
7
V =100σ70
=142. 86%
第二组:=70; ∆=6; AD =1. 71; σ=2; V σ=2. 86%
第二组的平均数代表性大 19. jia
=∑xf f =216700267=811. 61(元/人) σjia =
(x -) 2
f f =7834007
. 49267=171. 29(元/人)
V σjia
171. 29
σjia ==
. 61
=21. 10%
jia 811yi
=∑x ⋅f
f
=832(元/人)
σf
yi =∑
(x -) 2
⋅f
==185. 95(元/人)
V σyi
σyi =
=
185. 95
yi
832
=22. 35% 由以上计算可得:(1)乙单位的平均工资高于甲单位的平均工资。(以甲单位的平均工资更具有代表性。
20. 平均合格品次数=95%*400=380
σ=pq =0. 95⨯0. 05=0. 218或(21. 8%)
21.
平均合格率为:
P =
230+450+190+60
1000
=93%
标准差为:
σp =p (1-P ) =. 93(1-0. 93) =25. 51%
标准差系数为:
V σp =
σp
25. 52%
p
=
93%
27. 43%
2)由于标准差系数乙单位大于甲单位,所
22.
(1)σ=V σ=600⨯25%=150
x 2-2=450-202=7. 07 σ7. 07==35. 35% V σ=20
(2)σ=(3)σ=
x 2-2, =x 2-σ2=360-36=18
2
2
2
(4)由于σ=V σ=0. ,又=x -σ,所以,
2=174-(0. ) 2, 2=169, =13
第七章 抽样调查
7.X 1~N(μ1, σ12)=N(50,10), Z 1=
P(X
2
X 1-μ1
σ1
~N(0,1)
70-50
)=Φ(2)=0.9772; 10
X -μ2
~N(0,1) X 2~N(μ2, σ22)=N(60,42), Z 2=2
σ2
P(X
70-60
)=Φ(2.5)=0.9938.选第二条路。 4
8.1) 总的保费收入Y=20000*50=1,000,000;每人死亡时赔偿50,000元,那么要获利50万,则每年只能死亡10人。则其概率为:
P(X=10)=
(
10010
)0.0005
10
*(1-0.0005)19990
2) E(X 1)=0.0005,E(X)=10;D(X)=20000*0.0005*(1-0.0005)=9.9995
10-10
)=0.5
9.9995
230-200
9.1) X~N(200,400),则:P(X
20
210-200190-200
2) P(190
2020
3) Y~N(10,9.9995), 则P(X
2
s 2n 1. 0693236
10. =3. 3167, s =1. 0693 μ=(1-) =(1-) =0. 178
n N 3615000
置信水平为90%时:z=1.645 ∆=z μx =1. 645⨯0. 178=0. 2928, 置信区间为:[-∆, +∆]=[3. 3167-0. 2928, 3. 3167+0. 2928]=[3. 0239, 3. 6095] 置信水平为95%时:z=1.96 ∆=z μx =1. 96⨯0. 178=0. 3489
置信区间为:
[-∆, +∆]=[3. 3167-0. 3489, 3. 3167+0. 3489]=[2. 9678, 3. 6656]
s 2n 52210011.=450, s =52 μ=(1-) =(1-) =5. 1477
n N 1005000
置信水平为95%时:z=1.96 ∆=z μx =1. 96⨯5. 1477=10. 0895
置信区间为:[-∆, +∆]=[450-10. 0895, 450+10. 0895]=[439. 91, 460. 09]
12.
p (1-p ) n 0. 85⨯0. 15200
(1-) =(1-) =0. 0247 n N 2005000
置信水平为95.45%时:z=2 ∆p =z μp =2⨯0. 0247=0. 0495
p =
n 1170==0. 85 μp =n 200
置信区间为:[p -∆p , p +∆p ]=[0. 85-0. 0495, 0. 85+0. 0495]=[0. 8005, 0. 8995]
p (1-p ) 0. 45⨯0. 55
==0. 022 n 500
置信水平为95%时:z=1.96 ∆p =z μp =1. 96⨯0. 022=0. 043
13. p =
置信区间为:[p -∆p , p +∆p ]=[0. 45-0. 043, 0. 45+0. 043]=[0. 407, 0. 493]
n 1225
==0. 45 μp =n 500
Nz 2σ25000⨯1. 962⨯602
14. n ==≈34. 34=35(人) 222222
N ∆x +z σ5000⨯20+1. 96⨯60
16-16. 1
15.1) X~N(16.1, 0.2),则:P(X
0. 2
2) 0.3985=0.01
10
3) 0.3985=0.0001
5
s 2462
16.1)=2000, s =46 μ===4. 6
n 100
置信水平为68.27%时:z=1 ∆=z μx =4. 6
置信区间为:[-∆, +∆]=[2000-4. 6, 2000+4. 6]=[1995. 4, 2004. 6]
z 2σ212⨯4622)若∆=5.75 n ===64 极限误差缩小为原来的1/2,则样本容量变为原来的4倍,则22
∆x 5. 75
应抽取样本单位树为:64⨯4=256
3) 若要使极限抽样误差缩小到原来的, 概率为99.73%,则
z 2σ232⨯σ2
=5184
n =
∆2x
=
12∆x 9
=81⨯64
s 232. 452
17.1)=160, s =32. 45 μ===4. 589
n 50
置信水平为95.45%时:z=2 ∆=z μx =2⨯4. 589=9. 178
置信区间为:[-∆, +∆]=[160-9. 178, 160+9. 178]=[150. 822, 169. 178]
18.H 0:≥1000;H 1:
-1000958-1000
==-2. 1
100/25
n
显著性水平α=0. 02;临界值 -Z a =-1. 98 z =
z
19. H 0:P ≤1/5;H 1:P >1/5; 检验统计量z =
p -P pq n
=1. 368
(1)若a=0.10, 则Z>Za =1.285 拒绝原假设。调查结果不支持这位负责人的看法。 (2)若a=0.05, 则Z6. 7
-7. 25-6. 7
==3. 11 2. 5/200n
显著性水平α=0. 01; t a (199) =2. 345 t =
t >t α 所以拒绝原假设,说明如今每个家庭每天收看电视的平均时间增加了。
21.(1)H 0:=73;H 1:≠73
z =
-=
71. 15-73220. 5/200
=-1. 762
n
显著性水平α=0. 05; Z a /2=1. 96
接受原假设,说明今年考试成绩与去年处于同一水平。 (2)H 0:≥73;H 1:
z =
-=
71. 15-73220. 5/200
=-1. 762
n
显著性水平α=0. 05; Z a =-1. 645
拒绝原假设,说明今年考试成绩比往年有显著下降。
(3)上述量中检验,(1)是双侧检验,(2)是左侧检验。
第八章 相关与回归
7.根据题意:设利润为y ,产量为x 。 (1)利润随产量变化的散点图:
b =
n xy -x y n ∑x 2-∑x 2
=
7⨯15618-413⨯251
=0. 41
7⨯26347-4132
a =-b =
251413
-0. 41⨯=11.75 77
利润对产量的一元线性回归方程:y c =11. 75+0. 41x
(3)b=0.41 说明当产量增加一个单位(万件)时,利润平均增加0.41个单位(万元)。
ˆβ
(4)t 检验统计量t =1为:
s βˆ
1
a : t=5.9348 b: t=12.6604 2
R =0.9697
8. (1) Y =β0+β1X +β2Z +u 即:Y=116.16-1.3079X+11.2459Z (2)R =
ESS RSS
=1-=0.9606 拟合优度接近于1,说明方程拟合较好。 TSS TSS
ˆ-) 2/k (y SSR /k ∑F ===109.5892 方程整体是显著的。 2
ˆ) /(n -k -1) SSE /(n -k -1) (y -y
2
ˆ-ββi
t 检验统计量:t i =i
ˆc ii σ
β0: t=4.7131 β1: t=-10.1095 β2 : t=4.0389 说明系数都通过t 检验。
(3)复相关系数:0.9801
(4) X不变,Y 和Z 的偏相关系数:
r 02. 1=
1-r 1-r 2
2
01
12
r 02-r 01r 12
=
0. 229
=0. 446 0. 513r 01-r 01r 12
201
2
Z 不变,Y 和X 的偏相关系数:r 01. 2=Y 不变,X 和Z 的偏相关系数:r 12. 0=
1-r 1-r 12
=-0.943
=-0.517
1-r 1-r 2
2
01
02
r 12-r 01r 02
(5)假如某月商品价格为80(元/公斤) ,广告费用为7(元) ,则该商品的销售量: Y=116.16-1.3079×80+11.2459×7=90.2493 95%的预测区间:[ 79.73,100.75]
第九章 统计指数
2. 何谓综合指数?综合指数编制的原理是什么?
答:综合指数是两个价值总量指标对比形成的指数,将其中被研究因素以外的所有因素固定下来,仅观察被研究因素的变动情况。
综合指数编制的原理:一个是数量指标指数要以基期的质量指标为同度量因素;另一个是质量指标指数要以报告期的数量指标为同度量因素。 6.个体指数:
猪肉:105% 鸡:90% 鱼:116.67% 牛肉:111.11%
p q ∑7.价格综合指数:
p q
8.
11
1101
=
214
=99. 07% 216
p q =2656=97.79%
p q 2716
∑p q -∑p q =2656-2716=-60
011
∑p q =2984. 8=109. 9%p q =2656=88. 98%
p q 2716p q 12984. 8
∑p q -∑p q =2984. 8-2716=268. 8元∑p q -∑p q =2656-2984. 8=-328. 8
01
11
0001
01001101
97.79%=109.9%×88.98% -60=268.8+(-328.8) 9.
∑x f
f =372. 8=112. 02% ∑x f -∑x f =372. 8-332. 8=40 x f 332. 8f f f x f
f =372. 8=111. 67% ∑x f -∑x f =372. 8-333. 85=38. 95 x f 333. 85f f f x f
f =333. 85=100. 32% ∑x f -∑x f =333. 85-332. 8=1. 05
x f 332. 8f f f
111
111
00
000
111
111
011
011
011
011
00
000
112.02%=111.67%×100.32% 40=38.95+1.05
第十章 时间序列分析
(四)计算题
15. 2+14. 214. 2+17. 617. 6+16. 316. 3+15. 8
⨯2+⨯4+⨯3+⨯31. a =
2+4+3+3
=16元
14001420
+1510+1460+
=1460人 2. a =35082+50+52+60+78+3. a ==5. 41%
10001425
+1020+1085+1120+1218+22
4. a =
400000+46200+494500
=1085. 2元/人
400+420+430
6.
(1)接近于直线型
ˆ=a +bt =256. 7+3. 17t (2)Y t
ˆ 291. 57(万吨) (3)Y 2001
7.
(2)消除季节变动后各季销售额 一季度:76/98.4%=77.2(万元) 二季度:77/98.8%=77.9(万元) 三季度:89/121.5%=77.3(万元) 四季度:73/81.3%=89.8(万元)
第十一章 统计预测
6.
7.
简单季节预测模型下2007年第三季度的销售量为:78.71 移动平均季节预测模型下2007年第三季度的销售量为:78.9 8.
直线趋势方程:GDP=65963.86+19465.25*t 2007年GDP 预测值为:221685.9亿元
2
抛物线趋势方程:GDP=81663.14+8999.06*t+1308.274*t 2007年GDP 预测值为:237385.1亿元
t
指数趋势方程:GDP=1.94*1.37
12.389
2007年GDP 预测值为:10
9. ⑴单位营业额=0.664+日人流量*0.404
⑵单位面积营业额与日人流量的相关系数=0.79
日人流量对应的t 统计量为5.48,大于5%显著性水平的临界值,因而回归显著的。 ⑶日人流量对单位面积营业额回归方程的估计标准误差为:0.52 ⑷2.685 ⑸0.9
⑹[ 0.705,4.67]
第一章 总论
2. 统计有几种涵义?各种涵义的关系如何?
统计的三种涵义是指统计工作、统计资料及统计学。统计工作是统计的实践活动,统计资料是统计工作的成果,统计学是统计实践活动的科学总结,反过来又指导统计实践。
8. 什么是统计总体、总体单位?总体和单位的关系如何?
统计总体是指客观存在的,在同一性质基础上结合起来的许多个别事物的整体。构成统计总体的每个基本单位或元素称为总体单位。总体和单位的关系:(1)总体是由单位构成的;(2)总体和总体单位不是固定不变的,而是随着统计任务的不同,可以变换位置;(3)统计总体与总体单位是互为存在条件地联结在一起的,没有总体单位,总体也就不存在了。
10. 什么是标志?标志有几种?分别举例说明。
标志是说明总体单位特征的名称。标志有品质标志与数量标志之分。品质标志表示事物的质的特征,是不能用数值表示的,如人的性别、工人的工种等。数量标志表示事物的量的特征,是可以用数值表示的,如人的年龄、企业的产值等。
第二章 统计调查
1. 调查对象、调查单位以及填报单位的关系是什么?试举例说明。
调查对象是需要调查的那些社会经济现象的总体。调查单位是调查对象中所要调查的具体单位,是调查项目的直接承担者,它可能是全部总体单位,也可能是其中的一部分。填报单位是负责向上报告调查内容的单位,又称报告单位。
调查对象和调查单位在同一次调查中是包含和被包含的关系。确定调查对象是要划清所要研究的总体界限,确定调查单位是要明确调查标志有谁来承担。填报单位和调查单位有联系也有区别,二者有时一致,有时不一致。
如工业企业设备普查,调查对象是工业企业设备,调查单位是每台设备,填报单位是每个工业企业。 2. 什么是统计调查?它有哪些分类?
统计调查是按照预定的统计任务,运用科学的调查方法,有计划有组织地向客观实际搜集统计资料的过程。 按调查对象包括范围的不同,可以分为全面调查和非全面调查;按调查登记时间的连续性,分为经常性调查和一次性调查;按调查组织方式分为统计报表制度和专门调查;按搜集资料的方法可分为直接观察法、报告法、采访法。
5. 普查和全面统计报表都是全面调查,两者能否互相代替?
普查和全面统计报表都是全面调查,但它们是两种不同的调查方式方法,各有不同的特点和作用。普查是一次性调查,它所包含的单位和指标可以更全面,分组更详细,能搜集到全面报表不能或不宜取得的资料。但是普查花费的人财物力和时间较多,不可能象全面报表那样经常进行。全面统计报表可以定期取得资料,以满足制定和检查政策、计划及日常管理的需要,它是我国目前取得统计资料的主要手段。普查一般在编制长期计划和采取重大决策前进行。可见二者是不能相互代替的。
第三章 统计整理
2. 统计整理应按什么原则进行?统计整理的步骤是什么?
将统计调查所得的原始资料进行科学的分类汇总,或对已经加工的次级资料进行再加工,为统计分析准备系统化、条理化的综合资料的工作过程。
统计数据整理的内容与程序主要包括以下几个方面: 首先是统计数据的预处理——调查资料的审核。
其次是统计数据的排序。
再次,是统计数据的分组和汇总。 最后,是编制统计表和绘制统计图。
3. 什么是统计分组?统计分组有什么作用?
统计分组是指根据事物内在的特点和统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。
统计分组的作用:(1)可以区分现象的类型;(2)可以分析内部结构和结构特征;(3)可以揭示现象之间的依存关系。
10. 第一步:计算全距
R=max(x )-min (x )=99-60=39 第二步:确定组数
根据:k=1+3.322LgN=1+3.322Lg40=6.3 取整数6组。 第三步:确定组距
理论组距:i=R/k=39/6=5 第四步:确定组限
初始值取数列最小值60。 第五步:分配各组次数 11.
15.
(1)第一步:计算全距R=max(x )-min (x )=92-60=32 第二步:确定组数
根据:k=1+3.322LgN=1+3.322Lg38=6.3 取整数6组。 第三步:确定组距
理论组距:i=R/k=32/6=5 (2)第一步:确定组限 初始值取数列最小值60。 第二步:分配各组次数 (3)画图:略
第四章 总量指标和相对指标
1. 计算和应用相对指标应注意的问题是什么? (1)注意统计分组和相对指标的结合运用; (2)注意相对指标和总量指标的结合运用; (3)注意多种相对指标结合运用。 4. 简述总量指标的种类。
总量指标是反映社会经济现象总体规模和水平的统计指标。按其反映现象总体的内容不同,分为总体单位总量和总体标志总量;按其反映的时间状况不同,分为时期指标和时点指标。 (五)计算题
1. 计划完成相对数=95.6%/95.8%=99.79% 成本计划降低的百分率:1-99.79%=0.21%
2. 劳动生产率计划完成程度=(1+10%)/(1+8%)=101.85% 3. (1)销售利润超额完成计划不是4%,而是3.7%; (2)劳动生产率计划完成程度不是110%,而是100.48%;
(3)产品单位成本实际比计划不是多下降0.5个百分点,而是0.52个百分点。 4.
8. 中位数、众数与算术平均数的关系是怎样的?
众数、中位数与算术平均数之间存在着一定的数量关系,这种关系取决于总体内部的分布情况。如果次数分布是对称的钟型分布,则三者相同,即=M e =M 0。
若次数分布是非对称的钟型分布,则算术平均数、中位数、众数就有一定的差别,这种差别取决于非对称程度。非对称程度愈大,它们之间差别愈大,反之愈小。如果存在极端变量值,变量分布就会偏斜。若分布左偏,众数最大、平均数最小,即M 0 M e ; 若分布右偏,则算术平均数最大,众数最小,即 M e M 0。
无论左偏还是右偏,中位数总是居于算术平均数和众数中间。之所以能形成这样的关系是由于三者受极端变量值的影响不同。众数是次数分布最多的变量值,它既不受变量值大小的影响,也不受变量值位置的影响;中位数仅受变量值位置的影响,不受变量值大小的影响;只有算术平均数是根据所有变量值计算的,故受极端变量值的影响最大。
根据经验,在偏斜适度的情况下,不论左偏还是右偏,中位数与算术平均数之差约等于众数与算术平均数之差的
,即: M e -=(M o -)
由此可得以下三个关系式:
3M e -M 0
2M +2M e =0
3
M 0=3M e -2=
可以利用这些关系,从已知的两个平均指标来估计另一个平均指标。 10.
甲地段的单位面积产量:=
60
x =35000=700斤/亩
乙地段的单位面积产量:=
n 50x 24000==600斤/亩 丙地段的单位面积产量:=n 40
x =107000=713. 33斤/亩
三个地段的平均单位面积产量:=
n 150
x =48000=800斤/亩
n
xf =1500⨯5+.... +1900⨯2=1634. 4元/人
50f
xf =0. 85⨯140+.... +1. 25⨯40=105. 7%
12. =
2850f
500+... +3002830m ===0. 96元/斤 13. H =
∑x 1. 1⨯500+... +0. 8⨯3002960. 43
11. =
14.
按单利计算的平均年利率:
=
7%+5%+4%+3%+2%
=4. 2%
5
按复利计算的平均年利率:
=1+7%)(1+5%)(1+4%)(1+3%)(1+2%)-1=1. 0419-1=4. 19%
15.
=. 056⨯1. 064=105. 4%
年平均利率=年平均本利率-100%=105.4%-100%=5.4% 16.
(1)众数:众数在50~60这一组。
M 0=L +
∆11200-300
⋅i =50+⨯10=56(百元)
∆1+∆2(1200-800) +(1200-300)
中位数:中位数所在的组3150/2=1575,故中位数在50~60这一组。
∑f
M e -L +
-S m -1f m
3150
-500i =⨯10=59(百元) 1200
第六章 变异指标
2. 全距、平均差和标准差各有什么特点?
全距测定标志变动程度虽然简单,但它容易受极端变量值的影响,测定结果不能充分反映现象实际离散程度。平均差指标虽然弥补了全距指标的不足,但它在数学处理上是用绝对值消除负离差,因而不适合代数方法的运算。而标准差除了具有平均差的优点外,它在数学处理上采用平方消除负号,最后开方还原的方法,符合代数运算法则,所以它用的最多。
7. 全距R =X max -X min =750-440=310元
8. 全距R =X max -X min =120%-80%=40% 9.
=
x =440+... +750=558元/人
n
5
A ⋅D =
10.
∑X
i =1
N
i
-X
=
N
440-+.... +750-=93. 6元/人
5
1
x 20+... +120===70元/人
n
6
20-70+.... +-70
=36元/人
N 6x 67+... +732===70元/人 n 6A ⋅D 1=
i =1
∑X
N
i
-X
=
A ⋅D 2=
11.
∑X
i =1
N
i
-X
=
N
67-70+.... +73-70
=2. 4元/人
6
=
A ⋅D =
xf =55*4+... +95*4=73. 8元/人
50f
∑X -X f -73. 8⨯4+... +95-73. 8⨯4
m
i
i
∑f
i =1
m
=
50
=7. 232分/人
i
12. =
N
x =440+... +750=558元/人
n
5
i
σ==
∑(X
-X ) 2
N
(440-558) 2+... +(750-558) 2==109. 62元/人
5
xf f
=
250*208+... +950*20
=522. 95元/人
2000
σ=
=
13.
250-522. 952⨯208+⋅⋅⋅+950-522. 952⨯20
2000
56386595. 01
=167. 9(元/人)
2000
V 甲=
3
=16. 67%
18σ3. 3V 乙===11. 38%
29
=
σ
由于甲的标准差大于乙的标准差,所以乙企业日产量更有代表性。 15.
甲品种的收获率:
jia =
∑m =2430=506. 25(公斤/亩) f 4. 8
m =2250=500(公斤/亩) f 4. 5
乙品种的收获率:
jia =
甲品种的标准差:σjia =21. 32(公斤) 乙品种的标准差:σyi =25. 98(公斤) 甲品种的标准差系数:V σjia =4. 2% 乙品种的标准差系数:V σyi =5. 2%
由于标准差系数甲品种的小于乙品种的,且亩产较高。所以,更具有推广价值。 16.
xf =
f
=
1900*30+... +2500*600
=2305. 56元/户
2160
σ=
2305. 56-19002⨯30+⋅⋅⋅+2305. 56-25002⨯600
2160
=148. 97(元/户)
17.
12*3+16*7+.... +40*4
=26
100
∆=42-10=32 =
-*3+⋅⋅⋅+40-26*4(12-26) 2*3+⋅⋅⋅+(40-26) 2*4AD ==5. 32σ==8. 58
100100
8. 58V σ==33%
26
18. 第一组:
20+40+60+70+80+100+120
=70
7
20-+40-70+60-70+70-+⋅⋅⋅+-180
∆=120-20=100AD ===25. 71
770=
(20-70) 2+(40-70) 2+(60-70) 2+⋅⋅⋅+(120-70) 2
σ==100
7
V =100σ70
=142. 86%
第二组:=70; ∆=6; AD =1. 71; σ=2; V σ=2. 86%
第二组的平均数代表性大 19. jia
=∑xf f =216700267=811. 61(元/人) σjia =
(x -) 2
f f =7834007
. 49267=171. 29(元/人)
V σjia
171. 29
σjia ==
. 61
=21. 10%
jia 811yi
=∑x ⋅f
f
=832(元/人)
σf
yi =∑
(x -) 2
⋅f
==185. 95(元/人)
V σyi
σyi =
=
185. 95
yi
832
=22. 35% 由以上计算可得:(1)乙单位的平均工资高于甲单位的平均工资。(以甲单位的平均工资更具有代表性。
20. 平均合格品次数=95%*400=380
σ=pq =0. 95⨯0. 05=0. 218或(21. 8%)
21.
平均合格率为:
P =
230+450+190+60
1000
=93%
标准差为:
σp =p (1-P ) =. 93(1-0. 93) =25. 51%
标准差系数为:
V σp =
σp
25. 52%
p
=
93%
27. 43%
2)由于标准差系数乙单位大于甲单位,所
22.
(1)σ=V σ=600⨯25%=150
x 2-2=450-202=7. 07 σ7. 07==35. 35% V σ=20
(2)σ=(3)σ=
x 2-2, =x 2-σ2=360-36=18
2
2
2
(4)由于σ=V σ=0. ,又=x -σ,所以,
2=174-(0. ) 2, 2=169, =13
第七章 抽样调查
7.X 1~N(μ1, σ12)=N(50,10), Z 1=
P(X
2
X 1-μ1
σ1
~N(0,1)
70-50
)=Φ(2)=0.9772; 10
X -μ2
~N(0,1) X 2~N(μ2, σ22)=N(60,42), Z 2=2
σ2
P(X
70-60
)=Φ(2.5)=0.9938.选第二条路。 4
8.1) 总的保费收入Y=20000*50=1,000,000;每人死亡时赔偿50,000元,那么要获利50万,则每年只能死亡10人。则其概率为:
P(X=10)=
(
10010
)0.0005
10
*(1-0.0005)19990
2) E(X 1)=0.0005,E(X)=10;D(X)=20000*0.0005*(1-0.0005)=9.9995
10-10
)=0.5
9.9995
230-200
9.1) X~N(200,400),则:P(X
20
210-200190-200
2) P(190
2020
3) Y~N(10,9.9995), 则P(X
2
s 2n 1. 0693236
10. =3. 3167, s =1. 0693 μ=(1-) =(1-) =0. 178
n N 3615000
置信水平为90%时:z=1.645 ∆=z μx =1. 645⨯0. 178=0. 2928, 置信区间为:[-∆, +∆]=[3. 3167-0. 2928, 3. 3167+0. 2928]=[3. 0239, 3. 6095] 置信水平为95%时:z=1.96 ∆=z μx =1. 96⨯0. 178=0. 3489
置信区间为:
[-∆, +∆]=[3. 3167-0. 3489, 3. 3167+0. 3489]=[2. 9678, 3. 6656]
s 2n 52210011.=450, s =52 μ=(1-) =(1-) =5. 1477
n N 1005000
置信水平为95%时:z=1.96 ∆=z μx =1. 96⨯5. 1477=10. 0895
置信区间为:[-∆, +∆]=[450-10. 0895, 450+10. 0895]=[439. 91, 460. 09]
12.
p (1-p ) n 0. 85⨯0. 15200
(1-) =(1-) =0. 0247 n N 2005000
置信水平为95.45%时:z=2 ∆p =z μp =2⨯0. 0247=0. 0495
p =
n 1170==0. 85 μp =n 200
置信区间为:[p -∆p , p +∆p ]=[0. 85-0. 0495, 0. 85+0. 0495]=[0. 8005, 0. 8995]
p (1-p ) 0. 45⨯0. 55
==0. 022 n 500
置信水平为95%时:z=1.96 ∆p =z μp =1. 96⨯0. 022=0. 043
13. p =
置信区间为:[p -∆p , p +∆p ]=[0. 45-0. 043, 0. 45+0. 043]=[0. 407, 0. 493]
n 1225
==0. 45 μp =n 500
Nz 2σ25000⨯1. 962⨯602
14. n ==≈34. 34=35(人) 222222
N ∆x +z σ5000⨯20+1. 96⨯60
16-16. 1
15.1) X~N(16.1, 0.2),则:P(X
0. 2
2) 0.3985=0.01
10
3) 0.3985=0.0001
5
s 2462
16.1)=2000, s =46 μ===4. 6
n 100
置信水平为68.27%时:z=1 ∆=z μx =4. 6
置信区间为:[-∆, +∆]=[2000-4. 6, 2000+4. 6]=[1995. 4, 2004. 6]
z 2σ212⨯4622)若∆=5.75 n ===64 极限误差缩小为原来的1/2,则样本容量变为原来的4倍,则22
∆x 5. 75
应抽取样本单位树为:64⨯4=256
3) 若要使极限抽样误差缩小到原来的, 概率为99.73%,则
z 2σ232⨯σ2
=5184
n =
∆2x
=
12∆x 9
=81⨯64
s 232. 452
17.1)=160, s =32. 45 μ===4. 589
n 50
置信水平为95.45%时:z=2 ∆=z μx =2⨯4. 589=9. 178
置信区间为:[-∆, +∆]=[160-9. 178, 160+9. 178]=[150. 822, 169. 178]
18.H 0:≥1000;H 1:
-1000958-1000
==-2. 1
100/25
n
显著性水平α=0. 02;临界值 -Z a =-1. 98 z =
z
19. H 0:P ≤1/5;H 1:P >1/5; 检验统计量z =
p -P pq n
=1. 368
(1)若a=0.10, 则Z>Za =1.285 拒绝原假设。调查结果不支持这位负责人的看法。 (2)若a=0.05, 则Z6. 7
-7. 25-6. 7
==3. 11 2. 5/200n
显著性水平α=0. 01; t a (199) =2. 345 t =
t >t α 所以拒绝原假设,说明如今每个家庭每天收看电视的平均时间增加了。
21.(1)H 0:=73;H 1:≠73
z =
-=
71. 15-73220. 5/200
=-1. 762
n
显著性水平α=0. 05; Z a /2=1. 96
接受原假设,说明今年考试成绩与去年处于同一水平。 (2)H 0:≥73;H 1:
z =
-=
71. 15-73220. 5/200
=-1. 762
n
显著性水平α=0. 05; Z a =-1. 645
拒绝原假设,说明今年考试成绩比往年有显著下降。
(3)上述量中检验,(1)是双侧检验,(2)是左侧检验。
第八章 相关与回归
7.根据题意:设利润为y ,产量为x 。 (1)利润随产量变化的散点图:
b =
n xy -x y n ∑x 2-∑x 2
=
7⨯15618-413⨯251
=0. 41
7⨯26347-4132
a =-b =
251413
-0. 41⨯=11.75 77
利润对产量的一元线性回归方程:y c =11. 75+0. 41x
(3)b=0.41 说明当产量增加一个单位(万件)时,利润平均增加0.41个单位(万元)。
ˆβ
(4)t 检验统计量t =1为:
s βˆ
1
a : t=5.9348 b: t=12.6604 2
R =0.9697
8. (1) Y =β0+β1X +β2Z +u 即:Y=116.16-1.3079X+11.2459Z (2)R =
ESS RSS
=1-=0.9606 拟合优度接近于1,说明方程拟合较好。 TSS TSS
ˆ-) 2/k (y SSR /k ∑F ===109.5892 方程整体是显著的。 2
ˆ) /(n -k -1) SSE /(n -k -1) (y -y
2
ˆ-ββi
t 检验统计量:t i =i
ˆc ii σ
β0: t=4.7131 β1: t=-10.1095 β2 : t=4.0389 说明系数都通过t 检验。
(3)复相关系数:0.9801
(4) X不变,Y 和Z 的偏相关系数:
r 02. 1=
1-r 1-r 2
2
01
12
r 02-r 01r 12
=
0. 229
=0. 446 0. 513r 01-r 01r 12
201
2
Z 不变,Y 和X 的偏相关系数:r 01. 2=Y 不变,X 和Z 的偏相关系数:r 12. 0=
1-r 1-r 12
=-0.943
=-0.517
1-r 1-r 2
2
01
02
r 12-r 01r 02
(5)假如某月商品价格为80(元/公斤) ,广告费用为7(元) ,则该商品的销售量: Y=116.16-1.3079×80+11.2459×7=90.2493 95%的预测区间:[ 79.73,100.75]
第九章 统计指数
2. 何谓综合指数?综合指数编制的原理是什么?
答:综合指数是两个价值总量指标对比形成的指数,将其中被研究因素以外的所有因素固定下来,仅观察被研究因素的变动情况。
综合指数编制的原理:一个是数量指标指数要以基期的质量指标为同度量因素;另一个是质量指标指数要以报告期的数量指标为同度量因素。 6.个体指数:
猪肉:105% 鸡:90% 鱼:116.67% 牛肉:111.11%
p q ∑7.价格综合指数:
p q
8.
11
1101
=
214
=99. 07% 216
p q =2656=97.79%
p q 2716
∑p q -∑p q =2656-2716=-60
011
∑p q =2984. 8=109. 9%p q =2656=88. 98%
p q 2716p q 12984. 8
∑p q -∑p q =2984. 8-2716=268. 8元∑p q -∑p q =2656-2984. 8=-328. 8
01
11
0001
01001101
97.79%=109.9%×88.98% -60=268.8+(-328.8) 9.
∑x f
f =372. 8=112. 02% ∑x f -∑x f =372. 8-332. 8=40 x f 332. 8f f f x f
f =372. 8=111. 67% ∑x f -∑x f =372. 8-333. 85=38. 95 x f 333. 85f f f x f
f =333. 85=100. 32% ∑x f -∑x f =333. 85-332. 8=1. 05
x f 332. 8f f f
111
111
00
000
111
111
011
011
011
011
00
000
112.02%=111.67%×100.32% 40=38.95+1.05
第十章 时间序列分析
(四)计算题
15. 2+14. 214. 2+17. 617. 6+16. 316. 3+15. 8
⨯2+⨯4+⨯3+⨯31. a =
2+4+3+3
=16元
14001420
+1510+1460+
=1460人 2. a =35082+50+52+60+78+3. a ==5. 41%
10001425
+1020+1085+1120+1218+22
4. a =
400000+46200+494500
=1085. 2元/人
400+420+430
6.
(1)接近于直线型
ˆ=a +bt =256. 7+3. 17t (2)Y t
ˆ 291. 57(万吨) (3)Y 2001
7.
(2)消除季节变动后各季销售额 一季度:76/98.4%=77.2(万元) 二季度:77/98.8%=77.9(万元) 三季度:89/121.5%=77.3(万元) 四季度:73/81.3%=89.8(万元)
第十一章 统计预测
6.
7.
简单季节预测模型下2007年第三季度的销售量为:78.71 移动平均季节预测模型下2007年第三季度的销售量为:78.9 8.
直线趋势方程:GDP=65963.86+19465.25*t 2007年GDP 预测值为:221685.9亿元
2
抛物线趋势方程:GDP=81663.14+8999.06*t+1308.274*t 2007年GDP 预测值为:237385.1亿元
t
指数趋势方程:GDP=1.94*1.37
12.389
2007年GDP 预测值为:10
9. ⑴单位营业额=0.664+日人流量*0.404
⑵单位面积营业额与日人流量的相关系数=0.79
日人流量对应的t 统计量为5.48,大于5%显著性水平的临界值,因而回归显著的。 ⑶日人流量对单位面积营业额回归方程的估计标准误差为:0.52 ⑷2.685 ⑸0.9
⑹[ 0.705,4.67]