学历与收入关系之调查与分析
学 校: 西 江 中 学 班 级: 高 二4 班 组 长:
研究时间:20 年 月 日-20 年 月 日
学历与收入关系之调查与分析
【摘要】:文章将围绕学历高低和收入高低的关系用统计学原理进行调查、分析并得出一定的预测分析。文章就是用科学的统计学原理将其关系加以证明学历和收入有着很大的相关性,然后将这确定的关系应用于教育事业,协助教育事业的发展,因为当人们意识到学历和收入有着很大正相关性时,人们就会对学历有更全面的认识,从而自主学习,这样教育水平会真正的朝向素质教育发展,这也正是研究学历和收入关系的价值所在。从而在这相关性的基础上对怎样促进教育,提高人们的学历,进而取得较好的收入给出了一些建议。
关键词: 学历 ;月收入 ;相关系数
引言:
收入的高低是衡量一个地区经济发展水平的重要标志之一。提高收入对于提高人民生活水平、促进市场经济发育、提高国民经济整体效益和效率具有重要作用。影响收入的因素有很多,文章仅从学历方面对收入的影响进行研究,分析学历对收入的作用。通过研究后,从学历方面怎样提高收入提出建议。本文主要采用相关分析法和回归分析法和显著性检验等统计方法对学历与收入之间的关系进行分析,有助于人们了解学历对收入的影响有多大,从而重视学历的做用,提高国家的收入水平,促进经济发展。
一.研究对象和数据处理
研究对象:学历是小学、初中、高中、本科、硕士研究生、博士研究生。年龄在20-40岁之间,地区范围是广东。
数据的处理:
首先是数据的获得:对研究对象进行量化,即分别对学历和收入水平进行量化。 收入可以用月收入数值进行量化。
学历可以用学年制进行量化,具体如表1所示:
表1 学历和学年制表格
搜集数据的具体方法是:按照学历的划分标准(如小学、初中等)分别找30个人进行调查,得到他们的原始月收入值,再分别求平均月收入值,这个平均收入值就是研究数据。
数据获得方法的说明:由于那些小学、初中、高中同学。已不在一个地方,但是都在广东,对这些学历的月收入数据的获得是通过打电话或者利用网络通信技术得到的,对于大学以上学历的月收入是通过指导老师联系他以前同学获得。
二.学历和收入之间的关系分析
(一)相关分析
原始数据是
表2. 每种学历三十人的月收入及每种学历的平均收入
中
高中
本科
硕士研究生
博士研究生
根据上表得到所需数据如表3所示:
表3 学年制和平均月收入表格
则 x与y具体数据如下表所示:
通过Excel工作表得到学年制(x)和平均月收入(y)之间的散点图 如图1所示:
图1.学年制和平均月收入之间的散点图
(二)回归分析
由于从散点图中可看出学年制和平均月收入的关系可以近似看成是指数函数图像。 设指数函数表达式为y = aebx 由散点图可知 指数函数表达式为 y = 891.03e0.1082x
由上式可知,该指数函数表达式的经济意义是:学历每上升一个年度,其平均月
收入就上升 891.03e 0.1082 【把这个数据算出来】 说明学历与月收入之间存在着很大的相关性。虽然这些数据只是山东的,并不是全国的,但也具有一定的代表性,所以应该加大教育力度,提高人们的学历,已取得较高的收入,提高人们的生活水平。
(三)模型检验
1.回归方程的标准差检验
由于回归方程的计算值与实际值存在差距,即估计标准误差(Sy),所以我们必须计算出估计标准误差Sy的大小。用以衡量回归直线的代表性究竟有多大,从而说明观察值围绕回归直线的变化程度或分散程度。
令 Y = Ln y 新方程就变成了:Y = Ln a + bx 即可以看成是x与Ln y之间成线性相关关系。 表4如下所示:
表4.
x
y
ln y 7.81116338
6
2468
5
7.49498623
9
1799
4
7.86748856
12
2611
9
61.89737638 56.17481865 61.01427343 (ln y)^2
x*lny 46.8669803
1
67.4548761
1
94.4098628
2
136.210962
16
4980
8.51318517 8.82320622
19
6790
1
9.33609157
22
11340
∑ln y =
72.47432174 7
167.640918
77.84896801 2
205.394014
7 87.16260594
∑
∑
7
49.846 (lny)^2=416.5724 x*lny=717.977
a = 6.7924 b = 0.1082 n = 6 由以上数据可得:
Sy= 0.28036 lny = 8.30769 因为 Sy/lny = 0.033747= 3.3747%<15% 所以方程可用,且回归直线具有相当高的代表性。 2、回归方程的判定系数检验
判定系数r2是一个回归直线与样本观测值拟合优度判定的指标。r2的值总在0和1之间。一个线性回归方程模型如果充分利用了x的信息,则r2越大,拟合优度就越好;反之,如果r2不大,说明模型中给出的x对y的信息还不够充分,应进行修改,使x对y的信息的到充分利用。
由散点图可知判定系数R2 = 0.8835,其值接近于1,可以说学历和收入的相关性非常的高。
3、t检验
(1)、提出零假设与备择假设: H0:b=0 H1:b≠0
(2)、构造t统计量并计算:
b
∑(x-x)
Sy
2
t=
= 14.3885
(3)、确定显著性水平,并查t统计表,确定拒绝域:
取α=0.05,查T分布表得临界值 t0.025(6-2) = 2.7764
因为t ≥t0.025(6-2), 所以拒绝原假设,即学历作为月收入的解释变量作用是显著的,也就是说学历对月收入的影响是显著的。
(四)预测
1、单值预测
单值预测是指利用回归模型,对于x一个特定的值x0 求出y的一个预测值y0 。
当学历值是30时,即x = 30时,预测值y = 22935.22,该预测结果表明,当学历是30学年制时,月收入会达到22935.22。
2.区间预测
区间预测是自利用回归模型,对于x一个特定的值x0 求出y的一个预测区间,而
不是一个特定的值。对于给定的x0 ,在显著性水平α下的预测区间是
y0±tαsy+
1+n
x-x∑(x-x)
2
0n
i
i=1
为( 22935.07,22936.272),也就是说当学历在30 时,
2
月收入以95%的概率在22935.07元到22936.272元之间。
三.结束语
通过上述分析我们可以清楚的看到学历和收入有着很强的相关性,学历对收入的影响很大。所以我们应该加大教育力度,提高人们的知识水平,提高学历。近年来,我国高等职业教育蓬勃发展,为现代化建设培养了大量高素质技能型专门人才。加大课程建设和改革力度,增强学生的职业能力,重视优质教学资源和网络信息资源的利用,把现代信息技术做为提高教学质量的重要手段,不断推进教学资源的共进共享,提高优质教学资源的使用频率,扩大受益面。要全面贯彻党的教育方针,以服务为宗旨,以就业为指导,走产学结合发展道路,为社会主义现代化建设培养千百万高素质技能型知识型专门人才,提高人们的收入水平。
参考文献:
[1]刘定祥.统计学基础.北京:首都师范大学出版社,2009 [2]杨倩. 大学生成绩与高考成绩的关系. 2008级考试论文[D]
学历与收入关系之调查与分析
学 校: 西 江 中 学 班 级: 高 二4 班 组 长:
研究时间:20 年 月 日-20 年 月 日
学历与收入关系之调查与分析
【摘要】:文章将围绕学历高低和收入高低的关系用统计学原理进行调查、分析并得出一定的预测分析。文章就是用科学的统计学原理将其关系加以证明学历和收入有着很大的相关性,然后将这确定的关系应用于教育事业,协助教育事业的发展,因为当人们意识到学历和收入有着很大正相关性时,人们就会对学历有更全面的认识,从而自主学习,这样教育水平会真正的朝向素质教育发展,这也正是研究学历和收入关系的价值所在。从而在这相关性的基础上对怎样促进教育,提高人们的学历,进而取得较好的收入给出了一些建议。
关键词: 学历 ;月收入 ;相关系数
引言:
收入的高低是衡量一个地区经济发展水平的重要标志之一。提高收入对于提高人民生活水平、促进市场经济发育、提高国民经济整体效益和效率具有重要作用。影响收入的因素有很多,文章仅从学历方面对收入的影响进行研究,分析学历对收入的作用。通过研究后,从学历方面怎样提高收入提出建议。本文主要采用相关分析法和回归分析法和显著性检验等统计方法对学历与收入之间的关系进行分析,有助于人们了解学历对收入的影响有多大,从而重视学历的做用,提高国家的收入水平,促进经济发展。
一.研究对象和数据处理
研究对象:学历是小学、初中、高中、本科、硕士研究生、博士研究生。年龄在20-40岁之间,地区范围是广东。
数据的处理:
首先是数据的获得:对研究对象进行量化,即分别对学历和收入水平进行量化。 收入可以用月收入数值进行量化。
学历可以用学年制进行量化,具体如表1所示:
表1 学历和学年制表格
搜集数据的具体方法是:按照学历的划分标准(如小学、初中等)分别找30个人进行调查,得到他们的原始月收入值,再分别求平均月收入值,这个平均收入值就是研究数据。
数据获得方法的说明:由于那些小学、初中、高中同学。已不在一个地方,但是都在广东,对这些学历的月收入数据的获得是通过打电话或者利用网络通信技术得到的,对于大学以上学历的月收入是通过指导老师联系他以前同学获得。
二.学历和收入之间的关系分析
(一)相关分析
原始数据是
表2. 每种学历三十人的月收入及每种学历的平均收入
中
高中
本科
硕士研究生
博士研究生
根据上表得到所需数据如表3所示:
表3 学年制和平均月收入表格
则 x与y具体数据如下表所示:
通过Excel工作表得到学年制(x)和平均月收入(y)之间的散点图 如图1所示:
图1.学年制和平均月收入之间的散点图
(二)回归分析
由于从散点图中可看出学年制和平均月收入的关系可以近似看成是指数函数图像。 设指数函数表达式为y = aebx 由散点图可知 指数函数表达式为 y = 891.03e0.1082x
由上式可知,该指数函数表达式的经济意义是:学历每上升一个年度,其平均月
收入就上升 891.03e 0.1082 【把这个数据算出来】 说明学历与月收入之间存在着很大的相关性。虽然这些数据只是山东的,并不是全国的,但也具有一定的代表性,所以应该加大教育力度,提高人们的学历,已取得较高的收入,提高人们的生活水平。
(三)模型检验
1.回归方程的标准差检验
由于回归方程的计算值与实际值存在差距,即估计标准误差(Sy),所以我们必须计算出估计标准误差Sy的大小。用以衡量回归直线的代表性究竟有多大,从而说明观察值围绕回归直线的变化程度或分散程度。
令 Y = Ln y 新方程就变成了:Y = Ln a + bx 即可以看成是x与Ln y之间成线性相关关系。 表4如下所示:
表4.
x
y
ln y 7.81116338
6
2468
5
7.49498623
9
1799
4
7.86748856
12
2611
9
61.89737638 56.17481865 61.01427343 (ln y)^2
x*lny 46.8669803
1
67.4548761
1
94.4098628
2
136.210962
16
4980
8.51318517 8.82320622
19
6790
1
9.33609157
22
11340
∑ln y =
72.47432174 7
167.640918
77.84896801 2
205.394014
7 87.16260594
∑
∑
7
49.846 (lny)^2=416.5724 x*lny=717.977
a = 6.7924 b = 0.1082 n = 6 由以上数据可得:
Sy= 0.28036 lny = 8.30769 因为 Sy/lny = 0.033747= 3.3747%<15% 所以方程可用,且回归直线具有相当高的代表性。 2、回归方程的判定系数检验
判定系数r2是一个回归直线与样本观测值拟合优度判定的指标。r2的值总在0和1之间。一个线性回归方程模型如果充分利用了x的信息,则r2越大,拟合优度就越好;反之,如果r2不大,说明模型中给出的x对y的信息还不够充分,应进行修改,使x对y的信息的到充分利用。
由散点图可知判定系数R2 = 0.8835,其值接近于1,可以说学历和收入的相关性非常的高。
3、t检验
(1)、提出零假设与备择假设: H0:b=0 H1:b≠0
(2)、构造t统计量并计算:
b
∑(x-x)
Sy
2
t=
= 14.3885
(3)、确定显著性水平,并查t统计表,确定拒绝域:
取α=0.05,查T分布表得临界值 t0.025(6-2) = 2.7764
因为t ≥t0.025(6-2), 所以拒绝原假设,即学历作为月收入的解释变量作用是显著的,也就是说学历对月收入的影响是显著的。
(四)预测
1、单值预测
单值预测是指利用回归模型,对于x一个特定的值x0 求出y的一个预测值y0 。
当学历值是30时,即x = 30时,预测值y = 22935.22,该预测结果表明,当学历是30学年制时,月收入会达到22935.22。
2.区间预测
区间预测是自利用回归模型,对于x一个特定的值x0 求出y的一个预测区间,而
不是一个特定的值。对于给定的x0 ,在显著性水平α下的预测区间是
y0±tαsy+
1+n
x-x∑(x-x)
2
0n
i
i=1
为( 22935.07,22936.272),也就是说当学历在30 时,
2
月收入以95%的概率在22935.07元到22936.272元之间。
三.结束语
通过上述分析我们可以清楚的看到学历和收入有着很强的相关性,学历对收入的影响很大。所以我们应该加大教育力度,提高人们的知识水平,提高学历。近年来,我国高等职业教育蓬勃发展,为现代化建设培养了大量高素质技能型专门人才。加大课程建设和改革力度,增强学生的职业能力,重视优质教学资源和网络信息资源的利用,把现代信息技术做为提高教学质量的重要手段,不断推进教学资源的共进共享,提高优质教学资源的使用频率,扩大受益面。要全面贯彻党的教育方针,以服务为宗旨,以就业为指导,走产学结合发展道路,为社会主义现代化建设培养千百万高素质技能型知识型专门人才,提高人们的收入水平。
参考文献:
[1]刘定祥.统计学基础.北京:首都师范大学出版社,2009 [2]杨倩. 大学生成绩与高考成绩的关系. 2008级考试论文[D]