刘 彬 一、主成分回归预测方法的特点 多元回归预测法是建立在统计技术上的人力资源需求预测方法,它需要在众多的变量中,考虑变量之间的相互关系。它有全面反映变量关系、应用条件相对简便等优点。因为这些优点,所以多元回归分析预测方法是目前使用最广泛的工具,本文也适合采用多元回归预测。但是,多元回归方法在实用中也有很大的局限:首先,我们在进行多元分析时往往容易引入一些相互之间相关性比较强的变量,从而与使用多元回归模型的基本假设前提相违背,也使多元回归预测的效果受到很大的影响,准确度下降。而且,多元回归模型的使用要求各个变量符合正态分布,在实际生产生活实践中,往往有些样本的分布并不完全符合正态分布的规律,这也会影响回归分析的效果。 为了克服上述问题,本文将主成分分析和多元回归方法相结合,这种新的方法叫做主成分回归预测方法。主成分分析就是用降维的思想,把多个变量(指标)转变为几个综合变量的统计方法,通过这种方法,从原始变量(该地区的国内生产总值、外贸商品存储量和消费量)中提炼出1或2个新变量作为主成分,每个主成分都是原始变量的线性组合,之间互不相关。主成分回归预测方法就是在主成分分析的基础上将新形成的变量作为多元线性模型的自变量,预测因变量(人力资源需求)的方法。 二、案例分析 某课题组一直对一个沿海地区的外贸行业的人力资源需求量进行定性研究。经过长期的定性研究,课题组发现,外贸行业的人力资源需求量的增长与该地区的国内生产总值、外贸商品存储量和消费量的变动有着某种联系,换句话说,该沿海地区的国内生产总值、商品存储量和消费量对该地区外贸行业的用人需求有一定的影响,但影响的具体的强弱程度还没有定量的估计。外贸商品存储量和消费量发生变化,会导致沿海的外贸单位进行人力资源方面的调整,引起外贸单位增加(或减少)自己的外贸方面的人力资源,这是对该案例进行统计分析的基础。课题组在研究过程中,搜集了一系列相关的指标对应的数据,如表1所示。 表1 某沿海地区经济数据与外贸行业人力资源需求数据统计表 (自变量单位均为亿元,因变量单位为千人)
(一)设定相关变量: 因变量是该地区外贸行业人力资源需求数量(y),自变量是对人力资源数量产生影响的因素,包括:国内生产总值x1、商品储存量x2、商品消费量x3、自变量数量p=3、样本容量为n=11,满足多元回归条件n>p。 (二)变量相关性分析 主成分分析方法适用于原始变量(x1、x2、x3)之间相关性较强的情况,如果原始变量的数据之间相关性不强,主成分法将无法进行适当的降维,失去原有的意义。原始变量的相关系数大于0.3时,主成分分析的效果比较明显。所以要对原始变量进行相关性分析。 各变量数据如表1所示,用统计软件进行相关性分析,输出结果显示:x1和x3之间的相关系数为0.997,x2和x3之间的相关系数为0.036,x1和x2之间的相关系数为0.026,x1和x3之间有很强的相关性,满足使用主成分法的前提条件。 (三)主成分分析 运用统计软件对表1的数据进行主成分分析,得到了主成分(a、b)与原始变量(x1、x2、x3)的函数关系: a=0.999x1+0.062x2+0.999x3; b=-0.036x1+0.998x2-0.026x3 由此数据推导出一组新的数据,如表2所示 表2 主成分对应数据表
可以得出由主成分(a、b)作为自变量的方程 Y=-9.03+0.106a+0.607b (四)模型方程的显著性和自相关性检验 对得到的方程Y=-9.03+0.106a+0.607b进行显著性检验和自相关性检验(由统计软件进行)。显著性检验的目的是检验出模型方程的因变量(人力资源需求量)和自变量(国内生产总值、商品总储存量、商品总消费量)是否有显著的相关关系。 从输出结果可以看出,由主成分组成的自变量与因变量(人力资源需求量)有显著关系,如果用来进行预测的话准确率比较高。 表3 回归预测结果表
自相关性指模型方程中不同时间的变量的误差项之间有相关关系,换句话说,就是一个变量的不同时段的两个数值之间具有某种关联性。它产生的原因可能是由于经济社会指标等变量具有一定的滞后影响,如人力资源需求量、国内生产总值、商品消费量、商品存储量等指标,前期的状况会对后期的状况产生必然的影响,在整个时间序列中产生出具有一定规律的波动。如果这个波动出现将违反回归分析的基本假设,它将导致前面进行的显著性检验失效,造成我们的模型方程反映的是虚假的回归关系。 从输出结果可以推导出一个变量不同时段的两个样本的数值之间不具有关联性,该模型不具自相关性。 (五)进行预测 经过前面的各种检验,模型被验证为是可靠的,我们将使用它来预测该地区的2008、2009、2010年三年的外贸行业人力资源需求情况。使用95%的置信区间来预测2008年、2009年、2010年的人力资源需求的可能范围。我们先要将主成分方程变为原始变量方程的形式: y=-9.03+0.106a+0.607b =-9.03+0.106*(0.999x1+0.062x2+0.999x3)+0.607*(-0.036x1+0.998x2-0.026x3) =-9.03+0.106*0.999x1+0.106*0.062x2+0.106*0.999x3-0.607*0.036x1+ 0.607*0.998x2-0.607*0.026x3 =-9.03+0.084x1+0.612x2+0.09x3 预测结果及误差如表12所示: 由最后得出的表3可以看出,从1997年到2007年这11年来,人力资源需求量的预测值一直围绕当年实际的人力资源需要量(y)上下波动。同时,表3还给出了预测值的上限和下限,1997年到2007年这11年的预测值刚好就在预测值上限和预测值下限之间,表明本文用主成分回归方法得出的模型方程的预测比较准确。2008、2009、2010年这3年的预测值也将在这3年的预测值上下限之间围绕预测值波动。 来源:《中国人才》2008 |
上一篇:培养造就宏大的创新型人才队伍
下一篇:人才战略的制定与实施