基于多元线性回归的汽车油耗预测模型

2019-08-23 03:09
海峡科技与产业 2019年3期
关键词:每加仑变速箱回归方程

李 琴

西安财经大学,陕西 西安 710100

1 引言

1.1 研究目的及意义

预测是一门实用学科,所研究的内容是如何对未来事物的发展做出科学的估计。国民经济的高速发展,也带动了国内汽车工业的快速发展,使得汽车的燃油消耗量快速增长,而汽车的燃油消耗量又与很多因素有关,确定这些因素与汽车燃油消耗量的关联程度是一项值得深入的工作。多元线性回归分析作为一种较为科学的方法,在各行各业都有广泛的应用,可以在获得影响因素的前提下,将定性问题定量化,确定各因素对主体问题的影响程度。

1.2 研究背景

早在20世纪20年代,国外就开始了对汽车燃油消耗方面的研究,此时的研究主要是针对燃烧过程,以提高燃烧效率为目的。20世纪70年代石油危机爆发后,人们才越来越关注车辆的燃油消耗。

近年来,国民经济的高速发展也带动了国内汽车工业的快速发展,国内汽车保有量也越来越大,这就导致原油需求量的大幅提高。我国的车用燃油消耗量以年均超过10%的速度快速增长。仅汽车交通一项,所消耗的汽油和柴油便已占到国内汽、柴油生产总量的87%和40.7%;所消耗的石油总量也占到国内总石油消耗量的30%。而且,我国汽车产业发展势头迅猛:从2003年到2013年,我国汽车保有量增长迅速,从2400万辆增长到1.37亿辆。汽车燃油消费的过快增长将给我国经济和社会可持续发展带来巨大压力。所以,节约油耗已经刻不容缓,我们必须采取有效措施减少不必要的燃油浪费,延长石油资源的可使用时间。

2 理论与方法介绍

多元线性回归分析预测法是通过对两个或两个以上的自变量与一个因变量的相关分析,建立预测模型并进行预测的方法。它是研究一个随机变量Y与两个或两个以上的一般变量X1,X2,…,Xp之间相依关系的统计分析方法。

设计思路为:设影响因变量Y的自变量共有P个,即X1,X2,…,Xp,这些自变量之间无确定的线性关系。 有N组数据(Xr1,Xr2…,Xp,Yr),r=1,2,…,N。设预测量Y与X1,X2,…,Xp之间有线性的统计关系,N组统计数据有如下结构:

其中,εr(r=1,2,…N)为随机误差变量,一般假定εr~N(0,σ),且εr是不相关的,εr与Xr也是不相关的。利用N组数据可建立的回归方程为

其中,β0是常数项,而β0(j=1,2,…,p)是Y对Xj的回归系数参数值,对一般情况下p个自变量的多元线性回归而言,每个回归系数βj表示在回归方程中其他自变量保持不变的情况下,自变量Xj每增加一个单位时因变量Y的平均增加程度。

利用多元线性回归分析预测法计算出回归模型后,要对模型进行各种检验,其中包括:

判定系数检验、回归系数显著性检验、回归方程显著性检验。若回归方程的显著性检验没有通过,可能是因为选择自变量时漏掉了重要的影响因素,或者因为自变量与因变量之间的关系是非线性的,应重新建立预测模型。

3 建立预测模型

3.1 选取数据

本文数据来源于1974年的美国《汽车趋势》杂志,其中包括燃料消耗和32辆汽车的设计和性能的10个方面(1973—1974车型),本文主要选取每加仑行驶里程、马力、发动机、变速箱4个方面进行分析,以mpg表示每加仑行驶里程、以hp表示马力、以vs表示发动机、以am表示变速箱。其中汽车发动机用两个变量表示:0代表v型发动机,1代表直列式发动机;变速箱用同样的方法表示:0代表自动装置,1代表手动装置。

对于汽车燃油消耗量,本文用加仑(gal)衡量,传统意义上燃油消耗量是用L/km这样的复合单位表示的。其中1gal等于3.7853L,1L燃油可使汽车行驶5km。

3.2 模型的建立

3.2.1 每加仑行驶里程与各因素的相关性

根据原始数据对mpg与hp、vs、am的线性相关系数进行分析,如表1所示:

表1 mpg与其影响因素的线性相关系数

由表1可得:mpg与hp的相关系数为r=-0.776,mpg与vs的相关系数为r=-0.664,mpg与am的相关系数为r=0.600,说明hp、vs、am与线性相关,用mpg与 hp、vs、am作多元线性回归是合适的。

可建立每加仑行驶里程与各影响因素之间的多元线性回归模型,如下:

其中,mpg为每加仑行驶里程,hp、vs、am分别为马力、发动机、变速箱。

3.2.2 检验回归模型

表2 模型汇总

由表2可得整体相关系数R=0.898,判定系数R2=0.806,调整的判定系数为R2=0.785,说明样本的回归效果较好,方程拟合程度非常高。

表3 方差分析表

由表3可得,F=38.683,p值=0.000,取显著性水平α=0.05时,查F分布表可知F0.05(3,28)=2.975<F,表明回归方程高度显著,说明hp、vs、am整体上对mpg有高度显著的线性影响。

由表4可以得到:方差扩大因子VIFhp=2.165,VIFvs=2.096,VIFam=1.063,远远小于10,说明自变量hp、vs、am之间不存在多重共线性。

表4 多重共线性表

表5 回归系数的显著性检验

由表5可以得出多元线性回归方程为:

模型结果显示,截距项、hp、am在0.05显著性水平下显著,而vs在0.01显著性水平下显著。在其他因素不变的前提下,汽车马力hp每增加一个单位,每加仑行驶里程mpg平均下降0.044 71个单位,它们之间存在负相关关系;而发动机vs和变速箱am都与每加仑行驶里程mpg成正相关关系。当发动机为直列汽缸发动机时每加仑行驶里程比V型发动机增加2.658 846个单位。变速箱为手动挡时每加仑行驶里程比自动挡增加5.298 537个单位。

3.3 回归诊断

对模型进行回归诊断,判别是否违背多元线性回归模型建立的假设前提。分别检验:(1)检验残差是否服从正态分布;(2)DW检验;(3)异方差。通过对模型进行回归诊断,得到其并没有违背假设前提,所以建立的多元回归预测模型拟合程度好。

4 结语

本文利用32组汽车燃油消耗情况数据,通过建立多元线性回归模型分析马力、发动机和变速箱这三方面对每加仑行驶里程的影响情况。研究结果显示,汽车马力与每加仑行驶里程成反比关系,即汽车马力越大,所消耗的能源越少;而发动机和变速箱与每加仑行驶里程成正比关系,其中不同的发动机和不同的变速箱产生的燃油效果也会有所不同。

根据本文研究得出:在发动机方面,直列汽缸发动机比V型发动机耗油量小。直列汽缸发动机这种类型的发动机性能比较稳定,成本低,结构简单,运转平衡性比较好,体积小,稳定性高。在变速箱方面,手动挡比自动挡耗油量小。由于手动挡的动力是直接传递的,效率略高于自动挡,相同车速时发动机转速略低,当手动挡使用空挡滑行时,发动机只在怠速运行;而自动挡不可使用空挡行驶,带挡的发动机转速高于怠速较多,从而形成油耗差异。

建议在选购汽车时尽量选取马力大、直列汽缸发动机并且是手动挡的汽车。这三点同时满足可以为国家节省能源,为保护环境做出自己小小的贡献。汽车只是人类的代步工具,对于汽车,我们不应该盲目追求高大上,应该选择适合自己的。这样每个人都做出一点小小的改变,相信我们国家的燃油消耗量会在规定时间内达到要求的水平,天空也会更蓝,能源消耗会更少,生活更美好。

猜你喜欢
每加仑变速箱回归方程
采用直线回归方程预测桑瘿蚊防治适期
走进回归分析,让回归方程不再是你高考的绊脚石
带你走近一个你不知道的自动变速箱
浅析农机用变速箱壳生产工艺的改进
美国EIA认为柴油脱硫造成的燃油能量损失微乎其微
艾里逊变速箱助力日野FE系列
基于动力换挡变速箱换挡控制策略的研究