基于PLS1的天津市PM2.5与空气污染物相关性分析

2017-02-09 09:06苗云阁王健马银红杨文谷超
环境工程技术学报 2017年1期
关键词:共线性通径颗粒物

苗云阁,王健,马银红,杨文,谷超

1.天津师范大学城市与环境科学学院,天津 300387 2.新疆维吾尔自治区环境监测总站,新疆 乌鲁木齐 830011 3.中国环境科学研究院,北京 100012



基于PLS1的天津市PM2.5与空气污染物相关性分析

苗云阁1,王健3,马银红3,杨文3,谷超2*

1.天津师范大学城市与环境科学学院,天津 300387 2.新疆维吾尔自治区环境监测总站,新疆 乌鲁木齐 830011 3.中国环境科学研究院,北京 100012

运用相关性分析、单因变量偏最小二乘回归法(PLS1)和通径分析法,研究天津市2014年不同季节(共291 d)SO2、NO2、CO、O3(8 h)和O3(1 h)4类主要空气污染物对PM2.5浓度的直接影响以及间接影响和总作用影响。结果表明:春季与PM2.5浓度呈显著性相关的污染因子为SO2、NO2和CO;夏季为O3(8 h)和CO;秋季为SO2、NO2和CO;冬季为SO2、NO2、CO和O3(8 h)。冬季的O3(1 h)与O3(8 h)间存在严重的复相关性。剔除未通过T检验和F检验的污染因子后建立的春、夏、秋、冬四季PLS1模型的拟合优度(R2)分别为0.553、0.323、0.713和0.839,模型拟合良好。通径分析结果显示:各季节中,CO对PM2.5浓度的影响最大,且存在明显的季节变化,春、夏、秋、冬四季的总作用系数分别为10.810、5.587、6.271和12.500;O3(8 h)在夏季对PM2.5的总作用系数为0.897;NO2在春、秋、冬季对PM2.5的总作用系数分别为0.185、0.338和0.290;各污染因子对PM2.5的直接作用系数均大于其间接作用系数。

PLS1;通径分析;天津;PM2.5;CO;NO2;O3(8 h)

近年来,随着城市经济化的快速发展和现代化进程的加快,以PM2.5为主要成分的灰霾天气频繁出现,PM2.5已经成为严重影响公众身体健康和大气环境质量的主要空气污染物[1-5]。研究表明,大气细颗粒物对人体健康的危害程度在儿童和妇女中更高[6-7],甚至可造成新生儿不良妊娠结局的发生[8-13],粒径小于10 μm的颗粒物可进入上呼吸道,小于2.5 μm的则能够直接进入血液和肺泡[14-15],引发呼吸系统、心血管以及神经系统等方面的疾病[16-20]。其中,细颗粒物中的二次颗粒物化学成分更复杂,毒性也更大[21-23],主要的二次颗粒物包括硫酸盐、硝酸盐、铵盐和二次有机气溶胶(又称SOAs)[24-25]。它们是由SO2、NO2等气态物质与大气中的光化学氧化剂(如O3等)经过均相或非均相的光化学反应所产生[26-27],故PM2.5浓度的变化与大气中其他主要气态污染物存在着必然的联系。

目前,研究者对于气态污染物与PM2.5间相关性的研究主要采用主成分分析、相关性分析、因子分析等多元统计方法[28-32],忽略了气态污染物之间的多重相关性,导致最后模型建立存在偏差或失效。单因变量偏最小二乘回归法(PLS1)可以在多个因变量存在严重共线性的前提下将阻碍模型建立的因变量剔除,从而更科学地建立线性回归模型。大多数研究只针对单月数据进行分析,将全年数据按季节进行分析的案例国内鲜见报道。笔者运用2014年天津春、夏、秋、冬四季PM2.5、SO2、NO2、CO、O3(8 h)和O3(1 h)浓度数据,采用相关性分析法、PLS1和通径分析法对浓度数据进行分析,得到不同季节中各污染物对PM2.5浓度的直接影响、间接影响以及总影响作用,找出不同季节影响PM2.5浓度变化的主要污染因子,以期为环境管理部门更有针对性地开展不同季节PM2.5的环境治理工作提供科学依据。

1 材料

1.1 研究区概况

天津市(116°43′E~118°04′E,38°34′N~40°15′N)位于环渤海经济圈的中心,地处北温带,位于中纬度亚欧大陆东岸,主要受季风环流的支配,是东亚季风盛行的地区,属暖温带半湿润季风性气候。

1.2 数据来源及处理

根据GB 3095—2012检测天津市2014年PM2.5浓度数据结果显示:PM2.5浓度超过GB 3095—2012二级质量标准的天数在春、夏、秋、冬四季分别为48、27、44和52 d,全年超标天数为171 d,超标率达到46.8%。

2 研究方法

首先,运用SPSS 18.0软件对天津市2014年4个季节5类污染物的6组浓度数据〔PM2.5、SO2、NO2、CO、O3(8 h)和O3(1 h)〕分别进行正态分布检验(单个样本K-S检验),判断本研究的数据是否与理论正态分布有显著差异,如无显著差异,则满足正态分布,进一步进行相关性分析。

其次,采用PLS1建立最优线性回归方程,以PM2.5为因变量,其余为自变量,对所建立的回归方程进行显著性检验。

建模前首先对5个自变量进行共线性诊断,以保证所建立的回归模型有解且有合理的解。在共线性诊断和建模的显著性检验过程中将不断地剔除不符合要求或对PM2.5影响不大的自变量,以保证所建立的回归模型是最优的或较优的[33-41]。

最后,通过通径分析方法,计算出最优方程中的自变量对因变量(PM2.5)影响的直接作用系数、间接作用系数以及总作用系数。

直接作用系数的计算公式:

Pi=βi×(σiσy)

(1)

式中:Pi为自变量Xi对因变量Y的直接作用系数;βi为自变量Xi的偏回归系数;σi为自变量Xi的标准差;σy为因变量Y的标准差。

间接作用系数的计算公式:

Pij=rij×Pi

(2)

式中:Pij为自变量Xi通过自变量Xj对因变量Y的间接作用系数;rij为自变量Xi与自变量Xj间的相关系数。

总作用系数的计算公式:

ri=Pi+Pij

(3)

3 结果与讨论

3.1 正态分布检验

3.1.1 Q-Q图检验

对291 d可用数据中的PM2.5浓度数据分季节进行自然对数的Q-Q图检验,结果如图1所示。由图1可以看出,2014年天津市四季PM2.5浓度数据均高度符合正态分布检验。即本研究中所采用的291 d的数据与理论正态分布无显著差异,满足正态分布,为有效数据,可进一步进行相关性分析。

图1 2014年四季PM2.5浓度的正态Q-Q图Fig.1 The PM2.5 normal Q-Q tables in 2014 of four seasons

3.1.2 单个样本K-S检验

单个样本K-S检验是针对连续变量进行正态分布检验最常用的检验方法。对天津市2014年四季的PM2.5浓度数据进行单个样本K-S检验,结果如表1所示。由表1可见,春、夏、秋、冬四季的PM2.5数据的渐进显著性(双侧)P分别为0.129、0.449、0.139和0.578(一般认为P>0.05时,既满足正态分布检验),检验分布均为正态分布,再次验证了Q-Q图的检验结果。

表1 单样本正态分布(Kolmogorov-Smirnov)检验Table 1 The test of Kolmogorov-Smirnov in single sample

3.2 相关性分析

设PM2.5为因变量(Y),SO2、NO2、CO、O3(8 h)、O3(1 h)分别为自变量X1、X2、X3、X4、X5,对天津市2014年四季5类污染物的6组浓度数据运用SPSS 18.0软件分别进行相关性分析,结果见表2。由表2可知,春、秋季PM2.5与SO2、NO2、CO均在0.05水平(双侧)上呈显著正相关,与O3(1 h)和O3(8 h)呈较弱的负相关;夏季的PM2.5与O3(8 h)在0.05水平(双侧)上呈显著正相关,与CO有较大的正相关,与SO2、NO2和O3(1 h)呈较弱的正相关;冬季的PM2.5与SO2、NO2、CO、O3(8 h)均在0.01水平(双侧)上呈显著性相关,与O3(1 h)在0.05水平(双侧)上呈显著负相关。由此可见,冬季PM2.5与O3(1 h)的相关性最弱。

表2 相关性分析结果Table 2 The result of correlation analysis

注:**为在0.01水平(双侧)上显著相关;*为在0.05水平(双侧)上显著相关。

由表3可知,5个自变量都存在不同程度的共线性,但是冬季中O3(1 h)和O3(8 h)的方差膨胀因子(variance inflation factor,VIF)为10.177和13.895,均大于10,说明冬季O3(1 h)和O3(8 h)2个污染因子存在严重共线性,阻碍PLS1回归模型中最优方程的建立。从表2可知,O3(8 h)在夏季与PM2.5的相关性大于O3(1 h),所以本文在建立回归方程时,将冬季的O3(1 h)剔除,保留O3(8 h)。

表3 共线性诊断中各污染物的方差膨胀因子(VIF)Table 3 The VIF of pollution in diagnostics of collinearity

3.3 PM2.5的PLS1回归模型的建立及显著性检验

剔除冬季的O3(1 h)空气质量数据后,运用最小二乘法建立2014年春、夏、秋、冬四季的回归模型,并对其进行显著性检验,包括回归效果检验(F检验)和回归系数检验(T检验)。若模型未通过检验,则剔除相应的污染因子后重新建模,直至模型中污染因子均通过显著性检验方得到最优回归模型。

在建模过程中,未通过显著性检验剔除的部分数据为春季的SO2和O3(8 h);夏季的SO2和NO2;秋季的SO2和O3(8 h)以及冬季的SO2和O3(8 h)。最终得出四季的最优回归模型为:

春季Y=-5.021+0.566X2+0.037X3

夏季Y=-6.713+0.024X3+0.247X4

秋季Y=-38.606+1.679X2+0.027X3

冬季Y=-67.721+1.291X2+0.041X3

春、秋、冬季中导致PM2.5浓度变化的主要污染因子均为NO2和CO,夏季的主要污染因子为O3(8 h)和CO,CO是天津市2014年四季中影响PM2.5浓度变化共有的主要污染因子。

春、夏、秋、冬四季的最终回归模型的拟合优度(R2)分别为0.553、0.323、0.713和0.839,且均通过显著性检验,回归效果检验达到显著水平。最优回归模型的检验结果见表4。

表4 最优回归模型检验结果Table 4 The summary of model test results

3.4 PM2.5的PLS1回归模型的通径分析

通径分析法可更加直观地显示各自变量对因变量(PM2.5)的直接作用、间接作用和总作用影响,即各主要空气污染物对PM2.5浓度变化的直接影响、通过其他空气污染物的间接影响以及污染物之间的总作用影响,其统计量分别为直接作用系数、间接作用系数和总作用系数(表5)。

表5 通径分析结果Table 5 The result of path analysis

通径分析结果显示,CO、NO2和O3(8 h)对PM2.5的直接作用系数均高于间接作用系数,其中,CO每个季节的总作用系数均为最大值。

CO的总作用系数按季节排序为冬季>春季>秋季>夏季;NO2的总作用系数按季节排序为秋季>冬季>春季。

4 结论与建议

从相关分析来看,与PM2.5浓度变化有较大相关性的污染因子在四季表现不尽相同,其中,春季为SO2、NO2和CO;夏季为O3(8 h)和CO;秋季为SO2、NO2和CO;冬季为SO2、NO2、CO和O3(8 h)。

从通径分析结果来看,CO是各季节中影响PM2.5浓度的最主要的气态污染因子,且冬季影响最大。说明日常排放的CO与天津市空气中细颗粒物浓度的增长有着密切的关系,其中冬季的燃煤排放更会对此造成严重影响。因而提高以燃煤为主要动力的工厂、电厂以及其他大型设备的燃煤效率,尤其是冬季北方城市取暖过程中,减少煤炭的不充分燃烧,可在很大程度上改善空气质量。NO2在春、秋、冬季均对PM2.5浓度的变化产生重要影响,控制汽车尾气的排放、倡导绿色出行、大力推进新能源汽车行业均可在一定程度上减少雾霾现象的发生。夏季O3等光化学氧化剂的产生对PM2.5浓度的影响不容忽视,减少光化学氧化剂等生成二次颗粒物的中间产物的生成,可直接阻断二次颗粒物产生的途径,降低细颗粒物的污染程度。5类主要大气污染物对PM2.5的生成和浓度变化起主导作用的均为直接作用影响,但其间接作用同样不容忽视。因此今后的治霾工作中不仅要主抓细颗粒物的本源治理,同时也要注意污染物之间的协同治理工作。通过制定并实施不同季节有针对性的治理方案达到降低PM2.5浓度、减少雾霾现象产生的目的。

虽然在本研究中SO2由于未通过最优回归方程建模中的显著性T检验而未被纳入最优回归方程中进行通径分析,但是并不代表SO2的存在对空气中PM2.5浓度的改变没有影响。由于天津市属于以化石燃料为主要能源的城市,不能忽略SO2对细颗粒物生成的影响。因此建议应通过更加精细的源解析模型,来估算SO2对PM2.5的贡献量以及对二次颗粒物形成的影响。

[1] MA J Z,XU X B,ZHAO C,et al.A review of atmospheric chemistry research in China:photochemical smog,haze pollution,and gas-aerosol interactions[J].Advances in Atmospheric Sciences,2012,29(5):1006-1026.

[2] XU P,CHEN Y,YE X.Haze,air pollution,and health in China[J].Lancet,2013,382:2067.

[3] KELLY F J,FUSSELL J C.Air pollution and public health:emerging hazards and improved understanding of risk[J].Environmental Geochemistry & Health,2015,37(4):1-19.

[4] 蒋硕,赵金镯.大气细颗粒物健康危害的干预进展及趋势[J].卫生研究,2015,44(6):1042-1046. JIANG S,ZHAO J Z.Intervention and trend of health hazards of fine particulate matter in the atmosphere[J].Health Research,2015,44(6):1042-1046.

[5] MANNUCCI P M,HARARI S,MARTINELLI I,et al.Effects on health of air pollution:a narrative review[J].Internal & Emergency Medicine,2015,10(6):657-662.

[6] BARBOSA S M,FARHAT S C,MARTINS L C,et al.Air pollution and children’s health:sickle cell disease[J].Cad Saúde Pública,2015,31(2):265-275.

[7] BAGHAPOUR M A.Air pollution impacts on women’s health[J].Womens Health Bulletin,2015,2(2):e26864.

[8] PEDERSEN M,GIORGIS-ALLEMAND L,BERNARD C,et al.Ambient air pollution and low birthweight:a European cohort study (ESCAPE)[J].Lancet Respiratory Medicine,2013,1(9):695-704.

[9] GRAY S C,EDWARDS S E,SCHULTZ B D,et al.Assessing the impact of race,social factors and air pollution on birth outcomes:a population-based study[J].Environmental Health,2014,13(1):4.

[10] RITZ B,YU F,FRUIN S,et al.Ambient air pollution and risk of birth defects in Southern California[J].American Journal of Epidemiology,2002,155(1):17-25.

[11] 郑金艳,惠武利,兰晓霞,等.围妊娠期暴露于空气污染物SO2、NO2与出生缺陷的相关性研究[J].国际妇产科学杂志,2013,40(1):71-74. ZHENG J Y,HUI W L,LAN X X,et al.Periconceptional exposure to air pollutants SO2,NO2associated with birth defects[J].Journal of International Obstetrics & Gynecology,2013,40(1):71-74.

[12] BELL M L,EBISU K,BELANGER K.Ambient air pollution and low birth weight in Connecticut and Massachusetts[J].Environmental Health Perspectives,2007,115(7):1118-1124.

[13] FAIZ A S,RHOADS G G,DEMISSIE K,et al.Ambient air pollution and the risk of stillbirth[J].American Journal of Epidemiology,2012,176(4):308-316.

[14] LÜ Y.Indoor air purification system based on great number of plants and formation method thereof:WO,WO 2013152518 A1[P].2013-10-17.

[15] 刘艳丽.PM2.5来龙去脉[J].中国绿色画报,2012(5):20-21.

[16] ARDEN P C,BURNETT R T,THUN M J,et al.Lung cancer,cardiopulmonary mortality,and long-term exposure to fine particulate air pollution[J].Jama the Journal of the American Medical Association,2002,287(9):1132-1141.

[17] LEE B J.Air pollution exposure and cardiovascular disease[J].Toxicological Research,2014,30(2):5-71.

[20] 侯渊耀,张焕萍.细颗粒物与全身系统损害[J].中国药物与临床,2015(5):652-654

[21] 杨新兴,尉鹏,冯丽华.大气颗粒物PM2.5及其源解析[J].前沿科学,2013,7(2):12-19. YANG X X,WEI P,FENG L H.Atmospheric particulate matter PM2.5and its sources[J].Frontier Science,2013,7(2):12-19.

[22] 佟立志.积极探索PM2.5污染治理模式[J].群言,2013(12):16-18.

[23] 郝津川,李伟.大气PM2.5的污染特征及防控治理[C]2014中国环境科学学会学术年会:第六章.大气污染物减排及综合防治技木创新及产业升级.北京:中国环境科学学会,2014:5001-5005.

[24] 刘佳听.日本对PM2.5的研究及治理[J].汽车与安全,2014(3):36-39.

[25] FINE P M,CONSTANTINOS S,SOLOMON P A.Secondary particulate matter in the United States:insights from the particulate matter supersites program and related studies[J].Journal of the Air & Waste Management Association,2008,58(2):53-234.

[26] FENG J L,GUO Z G,ZHANG T R,et al.Source and formation of secondary particulate matter in PM2.5in Asian continental outflow[J].Journal of Geophysical Research Atmospheres,2012,117(D3):812-819.

[27] HERINGA M F,DECARLO P F,CHIRICO R,et al.Investigations of primary and secondary particulate matter of different wood combustion appliances with a high-resolution time-of-flight aerosol mass spectrometer[J].Atmospheric Chemistry & Physics,2011,11(12):5945-5957.

[28] 郑煜,邓兰.基于PLS1的哈尔滨市PM2.5与空气污染物相关性分析[J].生态环境学报,2014,23(12):1953-1957. ZHENG Y,DENG L.Correlation analysis based on PLS1 between and air polltants in Harbin City[J].Ecology and Environment Sciences,2014,23(12):1953-1957.

[29] 史宇,张建辉,罗海江,等.北京市2012—2013年秋冬季大气颗粒物污染特征分析[J].生态环境学报,2013,22(9):1571-1577. SHI Y,ZHANG J H,LUO H J,et al.Analysis of characteristics of atmospheric particulate matter pollution in Beijing during the fall and winter of 2012 to 2013[J].Ecology and Environment Sciences,2013,22(9):1571-1577.

[30] 黄虹,曾宝强,曹军骥,等.广州大学城大气PM2.5质量浓度与影响因素[J].环境科学与技术,2009,32(5):103-106. HUANG H,ZENG B Q,CAO J J,et al.Level of PM2.5and affecting factors in higher education mega centre,Guangzhou[J].Environmental Science & Technology,2009,32(5):103-106.

[31] 潘传信,孙秀萍,余伟,等.下沙空气PM2.5浓度与影响因素简析[J].能源环境保护,2013,27(3):58-60. PAN C X,SUN X P,YU W,et al.The preliminary analysis on monitoring results and its influencing factors of PM2.5in Xiasha[J].Energy Environmental Protection,2013,27(3):58-60.

[32] 孟晓艳,魏桢,王瑞斌,等.灰霾试点城市PM2.5浓度特征及其影响因素分析[J].环境科学与技术,2013,36(9):76-80. MENG X Y,WEI Z,WANG R B,et al.Analysis of variations and affection factors in experimental cities[J].Environmental Science & Technology,2013,36(9):76-80.

[33] 王惠文.偏最小二乘回归方法及其应用[M].北京:国防工业出版社,1999.

[34] 杜家菊,陈志伟.使用SPSS线性回归实现通径分析的方法[J].生物学通报,2010,45(2):4-6.

[35] 杜鹃.通径分析在Excel和SPSS中的实现[J].陕西气象,2012(1):15-18.

[36] 丁元林,孔丹莉,毛宗福.多重线性回归分析中的常用共线性诊断方法[J].数理医药学杂志,2004,17(4):299-300.

[37] 杨楠.岭回归分析在解决多重共线性问题中的独特作用[J].统计与决策,2004(3):14-15.

[38] 马雄威.线性回归方程中多重共线性诊断方法及其实证分析[J].华中农业大学学报(社会科学版),2008(2):78-81. MA X W.Diagnosis and empirical analysis on multicollinearity in linear regression model[J].Journal of Huazhong Agricultural University (Social Sciences Edition),2008(2):78-81.

[39] 柳丽,魏庆,赵树安.回归分析中多重共线性的诊断与处理[J].中国卫生统计,1994,11(1):5-7.

[40] 孟庆和.多元回归分析中多重共线性的处理[J].中国卫生统计,1997,14(1):49-50.

[41] 周家仪.主成分回归与特征根回归[J].中国卫生统计,1994,11(特刊):34-37. ▷

Correlation analysis based on PLS1 between PM2.5and air pollutants in Tianjin

MIAO Yunge1, WANG Jian3, MA Yinhong3, YANG Wen3, GU Chao2

1.College of Urban and Environmental Science, Tianjin Normal University, Tianjin 300387, China 2.Xinjiang Autonomous Region Environment Monitoring Centre, Urumqi 830011, China 3.China Research Academy of Environmental Sciences, Beijing 100012, China

The correlation analysis, PLS1 and path analysis were applied to study the direct effect five main air pollutants on the quality of PM2.5, their indirect effect on other pollutants and also the total effect in Tianjin in different seasons (291 days) of 2014.The results showed that the factors significantly related to PM2.5were SO2, NO2and CO in spring, O3(8 h)and CO in summer, SO2, NO2and CO in autumn and SO2, NO2, CO, O3(8 h)in winter, respectively. Meanwhile there was a positive multicollinearity between O3(1 h)and O3(8 h)in winter. The goodness of fitR2of PLS1 model in four seasons was 0.553, 0.323, 0.713, 0.839, respectively, which indicated that the model was reasonable. Path analysis revealed that CO was the greatest pollutant factor to PM2.5and showed there existed obvious seasonal variations, with the total effect coefficients of 10.810, 5.587, 6.271, 12.500 in four seasons, respectively. The total effect coefficient of O3(8 h)in summer was 0.897, and that of NO2was 0.185, 0.338 and 0.290 in spring, autumn and winter, respectively. Moreover, the direct effect coefficients of the pollutants in four seasons were higher than those of indirect effect.

PLS1; path analysis; Tianjin; PM2.5; CO; NO2; O3(8 h)

2016-05-24

北京市科技计划课题(Z141100002714002)

苗云阁(1991—),女,硕士研究生,主要研究方向大气环境科学,18911720413@163.com

*责任作者:谷超(1981—),男,工程师,主要研究空气颗粒物污染与防治,57901436@qq.com

X51

1674-991X(2017)01-0039-07

10.3969j.issn.1674-991X.2017.01.006

猜你喜欢
共线性通径颗粒物
牡丹江市气象因子与PM2.5浓度影响通径分析
道路空气颗粒物污染与骑行流的相关性研究
圆锥曲线焦点弦的一条斜率性质
南瓜SWEET蛋白家族的全基因组鉴定与进化分析
银行不良贷款额影响因素分析
气动通径机设计及使用中应注意的几个问题
油井管气动通径过程数值模拟研究*
不完全多重共线性定义存在的问题及其修正建议
我国寿险需求影响因素的岭回归分析
某高中校园内颗粒物尘源调查实测与分析