变权组合模型在景观水体水质模拟中的应用

2017-03-15 08:51:49 7

  景观水体大多数都是静止或者流动性较差的缓流水体,自净能力差,易出现水体的污染和富营养化[1]。景观水体的水质模拟与预测能为水质评价、水体富营养化与污染的控制以及水环境管理规划等提供科学的依据[2]。

  在水质模型中,存在着两种学习型模型:人工神经网络和支持向量机模型。然而,这两种模型都存在着一定的局限性和缺点,如基于经验风险最小化的人工神经网络是一种在应用和试验中建立的启发式方法,可能出现局部最优[3]。而基于结构风险最优化的支持向量机方法在处理大规模的样本时,往往需要求解复杂的二次规划问题,计算复杂[4]。

  组合预测是由Bates等[5]于1969年提出的一种预测方法,该方法在充分利用各个单一预测模型优点的基础上,能克服单一模型的局限性和缺点,并最高效率地利用与挖掘数据信息,因而被广泛地应用于水环境领域[6-9]。然而,实际情况往往是各单一模型是时间等一系列自变量的函数,在不同时刻模型变化也不相同,所以固定权重的分配方式自然无法体现这种关系。而变权重组合预测模型,提出权重随时间等一系列自变量而变化的思想,避免固定权重的弊端[10]。所以,本文采用基于神经网络与支持向量机2种模型,建立权重随时间等一系列自变量而变化的变权组合模型,来应用于景观水质的水质模拟与预测。

  1 变权组合模型

  1.1 神经网络模型神经网络(artificialneuralnetworks)是由大量的人工神经元广泛地连接而成,用以模仿人脑神经网络的复杂网络系统。BP(back-propagation)神经网络,即误差反向传递的神经网络,是将输出误差以某种形式通过隐含层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。权值经过不断的修正,最终得到可以满足要求的BP神经网络模型[11]。

  1.2 支持向量机模型支持向量机(supportvectormachine)是一类新型的机器语言,它具有完备的统计学习理论和出色的学习性能,能根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以求获得最好的推广能力[12]。对于非线性问题,支持向量机的基本思想是通过一个非线性映射将数据映射到高维特征空间,并在这个空间进行线性回归[13]。

  1.3 变权组合模型变权组合模型,其核心就是确定各个模型在各个时刻所占的权重,从而使模型更好地符合实际情况。对于m个单一预测模型得到的预测值f1,f2,…,fm,不妨假设每一个自变量对应一个相应的时刻,则其变权组合预测模型为:f(t) =Σmi=1gi(t)fi(t) (1)式中:t=1,2,…,n;i=1,2,…,m;fi(t)为第i个模型在t时刻的预测值;gi(t)为第i个模型在t时刻的权重,其满足:1=Σmi=1gi(t) (2)假设gi(t)为t的连续函数,则gi(t)可以用p次多项式来表示:gi(t) =gi0·t0 +gi1·t1 +gi2·t2 +… +gip·tp(3)则:f(t) =Σmi=1gi(t)fi(t) =[f1(t),f2(t),…,fm(t)]g10 g11 … g1pg20 g21 … g2p… … … …gn0 gn1 … géêêêêëùúúúúûnpt0t1…téêêêêëùúúúúûn=Δ F(t)GT(t) (4)一旦gi(t)多项式的次数p确定,就可以通过广义逆矩阵的循环迭代法[10]来求解系数矩阵G,并确定最终的变权组合预测模型。同时,从系数矩阵G的求解过程中可以发现,变权重组合预测方法其实就是根据m个单一预测模型在前n个时刻的预测值来确定某个时刻(某个自变量)的权重值,从而得到变权组合预测模型的预测值。

  2 实例分析

  2.1 基本资料本文选取天津市某园区的景观水体作为研究对象,该景观水体的水面面积约为29000m2,平均深度为3.6m,总容积约为10500m3,属于典型的城市封闭缓流水体。水质监测点位于水体主体水域地带,监测时间从2012年7月到2013年11月,共监测数据样本为35个,监测指标包括水温、pH值、氨氮、总氮、总磷和化学需氧量(COD)等水质指标。

  COD作为一种表征水体有机物含量大小的重要指标,在一定程度上可以表示景观水体的水质状况和水体的污染情况。因此,本文建立COD与时间、水温、pH值、氨氮、总氮和总磷之间变化关系的水质模型,通过COD的变化来了解当前景观水体水质状况,并为水质的预测预警作出科学的判断与分析。

  2.2 BP神经网络模型本文利用该景观水体从2012年7月到2013年11月的监测数据,建立BP神经网络水质模型。由于各个水质监测指标值的量纲及数量级不同,在BP神经网络训练前要先对原始水质数据进行归一化处理[14],使得各个指标值落在[0,1]之间。对于归一化方程,输入时间t,是以2012年7月28号为第1天,以后各个监测时期的时间为实际监测日期与7月28号的时间距离,单位为天。然后再将输入时间、水温、pH值、氨氮、总氮、总磷和COD值采用归一化公式(5)进行处理,公式如下:Xi = xi-xmin xmax -xmin(5)式中:xmin为原始监测值的最小值;xmax为原始监测值的最大值;xi为第i个原始监测值;Xi为归一化处理之后的第i个监测值;

  对于建立的BP神经网络模型,输入量包括时间、水温、pH值、氨氮、总氮和总磷,输出量为COD,隐含层的神经元采用Sigmoid型变换函数,输出层则采用线性变换函数。而对于神经网络结构中的各个参数确定则利用学习时间较短、精度与收敛性较好的L-__M算法,隐含层的节点数[15]则根据公式(6)确定:Ny =(Ns +Nj)0.5 +N (6)式中:Ny 为隐含层的节同时,将景观水体水质监测样本的数据分为训练集、检验集两个部分。用训练集来训练与拟合BP神经网络,用检验集来对模型的预测结果进行检验。本模型中将前3/4的归一化的数据作为BP神经网络的训练集,用后1/4的实际监测值作为BP神经网络模型的检验集。利用MATLAB中的BP神经网络工具箱,取训练的最大循环次数epochs=10000,性能函数goal=0,最大验证数据失败的次数max_fail=20,最小的性能梯度值mingrad=0.00001。进行不断地调试,发现在N=2,即隐含层的节点数Ny为4时,模型收敛性最好。模型结果与实际监测值的比较如图1所示。具体参见污水技术资料更多相关技术文档。


详情请下载:变权组合模型在景观水体水质模拟中的应用

电话咨询
客户案例
服务项目
QQ客服