不确定性是模型研究中的重要内容,虽然目前对于不确定性的研究已经出现了很多方法,但是复杂模型的不确定性的系统研究却依然匮乏。《三维水动力水质模型不确定性研究》针对三维水动力水质模型提出一套"不确定性评价-参数自动估计-决策响应可能性评价"研究体系。《三维水动力水质模型不确定性研究》以环境流体动力学模型为建模平台,以滇池湖泊为研究案例,通过构建滇池三维水动力水质模型开展不确定性的研究。首先采用Morris敏感性分析等方法对模型进行全局不确定性和敏感性分析,识别模型的不确定性分布和主控因子,以及模型不确定性的时空差异分析;然后,提出基于BP神经网络替代模型的多目标参数自动率定方法,降低参数率定的计算成本;后,提出基于不确定性的水质响应可能性评价方法,在模型应用中考虑不确定性的影响水平。
数理建模、水环境模型、水文模型等模型应用和研究领域的学者、技术人员和学生以及从事水环境管理、水文预报、环境科学等领域工作人员
目录
前
第1章 绪论 1
1.1 研究背景 1
1.2 研究意义与目的 4
1.2.1 研究意义 4
1.2.2 研究目的 5
1.3 研究内容与方法 5
1.3.1 EFDC模型不确定性与敏感性分析 5
1.3.2 基于替代模型的多目标参数估计 6
1.3.3 基于不确定性的水质响应可能性评价 6
1.4 技术路线 7
第2章 国内外研究进展 9
2.1 水质模型 9
2.1.1 水质模型发展历程 9
2.1.2 常见的水质模型 10
2.2 模型的不确定性和敏感性分析 12
2.2.1 水质模型不确定性分析 12
2.2.2 敏感性分析 13
2.3 模型参数率定方法 18
2.3.1 传统方法 18
2.3.2 替代模型法 19
2.4 基于不确定性的决策风险评估 23
2.5 本章小结 25
第3章 研究区域及EFDC水动力水质模型 26
3.1 研究区域 26
3.1.1 地理位置和地形地貌 26
3.1.2 气候条件及流域水系 28
3.1.3 水质状况 29
3.1.4 社会经济 31
3.2 EFDC水动力水质模型 33
3.2.1 EFDC水动力水质模型简介 33
3.2.2 EFDC模型主控方程 33
3.3 滇池EFDC水动力水质模型构建 39
3.3.1 EFDC模型集成 39
3.3.2 滇池EFDC三维水动力水质模型开发 40
3.3.3 水动力水质校验结果 42
3.4 本章小结 44
第4章 EFDC模型不确定性与敏感性分析 46
4.1 概述 46
4.2 EFDC模型的异参同效现象 47
4.3 不确定性和敏感性分析方法 48
4.3.1 LHS不确定性分析 48
4.3.2 敏感性分析方法 50
4.4 EFDC模型参数及外部输入条件分布 54
4.4.1 EFDC模型参数分布 54
4.4.2 外部驱动力选择与分布 54
4.5 EFDC模型参数不确定性分析和敏感性分析结果 55
4.5.1 参数不确定性分析结果 55
4.5.2 EFDC模型参数敏感性分析结果 64
4.5.3 SRRCs法敏感性结果及对比 71
4.5.4 敏感性分析的时空差异性 74
4.6 外部驱动力不确定性和敏感性分析 80
4.6.1 外部驱动力的不确定性分析 81
4.6.2 外部驱动力的敏感性分析 87
4.7 本章小结 88
第5章 基于替代模型的多目标参数估计 90
5.1 基于替代模型的多目标参数估计方法 90
5.1.1 替代模型 92
5.1.2 多目标优化计算 96
5.2 参数估计结果 100
5.2.1 参数与样本生成 100
5.2.2 BP神经网络训练结果 102
5.2.3 情景设计与BP神经网络构建 104
5.2.4 参数估计结果 107
5.3 本章小结 113
第6章 基于不确定性的水质响应可能性评价 115
6.1 决策的不确定型模型与概率型水质模型 115
6.2 研究方法 116
6.2.1 控制目标、指标和基准年设置 117
6.2.2 条件概率预测 118
6.2.3 负荷削减情景设计 126
6.3 结果与讨论 127
6.3.1 可行样本筛选 127
6.3.2 负荷削减情景统计分析 132
6.3.3 水质达标可能性(风险性)分析 135
6.3.4 讨论 137
6.4 本章小结 138
第7章 结论与展望 140
7.1 主要结论 140
7.2 创新点 142
7.3 不足与展望 142
参考文献 144
附录 156
致谢 169
彩图
第1章 绪论
1.1 研究背景
人类所处的环境具有大量的偶然或必然性因素,由于人类对自然的认知能力有限,对于不确定性规律的研究成为人类认识自然规律的有效手段。水系统是一个充斥着各类不确定性成分的复杂巨系统(张质明,2013),目前人们尚未了解它的内在机制。水系统不仅包括水文水动力现象,还涵盖泥沙、沉积物、污染物、微生物和水生生物等多种因素及其相互作用机制,是一个集物理、化学、生物和其他综合领域的体系。此外,水环境系统还受到外界自然条件以及人类活动的影响。长期以来,科学家一直不断探索水环境系统的变化过程和水质变化规律,以此为改善和保护水质提供定量化依据。研究人员试图通过建立水质模型来反映真实水环境系统,然而无论多么复杂的模型,其总是基于人类对真实系统认知的简化,这就造成水质模型存在多方面的不确定性。尽管无法真正消除不确定性,但是对模型不确定性的研究可以在一定程度上甄别有规律的现象和不确定性的影响范围,以此提高人们对水环境系统的认识,并进一步做出更加的管理决策。
计算机的发展和数据收集技术水平的提高加速了人们开发更加复杂水质模型的步伐,复杂模型被认为可以更地反映水体的动力状态和生化活动(Castelletti et al., 2010)。这些模型包含大量参数,并且计算成本较高。虽然有些参数的取值可以通过直接观测或测量获得,然而更多的参数需要进行参数率定(Pinder et al., 2009)。参数数量的增加带来的模型复杂程度的增大向人们提出了更高的计算要求,并且,参数之间高度交互性和目标空间的不确定非凸性提高了参数率定的难度(Gupta et al., 1998;Herman et al., 2013a)。此外,输入数据、模型结构、观测资料、性能指标(performance evaluation)等的误差都对参数估计造成不确定性。日益复杂的模型结构带来的大量参数在面对匮乏的观测资料时,往往导致"过度参数化"(overparameterization)(Kuczera and Mroczkowski, 1998;Brun et al., 2001)问题,而模型的非线性结构使得很多参数具有交互作用,从而出现"异参同效"(Beven, 2001a, 2006)问题,即模型参数率定时不同的参数组合可以得到结果相同或相似的模型输出。研究表明,只有一小部分参数控制了模型输出的大部分变化(Morris et al., 2014),因此,如何识别有影响力的参数对模型率定和结构认识具有重要意义。
然而,即使筛选出有效参数,模型的参数率定依然是一个严峻的考验。其一,大量参数导致"维数灾难";其二,模型单次运算时间长,传统的优化方法在率定参数时迭代次数可能高达几千或几万次,计算成本过高;其三,水质模型往往有多个输出指标需要率定,常为多维目标问题。由于计算成本问题,自动率参一直是复杂水质模型的难点之一,目前复杂的水质模型依然依靠手动调参。替代模型或元模型(surrogate model or metamodelling)是解决复杂动态模型优化的常见方法之一,被广泛应用于经济、环境、流体、航空器设计等方面(Forrester and Keane, 2009;Arena et al., 2010;Castelletti et al., 2010;Castelletti et al., 2012a;Li et al., 2012;Razavi et al., 2012)。通过对原始复杂模型进行替代或仿真,可以大大缩短计算时长,目前在水文模型参数率定上也开始使用这种方法(Song et al., 2012a;Burrows and Doherty, 2015;Gong et al., 2015)。多维水质模型常常需要数小时的运算时间,如何有效地进行参数率定是构建模型的关键。
如前所述,水质模型的多参数估计问题常常有"异参同效"和"过度参数化"的现象。模型的参数、数据和结构的不确定性本质使得建模者很难降低模型的不确定性。确定型模型的分析手段是基于"参数"得到的"what-if"情景(Hogrefe and Rao, 2001;Foley et al., 2012)。但是,鉴于模型外部(输入、观测数据等)和内部(模型结构和参数)的不确定性,模型在应用时还需评估其风险,通常,估算一个事件的发生概率(可能性),往往用判断""参数是否的方法更加(Pinder et al., 2009;Foley et al., 2012;Wellen et al., 2015)。此外,参数化往往基于历史数据,但是分析未来情景时可能会存在偏差。并且,水质观测模型较流量来说存在更大的误差,这源于水质检验的限制,而这些不确定性往往被人们忽视。不同的参数组合在一定程度上可以理解为不同的水体内部规律,虽然在模型输出上会具有相似的结果,但是却可以反映出不同的效果。
模型的不确定性分析有助于提高人们对模型和系统的认识,然而模型的复杂性限制了其适用范围。如何降低模型的复杂性、提高其计算速度和适用范围在实际管理生产中具有重要意义。一般来说,模型简化手段有两种:其一是忽略原始模型的细节、仅保留原始模型的主要框架(Forrester and Keane, 2009;Razavi et al., 2012)的低保真度模型(lower-fidelity model);其二是采用数据驱动模型(data driving model,DDM)近似模型响应,也可以称为元模型(metamodellings)(Blanning, 1975)。在实际管理中,管理者往往无需知道所有细节,因此,将模型简化会提高工作效率。
湖泊是人类赖以生存的水源之一,关系着人类的生产和生活。同时,湖泊在蓄水防洪、维护生物多样性、调节气候和地表径流等方面也具有不可替代的功能。中国约有湖泊2万个,占全球天然湖泊总数的1/10左右,水面总面积超过8万km2。其中,水面面积大于1km2的湖泊有2300多个,水资源量超过7000亿m3。淡水水资源量为2250亿m3(马荣华等, 2011)。然而,随着经济发展和人口的增长,生产生活排放的污水量日益增加,造成水体水质恶化,严重影响了湖泊供水等服务功能。其中,富营养化(eutrophication)是世界上较严重的水污染问题之一(Carpenter et al., 1995;Smith et al., 1997, 2006;Schindler, 2006;Carpenter and Lathrop, 2008;Conley et al., 2009)。过量的营养物质(氮、磷)流入水体,给水体系统带来巨大的风险(Carpenter and Lathrop, 2008)。有害藻类暴发(harmful algae blooms)、缺氧(hypoxia)和鱼类死亡(fish kill)带来巨大的经济和生态损失(Carpenter and Lathrop, 2008)。例如,全球每年因此造成的渔产损失高达1700亿美元(Partnership On Nutrient Management, 2013)。世界范围内遭受富营养化问题的水域面积处于总体上升水平,亚洲有54%的水体面临富营养化问题(Selman and Greenhalgh, 2009)。据统计,2014年中国61个国控重点湖泊(水库)中,有两个为中度富营养化,13个为轻度富营养化(图1.1)。面对如此严峻的湖泊高富营养化问题,如何有效改善水体水质、恢复水生态系统、切实保护好水环境,已成为流域水质综合管理的首要任务。
图1.1 2014年重点湖泊(水库)综合营养状态指数(环境保护部, 2015)
滇池是中国"三河、三湖、一水、一库"之一。20世纪80年代以来,滇池水质逐渐恶化,迄今,富营养化已成为滇池的主要环境问题。因此,对滇池开展三维水动力水质模型及其不确定性研究,对滇池的水污染和高富营养化控制具有关键作用,可以为地方政府管理部门提供科学的管理依据和技术支持。
1.2 研究意义与目的
1.2.1 研究意义
本书以三维水质水动力模型为平台,以复杂水质模型面临的两大问题,即复杂模型的不确定性问题和计算成本高的问题为关注点,通过对模型不确定来源分析以及模型简化等问题的探讨,深入了解模型运行规律并提高模型在进行实际应用时的鲁棒性和可行性,为应用复杂三维水动力水质模型提供不确定性研究基础。
本书的研究意义在于寻找合适的方法评价复杂三维水质模型不确定性,并评价不确定性对模型决策的影响,为今后降低模型不确定性和其带来的风险提供理论基础。本书将对以下3个问题依次进行阐述,包括模型的诊断、构建、应用3个层次:
(1)复杂水质模型的不确定性来源及模型运行的主要控制因子是什么?
水质模型的不确定性主要包括模型参数的不确定性和输入条件的不确定性,这些控制因子的不确定性对模型运行过程和输出结果是如何影响的?对于一个多维动态复杂模型,模型主要影响因子(influential factors)是否存在时空差异性?在不确定性分析中,是否存在一些普适性规律?
(2)多输出指标、计算成本高的复杂模型如何进行参数估计?
多维水动力水质模型通常有多个水质输出结果,且运算时间长达数十分钟甚至数小时。传统的优化方法需要上千甚至上万次迭代来达到满意的效果,过长的计算时间使得模型自动率参成为研究难点之一。如何针对计算缓慢的问题进行参数估算?多输出目标下的参数估计如何进行权衡?
(3)如何评估不确定性对模型决策结果的影响?
人类认知的局限性导致模型与实际系统之间存在偏差,因此无法避免基于模型的决策在实际问题上的不确定性。一般来说,决策者往往使用一组"的"参数代表系统响应并基于该模型做出决策,然而系统响应的模拟模型是否存在其他的可能性(possibility)?如果有其他的可能性,那么如何找到这些具有现实意义的可能情况?在模型的多种可能性下(也就是不确定性),如何正确评估不确定性在决策管理中的影响?
1.2.2 研究目的
本书以高污染湖泊——滇池为例,基于三维水动力水质模型[选择环境流体动力学模型(environmental fluid dynamics code,EFDC模型)]构建湖泊三维模型,针对模型的不确定性和计算成本高的问题,通过模型内部不确定性和敏感性分析、基于替代模型的参数率定、基于不确定性的水质响应分析三部分研究,实现以下研究目的:
(1)通过对模型参数及外部驱动力的不确定性和敏感性研究,确定模型的不确定来源以及模型控制因子对结果的影响。通过分析敏感性筛选不同水质指标的敏感参数和驱动力,寻找不同情境和时空差异的敏感性结果的规律,从而了解模型的控制规律,实现模型诊断(model diagnostics)。
(2)针对三维水质模型的计算成本高和多输出指标的问题,开发一套新的基于替代模型的多目标参数估计方法,解决复杂模型的参数自动率定问题。
(3)寻求再现历史情况的多种可能性内部动力学机制(以参数表达),探讨基于不确定性的水质响应可能性问题(以负荷削减为情景)。
1.3 研究内容与方法
1.3.1 EFDC模型不确定性与敏感性分析
基于拉丁超立方抽样(Latin hypercube sampling, LHS)的不确定性分析方法、Morris敏感性分析方法(以下简称Morris法)和标准秩序回归系数(standardized rank regression coefficients, SRRCs)法3种全局敏感性分析方法,对模型参数和外部驱动力进行不确定性和敏感性分析,识别模型不同状态情景下的敏感因子,并对模型进行诊断。
首先,对模型参数进行不确定性研究,采用拉丁超立方抽