English

利用机器学习方法揭示湖泊-流域关键要素世纪尺度时序变化规律及影响因素


湖泊流域系统充分体现了地球表层系统的自然和人文交互、多要素互馈、多过程耦合等特征,湖泊的资源环境生态要素演变与流域气候和环境等因素息息相关。由于湖泊水循环与物质变化的影响因素具有流域空间大尺度和时间非线性的特点,仅依靠观测手段难以实现全过程及各因素定量解析。过程模型模拟作为研究湖泊-流域间要素影响关系的有效方法,但常受限于过程机理复杂不明或参数数据难以获取。该瓶颈问题对于地处偏远的湖泊流域或由于早期资料缺测等因素而尤为明显。迫切需要多源资料融合和非线性过程解析方法,加强湖泊-流域关键要素长时序变化规律及影响因素的定量解析,支撑湖泊流域系统过程的科学理解与管理。   

在此背景下,宋春桥研究员课题组以站点观测、多源遥感反演资料及再分析数据集为基础,发挥人工智能技术挖掘变量间深层隐含信息的优势,利用机器学习方法实现对典型湖泊(北方干旱区的呼伦湖、博斯腾湖,东部季风区的鄱阳湖)的水位、水量、盐度及渔业资源量等关键要素(近)世纪尺度的重建,并解析其演变规律及驱动因素。相关研究成果近期发表在Water Resources Research、Journal of HydrologyFrontiers in Environmental Science等期刊。该研究得到国家重点研发计划、中科院战略性先导科技专项等项目资助。   

呼伦湖作为我国第五大湖泊,是蒙古高原生态环境和区域气候变化的重要指示。以往研究基于观测资料和水文模型探究了呼伦湖近几十年的水文演变及生态环境效应,特别关注了呼伦湖水位在卫星测高时代出现的快速下降。然而,呼伦湖在历史更长时间尺度是否出现比上世纪90年代来更显著的萎缩阶段?为了更好地理解呼伦湖水资源量变化特征及其驱动因子,本研究尝试在更长时间尺度(如世纪尺度)对比人类活动加剧影响的前后不同阶段研究呼伦湖的水量变化。本论文研究首先利用多源遥感技术构建了湖滨消落带-水下的完整湖盆地形信息,实现对全湖总水量及变化估算;对比和遴选了适宜的机器学习方法(见图1),结合卫星测高水位数据和气候再分析资料等,重建了过去世纪尺度呼伦湖水位-水量的变化规律,并探讨了湖泊水文水资源演变与气候因子和大气环流异常的联系(见图2)。研究结果表明,呼伦湖水量在20世纪60年代达到了近百年的最高位,最低阶段出现在20世纪30-40年代大旱阶段,甚至低于湖泊近期的最枯点(2012年)。整个研究时段,呼伦湖水量的年际波动主要受降水和水汽压的影响,其次是湿日频率、潜在蒸散量和温度等因子;然而在不同波动周期,不同气候因子的主导特征存在差异。大气环流指数AO、ENSO、PDO和NAO与呼伦湖的水量变化有不同程度相关性,且在不同年代际差异较大,这与以往的华北和蒙古高原相关研究结果较一致。其中,1960年代的湖泊水量高位与ENSO具有较强同相位关系。该研究为利用机器学习方法和再分析气候资料重建历史缺测阶段的湖泊水量长时序演变规律提供了一种可行的技术方案,也促进了对我国北方干旱半干旱区湖泊水量平衡响应气候和大气环流特征的科学认识。该研究发表在Water Resources Research,第一作者是中国科学院南京地理与湖泊研究所博士研究生范晨雨。      

图1. 基于机器学习方法的呼伦湖百年尺度时间序列水量重建技术流程      

图2. 呼伦湖水量重建的3种机器学习模型的性能比较评价与时间序列结果   

 

同样位于北方干旱半干旱气候区,我国西北最大湖泊博斯腾湖在过去几十年内由于气候与人类活动干扰,其水位与盐度经历了剧烈的变化,引发各界的广泛关注。由于博斯腾湖缺乏长期连续的水文与环境观测数据和统一的观测标准,现有研究大多的关注上世纪末以来该湖泊变化特征,对博斯腾湖水文环境的长期演变及其驱动因素还有待进一步理解。本研究尝试在更长时间尺度上挖掘博斯腾湖的水盐变化特征,提出了基于机器学习方法重建博斯腾湖过去一个世纪湖泊水盐变化的技术方案,揭示气候因素与人为扰动对博斯腾湖水量平衡与盐量平衡的影响,为干旱区水资源和生态环境保护提供科学参考。   

方案基于有限历史观测、文献萃取资料、卫星遥感等多源数据,结合水位与盐度的多年统计关系以及气候再分析数据,利用机器学习模型预测和重建博斯腾湖百年来的盐度与水量协同变化序列(如图3所示)。研究结果表明,博斯腾湖水位在1935年前后经历了一次急剧下降,接近1920-1934年期间变化速率的20倍。自此之后水位逐渐上升,直到上世纪60年代早期。湖水盐度相应呈现出大幅度的周期性变化:20世纪20年代缓慢上升并在30年代初开始超过1.40g/L,在30至40年代期间保持在1.60g/L左右的高值;此后,湖泊盐度开始缓慢下降至60年代初,然后反弹上升至1987年历史最高值1.87g/L;上世纪末盐度以更快速度持续下降,在2002年达到1.19g/L的底部;本世纪前20年,又重现前一个20年左右的周期振荡——2013年湖泊盐度上升到1.80g/L左右,并在近年来迅速下降。在分析自然气候因素驱动湖泊水量平衡与盐度变化基础上,本研究也从不同时空尺度讨论了人类活动与工程干扰对博斯腾水盐变化的影响。20世纪 60至80年代,博斯腾湖流域农业活动显著增强,灌溉面积及农业用水与排水量明显增加,农业活动引发湖泊水量的降低和盐度的升高。由于农业灌溉节水工程实施和现代化农业技术提高,以及一些生态环境保护和水利工程,农业活动影响湖泊水盐变化的程度在减弱。但由于农业活动影响无法在机器学习模拟进行长时序定量信息表达,可能给重建结果带来一定的不确定性,在某些年份误差可能超过10-20%。该研究发表在Journal of Hydrology,论文第一作者是蒋幸安。      

图3. 基于机器学习模型的博斯腾湖水位-水量-盐度百年(1920-2020年)时序重建

 

渔业资源作为湖泊生态服务功能的重要组成部分,可为人类提供直接的可食用蛋白质,因此渔业资源的可持续利用关乎民生及粮农安全。现有研究表明湖泊环境对鱼类栖息地分布、生物多样性及渔业资源的可持续性等有重要影响。但是由于湖泊环境变量的复杂性和多样性,湖泊环境变化影响渔业资源的主控因子难以确定。因此,有必要全面评估不同湖泊环境因子对渔业资源量的影响。传统调查研究湖泊渔业资源量与生境关系的方法侧重单点案例为基础的人工调查为主。例如,采用昂贵的水声学探测技术或鱼类标记技术来进行渔业资源及生境评估,需要付出大量的物资、人力、时间等成本,并且无法反映全湖区的总体状况和时空差异性特征,一定程度上限制了其在大区域尺度的推广。遥感技术在鱼类典型生境及渔业资源领域的发展优势,可以更加快速有效地获取密集时间尺度及广阔空间分布的渔业资源动态特征,并在反映直接影响渔业资源量的生境特征方面(产卵、索饵、洄游、栖息等)展现出了巨大的应用潜力。本研究以我国最大淡水湖鄱阳湖为例,利用多源遥感与机器学习方法,设计了不同输入变量(影响因素)组合的模拟实验来预测湖泊环境因子对湖泊渔业资源量的影响(见图4)。      

图4. 集成台站-遥感-再分析资料的地理空间大数据和机器学习方法构建湖泊渔业资源量受流域“气象-水文-水质-生态”综合环境影响的概念模型   

 

通过对鄱阳湖渔业资源量受环境因素在不同时间尺度影响的模拟,研究发现渔业生境的水文气象条件(水文站资料HS、气象站资料MS、CRU模型气象资料)是影响鄱阳湖渔业资源量长期演变的一个关键因素(图5)。此外,近20年的多变量叠加影响模拟实验表明,影响渔业资源量由高到低的环境因子依次为水生态环境因子(WECO)、水质环境因子(WQ)和水文气象环境因子(HM)。在不同的模拟实验中,最优模型方案为机器学习训练中同时叠加水文气象条件、水质、水生态环境因子的组合实验,模拟结果验证R值高达0.98。本研究结果发现基于公开获取的遥感数据及少量实测数据,利用机器学习智能算法构建基于多维(水文、水质和水生态)环境因子估算渔业资源量的模型可以有效地揭示湖泊-流域综合环境对渔业资源量的影响。研究也讨论了人类活动(特别是渔业政策)对湖泊渔业资源量在长时间尺度影响的关键节点。该工作提供了一个将机器学习算法与地面和卫星数据相结合的概念模型,可以促进渔业资源的大规模调查和评估,可用于全湖区范围的空间模拟,并可向其他区域湖泊进行推广。该研究发表在Frontiers in Environmental Science,第一作者是中国科学院南京地理与湖泊研究所陈探博士。         

图5. 利用机器学习模型构建不同影响因素组合的模拟实验预测(重建)湖泊渔业资源量. 左图:流域水文气象因子对湖泊渔业资源量影响模拟(60年尺度);右图:叠加水质因子与生态因子对湖泊渔业资源量影响模拟(20年尺度)      

 

论文链接:   

呼伦湖水位与水量百年尺度机器学习重建与影响分析

https://agupubs.onlinelibrary.wiley.com/doi/10.1029/2020WR028831   

博斯腾湖水量平衡与盐量平衡世纪尺度机器学习重建与影响分析

https://www.sciencedirect.com/science/article/pii/S0022169422006709?via%3Dihub   

鄱阳湖渔业资源量受综合环境因子影响的机器学习建模

https://www.frontiersin.org/articles/10.3389/fenvs.2022.944319/full

附件