跳转到主要内容

日立

公司信息研究与开发

工业艾未未的博客

用于建模和估计的历史数据的相关性

2020年3月24日

Vinoth库马尔
R&d中心,日立印度列兵。有限公司

原田靖
日立公司研发集团

电力公司通过提前一天估计负荷来有效地运行发电、输电和配电基础设施,因为像火电厂这样的发电机需要很长时间才能提高产量。近年来,随着电力市场的去监管化,可再生能源、储能、电动汽车等分布式能源在输配网络中的应用越来越广泛,负荷估算变得更加必要。

随着长时间内获取、存储和检索负载数据的技术的改进,数据驱动的模型在预估一天的负载[2]方面变得越来越流行。然而,获取和存储历史数据是有成本的,而且使用大量历史数据所能达到的准确性往往是有上限的。这促使我们开发出一种理论来量化历史数据的数量,以达到一定程度的负载估计的准确性。
时间序列数据,如负荷数据可以通过例如较长的时间经历结构变化不同的人口,电价,节能产品等,其影响功耗的知名度。足球比分手机新版如在下面的图1中所示,一些结构变化的实施例突出显示,并提供了在两个步骤中的方法来确定结构改变,随后的权衡量化被呈现。

图1:负载结构变化的例子


虽然很难对这些周期性变化模式,它是有益的,如果我们可以识别这些变化点,提出可用于将前一天负荷模型相关的历史数据。在这项研究中,我们提出了一种新颖的方法和数学标准,以检查结构变化的历史数据。我们调用方法HISIA,日立和印度统计研究所分析的缩写。HISIA方法可以用于数据驱动负荷预测以检查可用于实现最大可能的准确度的历史数据的量。

我们的方法中的两个关键步骤在下面的示例中给出。图2展示了第一步,目标是识别负载数据中的结构变化。我们考虑9月1日至6日上午9点至10点之间的每日负载数据(称为段),每分钟的时间分辨率(称为样本)可供我们使用。为了估算9月7日上午9点到10点的平均负荷,我们必须首先检测给定的时间序列数据是否有结构性变化。假设所有样本和线段都属于正态分布总体,不假设线段均值之间的关系。此外,设定比较平均值的置信水平(例如95%),并制定均方误差(MSE)来量化估计平均值的误差。


图2:确定结构更改


在第二步,如下面的图3所示,我们调查来自最后一个被拒绝的片段的样本是否可以用来提高我们估计的准确性。这也可以通过建立一个数学表达式来实现,该表达式量化了在结构变化之前收集的样本的权衡。与x7估计用X中,假设结构变化在x之前怀疑3.,对于使用更多数据,即从9月2日折衷通过使用具有偏差和方差的部件均方误差量化。

图3:使用更多历史数据的权衡

使用变化前的观察/数据的权衡表现在误差上,它有两个组成部分:方差(减少)和偏差(增加)。一旦均值发生变化,与增加偏差的误差贡献相比,减小方差分量的范围是非常有限的。可以注意到,指定为输入的较高置信水平将导致接受较少的段。它用额外的历史数据击败了试错法,后者需要更多的时间和成本,却没有关于边际效益的明确提示。

作为一个实验,我们使用NYISO[3]的Zone-F的综合小时负荷来评估HISIA。我们使用每天上午8 - 9点的平均负荷作为样本,并收集每年的所有数据,如下面的图4所示。如果我们将2014年视为必须进行估算的当前部分,我们会问一个问题,即我们必须使用多少来自过去的部分。第一步如图4左侧所示,其中我们检测到了segment(2012年)之前的结构变化。

图4:结构变化对估计平均荷载的影响

在使用之前的历史数据时,量化权衡的第二步出现在图4的右侧。可以注意到,MSE的下降趋势一直持续到1100个来自过去的观测值,这是用于负荷估计的最佳历史数据大小(2014年上午8 - 9点)。
所提出的方法可以被认为是简单而最佳的,因为它并不假定每个段中的参数之间存在以及变化点数目和关系。有关详细信息,我们建议您阅读我们的论文“负荷预测模型结构变化的数学检验,这是可用的ScienceDirect[4]。


参考

[1]
N斯里尼瓦桑和李,1995斯里尼瓦桑,D和李,M A;电力负荷预测的混合模糊神经方法综述,IEEE 21世纪智能系统国际会议,1995
[2]
彭伟等,2017彭伟,苏等;2017年分布式能源系统运行优化负荷预测技术发展趋势
[3]
NYISO NYISO;商务部市场运行数据www.nyiso.com 2014
[4]
https://www.sciencedirect.com/science/article/pii/S2405896318334323