• 头条内蒙古电力经济研究院专家提出配电网负荷缺失数据的修补方法
    2022-03-30 作者:蔡文斌、程晓磊 等  |  来源:《电气技术》  |  点击率:
    分享到:
    导语电力负荷属于具有时间序列特性的数据,依据数据固有的规律性和波动性特征,修补由于各种因素而缺失的负荷数据,可为电力系统研究和实验结果的有效性和可预测性奠定基础。内蒙古电力经济研究院的研究人员蔡文斌、程晓磊 等,在2021年第12期《电气技术》上撰文,首先提出基于密度的含噪声应用空间聚类(DBSCAN)二次聚类的方法;其次,提出针对配电网负荷数据的负荷属性相似度。 研究人员在此基础上进一步提出负荷记录综合相似度;然后,依据DBSCAN二次聚类方法的负荷类别结果和所得负荷记录综合相似度,匹配相似度最大的数据类别,并依据该类别的记录信息对所缺失数据进行修补;最后,采用算例分析证明所提方法的有效性和正确性。

    用电信息采集系统、自动化技术等在配电网的应用,为智能配电网运用大数据技术解决各种问题提供了路径。但是在电力数据的采集、传输及存储过程中常常会出现数据缺失、数据异常等质量问题,这些异常数据的存在使配电网的运行、调度、分析实验等工作受到潜在的影响。因此,如何对这些数据进行修复成为当前研究的一个重要热点问题。

    事实上,针对缺失数据的处理技术广泛存在于各行各业之中,缺失数据处理工作随着各个领域特征的不同,以及数据应用目的的不同可采用多种方法。实际处理时,往往根据缺失数据的特征属性、数据处理需要达到的目的、数据缺失的具体原因等选择最佳的处理方法以求达到最好的效果。

    配电网负荷数据往往存在时空特征明显、数据的规律性较强、数据在电力系统规划、调度、运行等各个环节的应用面较广等特征,所以需要对缺失的数据进行较为精准的填充和修补。

    针对配电网负荷数据具有时间规律的特点,对缺失数据的填充修补主要分为三种类型:

    ①采用构造映射的方法,根据数据规律的相似性,构造已有数据对缺失数据的映射进行修补;

    ②采用多重填补的方法,通过构造或者模拟影响其变动规律的相关因素的运动轨迹,推断出缺失数据的可能范围,再进一步通过统计、综合分析等方法从中优选最匹配结果;

    ③采用机器学习的方法,在海量数据集中进行数据集的聚类分析,通过去噪、压缩感知等方法匹配与缺失数据所属数据集最为接近的特征,从而完成对缺失数据的填补。

    在配电网负荷数据有较多积累的现状下,采用聚类分析,并按照特征匹配的方法填补缺失数据已成为针对具有时间特性规律数据的一种广泛而有效的方法。针对电力负荷数据,主要采用的聚类方法包括最近邻加权聚类、K均值聚类、熵权聚类等多种分析方法,这些方法的基本思想均为先将数据对象聚类,划分成多个簇,根据簇内相似对象对缺失数据进行修补。

    其中,基于密度的含噪声应用空间聚类(density-based spatial clustering of applications with noise, DBSCAN)方法对数据集的分布不敏感,抗噪性好,且对于数据集的识别能力较强,针对空间分布较为广泛的配电网负荷数据聚类具有较好的适应性,但该方法在处理大量庞杂数据时的计算速度还有待进一步提高。

    基于上述背景,内蒙古电力经济研究院的研究人员依据配电网负荷数据的时序特性,提出一种改进的DBSCAN二次聚类方法对配电网负荷缺失数据进行修补。

    内蒙古电力经济研究院专家提出配电网负荷缺失数据的修补方法

    图1 数据修补算法流程

    首先依据负荷数据长周期特征的关键指标,提取每一个数据记录的关键信息,针对缩减的数据集进行初步聚类,然后在初步聚类的基础上针对完整数据再次进行DBSCAN空间密度二次聚类,以利于缩短由于庞大数据集而延长的聚类时间。其次通过负荷数据的数值属性相似度和记录值相似度比较,以相似度最大为原则、以同类数据属性相同为原则修复缺失的负荷数据。最后将仿真结果与实测数据进行对比,验证所提方法对配电网负荷数据修复的有效性和准确性。

    内蒙古电力经济研究院专家提出配电网负荷缺失数据的修补方法

    图2 本方法对缺失负荷曲线的修补结果

    研究人员最后得出如下结论:

    1)在针对配电网负荷数据进行缺失数据修补时,DBSCAN二次聚类算法可以较好地依据负荷特性对负荷数据进行修补,且修补效果较好。

    2)改进的DBSCAN二次聚类算法,通过首先按照长时间周期特征对数据进行初步聚类形成子集,再在每一个子集内按照短时间周期二次聚类的方法,有效提高了聚类算法的计算速度。

    3)算例分析结果表明,DBSCAN二次聚类算法进行数据修补有更高的准确度,且针对连续性数据缺失也能取得较好的修补效果。

    后续研究还需要重点结合两方面问题进行考虑:一是两次DBSCAN聚类中,参数Eps和MinPts大小的适度配合,尤其是面向更大量数据的时候,两者的相互配合直接关系到计算速度的提升幅度;二是负荷记录综合相似度包含多种负荷属性特征,针对不同类型的数据修补问题,各权重大小如何取值才能取得更好的数据修补效果。

    本文编自2021年第12期《电气技术》,论文标题为“基于DBSCAN二次聚类的配电网负荷缺失数据修补”,作者为蔡文斌、程晓磊 等。