当前位置: 首页 » 风电资讯 » 风电百科 » 正文

风电数据处理领域,置信等效功率曲线带的风电建模及性能评估方法

放大字体  缩小字体 发布日期:2023-02-17   来源:风电叶片   作者:风电塔筒   浏览次数:134
核心提示:风电并网装机容量快速发展,规模化风电难以消纳,风资源的间歇性和随机性特点引起弃风限电现象严重。此外,风电数据采集、传输及存储过程中难免出现误差,包含大量异常数据会使其概率分布失真,难以正确表征风机真实运行特性,将严重影响到基于风机运行数据的相关应用研究的准确性和可靠性。因此,有必要通过技术手段预处理风机数据,采用一种科学、合理、严谨的方法对风电功率数据中异常数据进行识别剔除,提高风机数据质量;对于基于数据的风电场理论功率恢复等应用研究,其精度及可靠性将会显著改善;对合理评价风电场/群运行的安全性和经济性、

   

风电并网装机容量快速发展,规模化风电难以消纳,风资源的间歇性和随机性特点引起弃风限电现象严重。
此外,风电数据采集、传输及存储过程中难免出现误差,包含大量异常数据会使其概率分布失真,难以正确表征风机真实运行特性,将严重影响到基于风机运行数据的相关应用研究的准确性和可靠性。
因此,有必要通过技术手段预处理风机数据,采用一种科学、合理、严谨的方法对风电功率数据中异常数据进行识别剔除,提高风机数据质量;对于基于数据的风电场理论功率恢复等应用研究,其精度及可靠性将会显著改善;对合理评价风电场/群运行的安全性和经济性、科学衡量风电消纳情况等具有重大理论和应用指导意义。
而目前尚没有合适的基于置信等效功率曲线带的风机数据清洗模型建立及其性能评估方法。
问题拆分包括:对异常数据样本进行初筛剔除;将风速分为三个区域,采用核密度估计法统计每个区域内风速、功率概率分布情况,得到每个区域的Copula函数;采用最大似然估计法得到对应区域的置信等效功率边界模型;采用分段三次Hermite插值法重构缺失数据,完成原始数据样本的清洗;将置信度带宽比的均值作为模型性能评价指标,采用d折交叉验证的方法对不同区域上下边界模型进行验证,当指标基本稳定在某一定值时,确立不同区域的上下边界模型;采用滚动时间窗方法更新数据,以置信度带宽比的偏离度作为触发条件,超出一定阈值时进行上下边界模型更新。
问题解决针对上述问题,本发明提出一种基于置信等效功率曲线带的风电建模及性能评估方法,包括:步骤1:根据风机运行机理将风机运行分为五个不同的阶段,包括切入阶段、最大风能跟踪阶段、过渡阶段、额定功率阶段和切出阶段,基于风机阶段运行参量统计特征,对不同阶段的异常数据样本进行初筛剔除;步骤2:根据风机运行阶段,将风速分为三个区域,记为区域I、П、Ш,结合步骤1进行异常数据初筛后得到的数据,采用核密度估计法统计每个区域内风速、功率概率分布情况,得到风速-功率的联合概率分布模型,分析其联合分布特性,得到每个区域对应的Copula函数;步骤3:结合步骤2所得到的每个区域对应的Copula函数,采用半参数法,确定风速-功率联合概率分布函数,给定风速累积概率分布取值,得到功率累积概率分布取值的条件概率分布函数,建立每个区域的理论等效功率曲线的置信水平,采用最大似然估计法求出风速、功率的累积概率分布函数,进而得到对应区域的置信等效功率边界模型;步骤4:基于步骤3得到的风速-功率数据上下边界模型对原始数据样本进行数据剔除,然后,采用分段三次Hermite插值法重构缺失数据;步骤5:采用置信度带宽比作为数据清洗质量指标,对区域I、П、Ш,分别采用核密度估计法统计并对比其数据清洗前后的概率分布特性;步骤6:采用3折交叉验证的方法分别对区域I、П、Ш的上下边界模型进行验证,将3折验证过程获取的置信度带宽比的均值作为模型性能评价指标,当指标稳定在某一定值附近时,确立区域I、П、Ш的上下边界模型;步骤7:采用滚动时间窗方法更新数据,并计算区域I、П、Ш时间窗间隔对应的置信度带宽比,以置信度带宽比的偏离度作为触发条件,超出一定阈值时进行区域I、П、Ш上下边界模型更新,重复步骤1-7。
所述步骤1具体包括:风机的运行过程包括五个阶段,分别是:切入阶段:0≤V<Vcut_in,P=0;最大风能跟踪阶段:过渡阶段:额定功率阶段:Vrated≤V<Vcut_out,P=Prated<Pmax;切出阶段:Vcut_out≤V,P=0;其中,V为风机当前运行风速;Vcut_in为运行风机的切入风速(即风机切入阶段最大运行风速);为运行风机的额定转速对应风速(即风机最大风能跟踪阶段最大运行风速);Vrated为运行风机的额定功率对应风速(即风机过渡阶段最大运行风速);Vcut_out为运行风机的切出风速(即风机额定功率阶段最大运行风速);P为风机当前输出功率;为运行风机的额定转速对应输出功率(即风机最大风能跟踪阶段最大输出功率);Prated为运行风机的额定功率;Pmax为运行风机的最大输出功率,分别采集相同时间段下相同采样周期的V、P时间序列,风机运行在切入、切出阶段时,剔除风机输出功率非零的异常数据点;风机运行在最大风能跟踪阶段时,采用风速间隔ε将此风速区间均匀划分为 k个间隔,间隔风速区间表示为Vs min<Vs<Vs max,Vs max=Vcut_in+s·ε (2)其中,Vs为第s个风速间隔内的当前风速;Vs min为第s个风速间隔的最小风速;Vs max为第s个风速间隔的最大风速;s=1,2,…,k,k为自然数;依照风能最大利用率理论,理论最优转速和理论最优输出功率Ptheor分别为:其中,因此,针对不同Vs min<Vs<Vs max风速间隔,代入式(3)、(5)得到各风速间隔内风机最优转速和功率理论值:其中,为第s个风速间隔的风机最小理论最优转速;为第s个风速间隔的风机最大理论最优转速;为第s个风速间隔的风机最小理论最优输出功率;为第s个风速间隔的风机最大理论最优输出功率,按照以上风速间隔划分机制,对不同风速间隔内的异常数据点初筛剔除;风机运行在过渡阶段时,输出功率满足采用风速分段实现精确化剔除,其中,κ′为过渡阶段计及波动性的风机输出功率缩放系数的上限;κ″为过渡阶段计及波动性的风机输出功率缩放系数的下限,风机运行在额定功率阶段时,输出功率满足Prated-γ′≤P≤Prated+γ″≤Pmax,根据此范围区间对超限数据点进行初筛剔除,其中,γ′为额定功率阶段计及波动性的风机输出功率缩放系数的上限;γ″为额定功率阶段计及波动性的风机输出功率缩放系数的下限。
所述步骤1还具体包括:风机运行在最大风能跟踪阶段时,考虑一定湍流强度下风轮转速及功率值的波动性,对得到各区间段内风轮转速和输出功率理论最优值进行缩放:当风机输出功率其中,ξ′为计及波动性的风轮转速缩放系数的上限;ξ″为计及波动性的风轮转速缩放系数的下限;η′为计及波动性的风机输出功率缩放系数的上限;η″为计及波动性的风机输出功率缩放系数的下限。
所述步骤2具体包括:当风机运行于最大风能跟踪阶段时,将此风速段记为区域I,此时,运行风机采用最大风能追踪的控制策略,保持桨距角为0,依据实时风速数据,不断地调整风轮转速,以保证叶轮最佳叶尖比,实现风能最大利用;当风机运行于过渡阶段时,将此风速段记为区域П,此时,运行风机采用恒转速控制策略,通过调节发电机转矩,使风机转速保持基本稳定,实现风机从最大风能跟踪运行状态平稳过渡到额定功率运行状态;当风机运行于额定功率阶段时,将此风速段记为区域Ш,此时,运行风机采用定速变桨控制策略,此过程中风功率受到风轮、发电机及电气转换装置各组件最大负载限制,输出功率被严格限制在机组最大输出功率Pmax;设x1,x2,…,xn是取自一元连续总体的样本,在任意点x处的总体密度函数f(x)的核密度估计定义为:其中,K(·)为核函数;h为窗宽;n为样本总数;xq为第q个样本值,采用上述核密度估计算法分别计算每个运行区域下风速、功率的经验概率分布,在此基础上得到风速-功率的联合概率分布模型,进而依据联合概率分布特性分别判断区域I、П、Ш内风速-功率的联合相关结构,选取每个区域对应的 Copula函数。
所述步骤3具体包括:步骤31:基于Copula理论分别构造风速-功率联合概率分布函数C(FP(p), FV(v)),采用半参数法拟合未知参数ψ,确定风速-功率联合分布函数C(FP(p), FV(v)),给定风速累积概率分布取值,得到功率累积概率分布取值的条件概率分布函数F(FP(p)|FV(v))为:其中,v、p为区域I、П、Ш风速、功率的取值;FV(v)、FP(p)分别为区域I、П、Ш上整体风速、功率的累积概率分布函数;C表示由唯一Copula函数连接起来的V-P联合分布函数;F表示风速累积概率分布取值条件下的功率累积概率分布;步骤32:依次设区域I、П、Ш的理论等效功率曲线的置信水平1-βi,i=1, 2,3,在确定输出功率置信区间上下界时采用非对称概率区间,并且在各个区域段内采用均匀划分m个间隔来实现风功率异常数据的精细化剔除,当第i区域的显著性水平为βi时,第i区域第j段的置信区间上下界的分位概率β′ij、β″ij,以及置信区间不对称系数为κij分别为:κij=κi-min+li(κi-min-κi-max) (8)β′ij=κijβi (9)β″ij=1-(1-κij)βi (10)其中,κi-min为第i区域的不对称系数的最小值;κi-max为第i区域的不对称系数的最大值;li为第i区域的不对称系数的变化率;j=1,2,…,m;步骤33:分别在风速区域I、П、Ш上,利用最大似然估计法分别求出风速整体累积概率分布函数FV(v,θ1)中的参数θ1和第j段上功率累积概率分布函数中的参数当测量风速v取值已知时,设条件概率分布F(FP(p)|FV(v)) 的β′ij、β″ij对应分位点分别为p1、p2,即p1、p2分别对应第j段输出功率累积概率分布的取值,分别对p1、p2求逆,得到在该风速条件下,置信等效功率上下边界值:下边界值上边界值在不同风速区间段内跟随风速值的变化,按照式(11)、(12)依次计算相应取值条件下对应的置信功率上下边界值,分别得到对应于区域I、П、Ш上的置信等效功率边界线。
所述步骤4具体包括:步骤41:采用分段三次Hermite插值进行缺失数据重构,缺失数据分为两种情况:非连续缺失点和连续缺失点,对于非连续缺失点,直接运用缺失点两端的节点,建立三次Hermite插值多项式,填补缺失值;对于连续缺失点,采用分段三次Hermite插值法,由缺失数据段两端节点填补中间的缺失值,将缺失数据分成两段依次填补缺失数据;步骤42:单维度上填补数据所构造插值多项式的方法,对于时间序列x1, x2,…,xn中互异的节点xk,xk+1,给定的函数值f(xg)=yg,f′(xg)=y′g,g=k,k+1,则其存在唯一的Hermite插值多项式H3(x)满足:H3(xg)=yg=f(xg)H′3(xg)=y′g=f′(xg),g=k,k+1 (13)采用基函数法解得:采用上述方法构造的三次Hermite插值多项式在单维度上分别对异常数据剔除后的风速、功率数据进行插值重构。
所述步骤5具体包括:分别对区域I、П、Ш采用核密度估计法统计并对比其处理前后的风速、功率概率分布特性,并计算置信度带宽比χ、偏度ξ、峰度γ性能指标,显著性水平α条件下,对应的置信水平与变量的带宽即置信度带宽比χ为:其中,ΔP为变量的带宽;α为显著性水平,偏度ξ为:峰度γ为:其中,B2、B3、B4分别为样本数据的2阶、3阶、4阶中心矩,置信度带宽比反映数据样本的有效性,其值越大,有效数据占比越大;偏度反映数据样本分布对称特性,其值越接近0,分布越对称;峰度反映数据样本在其峰值附近的集中程度,其值越大,峰值附近越集中。
所述步骤6具体包括:将原始数据样本随机d等分,得到样本量相同的d 子集样本,每一个子集均作为1次校验集,剩余d-1个子集作为训练集,进行d 次训练,并分别对应三个校验集求取处理后的置信度带宽比χ1、χ2、…、χd,其均值χaver为:其中,d为不小于3的自然数。
多次随机等分样本,当χaver稳定在某一定值附近时,确立不同区间的上下边界模型。
所述步骤7具体包括:在线实时处理风机数据时,设定时间间隔T,按照步骤5所述方式计算该时间间隔对应的数据处理后的置信度带宽比χk,将其与前一时间间隔的置信度带宽比χk-1进行比较,并计算基于k-1段的置信度带宽比的偏离度ηΔχ为:其中,k为按照一定时间间隔划分的第k个间隔;k-1为按照一定时间间隔划分的第k-1个间隔,根据风机实际运行情况及历史异常数据产生量,时间间隔 T的范围在1个月到3个月之间,确保数据清洗质量和效率均达到最佳,以置信度带宽比的偏离度作为触发条件,超出一定阈值时进行上下边界模型更新,重复步骤1-7。
有益效果(1)本发明针对不同型号风机的实际记录输出功率,首先分析其运行特性及进行概率统计分析,定义置信度带宽比等相关性能指标对数据清洗质量进行综合评价,然后采用d折交叉验证方法对数据清洗模型进行校验,最终得到准确、可靠的等效功率边界线模型。
(2)本发明在建立置信等效功率边界线模型的基础上,针对某一型号风机制定模型评估方法、更新准则及机制,实现风速-功率异常数据实时在线的识别剔除,显著提高实时在线风功率预测等相关分析研究准确度和可靠性。

 
关键词: 风电招聘 节能风电
 
[ 风电资讯搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 违规举报 ]  [ 关闭窗口 ]

免责声明:
本网站部分内容来源于合作媒体、企业机构、网友提供和互联网的公开资料等,仅供参考。本网站对站内所有资讯的内容、观点保持中立,不对内容的准确性、可靠性或完整性提供任何明示或暗示的保证。如果有侵权等问题,请及时联系我们,我们将在收到通知后第一时间妥善处理该部分内容。
扫扫二维码用手机关注本条新闻报道也可关注本站官方微信账号:"风电之家",每日获得互联网最前沿资讯,热点产品深度分析!
 
 
0条 [查看全部]  相关评论

 
推荐图文
推荐风电资讯
点击排行