资讯详情

光伏发电量和用电量的概率预测研究综述(2)

前言

??因为这个综述太长,分为三部分,这是第二部分。第一部分:光伏发电和用电概率预测研究综述(1)

目录

  • 3. Forecasting techniques
    • 3.1. Statistical approach
      • 3.1.1. Parametric
      • 3.1.2. Nonparametric
    • 3.2. Physical approach
      • 3.2.1. Parametric
      • 3.2.2. Nonparametric
    • 3.3. Hybrid approach
  • 4. Review sorted on temporal horizon
    • 4.1. Intra-hour
    • 4.2. Intra-day

3. Forecasting techniques

在这里插入图片描述 ??本节介绍了这些具体的预测方法,因为本文主要涉及概率预测。 ??虽然在SPF中间时间序列法(如ARIMA)基于人工智能(AI)方法(如人工神经网络)被认为是统计方法,但在负载预测中,统计方法和基于人工智能的方法通常是有区别的。 ??最后,本文只列出了一些常用的概率预测方法。

3.1. Statistical approach

??以下是参数化和非参数化方法的介绍。

3.1.1. Parametric

3.1.1讲参数化方法。 ??依赖于参数方法,假设密度函数是围绕确定性预测的。通过这些统计方法的确定性预测,如ANN或ARIMA实施众所周知的方法。然而,这些方法超出了本文的范围,感兴趣的读者可以参考[15]、[16]和[26]获取更多信息。本节很短,因为参数方法依赖于确定性模型。但是,为了说明这种方法是如何工作的,David等人[70]提供了合适的例子。他们的模型基于广义自回归条件的异方差(GARCH)模型,估计这个模型有很多方差。假设模型误差正常,然后相应地建模以建立预测间隔。 ??总结:对于统计方法,参数化的体现是ANN或者ARIMA等待,但不在本文的讨论范围内。

表一:

3.1.2. Nonparametric

??3.1.讲非参数法。 回归分位数。 ??从表1可以看出,。这种方法是由的Koenker&&Bassett在1978年引进的[71],他们认为,为了建立非参数方法,一些错误可能会导致偏离这些分布,Koenker和Bassett意识到中位数可以定义为中位数对称定义导致绝对残差最小化的解决方案,从而获得第0位.五个分位数。实际上,QR是基于调查中的每个 τ \tau τ为了创建概率预测,将分位数定义回归模型并将其组合起来。 ??令 X ~ \tilde{X} X~随机响应变量, X X X 为预测变量,令 x ~ \tilde{x} x~和 x x x为随机变量的实现,令 F ( x ~ ∣ X = x ) = P ( X ~ ≤ x ~ ∣ X = x ) F(\tilde{x}|X=x)=P(\tilde{X} \leq \tilde{x}|X=x) F(x~∣X=x)=P(X~≤x~∣X=x)为累积分布函数,则阶数 τ , q τ ( x ) \tau,q_{\tau}(x) τ,qτ​(x)的条件分位数可以定义为: q τ ( x ) = F − 1 ( x ~ ∣ X = x ) = i n f { x ~ ∈ R , F ( x ~ ∣ X = x ) ≥ τ } q_{\tau}(x)=F^{-1}(\tilde{x}|X=x)=inf \{\tilde{x} \in R,F(\tilde{x}|X=x)\geq \tau \} qτ​(x)=F−1(x~∣X=x)=inf{ x~∈R,F(x~∣X=x)≥τ}   其中 τ ∈ [ 0 , 1 ] \tau \in[0, 1] τ∈[0,1]。如前所述,中值可以定义为绝对残差的最小化,它可以通过求解以下最小化问题来推广以获得其他分位数[67]: q τ ( x ) = a r g m i n   E { L τ ( X ~ τ , x ) ∣ X = x } q_{\tau}(x)=argmin\ E\{L{\tau}(\tilde{X}_{\tau}, x)|X=x\} qτ​(x)=argmin E{ Lτ(X~τ​,x)∣X=x}   其中 L τ ( X ~ τ , x ) L{\tau}(\tilde{X}_{\tau}, x) Lτ(X~τ​,x)是式(2.45)中定义的弹球损失函数。值得注意的是,QR也可以用作后处理技术,从点预测技术中获取密度函数。另一个重要的注意事项是,由于每个分位数是独立预测的,因此可能发生分位数交叉,这违反了单调性[72]。 q ~ τ i ( x ) ≤ q ~ τ i + 1 ( x ) ∀   i , . . . , τ   q u a n t i l e s , s o   t h a t   τ i ≤ τ i + 1 \tilde{q}_{\tau_{i}}(x)\leq\tilde{q}_{\tau_{i+1}}(x)\forall\ i,...,\tau\ quantiles,so\ that\ \tau_{i}\leq\tau_{i+1} q~​τi​​(x)≤q~​τi+1​​(x)∀ i,...,τ quantiles,so that τi​≤τi+1​   已经提出了许多方法来规避这种情况,例如单调重新排列或联合估计[72]。感兴趣的读者可参考[71],[73],[67]以获取更多信息。 分位数回归森林。   另一种用于构建非参数密度函数的方法是分位数回归森林(QRFs),它建立在随机森林(RFs)上,这是Breiman在2001年开发的一种回归集成学习方法[74]。QRFs最初由Meinshausen于2006年提出[67],旨在存储有关观测的所有信息,并能够基于该信息构建条件分布,与RF相反,其中只有某个节点中观测值的均值被储存了。   随机森林参考:决策树与随机森林(从入门到精通)   QRF的工作原理如下[67]:首先,与RF类似,生长k个树 T ( θ t ) T(\theta_{t}) T(θt​),其中 θ t \theta_{t} θt​是随机参数向量,它控制着树T和t=1,…,k,的分支的每个分裂点处的变量,与RF的不同之处在于所有信息(而不仅仅是平均值)都存储起来。   对于预测器X的某个实现x来说,下一步是分别为i∈{1,…,n}的每个树和每个观察计算观测值权重 w i ( x , θ t ) w_{i}(x,\theta_{t}) wi​(x,θt​)和 w i ( x ) w_{i}(x) wi​(x)。这些权重定义如下: w i ( x , θ t ) = 1 { X i ∈ R ζ ( x , θ ) } # { j : X j ∈ R ζ x , θ } w i ( x ) = k − 1 ∑ t = 1 k w i ( x , θ t ) w_{i}(x, \theta_{t})=\frac{1\{X_{i}\in R_{\zeta_{(x,\theta)}}\}}{\#\{j:X_{j}\in R_{\zeta_{x,\theta}}\}}\\ w_{i}(x)=k^{-1}\sum_{t=1}^{k}w_{i}(x, \theta_{t}) wi​(x,θt​)=#{ j:Xj​∈Rζx,θ​​}1{ Xi​∈Rζ(x,θ)​​}​wi​(x)=k−1t=1∑k​wi​(x,θt​)   其中Rℓ(x,θ)是空间S的,其中X对于每个叶子ℓ=1,…,L.此外,每个只有一个叶子ℓ因此也是x∈Rℓ,然后可以将其定义为树T(θ)的ℓ(x,θ)。   之后 F ~ ( x ~ ∣ X = x ) \tilde{F}(\tilde{x}|X=x) F~(x~∣X=x)可以插入式(3.1)代替 F ( x ~ ∣ X = x ) F(\tilde{x}|X=x) F(x~∣X=x)来获得分位数 q ~ τ ( x ) \tilde{q}_{\tau}(x) q~​τ​(x)。一旦构建和训练了随机森林,就可以从树上得到来自测试数据集的观察结果,之后将在每个分裂点处对其进行比较并指向最相似分支的方向,随后可以估计输出。从某种意义上说,这可以与最近邻居方法进行比较,本节稍后将对此进行说明。 高斯过程。   在第4节中相对较少的方法是使用高斯过程(GP),在Rasmussen和Williams[75]的书中广泛讨论。这种非参数和概率方法基于贝叶斯定理,其定义如下: p ( θ ∣ y ) = p ( θ , y ) p ( y ) = p ( y ∣ θ ) p ( θ ) p ( y ) p(\theta|y)=\frac{p(\theta,y)}{p(y)}=\frac{p(y|\theta)p(\theta)}{p(y)} p(θ∣y)=p(y)p(θ,y)​=p(y)p(y∣θ)p(θ)​   这里 θ \theta θ是一组未知参数,y={y1,…,yn},p(y|θ)表示给定模型参数θ在数据y上的PDF,p(θ)是先验,表示对模型参数的先验信念参数和p(θ|y)后验分布,是我们观察y后p(θ)的更新版本。换句话说,目的是在观察新数据时更新我们对先验的信念。以这种方式,可以以概率方式学习参数θ,其中PDF表示伴随这些参数的不确定性。   GP的定义表明它是随机变量的集合,并且这些随机变量的任何子集都具有联合多元高斯分布,其具有均值μ和协方差矩阵K[75]。更直观地,可以想象GP是某个函数f的表示,例如,观察x1和x2,生成输出f(x1)和f(x2),然后假设它们是根据N(μ,K)的联合高斯分布。然而,这不必限于两个观察,因此我们可以将该概念扩展到任意数量的输入x={x1,…,xn},使得协方差矩阵K可以定义为[76]:   其中 k ( x i , x j ) k(x_{i},x_{j}) k(xi​,xj​)是协方差函数或内核,表示任何输入x之间的相关性。有关内核的更多信息,请参阅[75]。另外,我们可以将平均函数定义为μ(x),以便多元高斯分布相当于:   在进行新观察的情况下,例如x*,可以首先通过定义新的联合分布来计算后验分布。 随后,我们可以根据计算后验分布   有关使用GP进行多步预测的更多信息,感兴趣的读者可参考Girard等人[77]的文章。同样,感兴趣的读者可以参考Roberts等人[76]有关时间序列建模情况下GP的更多信息。 自举法。   自举法由Efron[78]在1979年提出,作为一种从随机样本 X = ( X 1 , X 2 , … , X n ) X=(X_{1},X_{2},…,X_{n}) X=(X1​,X2​,…,Xn​)中估计随机变量R(X,F)的概率分布的方法,这些随机样本来自一个未知的父分布F。由于其简单性,自举方法在许多研究领域得到

标签: lorenz力传感器k

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台