亚洲成在人线在线播放_亚洲精品高清视频_欧美两性网_国产成人综合自拍_九九爱精品_四虎精品免费国产成人_欧美国产韩a在线视频_韩国三级丰满少妇2_欧美一级视频免费_久久免费视频播放,人人爽人人爽人人片AV免费,成人无码h免费动漫在线观看,国产手机在线精品

了解萬里揚(yáng)的最新動(dòng)態(tài)

資訊中心

負(fù)荷特性研究③丨基于赤池法則和距離分析的電力系統(tǒng)負(fù)荷預(yù)測(cè)研究·下篇

 

 

在上篇文章中,,我們確定了電力系統(tǒng)負(fù)荷預(yù)測(cè)對(duì)市場(chǎng)主體的必要性,,并利用多元回歸確立預(yù)測(cè)基本方法。接下來,,我們將引入赤池法則和庫克距離,,提升負(fù)荷預(yù)測(cè)結(jié)果的精準(zhǔn)度。

 

2.2曲徑通幽,,巧用赤池法則有效篩除弱相關(guān)要素

 

赤池法則(Akaike information criterion,,AIC)是衡量和評(píng)價(jià)模型擬合優(yōu)良性的標(biāo)準(zhǔn),被廣泛應(yīng)用于權(quán)衡模型的復(fù)雜度和評(píng)價(jià)模型的擬合優(yōu)良性,。在日本統(tǒng)計(jì)學(xué)家赤池弘次首次提出該法則的論文中,,模型的AIC參數(shù)以如下形式表示。其中L是最大似然函數(shù),,k表示模型回歸關(guān)聯(lián)的變量數(shù)目,。

 

 

那么,這樣一個(gè)“平平無奇”的式子和聽起來較為抽象的最大似然函數(shù)與我們今天探討的模型回歸誤差有什么關(guān)系呢,?根據(jù)大數(shù)定律,,當(dāng)研究樣本足夠多時(shí),我們可以假設(shè)模型回歸的誤差符合高斯分布(正態(tài)分布),。在此前提下,,最大似然函數(shù)取對(duì)數(shù)(以e為底)即等價(jià)于最小平方誤差,L越大意味著模型擬合精度越高,。數(shù)學(xué)功底強(qiáng)大且看到這里不覺技癢的大神可嘗試結(jié)合最大似然估計(jì)的成立條件和誤差的正態(tài)分布表達(dá)式自己推導(dǎo)一下,,而像小編一樣懶于動(dòng)腦的小白只需要記住這個(gè)結(jié)論就可以了。順帶一提,,這個(gè)結(jié)論也是眾多基于損失函數(shù)的機(jī)器學(xué)習(xí)方法的理論基礎(chǔ),。AIC表達(dá)式可近似理解為在模型的擬合準(zhǔn)確度-2ln(L)的基礎(chǔ)上疊加了模型變量數(shù)目的懲罰項(xiàng)2k。容易看出,,在過擬合情況下,,模型擬合精度高但擬合所用變量較多,則L值和K值均會(huì)較大,。在欠擬合的情況下,,模型擬合精度差但所用變量較少,則L值和K值均會(huì)較小,。兩種情況下模型的AIC值均會(huì)較大,。

一般而言,,在回歸模型考慮的變量從少變多的過程中,隨著模型精度提升,,似然函數(shù)L的增速會(huì)先大于k的增速,因此AIC值不斷下降,。但隨著模型復(fù)雜度提升到了一定水平而精度增長(zhǎng)趨緩時(shí),,似然函數(shù)L的增速逐漸小于k的增速,AIC值開始上升,。因此,,對(duì)于若干個(gè)不同變量數(shù)目的同類回歸模型,可以優(yōu)先考慮AIC值最小的模型,,保證模型既具備較高適用性的同時(shí)不失預(yù)測(cè)精確度,。

 

2-3.png 

隨著自變量逐步減少,AIC值呈現(xiàn)“先減后增”的規(guī)律

 

為了降低模型的復(fù)雜度,,避免“維數(shù)災(zāi)”,,我們根據(jù)回歸模型的AIC參數(shù)去篩選關(guān)鍵變量,從第二階段的回歸模型出發(fā),,設(shè)計(jì)了一套精簡(jiǎn)變量的方法,,具體如下:1、將所有的自變量,,包括歷史負(fù)荷和溫度,、風(fēng)力、濕度和天氣條件等天氣信息做最小二乘法擬合,,基于N個(gè)變量得到初始模型A-0(即Case2),,計(jì)算A-0的AIC值A(chǔ)IC1;2,、在A-0的基礎(chǔ)上逐個(gè)刪除變量并做最小二乘擬合,,得到N個(gè)N-1個(gè)變量的模型,分別計(jì)算這些模型的AIC值,,選取AIC值最小的模型作為局部最優(yōu)模型A-1,;3、對(duì)模型A-1重復(fù)步驟2的過程,,直到某一步的局部最優(yōu)模型的AIC值較上一步不再明顯下降,。

上述方法可以求得理論上AIC值最低的模型。但值得注意的是若起始納入考慮擬合的變量過多,,有時(shí)AIC值最低的模型仍擁有較多變量,。因此在實(shí)際應(yīng)用中不必墨守理論最優(yōu)模型方法,可在第3步后繼續(xù)結(jié)合AIC值最低點(diǎn)后上升的速度和模型復(fù)雜度的下降程度選取AIC值較低而擬合變量較少的模型,。

 

 

基于AIC篩選弱相關(guān)變量后模型擬合效果初步提升(Case4)

 

我們?cè)谘芯肯到y(tǒng)負(fù)荷與天氣的相關(guān)性的案例中采取了上述方法,,成功篩選出了對(duì)負(fù)荷影響最大的氣象要素(最高溫度,,最低溫度和天氣狀況)。而且在我們的案例中,,僅采用關(guān)鍵要素去做擬合(Case 3)時(shí)模型精度要優(yōu)于將全部天氣信息一股腦灌進(jìn)回歸模型(Case 2)內(nèi),。這是因?yàn)槟承┡c負(fù)荷弱相關(guān)的變量在某些樣本里波動(dòng)性很大(如沿海城市海區(qū)的風(fēng)力水平受受洋流和氣壓帶影響,天與天之間波動(dòng)頻繁且時(shí)間分布差異較大,,但海上風(fēng)力在正常范圍內(nèi)時(shí)對(duì)城市負(fù)荷幾乎無顯著影響),,從而放大了樣本的方差,造成擬合效果偏差,。確定了和負(fù)荷相關(guān)的強(qiáng)相關(guān)因素后,,為了進(jìn)一步提升模型的精度,我們嘗試加入了更多城市的關(guān)鍵氣象信息(Case 4),,然而盡管模型變得更加復(fù)雜,,但精確度提升效果卻著實(shí)令人失望。這說明了除了氣象因素和歷史負(fù)荷外,,仍有其他關(guān)鍵要素對(duì)負(fù)荷有較大的影響性,。然而,由于這些要素是未知的,,我們難以直接提出明確的方法來識(shí)別這些要素,。因此,我們退而求其次,,參考了一些聚類算法的思想,,設(shè)法篩選要素含量豐富的樣本,再根據(jù)這些樣本的特征進(jìn)行分析,。

 

2.3一石二鳥,,分析庫克距離查異常指明路

 

 

距離常用于衡量樣本之間的差異。在線性回歸中,,庫克距離(Cook's Distance)描述了單個(gè)樣本對(duì)整個(gè)回歸模型的影響程度,。某個(gè)樣本的庫克距離定義為基于所有樣本得到的所有估計(jì)值和未包含該樣本所得的估計(jì)值之間的平均差異。庫克距離測(cè)量了每個(gè)樣本對(duì)回歸結(jié)果的影響,。距離值越大則說明該樣本對(duì)擬合效果的影響越大,。庫克距離也可以用來檢測(cè)異常點(diǎn)。在最理想的情況下,,每個(gè)樣本對(duì)模型的影響是相等的,。如某個(gè)樣本的庫克距離非常大,我們可以視這個(gè)樣本為與整體特性相異的異常點(diǎn),。

 

2-5.png 

研究樣本庫克距離統(tǒng)計(jì)示意

 

通過反復(fù)研究數(shù)據(jù)特征,,我們?cè)诒敬窝芯恐袑?倍于平均距離的樣本作為異常點(diǎn)篩選出來。剔除了這些異常樣本后剩余樣本總體整體特征和數(shù)量仍較為可觀比較一致,,大幅提升了擬合效果(Case 5),。Case 5 的擬合誤差已經(jīng)達(dá)到了0.9347,,意味著對(duì)于特性與樣本特征相近的運(yùn)行日系統(tǒng)運(yùn)行負(fù)荷預(yù)測(cè)已達(dá)較高的準(zhǔn)確度。

 

 

AIC+庫克距離分析后模型擬合效果顯著提升(Case5)

 

此外,,我們還嘗試從庫克距離分析的結(jié)果進(jìn)行事后分析以尋找對(duì)負(fù)荷產(chǎn)生顯著影響的隱藏因素,,從而確定模型的適用范圍。通過對(duì)被篩選出來的運(yùn)行日樣本進(jìn)行了進(jìn)一步的共性特征分析,,我們發(fā)現(xiàn)這些“異常運(yùn)行日”通常分布于法定節(jié)假日結(jié)束后的工作日,、強(qiáng)對(duì)流天氣影響日以及天氣狀況劇烈變化約前后兩天等具有某些特征的時(shí)期。對(duì)這些異常樣本的分析有效加深了我們對(duì)系統(tǒng)負(fù)荷影響因素的進(jìn)一步理解,,并能在實(shí)際負(fù)荷預(yù)測(cè)中意識(shí)到模型的適用范圍,有效降低預(yù)測(cè)失誤率,。

 

3小結(jié)

 

為了幫助市場(chǎng)主體有效分析市場(chǎng)形勢(shì),,萬里揚(yáng)能源科技技術(shù)團(tuán)隊(duì)針對(duì)電力系統(tǒng)負(fù)荷預(yù)測(cè)開展了研究工作。我們旨在刪繁就簡(jiǎn),,為市場(chǎng)用戶設(shè)計(jì)便于應(yīng)用,、易于執(zhí)行、復(fù)制并可自主發(fā)揮的研究手段,。在本文所述的研究案例中,,成功建立了“線性回歸模型+赤池法則篩選弱相關(guān)變量+庫克距離分析篩除異常樣本”的基本分析方法。所用數(shù)據(jù)均基于公有信息,,且取得了較好的擬合效果,。此外,這套方法易于復(fù)制,,其中的回歸,、篩選等方式均可替換為其他算法以進(jìn)一步提升模型的準(zhǔn)確度和適應(yīng)范圍,唯一要注意的是算法之間的協(xié)調(diào)配合關(guān)系,。

本次研究的過程也大大啟發(fā)了我們的思路,,在后續(xù)樣本聚類分析、歸因分析和多時(shí)間尺度精細(xì)化模型應(yīng)用等層面取得了一定進(jìn)展,,并在實(shí)戰(zhàn)中獲得了不錯(cuò)的效果,,有效支持了我們后續(xù)開展市場(chǎng)中長(zhǎng)期的研究分析工作。我們也衷心希望能耐心看到這里的看官對(duì)我們的研究進(jìn)行拓展,,并渴望能一起合作碰撞出更棒的成果,。








微信掃碼辦理電力零售交易業(yè)務(wù)

國網(wǎng)區(qū)域

南網(wǎng)區(qū)域