亚洲天堂1区在线|久久久综合国产剧情中文|午夜国产精品无套|中文字幕一二三四区|人人操人人干人人草|一区二区免费漫画|亚洲一区二区a|91五月天在线观看|9丨精品性视频亚洲一二三区视频|国产香蕉免费素人在线二区

中國儲能網(wǎng)歡迎您!
當前位置: 首頁 >新聞動態(tài)>零碳園區(qū)與零碳電網(wǎng) 返回

直流微電網(wǎng)協(xié)調均流和電壓恢復的分布式強化學習算法

作者:中國儲能網(wǎng)新聞中心 來源:電力系統(tǒng)自動化 發(fā)布時間:2018-07-18 瀏覽:次

中國儲能網(wǎng)訊:

該文為國家重點研發(fā)計劃資助項目成果,2018年3月發(fā)表于MPCE 2018年第6卷第2期。

引文信息:

Zifa LIU, Ya LUO, Ranqun ZHUO, et al. Distributed reinforcement learning to coordinate current sharing and voltage restoration for islanded DC microgrid[J]. Journal of Modern Power Systems and Clean Energy, 2018, 6(2): 364-374

Distributed reinforcement learning to coordinate current sharing and voltage restoration for islanded DC microgrid

直流微電網(wǎng)協(xié)調均流和電壓恢復的分布式強化學習算法

DOI:10.1007/s40565-017-0323-y

作者:劉自發(fā),羅婭,卓然群,靳現(xiàn)林

由于電力系統(tǒng)直流電源和直流負載的比例增加,直流微電網(wǎng)受到的關注日益增多。直流微電網(wǎng)無需變流器進行交直流轉換,減少了變換時的電能損耗,可避免在交流微電網(wǎng)中常發(fā)生的問題, 例如同步和諧波污染等;且直流電網(wǎng)中不需要無功補償,電能質量和可靠性也得到了提高。因此,直流微電網(wǎng)控制與管理成為目前國內外學者研究的熱點。為獲得快速準確的控制效果,直流微電網(wǎng)普遍采用分布式分層下垂控制。然而直流微電網(wǎng)的均流和電壓恢復兩個重要控制目標之間存在矛盾。強化學習算法是一種直接與環(huán)境交互的學習算法, 計算條件要求低、計算過程簡單、能避免陷入局部收斂,是協(xié)調直流微電網(wǎng)均流和電壓恢復之間矛盾的有效方法。

1、直流微電網(wǎng)的分層協(xié)同控制方案

典型直流微電網(wǎng)控制策略分為兩層:1)一次控制,采用下垂控制模式,控制目標為快速響應并維持系統(tǒng)的穩(wěn)定性;2)二次控制,控制目標為電壓恢復并以合理比例進行負荷分配。與交流微電網(wǎng)不同,直流微電網(wǎng)中下垂控制要預定義電壓和電流的關系,為解決分布式控制方式可能導致穩(wěn)態(tài)偏差和分布式電源(DG)間通信缺失的問題,二次控制中參考電壓控制變化量分成兩部分:1)電流調整分量,旨在實現(xiàn)比例功率調度;2)電壓調整分量旨在校正電壓偏差。基于牽制控制的分布式一致法可離散方程表示,描述了迭代過程中每個代理(agent)狀態(tài)變量的變化,其變化規(guī)律與相鄰代理間的聯(lián)通系數(shù)、牽制增益和牽制一致預設值有關。其中,由一種自適應更新法修正聯(lián)通系數(shù),在滿足即插即用條件下計算定義智能體總數(shù);牽制一致預設值由分布式一致法計算得出?;跔恐瓶刂频闹绷魑㈦娋W(wǎng)系統(tǒng)的一致性過程可由所有代理狀態(tài)方程構成的矩陣表示,并利用李雅普諾夫函數(shù)證明了所用分布式一致法的穩(wěn)定性。

2、基于分布式強化學習法的直流微電網(wǎng)控制策略

本文提出的分布式強化學習(DRL)方案可以在發(fā)生擾動時瞬間響應, 實現(xiàn)分布式?jīng)Q策和協(xié)同恢復。DRL 是一種簡單的迭代算法, 通過探索未知環(huán)境得到的獎勵來獲得最佳動作, 可用于提高控制特性。在 DRL 過程中, 該解決方案根據(jù)相應的獎勵信號更新其性能。因此, 每個智能體都可以優(yōu)化其相連電源、儲能和負荷的控制方案, 而其解集中的某些元素可以傳遞給其他智能體以達到共享解決方案。DRL基本控制結構如圖1所示。

圖1 DRL基本控制結構

針對DRL算法難以尋求全局獎勵函數(shù)的問題,本文利用分布式一致法分別計算均流技術比例系數(shù)以及和均流控制協(xié)同的電壓恢復,獲得局部獎勵函數(shù),局部獎勵函數(shù)之和為全局獎勵函數(shù)。具體流程為:1)根據(jù)直流微電網(wǎng)的等比例均流和電壓恢復的要求,獲得每個代理的局部獎勵函數(shù)和相應的電流比例系數(shù)以及電壓控制調整量;2)計算整個直流微電網(wǎng)的全局獎勵函數(shù)最大值,即DRL的優(yōu)化目標;3)分布式一致法來求解優(yōu)化問題;4)獲得DRL最優(yōu)解, 通過全局獎勵的同步過程,實現(xiàn)了直流微電網(wǎng)的協(xié)同比例電流共享和電壓恢復??刂剖疽鈭D如圖2所示。

圖2 控制示意圖

3、DRL控制協(xié)調均流和電壓恢復效果分析

本文所用的創(chuàng)新DRL 策略結合牽制控制和基于強化學習的分布式一致法的優(yōu)點,對孤島微電網(wǎng)進行快速有效的控制。所提出的分布式一致法可用于發(fā)現(xiàn)全局信息, 實現(xiàn)牽制同步, 也可以滿足通信網(wǎng)絡中變化要求,例如通信線路開關或代理即插即用操作。利用基于局部和全局獎勵的DRL 可求解全局獎勵最大值, 并為獲得 直流微電網(wǎng)最佳控制方案。因此, 所提出的策略可以協(xié)調自治直流微電網(wǎng)的等比例均流和電壓恢復。為了分析所提出的 DRL 的有效性和適應性, 在PSCAD/EMTDC 平臺上模擬了一個典型的含5個分布式電源機組的直流微電網(wǎng)控制系統(tǒng)。其配置如圖3所示。

圖3 直流微電網(wǎng)控制系統(tǒng)配置

在 MATLAB 中編寫了 DRL算法,包括局部獎勵的計算、分布式一致法信息共享以及基于牽制控制的分布式一致法。將PSCAD模型和 MATLAB 程序通過基于 Fortran 語言的接口程序連接在一起, 說明模擬直流微電網(wǎng)的通信拓撲結構。對三種典型場景進行仿真,包括“過負荷”、“過負荷+增加一個新的通信鏈路”和“ 過負荷+一個DG代理的退出”,結果表明,無論在過負荷還是過負荷同時發(fā)生通信鏈路的改變,系統(tǒng)中每個代理的均流比例系數(shù)均能收斂到同一值,電壓水平也能跟隨電流控制量靈活調整到一個新的協(xié)同狀態(tài)。以場景3“過負荷+一個DG代理的退出”為例,結果如圖4所示。由圖可見,每個DG的均流比例系數(shù)和局部獎勵值均收斂到相同值,均流效果協(xié)同電壓恢復效果很好,證明了所用方法的有效性和優(yōu)越性,即 DRL 控制策略在每種情況下都能快速有效地工作。

圖4仿真結果

作者介紹

劉自發(fā):博士,華北電力大學電氣與電子工程學院教授,主要研究方向包括電網(wǎng)規(guī)劃、新能源并網(wǎng)技術、分布式發(fā)電技術和綜合評估。

羅婭:華北電力大學碩士研究生,主要研究方向包括電網(wǎng)規(guī)劃、風電場并網(wǎng)技術。

卓然群: 華北電力大學碩士研究生,主要研究方向包括電網(wǎng)規(guī)劃、可再生能源發(fā)電分析。

靳現(xiàn)林:碩士,高級工程師,主要研究方向包括風電場運行管理工作。

分享到:

關鍵字:直流微電網(wǎng)

中國儲能網(wǎng)版權說明:

1、凡注明來源為“中國儲能網(wǎng):xxx(署名)”,除與中國儲能網(wǎng)簽署內容授權協(xié)議的網(wǎng)站外,未經(jīng)本網(wǎng)授權,任何單位及個人不得轉載、摘編或以其它方式使用上述作品。

2、凡本網(wǎng)注明“來源:xxx(非中國儲能網(wǎng))”的作品,均轉載與其他媒體,目的在于傳播更多信息,但并不代表中國儲能網(wǎng)贊同其觀點、立場或證實其描述。其他媒體如需轉載,請與稿件來源方聯(lián)系,如產(chǎn)生任何版權問題與本網(wǎng)無關。

3、如因作品內容、版權以及引用的圖片(或配圖)內容僅供參考,如有涉及版權問題,可聯(lián)系我們直接刪除處理。請在30日內進行。

4、有關作品版權事宜請聯(lián)系:13661266197、 郵箱:ly83518@126.com