對電力市場負(fù)荷服務(wù)實體的聯(lián)合投標(biāo)與定價的深度強化學(xué)

來源:科學(xué)技術(shù)處、電力工程系發(fā)布時間:2019-12-13

【講座題目】對電力市場負(fù)荷服務(wù)實體的聯(lián)合投標(biāo)與定價的深度強化學(xué)習(xí)

【講座時間】2019年12月16日(星期一)上午10:30

【講座地點】保定校區(qū) 教一樓 217

【主 講 人】Hongbo Sun,美國三菱電機研究所高級首席研究科學(xué)家

【主講人簡介】

Hongbo Sun,在重慶大學(xué)獲得電氣工程博士學(xué)位,現(xiàn)任美國三菱電機研究所高級首席研究科學(xué)家,在加入三菱電機研究所之前,他曾先后擔(dān)任過重慶大學(xué)的全職教授、Oracle 的首席應(yīng)用工程師、SPL 的技術(shù)架構(gòu)師。他參與編著了一本書籍專著,并發(fā)表 110 余篇論文,并獲得 25 項專利。他的研究方向包括電力系統(tǒng)的運行和控制、電力系統(tǒng)的規(guī)劃和分析、智能電網(wǎng)的應(yīng)用。

【內(nèi)容簡介】

在本次報告中,主講人將對負(fù)荷服務(wù)實體聯(lián)合在電力批發(fā)市場進行能源投標(biāo)和在零售電力市場能源定價的問題進行講解。聯(lián)合投標(biāo)和定價問題被構(gòu)建為具有連續(xù)狀態(tài)和行為空間的馬爾可夫決策過程,其中,能源投標(biāo)和能源定價是兩個具有共同目標(biāo)的行為。應(yīng)用深度確定性策略梯度算法來求解此馬爾可夫決策過程,以獲取最佳的投標(biāo)和定價策略。然而,深度確定性策略梯度算法通常需要大量的狀態(tài)轉(zhuǎn)換樣本,導(dǎo)致很高的計算成本。為此,應(yīng)用神經(jīng)網(wǎng)絡(luò)從歷史數(shù)據(jù)中學(xué)習(xí)動態(tài)報價和價格響應(yīng)函數(shù),去分別構(gòu)建電力批發(fā)市場和終端用戶集體行為的模型。這些響應(yīng)函數(shù)可準(zhǔn)確捕獲批發(fā)電力市場出清結(jié)果與終端用戶的響應(yīng)之間的時間相關(guān)性,并可用于生成狀態(tài)轉(zhuǎn)換樣本,而無需任何計算成本。更重要的是,響應(yīng)函數(shù)還為馬爾科夫決策過程中的狀態(tài)選擇提供了信息。本報告還通過一個算例將說明所提出方法的有效性。

返回