Краткосрочное прогнозирование цен на российском оптовом рынке электроэнергии на основе нейронных сетей |
Статьи - Анализ | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Золотова И.Ю. Рынок электроэнергии в Российской Федерации представляет собой систему взаимоотношений между его участниками по поводу обращения (купли-продажи) двух товаров: электрической энергии и мощности. При этом цена на электрическую энергию определяется стоимостью топлива, сжигаемого на электростанциях (переменная составляющая). Стоимость электрической мощности, формируется исходя из условия компенсации условно-постоянных затрат энергетических компаний. Потребитель, оплачивая потребляемый фактический объем электроэнергии, дополнительно несет обязательства по оплате электрической мощности за готовность электрогенерирующего объекта выполнить требуемую нагрузку. Ниже рассматривается одна из составляющих системы цен в электроэнергетике -свободная оптовая цена электрической энергии, формируемая на так называемом «рынке на сутки вперед» (далее - РСВ)2, которая в большей степени (по сравнению с другими ценовыми параметрами) подвержена волатильности под влиянием как циклических (например, сезонности), так и стохастических факторов. На рынке РСВ действует маржинальный принцип ценообразования. Потребители и поставщики электрической энергии подают заявки, включающие предложения участников по объему и ценам приобретения (поставки) электрической энергии. Отбор заявок осуществляется, исходя из условия минимизации затрат (цены) покупателей электроэнергии, т.е. первоначально отбираются предложения поставщиков электрической энергии (электростанций) с наименьшей ценой, затем рассматриваются следующие по возрастанию ценовые предложения пока спрос на электроэнергию не будет удовлетворен (обеспечен предложением) полностью. Цена последней заявки поставщика, «замкнувшая» предложение, и будет являться ценой РСВ, по которой электрическая энергия реализуется всеми поставщиками3. Волатильность цен на электроэнергию и непредсказуемость условий, в которых предстоит функционировать участникам энергорынка в будущих периодах, существенно затрудняют принятие ими управленческих решений4. Таким образом, формирование прогноза цен в электроэнергетике, а главное - повышение его точности, является актуальной задачей развития экономических отношений на перспективу. Модели краткосрочного прогнозирования цен в электроэнергетикеПервая группа прогнозных моделей - модели на основе теории игр. Для моделирования рыночной конъюнктуры в электроэнергетике используются модели равновесия по Нэшу, модель Курно, модель Бертрана и др. [1]. Ко второй группе моделей относят так называемые имитационные, или фундаментальные модели. Прогнозное значение цены на электроэнергию определяется по результатам аукциона для рассматриваемой зоны энергосистемы. С учетом того, что эти модели требуют большого объема исходных данных, их использование для краткосрочного прогнозирования ограничено. Третья группа прогнозных моделей основывается на анализе временных рядов, в котором используется совокупность математико-статистических методов, предназначенных для выявления структуры временных рядов, изучения исторической динамики исследуемых показателей и экстраполяции их на перспективу. В данной группе прогнозных моделей выделяют две подгруппы: традиционные статистические модели и модели искусственного интеллекта. Представителями моделей искусственного интеллекта являются прогнозные модели на основе нейронных сетей. В отличие от традиционных статистических моделей, которые по существу являются линейными, модели искусственного интеллекта позволяют учесть сложную нелинейную взаимосвязь между зависимой и объясняющими переменными. Последнее связано с архитектурой таких моделей, повторяющих устройство головного мозга человека. Использование данных моделей позволяет ассоциировать исследуемый показатель (цена на электроэнергию) с набором различных факторов (не только исторических значений) и экстраполировать его значение на перспективу5. Рассматриваемая нами разработка модели прогнозирования цен на электроэнергию на РСВ учитывает строго детерминированные на прогнозный период факторы с шагом прогнозирования, равным часу, и горизонтом прогнозирования в один месяц. Данная задача может быть реализована с использованием моделей нейронных сетей. При этом необходимым условием (критерием) ее применимости на практике (например, для решения бизнес-задач) является обеспечение высокой точности прогнозирования6, т.е. способность модели допускать низкие средние ошибки прогнозирования и предугадывать существенные отклонения цены в отдельные моменты времени («аномалии»). Прогнозирование на основе нейроннъх сетейИскусственная нейронная сеть (Artificial neural network - ANN) представляет собой математическую модель, принцип которой соответствует принципу функционирования биологических нейронных сетей. Основными элементами модели ANN являются искусственные нейроны (простейшие процессоры), способные посылать выходной сигнал, полученный путем обработки набора входных сигналов. Важный этап прогнозирования на базе ANN - так называемый процесс обучения сети, который заключается в определении и «подгонке» весов каждого сигнала на входе нейрона таким образом, чтобы значение на выходе из сети максимально соответствовало целевому (фактическому) значению. Другими словами, обучение представляет собой процесс решения оптимизационной задачи по минимизации ошибки между значениями целевого (фактического) параметра и выходного параметра сети. Самым известным и наиболее распространенным видом ANN является многослойный персептрон (multilayer perceptron - MLP) [4]. Структурно такая сеть состоит из трех основных слоев:
MLP является сетью прямого распространения, т.е. входной сигнал распространяется от слоя к слою сети в прямом направлении. При этом нейроны во втором и третьем слоях могут быть связаны одним и тем же набором входных сигналов, но не связаны друг с другом. Необходимо отметить, что параметры сети напрямую зависят от сложности поставленной задачи, т. е. не существует однозначных параметров ANN (включая их количество) для решения различных задач [5]. Для определения количества нейронов сети используют следующие основные принципы. Число нейронов во входном и выходном слоях соответствует количеству исходных данных и целевых (искомых) параметров соответственно. Число нейронов в скрытом слое, как правило, определяется экспериментальным путем. При этом важно понимать, что наличие только одного скрытого нейрона в ряде задач прогнозирования может привести к высокой ошибке прогноза, а слишком большое число таких нейронов значительно увеличивает время вычислений без адекватного повышения качества прогнозирования (другими словами, можно достигнуть эквивалентного результата прогнозирования при использовании меньшего числа нейронов). Более того, слишком большие модели ANN подвержены переобучению7 [6]. Способ обработки входящих сигналов описывается так называемыми функциями активации нейронов. В большинстве прикладных задач в прогнозировании для скрытого слоя ANN используется сигмоидальная активирующая функция, для выходного -простая линейная функция [7]. В использовании моделей ANN для решения задач прогнозирования можно выделить следующие этапы:
Важно подчеркнуть, что на этапе собственно прогнозирования известны только входные параметры, подача которых на вход сети позволяет получить прогнозные значения анализируемого параметра. Адекватность результатов прогноза оценивается на основе расчета средней абсолютной ошибки (Mean absolute error - MAE) и аналогичного показателя в процентах (Mean absolute percentage error - MAPE) [9]. Формирование модели прогноза цен на электроэнергию на рынке РСВВ целях реализации поставленной задачи рассмотрим ANN с одним скрытым слоем. Число нейронов во входном слое соответствует 6-ти входным параметрам. При этом важно, чтобы все рассматриваемые входные параметры были строго детерминированы (заранее четко, без погрешности определены). Число нейронов в скрытом слое получено эмпирическим путем и равно 8-ми. В ходе работы было проведено 30 итераций, т.е. число скрытых нейронов варьировалось от 1 до 30. Наименьшую ошибку прогноза показала модель с 8-ю скрытыми нейронами. В рассматриваемой сети только один выходной нейрон - прогнозный уровень цены на электроэнергию на РСВ. Для обработки входных сигналов приняты сигмоидальная и линейная функции активации для скрытого и выходного слоев соответственно. Обучение сети происходит путем решения оптимизационной задачи с использованием алгоритма Левенберга-Марквардта, комбинации метода Ньютона и градиентного спуска [10]. Оценка обучения сети проводится на основе соответствия целевых и полученных выходных значений R2 и характера распределения ошибки [11]. В качестве исходных данных (фактических значений целевого показателя) принята почасовая динамика индекса равновесных цен (цена РСВ)8 первой ценовой зоны оптового рынка электроэнергии и мощности (ОРЭМ)9 за период с сентября 2006 по октябрь 2012 г., всего 53 904 наблюдения (рис. 2) [12]. Каждому значению индекса цены РСВ соответствуют шесть рассматриваемых в модели входных параметров:
При этом первые два параметра относятся к историческим значениям цены на электроэнергию на РСВ, остальные - к сезонным факторам, отражающим специфику рынка электроэнергии10. Кроме того, первые два параметра включены в модель в качестве входных параметров. Обоснованность рассмотрения их в качестве входных параметров подтверждается наличием выявленной высокой автокорреляцией часовых значений цен на электроэнергию РСВ и соответствующих показателей. На представленной на рис. 3 коррелограмме анализируемого временного ряда с числом лагов 744 (количество часов в месяце) наибольшую корреляцию демонстрируют значения цены в предшествующий час суток (1-й лаг, автокорреляция первого порядка) и в аналогичный час на предшествующей неделе (168-й лаг). При формировании прогнозной модели цен на электроэнергию также были учтены отраслевые показатели (входные параметры), влияющие на уровень цен на рынке, при этом строго детерминированные на перспективу: час суток11, день недели, признак «рабочий (выходной) день». Диаграммы рассеивания наблюдений индекса цен РСВ в соответствии с указанными характеристиками показаны на рис. 4. Цена электроэнергии на РСВ в дневные часы выше по сравнению с ночным периодом, аналогично можно отметить превышение цены РСВ в рабочие дни над данным показателем в праздничные и выходные дни. Соответствующая тенденция наблюдается и для значений стандартного отклонения: в ночные часы, выходные и праздничные дни стандартное отклонение в основном ниже, чем в дневные часы и рабочие дни. Данный факт связан с ростом объема потребления электроэнергии (спроса) в дневные часы по сравнению с ночным периодом и аналогично - в рабочие дни по сравнению с выходными и праздничными днями. Последнее в большей мере связано с графиком нагрузки (работы) крупных промышленных потребителей. В условиях маржинального ценообразования на рынке электроэнергии для покрытия большего спроса необходимо «задействовать» более дорогую генерирующую мощность, что и приводит к отмечаемому росту цены РСВ. Стоит отметить, что спецификация прогнозной модели цен РСВ с включением отдельно двух бинарных переменных, относящих операционные сутки к выходному или рабочему дням, показала лучшую прогнозирующую способность. Данный факт можно объяснить большей степенью ассоциированности входных и выходного параметров рассматриваемой модели. В связи с отсутствием статистических данных по таким специфическим параметрам, как нагрузка сети, температура наружного воздуха, состав включенного генерирующего оборудования, водность рек (отражающим особенность функционирования рынка электроэнергии и влияющих на точность учета сезонности), а также в связи с невозможностью строго детерминировать данные факторы на перспективу соответствующие показатели не были учтены при формировании модели. Анализ фактических данных о ценах РСВ показал различную динамику цены на электроэнергию в зависимости от времени года12 (рис. 5). Таким образом, с целью оценки возможности применения прогнозной модели цен РСВ на практике в рамках данной работы рассмотрена дополнительная характеристика (дополнительный косвенный фактор - сезон), с учетом которой построены четыре прогнозных модели (в качестве характерных данных приняты значения цен за второй (средний) месяц каждого сезона: январь, апрель, июль, октябрь). Относительно исходных данных по уровням цен РСВ необходимо отметить следующее. Фактические данные, предшествующие месяцу прогноза, использовались для построения прогнозной модели, а данные за месяц, соответствующий прогнозному периоду, использовались для оценки адекватности результатов прогноза. Так, при прогнозировании почасовой динамики цены РСВ на октябрь 2012 г. данные за сентябрь 2006 г. - сентябрь 2012 г. были приняты для построения модели, а фактические данные за октябрь 2012 г. - для оценки точности (корректности) прогнозных значений. Для построения моделей использовался программный комплекс Matlab R2013b. Распределение наблюдений в соответствии с методологией прогнозирования на базе ANN приведено в табл. 1. В каждом из четырех случаев наблюдений обучения сети 70% выборки, предшествующей прогнозному периоду, отводилось на обучение сети и по 15% - на кросс-тестирование и итоговое тестирование. Таблица 1 Распределение наблюдений для обучения прогнозной модели ANN, количество наблюдений
Распределение наблюдений для каждого шага построения модели проводилось с точки зрения обеспечения достаточности информации для максимальной ассоциированности рассматриваемых факторов и цены на электроэнергию, а также для предотвращения эффекта переобучения сети. В данном случае распределение выборки на обучение в размере 70% не привело к ситуации, при которой ошибка на каждой итерации обучения уменьшается с одновременным ее ростом на стадии кросс-тестировании, т.е. не наблюдаются переобучение сети и потери способности модели качественно обобщать информацию (прогнозировать). Результаты тестирования обученной модели обусловлены высоким качеством предлагаемой ANN (табл. 2). Для фактических данных и выходных данных сети на тестовой выборке были рассчитаны коэффициенты детерминации R2. Их значения для каждой из четырех моделей близки к единице, что говорит о высоком качестве «подгонки» весов нейронной сети и, следовательно, способности сети обобщать информацию. Таблица 2 Результаты тестирования обученной ANN
Для оценки характера распределения ошибки между фактическими данными и выходными данными на этапе обучения был проведен тест Колмогорова - Смирнова. Распределение ошибок носит нормальный характер, поскольку для каждой из моделей статистическая значимость выше порогового значения 0,05 (ниже которого высока вероятность отклонения от нормального распределения). Руководствуясь правилом трех сигм, согласно которому 99,73% ошибок попадает в соответствующий диапазон (-3о; 3о), для каждой модели были определены интервальные значения ошибки (табл. 3). Таким образом, ожидается, что сформированная модель минимизирует число ошибок прогноза (количество некорректных прогнозных значений). Таблица 3 Интервал попадания ошибки между фактическими и выходными параметрами сети (руб./МВт-ч)
Прогноз цен на электроэнергию на РСВ в первой ценовой зоне оптового рынка на базе сформированной модели ANNКак отмечено выше, предложенная прогнозная модель на базе ANN была применена для прогнозирования месячной почасовой динамики индекса цен РСВ первой ценовой зоны ОРЭМ в 2012 г. в соответствующие периоды (сезонные месяцы). Проверка адекватности прогнозирования цен на электроэнергию выполнена путем сравнения теоретических значений (полученных на модели) и соответствующих фактических данных. Результаты выполненных расчетов - значения ошибок прогноза цены РСВ в различные сезоны на месячном горизонте (с шагом «неделя»), а также данные по числу «аномальных» значений цен - значительных отклонений фактической цены РСВ от средних значений приведены в табл. 4. Таблица 4 Ошибка прогноза цены РСВ на горизонте прогнозирования один месяц в различные сезоны 2012 г.
Средние абсолютные ошибки почасового прогноза цен РСВ за рассматриваемые месяцы 2012 г. находятся в пределах 2,48% - 3,41%. Модель позволила спрогнозировать значительные фактические отклонения цены («аномалии»). При этом необходимо отметить, что в точках «аномалии» ошибка прогноза превышает среднюю ошибку за рассматриваемый период. В октябре 2012 г. существенных отклонений цен РСВ не наблюдалось, т.е. модель также предугадала отсутствие «аномалий». Оценка результатов моделированияДля отладки модели прогнозирования были использованы данные почасовой динамики цены РСВ в период с сентября 2006 по октябрь 2012 г. Как отмечено выше, модель показала адекватные результаты при сопоставлении прогнозных и фактических данных за 2012 г. Для оценки возможности применения предложенной модели на практике авторы дополнительно выполнили прогноз цен РСВ на август 2015 г. (на основе данной модели). Результаты моделирования и фактическая почасовая динамика цены РСВ за август 2015 г. показаны на рис. 6. Средняя абсолютная ошибка прогноза составила 39,8 руб./МВт-ч, аналогичный показатель в процентах - 3,81, что может говорить об адекватности и прикладной применимости представленной прогнозной модели цен РСВ. Актуализация выборки (включение в модель дополнительных данных13) для обучения нейронной сети может увеличить точность прогноза цен РСВ на 2015 г. С целью оценки адекватности сформированных прогнозных моделей цен на электроэнергию (и точности выполненных прогнозов) авторами дополнительно были проанализированы некоторые результаты аналогичных исследований рынков электроэнергии зарубежных стран, также характеризующихся высокой волатильностью цен (табл. 5). Сравнение с зарубежными аналогами позволяет сделать вывод о достаточно высоком качестве разработанной модели. Таблица 5 Точность моделей прогнозирования цен на электроэнергию на основе нейронных сетей (примеры)
Рассмотренная модель краткосрочного прогнозирования цен на электроэнергию на РСВ на основе нейронных сетей позволила сформировать с достаточно высокой степенью точности предсказываемые значения цен в условиях волатильности и неопределенности в разные сезоны года. Важным преимуществом модели является включение в нее только строго детерминированных на перспективу показателей при обеспечении качества (минимизации ошибки) прогноза и возможности предсказать существенные отклонения цен РСВ в отдельные часы (точки «аномалии»). Результаты исследования пригодны для использования участниками российского рынка электрической энергии в планировании лучших финансовых результатов своей работы. 1 Исследование выполнено при финансовой поддержке Российского фонда фундаментальных исследований (проект № 16-56-00589 «Моделирование российского рынка электроэнергии в условиях неопределенности: прогнозирование рынка, разработка стратегии участников и оценка риска»). 2 «Рынок на сутки вперед» (РСВ) представляет собой проводимый коммерческим оператором рынка (ПАО «АТС») конкурентный отбор ценовых заявок поставщиков и покупателей за сутки до реальной поставки электроэнергии с определением цен и объемов поставки на каждый час суток. Доля РСВ в России составляет 60% в общем объеме оптового рынка электроэнергии и мощности (стоимости реализации рассматриваемых товаров). 3 Данный принцип ценообразования предусматривает разный маржинальный доход электрических станций. 4 С точки зрения теории аукционов действующий механизм отбора заявок на РСВ является закрытым, так как ни покупатели, ни продавцы не знают о содержании ценовых заявок, поданных другими участниками, и не могут заранее предсказать цены и прошедшие на рынок объемы электроэнергии. 5 О применении нейронных сетей к моделированию рынка электроэнергии см. в [2-4]. 6 Конечно, с учетом понимания того, что будущее не может быть точно определено и слишком детальные детерминированные предсказания в экономике невозможны в принципе (это допущение справедливо и будет иметь место при формировании любых прогнозных моделей и использовании различных методов прогнозирования. 7 Процесс, при котором модель достаточно точно обобщает фактическую информацию, но некорректно прогнозирует исследуемый параметр. 8 Индекс цен РСВ в определенный час соответствующих операционных суток представляет собой средневзвешенную величину равновесных узловых цен РСВ, сложившихся по результатам конкурентного отбора ценовых заявок на сутки вперед в данный час. В рамках настоящей статьи авторы под ценой РСВ в определенный час рассматриваемого периода понимают соответствующий индекс цен РСВ. 9 Исходя из технологической структуры генерирующих и сетевых мощностей оптовый рынок электроэнергии и мощности разделен на две ценовые зоны: первая (территории Центра и Урала) и вторая (Сибирь). Первая ценовая зона занимает 76% в общем объеме производства электроэнергии. 10 Неравномерность графика нагрузки в течение суток, зависимость объема спроса на электроэнергию от характеристики дня по признаку «рабочий день или выходной/праздничный» и проч. В условиях маржинального ценообразования на рынке РСВ такие колебания спроса (наряду с другими неценовыми факторами, такими как, график загрузки ТЭЦ, ремонтная компания, водность рек, стратегии поставщиков при подаче заявок) отражаются на уровне цены на электроэнергию на рынке. 11 В соответствии с действующими правилами рынка уровень цены РСВ определяется по итогам аукционов на каждый час операционных суток. 12 На дифференциацию уровней цен на электроэнергию на РСВ в различные сезоны оказывают влияние такие факторы, как уровень теплофикационной нагрузки ТЭЦ (в отопительный сезон (осень-зима), рост выработки тепла на ТЭЦ приводит к снижению удельных расходов топлива на выработку электроэнергии и в свою очередь — цены), график ремонтов (вывод в летний период в плановый ремонт более эффективного генерирующего оборудования может привести к росту цен РСВ в данный период), водность рек (увеличение водности рек весной приводит к росту выработки электроэнергии на ГЭС и снижению цены РСВ) и проч. 13 Данные о динамике цены РСВ на российском рынке электроэнергии раскрываются на официальном сайте Администратора торговой системы (ПАО «АТС»). На момент проведения исследования и написания статьи доступные актуальные отчетные данные представлены за август 2015 г.. Литература
|