Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Подсистема прогноза снабжения энергетическими ресурсами теплогенераторных станций

ПРОЕКТИРОВАНИЕ

Разработка обобщённой подсистемы прогнозирования

Согласно аналитическому обзору, для решения задачи прогнозирования температуры окружающей среды в рамках управления производством тепловой энергии на теплогенераторных станциях наиболее востребованными методами прогнозирования являются фактографические методы.

Точность прогнозирования при этом должна обеспечиваться за счет предоставления подсистеме прогнозирования исходных данных о температуре окружающей среды за прошедшие периоды времени.

Таким образом, работа подсистемы прогнозирования представляет собой следующие действия:

  • 1) получение накопленного массива данных о температуре окружающей среды за некоторый квант времени;
  • 2) сглаживание полученного временного ряда наблюдений;
  • 3) аппроксимация и формирование нового ряда;
  • 4) прогнозирование и экстраполяция.

Временным рядом называется последовательность значений, изменяемых во времени. Временной ряд позволяет наблюдать всю историю изменения величины и даёт возможность судить о её «типичном» поведении, а также об отклонениях от такого поведения.

В отличие от анализа случайных выборок, анализ временных рядов основывается на предположении, что последовательные значения в массиве данных наблюдаются через равные промежутки времени.

Большинство регулярных составляющих временных рядов являются либо трендом, либо сезонной составляющей. Тренд - общая систематическая линейная или нелинейная компонента, которая может изменяться во времени. Сезонная составляющая - это периодически повторяющаяся компонента. [4]

Описание модели временного ряда температуры воздуха окружающей среды состоит в следующем:

  • 1) длительность наблюдения данных - от одного года;
  • 2) промежутки наблюдения данных - 1 сутки или 1 месяц;
  • 3) присутствует сезонная составляющая: повышение температуры в летние периоды времени и понижение температуры в зимние периоды.

Одними из самых популярных методов для оценки параметров временного ряда и прогнозирования его данных являются:

  • 1) метод авторегрессии проинтегрированного скользящего среднего (АРПСС). Данный метод имеет высокую мощность и гибкость, однако, благодаря этому, АРПСС - сложный метод, его не так просто использовать, и требуется большая практика, чтобы овладеть им;
  • 2) экспоненциальное сглаживание. Является очень популярным методом прогнозирования. Существует несколько вариантов такого метода:

a) простое экспоненциальное сглаживание не учитывает тренд и сезонную составляющую;

b) методы, учитывающие аддитивные и мультипликативные тренд и сезонность - модель Хольта, модель Хольта-Уинтерса и модель Тейла-Вейджа;

  • 3) сезонная декомпозиция (метод Census I). Тренд и циклическая компонента объединяются в одну тренд-циклическую компоненту;
  • 4) сезонная корректировка X-11 (метод Census II). Метод учитывает корректировки временного ряда, такие как: поправка на число рабочих дней, резко выделяющиеся наблюдения (выбросы) и другие;
  • 5) анализ распределенных лагов - это специальный метод оценки запаздывающей зависимости между рядами;
  • 6) одномерный анализ Фурье. Позволяет разложить временной ряд с циклическими компонентами на несколько основных синусоидальных функций с определенной длиной волн;
  • 7) кросс-спектральный анализ. Развивает одномерный анализ Фурье и позволяет анализировать одновременно два ряда.

Для решения задачи прогнозирования воспользуемся методом экспоненциального сглаживания.

Простое экспоненциальное сглаживание временного ряда осуществляется по формуле:

, (2.1)

где - прогнозируемое значение для периода t текущего цикла;

- значение временного ряда для периода t текущего цикла;

- коэффициент сглаживания, .

Простое экспоненциальное сглаживание не учитывает тренд и сезонную составляющую, поэтому его применение для поставленной задачи прогнозирования обосновано только при описании временным рядом менее двух сезонов.

Для прогнозирования значений временного ряда при описании им двух и более сезонов используем экспоненциальное сглаживание по модели Хольта-Уинтерса.

Модель Хольта-Уинтерса расширяет прогностическую модель экспоненциального сглаживания и учитывает тренд и сезонность временного ряда. [5]

Существует две вариации модели Хольта-Уинтерса в зависимости от природы сезонной составляющей: аддитивный и мультипликативный методы.

Использование аддитивного метода предпочтительно, когда сезонная составляющая временного ряда примерно постоянна для каждого цикла. Мультипликативный же метод предпочтителен, когда сезонная составляющая изменяется пропорционально значениям временного ряда в каждом цикле.

Согласно определенной модели временного ряда поставленной задачи прогнозирования ясно, что необходимо использование аддитивного варианта модели Хольта-Уинтерса. Прогнозируемые значения временного ряда y с количеством измерений в одном цикле m для горизонта прогнозирования h рассчитываются по формулам:

, (2.2)

, (2.3)

, (2.4)

, (2.5)

где - прогнозируемое значение для периода времени, отстающего на d шагов от последнего значения временного ряда;

- параметр прогноза, очищенный от влияния тренда и сезонности;

- параметр тренда периода t;

  • - параметр сезонности периода t;
  • - значение временного ряда для периода t;

- коэффициенты сглаживания, .

Для использования формул (2.3), (2.4) и (2.5) необходима установка начальных значений по следующим формулам:

, (2.6)

, (2.7)

при , (2.8)

Использование метода экспоненциального сглаживания ставит перед нами новую проблему: результаты прогнозирования зависят от выбора коэффициентов сглаживания ( для простого экспоненциального сглаживания и для экспоненциального сглаживания по модели Хольта-Уинтерса).

Коэффициенты сглаживания невозможно выбрать на основе одних лишь исходных данных временного ряда. Поэтому для оценки качества прогнозов применяют специальные статистические методы. [6]

К простейшим статистикам качества прогнозов относятся:

  • 1) средняя абсолютная процентная ошибка (Mean Absolute Percentage Error - MAPE);
  • 2) средняя абсолютная ошибка (Mean Absolute Error - MAE);
  • 3) корень квадратный из средней квадратичной ошибки прогнозирования (Root Mean Squared Error - RMSE).

Средняя абсолютная процентная ошибка прогнозирования является абсолютной мерой качества прогнозов в том смысле, что позволяет оценить его независимо от других прогнозов: достаточно выбрать некий уровень средней ошибки (например, 5%) и сравнивать рассчитанное по статистике значение с этим тестовым уровнем. Если расчетное значение меньше тестового, то прогноз считается хорошим, если больше - плохим.

Две другие меры качества прогнозов (MAE и RMSE) являются относительными, то есть могут быть использованы для сравнения двух (или более) различных прогнозов одного и того же показателя между собой: лучшим считается тот прогноз, у которого значение МАЕ или RMSE меньше. При этом, очевидно, этот лучший прогноз может быть хорошим или плохим с точки зрения МАРЕ.

Главными достоинствами этих трёх статистик качества является простота их расчета и независимость от свойств ошибок прогнозирования, главным недостатком - то, что они не позволяют получить ответ на вопрос о том, являются ли два прогноза показателя разными со статистической точки зрения.

Кроме того, обычно все эти статистики не противоречат друг другу, то есть при их использовании лучшим будет выбран один и тот же прогноз, однако, наиболее часто для сравнения прогнозов используется RMSE.

Приведенные выше статистики качества рассчитываются по следующим формулам:

, (2.9)

, (2.10)

, (2.11)

где N - количество измерений;

  • - значение временного ряда для периода t;
  • - прогнозируемое значение для периода t.

Воспользуемся статистикой качества RMSE для оценки прогноза и выбора оптимальных параметров сглаживания. Для этого в системе необходимо разработать функционал расчета RMSE с помощью перебора по сетке.

Метод перебора по сетке являясь наиболее простым и универсальным, одновременно является и самым трудоёмким методом решения задач нелинейного программирования.

Метод перебора по сетке заключается в следующем: возможные значения параметра разбиваются сеткой с определенным шагом (например, для простого экспоненциального сглаживания возможная рассматриваемая сетка значений для коэффициента сглаживания : от до с шагом 0.1), после чего находятся значения целевой функции с использованием каждого из возможных значений в сетке и среди них выбирается наилучшее значение.

Практически метод перебора по сетке применим только при числе переменных целевой функции не больше 4, так как трудоёмкость быстро возрастает с ростом размерности задачи. Поэтому для экспоненциального сглаживания по модели Хольта-Уинтерса возможно необходимо предусмотреть дополнительное упрощение поиска оптимальных параметров сглаживания.

 
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 
Предметы
Агропромышленность
Банковское дело
БЖД
Бухучет и аудит
География
Документоведение
Естествознание
Журналистика
Информатика
История
Культурология
Литература
Логика
Логистика
Маркетинг
Математика, химия, физика
Медицина
Менеджмент
Недвижимость
Педагогика
Политология
Право
Психология
Религиоведение
Социология
Статистика
Страховое дело
Техника
Товароведение
Туризм
Философия
Финансы
Экология
Экономика
Этика и эстетика
Прочее