Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Технологии обработки данных в прогнозировании


Служба Рассылок Subscribe.Ru

rass_4

Выпуск 5.   Временные ряды. Тренды.

  В рассылке представлены аналитические материалы как лично мои так и те, которые будут присылаться, а также информация, полученная  из других источников. Будут указаны ссылки на литературу. Список литературных и электронных источников  находится на сайте (здесь).  При возможности там же будут указаны и адреса. На вопросы буду отвечать лично, или включать их в рассылку, или помещать в форум на сайте. Разные рассылки будут ориентированы на разный уровень читателей. Так что не огорчайтесь, если текст для Вас слишком легкий, или совсем непонятный. Возможно cледующий материал будет специально для Вас. Ну вот и все. Приступаем!

Предыдущие выпуски

                                                           Здравствуйте!                                                             

      Временным рядом будем называть таблицу, в верхней строке которой находится счетное множество моментов времени   (с постоянной дискретностью, напр. t=2, 5, 8, 11,...), в нижней - значение некоторого показателя Y. Предположим, без ограничения общности, что Y является функцией времени. Все другие факторы, кроме времени, оказывающие влияние на Y, аккумулируем и считаем. что они представляют собой случайный процесс Z(t), математическое ожидание которого равно нулю. Таким образом 

                                                            Yt=f(t)+Z(t).                                                           (*)                  Функция f(t) - детерминированная составляющая, она   называется трендом. Рассматривая временные ряды (в т.ч. и потребление электроэнергии) можно заметить, что, в общем случае, они имеют четыре составляющих [8]:

  • долговременную эволютарно изменяющуюся;
  • долговременные циклические колебания;
  • кратковременные циклические колебания;
  • случайная.

        Оценка коэффициентов одновременно присутствующих четырех составляющих довольно таки сложная задача, но ее можно решить, используя композицию линейного, полиномиального и тригонометрического трендов. Начнем с линейного тренда.

         Ели тренд линеен, то соотношение (*) принимает вид  

                                             Yt=a0+a1*t+et.                                           (**) Коэффициенты  a0 и a1 находят по методу наименьших квадратов и они равны:              a1=(n*sum(ti*yi*)-sum(ti)*sum(yi))/(n*sum(ti*ti)-sum(ti)*sum(ti)),                      a0=yсреднее-a1*tсреднее.    

Так, например, если дана таблица значений,                                  

1 2 3 4 5 6 7
3 6 7 8 11 12 ?

   то n=7,  sum(ti)=1+2+3+4+5+6=21,   sum(yi)=3+6+7+8+11+12=47,                  sum(ti*yi)=1*3+2*6+3*7+4*8+5*11+6*12=195,  

sum(ti*ti)=1*1+2*2+3*3+4*4+5*5+6*6=91,   a1=1.74, a0=1.73, Y(7)=13.9 

Полученное прогнозное значение, безусловно, имеет низкую точность. Для того, чтобы повысить точность результата необходимо рассматривать интервальные оценки. В любой книге по эконометрии можно найти результаты, описывающие насколько построенная модель (**) адекватна начальным данным,  как вычислить доверительные интервалы для коэффициентов (**) и для прогнозного значения.

Анонс следующего выпуска

В следующем выпуске прогнозирование с помощью других, более сложных трендов.                                           
                                                       

Внимание! Если Вы имеете проблемы с анализом данных, не можете правильно решить задачу оптимизации или прогнозирования, напишите, и, возможно, мы найдем решение вместе.
Посетить сайт  Информационные интеллектуальные системы

                                 Написать автору рассылки

 


http://subscribe.ru/
E-mail: ask@subscribe.ru
Отписаться
Убрать рекламу

В избранное