Одной из важнейших целей построения эконометрической модели является прогнозирование поведения исследуемого процесса или объекта. Если в модели присутствует фактор времени, то прогнозирование подразумевает предсказание состояния системы в будущем. Если фактор времени в модели отсутствует, то прогнозирование величины исследуемой переменной (вычисление yпрогн) производится при некотором наборе (наборах) значений факторных переменных. Эти значения факторов (xпрогн1, xпрогн2, … , xпрогн m) должны быть заданы исследователем или вычислены с помощью других моделей.
Как и в случае парной регрессии вычисляются точечное и интервальное прогнозные значения исследуемой переменной.
Точечный прогноз осуществляется подстановкой прогнозного набора факторных переменных в уравнение регрессии:
. (3.14)
Если прогноз осуществляется не для одного набора факторных переменных, а для некоторого ряда наборов, то ряд точечных прогнозов исследуемой переменной можно представить в виде вектора, и вычислять его удобнее с использованием операций с матрицами:
, (3.15)
где
(3.16)
Интервальный прогноз в рамках модели множественной регрессии строится с использованием соотношений, являющихся обобщением формул (2.22), (2.23), позволяющих строить прогноз на основе парной регрессионной модели.
Для нахождения размаха доверительного интервала необходимо вычислить матрицу V:
. (3.17)
В выражении (3.17) участвуют матрица Xв, составленная из значений факторных переменных, имевших место в рядах наблюдений по правилу (3.5), и матрица Xпрогн, составленная из прогнозируемых значений факторных переменных по правилу (3.16). Размерность матрицы V равна , то есть зависит от числа прогнозируемых наборов факторных переменных. Если мы хотим рассчитать прогноз для одного набора факторных переменных, то получим матрицу V размером , то есть число. Размах прогнозного интервала для i-го набора факторных переменных равен:
. (3.18)
Величины вычисляются тем же образом, что и в (2.22), а является диагональным элементом матрицы (3.17). Тогда фактические значения исследуемой величины y для i-го набора значений факторных переменных с вероятностью (1-α) попадают в интервал:
. (3.19)
Несмотря на то, что в ходе исследования качества построенной нами модели (3.8) мы сделали вывод о нецелесообразности её использования для анализа и прогнозирования, рассчитаем прогноз для прогнозного значения температуры x1прогн = 28 и величины торговой наценки x2прогн = 25, то есть матрица Xпрогн примет у нас вид вектора:
.
Точечный прогноз будет тогда равен:
.
Вычислим матрицу V по правилу (3.17), имея в виду, что матрицу мы уже вычислили в п.3.2, получим число (поскольку один прогнозируемый набор факторов): V=0,32. Далее, с учётом приведённых в п.3.3 стандартной ошибки и значения, получим по формуле (3.18) размах интервала: L = 15,33. В итоге получим прогнозный интервал для фактического значения объёма продаж:
.
Если мы сравним прогноз, полученный по двухфакторной линейной модели, с прогнозом, который мы сделали в п.2.8. на основе парной показательной модели, то увидим, что прогнозный интервал у двухфакторной модели больше, чем у однофакторной, то есть качество прогнозирования, несмотря на введение нового фактора, ухудшилось. Рекомендации о нецелесообразности использования, сделанные нами при исследовании качества линейной двухфакторной модели, оправдались.
Этот результат обусловлен, в первую очередь явно нелинейным характером связи между исследуемым объёмом продаж и основным фактором – температурой воздуха. Для улучшения парной показательной модели достаточно логично было бы ввести в модель дополнительную факторную переменную, не меняя показательной связи между объёмом продаж y и температурой воздуха x1. Это оказывается возможным с использованием техники вычислений, применявшейся нами при построении множественной линейной модели регрессии.
Построим по данным Примера 1 нелинейную модель вида:
. (3.20)
Применив операцию логарифмирования к уравнению (3.20) и сделав замены переменных, получим уравнение линейной модели множественной регрессии:
, (3.21)
где . Соответственно, для нахождения коэффициентов линейной модели (3.21) , исследования свойств полученной модели и прогнозирования, будем использовать данные наблюдений из Таблицы 6, при этом каждое из значений в первом и третьем столбцах (данные для y и x2) необходимо предварительно прологарифмировать.
Применив процедуру МНК, получим модель:
. (3.22)
В соответствии с уравнением (3.22), в отличие от уравнения линейной модели (3.8), при увеличении торговой наценки объём продаж будет уменьшаться, что соответствует реальному процессу.
Произведя все операции для построения прогнозного интервала на основе линейной модели множественной регрессии, аналогично тому, как это описано выше, получим:
.
Тогда с учётом соотношений прогнозный интервал для исходной исследуемой переменной с уровнем значимости α = 0,1:
.
С помощью построения нелинейной двухфакторной модели нам удалось уменьшить длину прогнозного интервала, полученного с помощью однофакторной показательной модели. Однако, интервал остаётся достаточно большим.
Если выбрать уровень значимости α = 0,3, то прогнозный интервал значительно уменьшится:
.
При этом, однако, вероятность выполнения прогноза уменьшится с 90% до 70%.
В итоге наилучшей из построенных нами по данным Примера 1 моделей оказалась нелинейная двухфакторная модель вида:
.
Здесь использовано обратное преобразование коэффициентов:
Поможем написать любую работу на аналогичную тему