Иногда необходимо включить в модель фактор, имеющий качественную характеристику (пол, профессия). Т.к. эти переменные не поддаются количественной оценке им нужно присвоить им цифровые метки, т.е. преобразовать качественные переменные в количественные = «Фиктивные переменные», или «структурные переменные».
|
A |
B |
C |
D |
E |
1 |
i |
X1i возраст машины |
X2i марка |
Y к-во дней работы без ремонта |
Yteor |
2 |
1 |
1 Внимание!
Если вам нужна помощь в написании работы, то рекомендуем обратиться к
профессионалам. Более 70 000 авторов готовы помочь вам прямо сейчас. Бесплатные
корректировки и доработки. Узнайте стоимость своей работы.
|
Москвич |
10 |
|
3 |
2 |
2 |
Жигули |
150 |
|
.. |
.. |
|
|
|
|
21 |
20 |
10 |
Тойота |
1000 |
|
Если (С2= «Москвич»;1; если (С2= «Жигули»;2;…()))). В новом столбце названия заменяются цифрами.
Сервис/анализ данных/регрессия – Находим У теор.
У теор (x1i,x2i) = a*+b1**x1i+b2**x2i…
Можно улучшить качество уравнения за счет введения дополнительных фиктивных переменных. Количество переменных = число градаций -1. Т.е. пусть марок машин 4. Тогда вводим 4-1 = 3 фиктивные переменные.
Х22i = 1,если марка=2
= 0, в противном случае;
Х23i=1,если марка = 3,
=0, в противном случае
Х24i = 1, если марка =4,
= 0, в противном случае.
Т.е. вместо столбца «С» вводим три новых столбца Х22i Х23i Х24i. Т.е. вместо второй переменной вводим три фиктивные переменные.
Y teor = a*+b1**x1i+b22**x22i+b23**x23i+b24**x24i.
Чтобы модель была хорошая, нужно, чтобы Fфакт был больше Fтабл, при £=0,05 и 1-£=0,95 при v1=m, v2=n-m-1
Если в регрессии получаются такие данные:
Р значения
У пересечение a* 0,02
Переменная 1 b1* 0,54
Переменная 2 b2* 0,06
Переменная 3 b3* 0,08
Переменная 4 b4*
То 1му коэффициенту можно верить с вероятностью 1-0,02= 0,98, 2й коэффициент незначим, т.к. вероятность очень низкая 1-0,54 = 0,46. Если все коэффициенты меньше 0,05, то модель хорошая.
Также для улучшения модели включаем логарифмы: вместо У теор находим ln У теор по той же формуле. Еще более точное значение можно получить:
ln У теор = a*+b1**x1i+b2**x2i+b3**x3+b4*x2i^2
Модель улучшается, когда значение Rквадрат (из таблицы регрессии) улучшается (приближается к 1), При этом значения У теор при фиктивных переменных приближены к реальным значениям.
Среди моделей с ФП наибольшими прогностическими возможностями обладают модели, в которых зависимая переменная у рассматривается как функция ряда экономических факторов xi и фиктивных переменных zi (отражают различия в формировании результативного признака по отдельным группам единиц совокупности, т.е. в результате неоднородной структуры пространственного или временного характера.)
Поможем написать любую работу на аналогичную тему