При оценке параметров уравнения регрессии - МНК. при этом делаются предпосылки относительно случайной составляющей «E». В модели y=a+b1*x1+b2*x2+…+bp*xp+e е= ненаблюдаемая величина. Делается предположение о поведение остатков еi-это независимые случ-е величины и их среднем значении =0 они имеют одинаковую дисперсию и подчиняются нормальному распределению. Оценки параметров регрессии при МНК должны отвечать следующим требованиям: дБ несмещенными (матем ожидание остатков =0), дБ эффективными (характеризуется наименьшей дисперсией), дБ состоятельными (увеличение их точности с увеличением выборки). МНК строит оценки регрессии на основе минимизации суммы квадратов остатков. Важно исследовать поведение остаточных величин регрессии ei. Условия, необходимые для получения несмещ, эфф, сост оценок = предпосылки МНК, соблюдение которых желательно для получения достоверного результата регрессии.
Исследование остатков ei предполагает проверку наличия след предпосылок МНК:
-случайный характер остатков
-нулевая средняя величина остатков, не зависящая от xi
-гомоскедастичность - те дисперсия каждого отклонения ei одинакова для всех значений х
-отсутствие автокорреляции остатков, те распределены независимо др от друга
-остатки подчиняются нормальному распределению.
Если не исполняется хотя бы 1 предпосылка, то нужно корректировать модель.
1 предпосылка: строим график зависимости остатков ei от теоретического значения результативного признака. Если на графике горизонтальная полоса, то остатки = случайные величины и МНК оправдан.
2 означает, что ∑(y-yтеор)=0. Это выполнимо для линейных моделей, затем строится график аналогично. График зависимости сл остатков от факторов х. Если горизонтальная полоса – независимы, модель адекватна.
Для 5 позволяет проводить проверку параметров регрессии и корреляции с помощью критерия F.
3 если это условие не соблюдается то имеет место гетероскедантичность (дисперсия остатков растет по мере увеличения х , дисперсия остатков достигает макс величины при среднем значении переменной х и уменьшении при мин и макс значении). Ведет к смещенности оценок.
Чтобы оценить нарушение гомоскед-ти можно сделать параметрический тест, шаги:
1Упорядочение n наблюдений по мере возрастания переменной х
2Исключение из рассм-я С центральных наблюдений, при этом (n-С):2>p, где р - число оцениваемых параметров
3Разд-е совокупности из (n-С) набл-й на 2 группы (с малым и большим знач фактора х) и определение по каждой из групп уравнений регрессии
4Опр-е остаточной суммы квадратов для 1-й (S1) и 2-й (S2) групп и нахождение их отношения: R=S1/S2.
Чем больше величина R превышает табличные значения F-критерия тем более нарушена предпосылка о равенстве дисперсий остаточных величин.
4. автокорреляция = наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений.
К корреляции между ei и ej, где ej -остатки предыдущих наблюдений j=i-1 может быть определен как reiej= cov(ei,ej)/σei*σej
Т.е. по обычной формуле линейного коэффициента корреляции. Если он окажется существенно отличен от нуля, то остатки автокоррелированы и функция плотности вероятности зависит от житой точки наблюдения и от распределения остатков в других точках наблюдения.
Отсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэф-тов регрессии.
Поможем написать любую работу на аналогичную тему