Часто случается так, что отдельные факторы, которые должны быть введены в регрессионную модель, являются качественными по своей природе и, следовательно, не измеряются в числовой шкале.
Приведем несколько примеров.
1. Исследуется зависимость между продолжительностью полученного образования и доходом, и в выборке представлены лица как мужского, так и женского пола. Нужно выяснить, обусловливает ли пол различие в результатах.
2. Исследуется зависимость между доходом и потреблением в какой-либо стране, например Бельгии, и выборка включает как франкоговорящие семьи, так и семьи, говорящие по-фламандски. Нужно выяснить, имеет ли существенное значение это этническое различие.
3. Исследуются факторы, определяющие инфляцию, и в некоторые годы периода наблюдений правительство проводило политику регулирования доходов. Нужно проверить, оказало ли это какое-либо влияние на исследуемую зависимость.
В каждом из этих примеров одним из возможных решений было бы оценивание отдельных регрессий для двух указанных категорий с последующим выяснением, различаются ли полученные коэффициенты. Другой возможный подход к решению состоит в оценивании единой регрессии с использованием всей совокупности наблюдений и измерением степени влияния качественного фактора посредством введения так называемой фиктивной переменной - переменной, принимающей в каждом наблюдении только два значения: 1 – «да» или 0 – «нет».
Фиктивные переменные включаются в модель множественной регрессии, если необходимо узнать влияние каких-нибудь дискретных факторов, например, числа человек в семье, месяца года, цвета окраски машины и т.п.
При этом следует помнить, что в модели множественной регрессии всегда желательно присутствие хоть одной не фиктивной переменной, так как дисперсия фиктивной переменной очень мала и это сказывается достоверности оценок.
В модели с фиктивными переменными коэффициент R2 часто бывает очень малым, а значения t-статистики незначительно отличаются от 0 для фиктивных переменных.
Вместе с этим, это не является поводом для удаления фиктивных переменных из модели с целью снижения последствий возникновения мультиколлинеарности. Чаще всего они описывают небольшие, но важные поправки к главной (не фиктивной) объясняющей переменной.
Поможем написать любую работу на аналогичную тему