Предположим, усеченное распределение является частью неусеченного распределения, которая находится выше или ниже определенного порогового значения.
Плотность непрерывной случайной переменной z, усеченной выше уровня b, определяется согласно следующему выражению:
Выражение (10.136) вытекает, из формулы условной вероятности. В самом деле, условная вероятность того, что случайная величина z примет некоторое значение при условии, что z< b, определяется следующим образом:
òò/ò
Продифференцировав левую и правую части выражения (10.137) по z, получим (10.136).
Во многих практических исследованиях предполагается, что случайная величина z распределена по нормальному закону. В этом случае вероятность того, что z>b определяется согласно следующему выражению:
где m и s – соответственно математическое ожидание и стандартное отклонение случайной величины z; b=(b–m)/s; Ф(.) – значение стандартной нормальной интегральной функции распределения в соответствующей точке.
Тогда согласно выражению (10.136), функция плотности усеченного нормального распределения определяется как:
где j(.) – стандартная нормальная функция распределения.
На рис. 10.6 представлены графики функций плотностей усеченного стандартного нормального распределения с m=0 и s=1 для b=–0,5; 0; 0,5. Из графиков, представленных на этом рисунке следует, что усечение как бы “поднимает” функцию плотности на оставшемся после усечения участке над графиком этой функции “неусеченного” распределения.
В дальнейшем случайную переменную с усеченным распределением будем называть усеченной случайной переменной.
Заметим, что математическое ожидание и дисперсия усеченной случайной переменной определяются согласно следующим выражениям:
M=ò
D=ò
Проведя интегрирование в выражениях (10.140)–(10.141) с учетом того, что функция плотности f(z, z>b) определена выражением (10.139), получим, что математическое ожидание и дисперсия усеченной случайной переменной z соответственно равны:
M=m+s×l(b). (10.142)
D=s 2×. (10.143)
где b=(b–m)/s;
l(b)=j(b)/, если z>b; (10.144)
l(b)=–j(b)/F(b), если z<b; (10.145)
d(b)=l(b)×. (10.146)
|
|
Рис. 10.6. Зависимости плотностей усеченного нормального распределения от степени усечения
Функцию l(b) называют обратным отношением Миллса или функцией отказов (hazard-function), b – степенью усечения.
Заметим, что d(b)<1 при любом значении b.
Из выражения (10.142) следует, что математическое ожидание усеченной стандартной нормальной переменной является функцией от степени усечения (см. рис. 10.7).
Рассмотрим некоторые результаты, приведенные на рис. 10.7. В частности, математическое ожидание стандартной нормальной величины при усечении z³0 равно 0,79, а при усечении z£b равно –0,79.
Несложно также убедиться, что вероятность того, что х меньше b, является возрастающей функцией от b. С возрастанием этой вероятности увеличивается количество нерассматриваемых элементов совокупности, а, следовательно, возрастает и математическое ожидание усеченной случайной переменной.
|
|
|
|
|
|
Рис. 10.7. Графики зависимости математических ожиданий стандартной нормальной величины от степени усечения
На рис. 10.8 приведена функция, отражающая взаимосвязь между математическим ожиданием M и вероятностью Р для стандартного нормального распределения.
|
|
|
Рис.10.8. Условное среднее как функция степени усечения.
Предположим, что зависимость некоторой случайной переменной yt, от значений влияющих на нее факторов, можно представить следующим образом:
yt =a¢×xt +et, (10.148)
где xt – вектор независимых переменных, влияющих на переменную yt; a – вектор параметров; et – ошибка модели, в отношении которой предполагается, что она распределена по стандартному нормальному закону с нулевым математическим ожиданием и постоянной дисперсией, et ~N.
Переменная yt, описанная выражением (10.148), распределена по нормальному закону с математическим ожиданием mt=a¢×xt и дисперсией s 2.
Рассмотрим распределение зависимой переменной yt при условии, что наблюдаемые значения yt превышают некоторый порог b. Согласно выражению (10.142) получим, что условное математическое ожидание yt для модели (10.148) является нелинейной функцией от хt и a, и определяется как
M=a¢×xt +
Перепишем выражение (10.149) с использованием функции отказов l(bt) (см. выражение (10.144)):
M=a¢×xt +s×l(bt), (10.150)
где bt =(b –a¢×xt)/s.
С учетом вида выражения (10.150) оценим величину маржинального эффекта факторов xt для случая усеченной выборки:
Поскольку для каждого набора факторов xt выполняется соотношение 0<d(bt)<1, то из выражения (10.151) вытекает, что для любого xit (i=1,2,..., n; t=1,2,...,T) маржинальный эффект меньше соответствующего коэффициента ai.
Заметим, что в силу специфики выражения (10.150) ошибка et модели (10.146), построенной для усеченной выборки, имеет математическое ожидание s×l(bt). Дисперсия ошибки et в этом случае определяется следующим образом:
D=s 2×. (10.152)
где s2 – дисперсия ошибки модели (10.148), построенной на неусеченной выборке; d(b t)=l(b t)×; l(b t)=j(b t)/; bt =(b –a¢×xt)/s.
Таким образом, из выражений (10.150) и (10.152) вытекает, что оценки параметров модели (10.148), определенные на основании усеченной выборки зависимой переменной (yt>b или yt<b), являются смещенными и несостоятельными по сравнению с оценками, которые могли бы быть получены по полной выборке.
Поможем написать любую работу на аналогичную тему