Нужна помощь в написании работы?

Предположим, что переменные у и z имеют двумерное распределение с коэффициентом корреляции r. Найдем распределение у по случайной выборке (у, z) условии, что уровень переменной z превышает определенное значение (z>b). Интуиция подсказывает, что если у и z положительно коррелированы, то усечение z должно подвинуть распределение у вправо.

Нахождение распределения у связано с определением, во-первых, вида функции плотности случайно усеченного распределения переменных у и z, и, во-вторых, математического ожидания и дисперсии случайно усеченной переменной у при условии, что у и z подчинены закону двумерного нормального распределения.

Усеченная совместная плотность у и z  согласно выражению (10.136) при любом распределении этих переменных определяется следующим выражением:

Если у и z  распределены согласно двумерному нормальному закону с математическими ожиданиями my  и mz  и стандартными отклонениями s y  и s z, а коэффициент их парной корреляции равен r, то  в соответствии с выражениями (10.142)–(10.143) условные математическое ожидание и дисперсия у при усечении z определяются следующим образом:

M=my+r×s y ×l(b z);               (10.169)

D=sy2×,                   (10.170)

где

b z =(b–my)/s z;                        (10.171)

l(b z)=f(b z)/;                      (10.172)

 d(b z)=l(b z)×.                     (10.173)

Заметим, что при усечении сверху, т. е. z<b, математическое ожидание и дисперсия переменной у также определяется согласно выражениям (10.169) и (10.170) при l(b z)=–f(b z)/ F(b z).

Из выражения (10.169) следует, что при усечении “снизу” условное математическое ожидание у смещается в направлении корреляции переменных у и z, если усечение проводится “сверху”, то – в направлении противоположном корреляции. Случайное усечение уменьшает дисперсию, т. к. d(b z) и r2 принадлежат интервалу (0,1).

Рассмотрим два примера, иллюстрирующих случайное усечение.

Предположим, что любая женщина выходит на работу только в том случае, если ее потенциальный доход будет превышать некоторый критический уровень (для каждой женщины свой). Допустим, переменная zt  представляет собой разность между потенциальным и критическим доходом, и зависимость между переменной zt  и влияющими на нее факторами xt1  можно представить следующим образом:

Внимание!
Если вам нужна помощь в написании работы, то рекомендуем обратиться к профессионалам. Более 70 000 авторов готовы помочь вам прямо сейчас. Бесплатные корректировки и доработки. Узнайте стоимость своей работы.

zt=a¢×xt (1)+et(1),                      (10.174)

где xt(1) – вектор независимых факторов, влияющих на  разность доходов (например, возраст, образование, количество детей и т. д.); a – вектор параметров модели; et(1) – ошибка модели.

Для всех женщин, у которых zt>0, требуется определить желательное количество рабочих часов yt. Предположим, что зависимость между переменной yt   и влияющими на нее факторами  хt(2) также можно описать линейной эконометрической моделью:

yt=b¢×xt(2)+et(2),                      (10.175)

где xt(2) – вектор независимых факторов, влияющих на желательное количество рабочих часов (например, семейный статус, количество детей и т. д.); b – вектор параметров модели; et(2) – ошибка модели.

Заметим, что вектора xt(1) и xt(2) могут как совпадать, так и отличаться друг от друга.

При формировании модели (10.175)  возникает проблема усечения, поскольку данные о часах работы имеются только для работающих женщин, т. е. число часов – случайно усеченная переменная.

В разделе 10.3.1 рассматривалась модель миграции, в которой переменные, влияющие на принятие решения о смене места жительства, были представлены эконометрическими моделями в зависимости от набора соответствующих факторов. В целом модель содержала три уравнения:

чистая прибыль от переезда  – Nt*=g¢×wt +ut;    (10.176)

доходы при переезде  – ytp =a¢×xtp +etp;        (10.177)

доходы при “непереезде”  – ytm =b¢×xtm +etm.    (10.178)

где wt, xtp  и xtm  – вектора независимых переменных, влияющих соответственно на чистую прибыль от переезда, и доходы в случае переезда и “непереезда”; g, a  и  b – вектора параметров; ut, etp  и etm – ошибки модели.

Предположим, что совокупность мигрантов формируется из числа лиц, желающих переехать, для которых чистая прибыль от переезда положительна. Чистая прибыль от переезда zt*, определяется согласно выражению (10.176) как

zt*=g¢×wt +ut.                                                              (10.179)

Для совокупности мигрантов формируется уравнение, связывающее величину их дохода на новом месте уt  с некоторым набором факторов xt, характеризующих, например, опыт работы, пол, образование и т. д:

 уt=a¢×xt +et.                               (10.180)

где a  – вектор параметров; et  – вектор ошибки.

Переменная уt  является случайно усеченной, так как информация о доходе мигранта может быть получена, когда переезд индивидуума на новое место жительства уже осуществился, и индивидуум приступил к работе.

Поскольку доход  на новом месте и чистая прибыль от переезда взаимосвязаны, ошибки et  и ut моделей (10.179) и (10.180) взаимозависимы. Предположим, что они распределены согласно двумерному нормальному закону с нулевыми математическими ожиданиями и коэффициентом корреляции r. В этом случае в соответствии с выражениями (10.169)–(10.170) получим:

M=M=M=

=a¢×xt+M=a¢×xt +r×se×lt (b u)=a¢×xt +al×lt (bu), (10.181)

где bu =–g¢×wt /su  и l t(bu)=f(g¢×wt /su)/F(g¢×wt /su).

Выражение (10.181) показывает, что условное математическое ожидание выборочной совокупности доходов мигрантов при условии zt>0 находится в непосредственной и опосредованной зависимости от  факторов xt. Непосредственная зависимость выражается слагаемым a¢×xt,  а опосредованная, характеризующая влияние факторов xt  на вероятность того, что переменная zt*  положительна, определяется слагаемым r×se×lt(bu).

На практике значение переменной zt*  не наблюдается, она является латентной. Наблюдаемая переменная z принимает значение 1 (событие произошло) или 0 – в противном случае. В наших примерах: женщина работает или нет, индивидуум мигрирует или нет. С учетом этого представим модель (10.179)–(10.180) в виде совокупности двух  следующих моделей:

1. Модели селекции, определяющие выборку мигрантов

zt*=g¢×wt+ut;                             (10.182)

 zt=1, если zt*>0;                          (10.183)

zt=0, если zt*<0;                          (10.184)

P(zt =1)=F(g¢×wt );                       (10.185)

P(zt =0)=1–F(g¢×wt ).                        (10.186)

2. Модели дохода мигранта

yt =a¢×xt +et.                     (10.187)

yt  представляет собой значение дохода индивидуума, фактически сменившего место жительства случайную выборку мигрантов, лиц фактически сменивших место жительства, для которого zt =1.

В соответствии с введенным предположнием о зависимости между ошибками et  и ut моделей (10.179) и (10.180) закон их совместного распределения характеризуется характеризуется следующими свойствами:

(ut, et)~N(0,0,1, se, r).                   (10.188)

Согласно выражению (10.169) условное математическое ожидание yt   при  zt=1 определяется согласно выражению:

M=a¢×xt+r×se×l(g¢×wt ).                  (10.189)

Поделись с друзьями