Модели случайно усеченных выборок (selection-model)

Предположим, что переменные у и z имеют двумерное распределение с коэффициентом корреляции r. Найдем распределение у по случайной выборке (у, z) условии, что уровень переменной z превышает определенное значение (z>b). Интуиция подсказывает, что если у и z положительно коррелированы, то усечение z должно подвинуть распределение у вправо.

Нахождение распределения у связано с определением, во-первых, вида функции плотности случайно усеченного распределения переменных у и z, и, во-вторых, математического ожидания и дисперсии случайно усеченной переменной у при условии, что у и z подчинены закону двумерного нормального распределения.

Усеченная совместная плотность у и z согласно выражению (10.136) при любом распределении этих переменных определяется следующим выражением:

Если у и z распределены согласно двумерному нормальному закону с математическими ожиданиями my и mz и стандартными отклонениями s y и s z, а коэффициент их парной корреляции равен r, то в соответствии с выражениями (10.142)–(10.143) условные математическое ожидание и дисперсия у при усечении z определяются следующим образом:

M[y|z>b]=my+r×s y ×l(b z); (10.169)

D[y|z>b]=sy2×[1–r2×d(b z)], (10.170)

где

b z =(b–my)/s z; (10.171)

l(b z)=f(b z)/[1–F(b z)]; (10.172)

d(b z)=l(b z)×[l(b z)–b z]. (10.173)

Заметим, что при усечении сверху, т. е. z

Из выражения (10.169) следует, что при усечении “снизу” условное математическое ожидание у смещается в направлении корреляции переменных у и z, если усечение проводится “сверху”, то – в направлении противоположном корреляции. Случайное усечение уменьшает дисперсию, т. к. d(b z) и r2 принадлежат интервалу (0,1).

Рассмотрим два примера, иллюстрирующих случайное усечение.

Предположим, что любая женщина выходит на работу только в том случае, если ее потенциальный доход будет превышать некоторый критический уровень (для каждой женщины свой). Допустим, переменная zt представляет собой разность между потенциальным и критическим доходом, и зависимость между переменной zt и влияющими на нее факторами xt1 можно представить следующим образом:

zt=a¢×xt (1)+et(1), (10.174)

где xt(1) – вектор независимых факторов, влияющих на разность доходов (например, возраст, образование, количество детей и т. д.); a – вектор параметров модели; et(1) – ошибка модели.



Для всех женщин, у которых zt>0, требуется определить желательное количество рабочих часов yt. Предположим, что зависимость между переменной yt и влияющими на нее факторами хt(2) также можно описать линейной эконометрической моделью:

yt=b¢×xt(2)+et(2), (10.175)

где xt(2) – вектор независимых факторов, влияющих на желательное количество рабочих часов (например, семейный статус, количество детей и т. д.); b – вектор параметров модели; et(2) – ошибка модели.

Заметим, что вектора xt(1) и xt(2) могут как совпадать, так и отличаться друг от друга.

При формировании модели (10.175) возникает проблема усечения, поскольку данные о часах работы имеются только для работающих женщин, т. е. число часов – случайно усеченная переменная.

В разделе 10.3.1 рассматривалась модель миграции, в которой переменные, влияющие на принятие решения о смене места жительства, были представлены эконометрическими моделями в зависимости от набора соответствующих факторов. В целом модель содержала три уравнения:

чистая прибыль от переезда – Nt*=g¢×wt +ut; (10.176)

доходы при переезде – ytp =a¢×xtp +etp; (10.177)

доходы при “непереезде” – ytm =b¢×xtm +etm. (10.178)

где wt, xtp и xtm – вектора независимых переменных, влияющих соответственно на чистую прибыль от переезда, и доходы в случае переезда и “непереезда”; g, a и b – вектора параметров; ut, etp и etm – ошибки модели.

Предположим, что совокупность мигрантов формируется из числа лиц, желающих переехать, для которых чистая прибыль от переезда положительна. Чистая прибыль от переезда zt*, определяется согласно выражению (10.176) как



zt*=g¢×wt +ut.(10.179)

Для совокупности мигрантов формируется уравнение, связывающее величину их дохода на новом месте уt с некоторым набором факторов xt, характеризующих, например, опыт работы, пол, образование и т. д:

уt=a¢×xt +et. (10.180)

где a – вектор параметров; et – вектор ошибки.

Переменная уt является случайно усеченной, так как информация о доходе мигранта может быть получена, когда переезд индивидуума на новое место жительства уже осуществился, и индивидуум приступил к работе.

Поскольку доход на новом месте и чистая прибыль от переезда взаимосвязаны, ошибки et и ut моделей (10.179) и (10.180) взаимозависимы. Предположим, что они распределены согласно двумерному нормальному закону с нулевыми математическими ожиданиями и коэффициентом корреляции r. В этом случае в соответствии с выражениями (10.169)–(10.170) получим:

M[yt | yt наблюдаемый доход]=M[yt |zt*>0]=M[yt | ut>–g¢×wt]=

=a¢×xt+M[et | ut>–g¢×wt]=a¢×xt +r×se×lt (b u)=a¢×xt +al×lt (bu), (10.181)

где bu =–g¢×wt /su и l t(bu)=f(g¢×wt /su)/F(g¢×wt /su).

Выражение (10.181) показывает, что условное математическое ожидание выборочной совокупности доходов мигрантов при условии zt>0 находится в непосредственной и опосредованной зависимости от факторов xt. Непосредственная зависимость выражается слагаемым a¢×xt, а опосредованная, характеризующая влияние факторов xt на вероятность того, что переменная zt*положительна, определяется слагаемым r×se×lt(bu).

На практике значение переменной zt* не наблюдается, она является латентной. Наблюдаемая переменная z принимает значение 1 (событие произошло) или 0 – в противном случае. В наших примерах: женщина работает или нет, индивидуум мигрирует или нет. С учетом этого представим модель (10.179)–(10.180) в виде совокупности двух следующих моделей:

1. Модели селекции, определяющие выборку мигрантов

zt*=g¢×wt+ut; (10.182)

zt=1, если zt*>0; (10.183)

zt=0, если zt*<0; (10.184)

P(zt =1)=F(g¢×wt ); (10.185)

P(zt =0)=1–F(g¢×wt ). (10.186)

2. Модели дохода мигранта

yt =a¢×xt +et. (10.187)

yt представляет собой значение дохода индивидуума, фактически сменившего место жительства случайную выборку мигрантов, лиц фактически сменивших место жительства, для которого zt =1.

В соответствии с введенным предположнием о зависимости между ошибками et и ut моделей (10.179) и (10.180) закон их совместного распределения характеризуется характеризуется следующими свойствами:

(ut, et)~N(0,0,1, se, r). (10.188)

Согласно выражению (10.169) условное математическое ожидание yt при zt=1определяется согласно выражению:

M[yt |zt=1]=a¢×xt+r×se×l(g¢×wt ). (10.189)

ДЕЛЕНИЕ – это логическая операция, раскрывающая объем понятия путем выделения в нем возможных видов объектов.
Оціночні показники умов і безпеки праці
Методи фінансового аналізу
Электромагнитные потенциалы в квантовом поле
Настройка элементов управления формы с помощью панели инструментов.
Listen to the introduction to the course. Fill in the spaces in the sentences below with the words actually used.
Фінансування охорони здоров 'я та фізичної культури
Подвижного состава или имеет разъездной характер
ІІІ. Виконання вправ на застосування узагальнюючих правил.
Зміст звіту з практичної роботи
Зміст та послідовність проведення аналізу платоспроможності підприємства
Близость начинается с любви к самому себе
Мовні засоби
Види та функції мови і мовлення
Природа и основные характеристики услуги
II.2. Деятельностный подход в воспитании учащихся
Общество с дополнительной ответственностью (ОДО) -
Становлення соціології як самостійної науки.
Не пропускайте очевидного: хватайтесь за камни
Назначение, принцип действия и особенности конструкции агрегатов АП-34Б.
Середньовічна музика та театр.
Типы психической конституции
Расскажите о своей квартире (комнате).
Главная Страница