Кореляційно-регресійний аналіз в економіці

У багатьох задачах потрібно встановити та оцінити залежність деякого економічного показника від одного чи кількох інших показників. Будь-які економічні показники, зазвичай, перебувають під впливом випадкових факторів, а тому з математичної точки зору інтерпретуються як випадкові величини.

З теорії ймовірностей відомо, що випадкові величини можуть бути пов'язані функціональною чи статистичною залежністю або ж узагалі бути незалежними. Співвідношення між незалежними змінними тут не розглядаються, тому що строга функціональна залежність реалізується в економіці рідко. Частіше спостерігається так звана статистична залежність.

Нагадаємо, що статистична залежність - це коли зі змінюванням однієї випадкової величини змінюється закон розподілу ймовірностей іншої. Статистична залежність виявляється в тому, що зі змінюванням однієї величини змінюється середнє значення іншої. Така залежність називається кореляційною.

Наприклад, у авіакомпаній з однаковою кількістю та видів літаків існує різний дохід. Звичайно, немає строгої функціональної залежності між кількістю та видами літаків. Це пояснюється впливом інших факторів ( якість обслуговування, безпека польоту, кваліфікація працівників, розташування авіакомпанії та кас придбання квитків, тощо). Водночас, середня кількості літаків та їх видів, напевне, пов'язані кореляційною залежністю.

Землеробстві з однакових за площею ділянок землі при рівних кількостях внесених добрив збирають різний врожай. Звичайно, немає строгої функціональної залежності між урожайністю землі та кількістю внесених добрив. Це пояснюється впливом випадкових факторів (опади, t повітря, розташування ділянки тощо). Хоча, як показує досвід, середній врожай залежить від кількості внесених добрив, тобто ці показники, напевне, пов'язані кореляційною залежністю.

Два типи взаємозв'язку змінних. В одному випадку невідомо, яка зі змінних незалежна, а яка - залежна, тобто вони рівноправні й зв'язок можна розглядати як в один, так і в інший бік. У другому випадку змінні нерівноправні, тобто змінювання лише однієї з них впливає на змінювання іншої, а не навпаки. При розгляді зв'язку між двома змінними величинами важливо встановити на основі логічного міркування, яка з ознак є причиною, а яка - наслідком. Наприклад, урожайність залежить від родючості землі, а не навпаки, тобто економічна оцінка землі є незалежною змінною, а врожайність - залежною.



Необхідно пам’ятати, що статистичний аналіз залежностей сам по собі не розкриває сутності причинних зв'язків між явищами, тобто він не вирішує питання, з яких причин одна змінна впливає на іншу. Розв'язок такої задачі є результатом якісного (змістовного) вивчення зв'язків, що обов'язково має або передувати статистичному аналізу, або супроводжувати його.

Нехай з певних економічних міркувань встановлено, що деякий економічний показник хє причиною змінювання іншого показника у. Статистичні дані по кожному з показників інтерпретуються як деякі реалізації випадкових величин Xі У. З теорії ймовірностей: математичним сподіванням випадкової величини називається її середнє (арифметичне чи зважене) значення. А залежність середнього значення від іншої випадкової величини зображується за допомогою умовного математичного сподівання.

Кореляційну залежність між ними або залежність в середньому в загальному випадку можна подати у вигляді співвідношення

М(У| х) = f(х), (1.1)

де М(У | х) — умовне математичне сподівання.

Функція f(х) називається функцією регресії У на X. При цьому X називається незалежною (пояснюючою) змінною (регресором), У — залежною (пояснюваною) змінною (регресандом). Розглядаючи залежність двох випадкових величин, говорять про парну регресію.

Залежність У від кількох змінних, що описується функцією

М(У\хі,х2,...,хт) = F(хі,х2,..., хт), (1.2)

називають множинною регресією.

Термін "регресія" (рух назад, повернення до попереднього стану) увів Френсіс Галтон наприкінці XIX ст., проаналізувавши залежність між зростом батьків і зростом дітей. Він помітив, що зріст дітей у дуже високих батьків у середньому менший, ніж середній зріст батьків. У дуже низьких батьків, навпаки, середній зріст дітей вищий. В обох випадках середній зріст дітей прямує (повертається) до середнього зросту людей у даному регіоні. Звідси й вибір терміна, що відбиває таку залежність,

Однак реальні значення залежної змінної не завжди збігаються з її умовним математичним сподіванням, тому аналітична залежність (у вигляді функції у = f(х)) має бути доповнена випадковою складовою и, що, власне, і вказує на стохастичну сутність залежності.

Означення 1.1. Зв'язки між залежною та незалежною (незалежними) змінними, що описуються співвідношеннями

у = f(х) + и, (1.3) у = F(хі,х2,...,хт) + и, (1.4)

називають регресійними рівняннями (моделями).

Причини обов'язкової присутності в регресійних моделях випадкового фактора (відхилення). Серед таких причин виокремимо найістотніші.

1. Уведення в модель не всіх пояснюючих змінних. Будь-яка регресійна (зокрема, економетрична) модель — це спрощення реальної ситуації, що призводить до відхилення реальних значень залежної змінної від її модельних значень. Наприклад, попит на товар визначається його ціною, цінами на товари-замінники, на товари, що його доповнюють, прибутком споживачів, їхніми смаками, уподобаннями тощо. Безумовно, перелічити всі пояснюючі змінні практично неможливо. Зокрема, неможливо врахувати такі фактори, як традиції, національні чи релігійні особливості, географічне положення району, погоду та багато інших, вплив яких призводить до деяких відхилень реальних спостережень від модельних. Ці відхилення можуть бути описані як випадкова складова моделі.

У деяких випадках заздалегідь невідомо, які фактори за умов, що склалися, насправді є визначальними, а якими можна знехтувати. Крім того, інколи безпосередньо врахувати якийсь фактор неможливо через відсутність ст-их даних. Наприклад, обсяг заощаджень домогосподарств може визначатися не лише прибутками їх членів, а й станом здоров'я, інформація про яке в цивілізованих країнах становить лікарську таємницю. У деяких ситуаціях ряд факторів має принципово випадковий характер, що додає неоднозначності певним моделям, наприклад погода в моделях, що прогнозують обсяг врожаю.

2. Неправильний вибір функціональної форми моделі. Через слабку вивченість досліджуваного процесу або через його мінливість може бути неправильно дібрано функцію, що його моделює. Це, безумовно, спричинить відхилення моделі від реальності, що позначиться на величині випадкової складової. Наприклад, виробнича функція (У) одного фактора (X) може моделюватися функцією У = а + ЬХ, хоча мала б використовуватися інша моделі,: У = аХь(0<Ь<1), що враховує закон спадної ефективності. Крім того, неправильним може бути добір пояснюючих змінних.

3. Агрегування змінних. У багатьох моделях розглядаються залежності між факторами, що самі є складною комбінацією інших, простіших змінних. Наприклад, при вивченні сукупного попиту аналізується залежність, у якій пояснювана змінна (сукупний попит) є складною композицією індивідуальних попитів, що також може виявитися причиною відхилення реальних значень від модельних.

4. Помилки вимірювань. Якою б якісною не була модель, помилки вимірювання змінних впливатимуть на розбіжності між модельними та емпіричними даними, що також позначиться на величині випадкового члена.

5. Обмеженість статистичних даних. Найчастіше будуються моделі, що описується неперервними функціями. Для оцінювання параметрів моделі використовується набір даних, що має дискретну структуру. Ця невідповідність знаходить відображення у випадковому відхиленні,

6. Непередбачуваність людського фактора. Ця причина може "зіпсувати" найякіснішу модель. Дійсно, при правильному виборі форми моделі. Скрупульозному доборі пояснюючих змінних неможливо спрогнозувати поведінку кожного індивідуума.

Сукупність методів, за допомогою яких досліджуються та узагальнюються взаємозв'язки кореляційно пов'язаних змінних, називається кореляційно-регресійним аналізом.

Зазначеними методами розв'язують дві основні задачі:

1) знаходження загальної закономірності, що характеризує залежність двох (чи більше) кореляційно пов'язаних змінних – розробка математичної моделі зв’язку (задача регресійного аналізу);

2) визначення тісноти зв’язку (кореляційного аналізу).

Здебільшого процедура аналізу зв'язку між змінними дає змогу встановити його природу, тобто визначити форму залежності між змінними.

Побудова якісного рівняння регресії, що відповідає емпіричним даним і цілям досліджень, є досить складним процесом. Його можна поділити на три етапи:

1) вибір форми рівняння регресії;

2) визначення параметрів обраного рівняння;

3) аналіз якості рівняння та перевірка адекватності рівняння емпіричним даним, удосконалення рівняння.

Вибір форми зв'язку змінних називається специфікацією моделірегресії.

У випадку парної регресії вибір формули звичайно здійснюється за графічним зображенням реальних статистичних даних у вигляді точок у декартовій системі координат, що називається кореляційним полем (діаграмою розсіювання) (рис. 1.1).

Рис. 1.1

На рис. 1.1 проілюстровано три ситуації.

На графіку 1.1, а взаємозв'язок між X і У близький до лінійного, і пряма 1 досить добре узгоджується з емпіричними точками. Тому щоб описати залежність між X і У, Доцільно вибрати лінійну функцію У = Ьо + Ь1Х.

На графіку 1,1, б реальний взаємозв'язок між X і У, найімовірніше, описується квадратичною функцією У = аХ2 + ЬХ + с (лінія 2).

На графіку 1.1, в явний взаємозв'язок між X і У відсутній. Тому щоб краще вибрати форму зв'язку, необхідно, можливо, збільшити кількість спостережень — точок кореляційного поля або скористатися іншими способами вимірювання показників.

У випадку множинної регресії визначити форми залежності ще складніше.

Якщо природа зв'язку невідома, то співвідношення між показниками описують за допомогою наближених спрощених форм залежностей, насамперед лінійних.

Наприклад, Кейнс запропонував лінійну формулу залежності індивідуального споживання С від доходу У: С = с0 + ЬУ, де с0 > 0 — величина автономного споживання; Ь — гранична схильність до споживання, 0 < Ь < 1.

Однак поки не обчислено кількісні значення коефіцієнтів с0 і Ь й не перевірено надійність отриманих результатів, зазначена формула залишається лише гіпотезою.

refalok.ostref.ru referatuya.nugaspb.ru referatxcv.nugaspb.ru shv.deutsch-service.ru Главная Страница