Построение множественной регрессивной модели

.1 В таблице 2 приведены данные, формирующие цену на строящиеся квартиры в двух различных районах

Таблица 2

Имеются следующие факторы, влияющие на цену жилья:

район, где расположена строящаяся квартира (а или б);

жилая площадь квартиры;

площадь кухни;

этаж (средний или крайний);

тип дома (панельный или кирпичный);

срок сдачи квартиры (через сколько месяцев).

Определите минимальный объём выборки Nmin для построения линейной множественной регрессии. Какие переменные являются фиктивными. Для оценки зависимости у от х построена линейная множественная регрессионная модель с помощью метода наименьших квадратов:

Дайте экономическую интерпретацию полученной модели.

Определить минимальный объём выборки для получения статистически значимой модели можно по формуле

= 5(m + n),

где m - число факторов, включаемых в модель,- число свободных членов в уравнении.

Число факторов, включаемых в модель, m = 6, а число свободных членов в уравнении n = 1. Получаем Nmin = 5 × (6 + 1) = 35.

Экономическую интерпретацию полученной модели состоит в следующем:

Квартиры в районе А стоят на 41,75% дешевле, чем в районе В. При увеличении жилой площади на 1% стоимость квартиры возрастает на 0,794%. При увеличении площади кухни на 1% стоимость квартиры увеличивается на 0,096%. Квартиры на средних этажах стоят на 34,8% дороже, чем на крайних. Квартиры в кирпичных домах стоят на 30,48% дороже, чем в панельных домах, при увеличении срока сдачи дома на 1% стоимость квартиры уменьшается на 0,396%.

Таблица 3. Дана матрица коэффициентов частной корреляции.

х1 - район, где расположена строящаяся квартира (а или б);

х2 - общая площадь квартиры;

х3 - жилая площадь квартиры;

х4 - площадь кухни;

х5 - срок сдачи квартиры (через сколько месяцев).

Проверьте факторы на мультиколлинеарность и устраните ее.

Проверим факторы на мультиколлинеарность. Мультиколлинеарная зависимость присутствует, если коэффициент парной корреляции:

Это условие выполняется для факторов х2 и х3, х2 и х4, х3 и х4:

Будем исключать факторы, имеющие наименьшее значение

Из пары факторов х2 и х3 исключаем фактор х3, так как rx3y = -0,81 меньше rx2y = 0,9045.

Из пары факторов х2 и х4 исключаем фактор х4, так как rx4y = 0,693 меньше rx2y = 0,9045.

И последнюю пару факторов х3 и х4 можно не рассматривать, т. к. они уже исключены.

Оставшиеся в модели факторы не являются мультиколлинеарными.