.1 В таблице 2 приведены данные, формирующие цену на строящиеся квартиры в двух различных районах
Таблица 2
Имеются следующие факторы, влияющие на цену жилья:
район, где расположена строящаяся квартира (а или б);
жилая площадь квартиры;
площадь кухни;
этаж (средний или крайний);
тип дома (панельный или кирпичный);
срок сдачи квартиры (через сколько месяцев).
Определите минимальный объём выборки Nmin для построения линейной множественной регрессии. Какие переменные являются фиктивными. Для оценки зависимости у от х построена линейная множественная регрессионная модель с помощью метода наименьших квадратов:
Дайте экономическую интерпретацию полученной модели.
Определить минимальный объём выборки для получения статистически значимой модели можно по формуле
= 5(m + n),
где m - число факторов, включаемых в модель,- число свободных членов в уравнении.
Число факторов, включаемых в модель, m = 6, а число свободных членов в уравнении n = 1. Получаем Nmin = 5 × (6 + 1) = 35.
Экономическую интерпретацию полученной модели состоит в следующем:
Квартиры в районе А стоят на 41,75% дешевле, чем в районе В. При увеличении жилой площади на 1% стоимость квартиры возрастает на 0,794%. При увеличении площади кухни на 1% стоимость квартиры увеличивается на 0,096%. Квартиры на средних этажах стоят на 34,8% дороже, чем на крайних. Квартиры в кирпичных домах стоят на 30,48% дороже, чем в панельных домах, при увеличении срока сдачи дома на 1% стоимость квартиры уменьшается на 0,396%.
Таблица 3. Дана матрица коэффициентов частной корреляции.
х1 - район, где расположена строящаяся квартира (а или б);
х2 - общая площадь квартиры;
х3 - жилая площадь квартиры;
х4 - площадь кухни;
х5 - срок сдачи квартиры (через сколько месяцев).
Проверьте факторы на мультиколлинеарность и устраните ее.
Проверим факторы на мультиколлинеарность. Мультиколлинеарная зависимость присутствует, если коэффициент парной корреляции:
Это условие выполняется для факторов х2 и х3, х2 и х4, х3 и х4:
Будем исключать факторы, имеющие наименьшее значение
Из пары факторов х2 и х3 исключаем фактор х3, так как rx3y = -0,81 меньше rx2y = 0,9045.
Из пары факторов х2 и х4 исключаем фактор х4, так как rx4y = 0,693 меньше rx2y = 0,9045.
И последнюю пару факторов х3 и х4 можно не рассматривать, т. к. они уже исключены.
Оставшиеся в модели факторы не являются мультиколлинеарными.
|