Методы коррекции гетероскедастичности случайных отклонений, тестирование гетероскедастичности в скорректированной модели с помощью тес
Курсовая работа, 24 Октября 2011, автор: пользователь скрыл имя
Описание работы
При проведении регрессионного анализа, основанного на методе наименьших квадратов, на практике следует обратить внимание на проблемы, связанные с выполнимостью свойств случайных отклонений модели. Одной из ключевых предпосылок МНК является условие постоянства дисперсий случайных отклонений. Данное условие подразумевает, что, несмотря на то, что при каждом конкретном наблюдении случайное отклонение может быть либо большим, либо меньшим, не должно быть некой априорной причины, вызывающей большую ошибку (отклонение). Выполнимость данной предпосылки называется гомоскедастичностью.
Содержание
Содержание
Введение 3
Теоретическое обоснование модели 5
Построение и анализ эконометрической модели 6
Заключение 11
Список использованных источников 12
Приложение 13
Работа содержит 1 файл
готовая.doc
— 380.50 Кб (Скачать)МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ
БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Экономический факультет
Кафедра
банковской и финансовой экономики
КУРСОВОЕ
ПРОЕКТИРОВАНИЕ
на тему:
Методы коррекции гетероскедастичности
случайных отклонений, тестирование гетероскедастичности
в скорректированной модели с помощью
теста Голдфелда-Квандта
Студентки
3 курса __________ дневного отделения
Научный
руководитель __________
Минск 2010
Содержание
Введение
При проведении регрессионного анализа, основанного на методе наименьших квадратов, на практике следует обратить внимание на проблемы, связанные с выполнимостью свойств случайных отклонений модели. Одной из ключевых предпосылок МНК является условие постоянства дисперсий случайных отклонений. Данное условие подразумевает, что, несмотря на то, что при каждом конкретном наблюдении случайное отклонение может быть либо большим, либо меньшим, не должно быть некой априорной причины, вызывающей большую ошибку (отклонение). Выполнимость данной предпосылки называется гомоскедастичностью. Невыполнимость данной предпосылки называется гетероскедастичностью. Гетероскедастичность может быть вызвана следующими причинами:
- Разброс в значениях переменных
- Наличие резко выделяющихся наблюдений
- Ошибки спецификации модели (наличие пропущенных переменных)
- Ассиметрия распределения данных по какой-либо экзогенной переменной
- Ошибки в преобразовании данных
Обычно проблема гетероскедастичности характерна для моделей, построенных на пространственных данных. Наличие гетероскедастичности влечет за собой следующие последствия:
Оценки коэффициентов модели остаются линейными и несмещенными, но перестают быть эффективными. Оценки не будут даже асимптотически эффективными.
Дисперсия случайного отклонения рассчитывается со смещением, поэтому дисперсии оценок или параметров модели также являются смещенными оценками;
Выводы о качестве регрессионной модели, сделанные на основании t- и F-статистик, становятся ненадежными, а заключение, сделанное на основании этих статистик, может быть ошибочным.
Следовательно,
при присутствии
Итак, иногда на практике, зная природу данных, проблему гетероскедастичности можно предвидеть и попытаться устранить ее на этапе спецификации модели. Однако чаще всего проблему обнаружения гетероскедастичности приходится решать уже после оценивания регрессионной модели.
Для выявления проблемы гетероскедастичности могут использоваться следующие методы:
- Графический анализ
- Тест Голдфелда-Квандта
- Тест Парка
- Тест Глейзера
При
обнаружении
Я исследовала модель на
Таким
образом, целью данной работы является
исследование модели на наличие гетероскедастичности
и последующее ее устранение. Для
проведения данного анализа будет
исследована зависимость цены квартиры
в г. Минске от ее характеристик (приложение,
таблица№1).
Теоретическое обоснование модели
В исследуемой модели в качестве зависимой переменной взята цена квартиры в городе Минске. Целесообразно проводить оценку продажной цены квартиры (price, $) по следующим факторам:
- общая площадь (м2) (totsq): при увеличении количества квадратных метров общей площади квартиры пропорционально возрастает ее стоимость;
- жилая площадь(м2) (livsq): при увеличении количества квадратных метров жилой площади квартиры пропорционально возрастает ее стоимость;
- площадь кухни(м2)( kitsq): при увеличении количества квадратных метров кухни пропорционально возрастает стоимость квартиры;
- расстояние до центра (м) (distc): чем меньше расстояние от квартиры до центра города, тем выше стоимость данной квартиры;
- этаж – 0 – первый или последний, 1 – нет(floor): стоимость квартиры, находящейся на первом или последнем этаже ниже стоимости квартир, находящихся на промежуточных этажах;
- наличие балкона – 1 – есть хотя бы один или лоджия, 0 – нет(bal): наличие в квартире балкона повышает ее стоимость;
- наличие телефона – 1- есть, 0 - нет (tel): наличие в квартире телефонной связи увеличивает ее стоимость;
- «возраст» дома (year): квартиры более раннего года постройки, как правило, дешевле аналогичных квартир более позднего года постройки.
В модели предполагается положительная зависимость PRICE от TOTSQ, LIVSQ, KITSQ, FLOOR, BAL, TEL; отрицательная — от DISTC, YEAR. При исследовании зависимости между данными переменными вероятно возникновение проблемы гетероскедастичности (PRICE будет иметь большую ошибку для больших квартир.
Для устранения гетероскедастичности используется взвешенный метод наименьших квадратов. Преобразование модели зависит от того, известны дисперсии случайных отклонений или нет. Если дисперсии случайных отклонений известны можно устранить гетероскедастичность, разделив каждое наблюдаемое значение на соответствующее ему значение среднего квадратического отклонения. Для преобразованной модели выполняются все предпосылки МНК; оценки, полученные по МНК являются BLUE- оценками. Оценки, полученные для исправленного уравнения, используются в исходном уравнении. Однако на практике значения дисперсии чаще всего неизвестны, и для применения взвешенного МНК необходимо сделать реалистичные предположения о дисперсии.
Построение и анализ эконометрической модели
Для начала необходимо проверить модель на адекватность.
Если
знак положителен , то это прямая зависимость:
при повышении Х – растет Y,
и аналогично при уменьшении Х – падает
Y. Это полностью согласовывается с экономической
теорией.
Для начала мы исследуем значимость влияния всех факторов на цену квартиры.
| Коэффициенты | Ст. ошибка | t-статистика | P-Значение | |
| Y-пересечение | -23663,9 | 18732,7 | -1,2632 | 0,21248 |
| distc | -2,14783 | 0,878342 | -2,4453 | 0,01811 |
| totsq | 3904,6 | 1553,3 | 2,5137 | 0,01528 |
| Livsq | -2129,74 | 1632,66 | -1,3045 | 0,19817 |
| Kitsq | 132,229 | 2208,8 | 0,0599 | 0,95251 |
| dopsq | -960,113 | 1207,84 | -0,7949 | 0,43051 |
| floor | -717,44 | 5969,81 | -0,1202 | 0,90483 |
| totfloor | 288,872 | 1208,88 | 0,2390 | 0,81213 |
| bal | 3163,87 | 10069,3 | 0,3142 | 0,75470 |
| tel | 13496,5 | 8115,84 | 1,6630 | 0,10270 |
| year | -34,0782 | 220,289 | -0,1547 | 0,87770 |
Для проверки значимости коэффициентов используем P-value- вероятность того, что статистика будет меньше, чем t-набл.
Так, если P-value<Alpha, то коэффициенты значимы, если же
P-value>Alpha, коэффициенты незначимы.
В нашем случае P-value <0,05.
И в
итоге значимыми оказались факторы
– distc, totsq. Все незначимые факторы мы исключим
из модели и построим новую модель.
R2=0,858209, F(R2)=29,65795
| Регрессионная статистика | |
| Множественный R | 0,807777 |
| R-квадрат | 0,858209 |
| Нормированный R-квадрат | 0,829272 |
| Стандартная ошибка | 18590,73 |
| Наблюдения | 59 |
Полученное при построении регрессии значение коэффициента детерминации R2=0,858209 свидетельствует о сравнительно невысокой точности модели, т.е. о том, что изменение данных факторов в совокупности лишь в некоторой степени определяет изменение зависимой переменной Y. Влияние случайной составляющей на наблюдаемые значения объясняемой переменной значительно.
| Коэффициенты | Ст. ошибка | t-статистика | P-Значение | |
| Y-пересечение | -5290,571274 | 9675,674362 | -0,546791 | 0,586657 |
| distc | -1,772805891 | 0,743724094 | -2,383688 | 0,020494 |
| totsq | 2314,219149 | 138,915663 | 16,659166 | 1,44E-23 |
R2=0,837008, F(R2)=146, 3555
| Регрессионная статистика | |
| Множественный R | 0,91488154 |
| R-квадрат | 0,837008233 |
| Нормированный R-квадрат | 0,831289223 |
| Стандартная ошибка | 18480,59217 |
| Наблюдения | 60 |