Сравнительный подход множественная регрессия

Автор: Пользователь скрыл имя, 23 Сентября 2011 в 15:30, реферат

Описание работы

Регрессионная модель описывает объективно существующие между явлениями корреляционные связи. По своему характеру корреляционные связи необычно сложны и разнообразны. Отследить все эти взаимосвязи и установить точный функциональный вид практически невозможно. Поэтому при выборе функции идет речь только об аппроксимации относительно простыми функциями несравненно более сложных по своей природе взаимосвязей.

Работа содержит 1 файл

1. Раздел в отчет-Сравнительный подход.doc

— 977.00 Кб (Скачать)
 

Так как  наибольшее значение Х (площадь объекта, численность населения) намного  превосходит минимальное (коэффициенты значимости, описывающие качественные признаки объектов), требуется преобразование исходных факторов Хi. Устранение приоритета относительных отклонений над абсолютными производим путем логарифмического шкалирования данных.

Формула регрессии при этом принимает  вид: 

y = exp(a + b1 *ln x1 + b2 * ln x2 …. bn *ln xn + e) 

Преобразованные факторы приведены в таблице:

Таблица  1.3. Логарифмированные значения характеристик сопоставимых объектов

№ пп Цена Площадь Тип здания Район города Оживленность  улицы Парковка Охрана Состояние Численность населения
ln(Y) ln(X1) ln(X2) ln(X3) ln(X4) ln(X5) ln(Х6) ln(X7) ln(X8)
1 11,287 4,127 0,000 1,099 1,099 0,693 0,693 1,099 6,359
2 11,213 4,007 0,000 1,099 0,693 0,693 0,693 1,099 6,359
3 11,211 3,738 0,000 1,099 1,099 0,693 0,693 1,099 6,359
4 11,099 4,007 0,000 1,099 1,099 0,693 0,000 0,693 6,364
5 11,052 5,394 0,693 1,099 0,000 0,693 0,000 0,000 6,364
6 11,052 5,247 0,693 1,099 1,099 0,000 0,000 1,099 6,364
7 11,020 4,905 0,000 1,099 1,099 0,693 0,693 1,099 6,359
8 10,981 3,951 0,000 1,099 1,099 0,000 0,000 1,099 6,364
9 10,977 4,220 0,000 1,099 1,099 0,693 0,693 1,099 6,359
10 10,969 4,624 0,693 1,099 1,099 0,693 0,000 1,099 6,364
11 10,929 6,700 0,693 0,693 0,693 0,693 0,000 0,693 6,364
12 10,917 3,784 0,693 0,693 0,693 0,000 0,693 0,693 6,359
13 10,901 2,833 0,000 0,693 0,693 0,693 0,000 0,693 6,364
14 10,885 6,250 0,693 1,099 1,099 0,000 0,000 0,693 6,364
15 10,885 4,787 0,693 0,693 0,693 0,693 0,693 0,693 6,364
16 10,838 4,382 0,693 0,693 0,693 0,000 0,000 0,693 6,359
17 10,835 5,561 0,000 1,099 0,693 0,693 0,693 0,693 6,364
18 10,820 4,159 0,000 0,693 0,693 0,693 0,693 0,693 6,359
19 10,762 4,527 0,693 1,099 0,693 0,000 0,000 0,693 6,364
20 10,712 4,682 0,693 0,693 0,000 0,000 0,000 0,693 6,359
21 10,703 4,691 0,693 0,693 0,693 0,000 0,000 1,099 6,359
22 10,684 6,551 0,693 0,693 0,693 0,693 0,693 1,099 6,359
23 10,683 5,075 0,000 0,693 0,693 0,693 0,000 1,099 5,136
24 10,600 4,934 0,000 0,693 0,693 0,693 0,000 0,693 5,136
25 10,583 4,511 0,000 0,693 0,693 0,693 0,693 0,000 6,359
26 10,575 4,700 0,000 0,693 0,693 0,693 0,693 0,000 6,364
27 10,571 4,718 0,000 0,693 0,693 0,693 0,693 0,000 6,359
28 10,553 4,426 0,000 1,099 1,099 0,693 0,693 0,000 6,359
29 10,540 4,344 0,693 0,693 0,693 0,000 0,000 0,000 6,364
30 10,533 3,738 0,000 0,693 0,693 0,693 0,000 0,000 6,364
31 10,492 3,555 0,000 0,693 0,693 0,693 0,000 0,000 6,364
32 10,479 5,832 0,693 0,693 0,693 0,693 0,000 0,000 6,364
33 10,422 4,500 0,693 0,693 0,693 0,000 0,693 0,000 5,136
34 10,417 4,620 0,000 1,099 0,693 0,000 0,000 1,099 3,381
35 10,378 4,970 0,000 1,099 1,099 0,000 0,000 1,099 3,381
36 10,292 5,652 0,000 1,099 0,693 0,000 0,000 1,099 3,381
37 10,290 6,190 0,693 0,000 0,000 0,693 0,000 0,000 6,364
38 10,202 6,802 0,693 0,000 0,000 0,000 0,000 0,000 6,359
39 10,193 4,731 0,000 1,099 0,693 0,000 0,000 0,693 3,381
40 10,173 6,780 0,000 0,000 0,000 0,000 0,693 0,693 6,364
41 10,152 5,220 0,693 0,000 0,000 0,000 0,693 0,693 5,136
42 10,151 4,474 0,000 1,099 1,099 0,000 0,000 1,099 3,381
43 10,146 5,226 0,000 0,000 0,000 0,693 0,000 0,000 5,136
44 10,127 4,465 0,000 1,099 0,693 0,000 0,000 0,693 3,381
45 10,126 2,918 0,000 1,099 0,693 0,000 0,000 0,693 3,381
46 10,119 4,317 0,000 0,000 0,000 0,693 0,000 0,000 5,136
47 10,070 4,143 0,693 0,000 0,000 0,693 0,000 0,000 5,136
48 9,968 4,317 0,000 0,000 0,000 0,000 0,000 0,000 6,364
49 9,872 4,787 0,693 0,000 0,000 0,693 0,000 0,000 5,136
Объект  оценки ? 5,508 0,693 0,000 0,000 0,693 0,000 0,000 3,381

1.8. Построение регрессионной модели

   Для исключения явления мультиколлинеарности (включение в модель независимых  переменных, являющихся выражением одного и того же свойства объекта), на первом этапе проведен корреляционный анализ, позволяющий выявить наличие связанных признаков.

   Корреляционная  матрица приведена в таблице:

   Таблица  1.4. Корреляционная матрица

  ln(Y) ln(X1) ln(X2) ln(X3) ln(X4) ln(X5) ln(Х6) ln(X7) ln(X8)
ln(Y) 1                
ln(X1) -0,1460332 1              
ln(X2) 0,045457 0,3846835 1            
ln(X3) 0,6029753 -0,2701358 -0,2484665 1          
ln(X4) 0,5926346 -0,2813713 -0,2736948 0,8323963 1        
ln(X5) 0,2969205 -0,0652602 -0,2037719 -0,0742019 0,027726 1      
ln(Х6) 0,3131538 -0,0080227 -0,1691259 0,071755 0,179986 0,2846674 1    
ln(X7) 0,4736085 -0,032524 -0,1469288 0,5761718 0,5610351 -0,2293963 0,0898334 1  
ln(X8) 0,5743893 0,0902628 0,2986733 -0,1357548 0,0050905 0,3957969 0,3303313 -0,1990939 1
 

   Сразу бросается в глаза наличие  высокой корреляционной связи (коэффициент  корреляции = 93%) между параметрами ln(Х3) – Район города и ln(Х4) – Оживленность улицы. В самом деле, данные признаки тесно взаимосвязаны, центральная часть города характеризуется большей оживленностью улиц, чем окраины. Для исключения явления мультиколлинеарности, в модели необходимо оставить только один признак. Поскольку для офисов наиболее значимым фактором, оказывающим влияние на стоимость объекта, является признак расположение в определенной части города (признак «оживленность улиц» более применим к характеристикам торговых объектов), то дальнейший анализ производим без учета признака «оживленность улиц» (ln(Х4).

   Регрессионная модель реализована с применение программы «Пакет анализа» в EXCEL. Результаты регрессионного анализа, выполненного при уровне надежности 95%, представлены в утилите из EXCEL, там же приводятся также результаты дисперсионного анализа, коэффициенты регрессии, стандартная погрешность вычисления стоимости, среднеквадратичные отклонения, стандартные погрешности для коэффициентов. 

 

   Последние четыре столбца нижней таблицы содержат границы доверительных интервалов для регрессионных коэффициентов, построенные для стандартного (95%) и выбранного пользователем (95%) уровней надежности.

   Проверка  адекватности модели

   Далее необходимо произвести проверку значимости регрессии.

   Точность  и надежность полученного результата оценивается с помощью ряда статистических критериев. Приведенные  статистические оценки получены и справедливы в  предположении нормальности распределения  случайной величины Y, а также независимости и нормальности распределения погрешностей ei.

   1) Для интерпретации итоговых параметров  регрессии рассмотрим результаты  дисперсионного анализа, приведенные  в таблице «Дисперсионный анализ».

   В таблице анализа дисперсии дается информация о статистической значимости подогнанной модели регрессии. Дисперсионный анализ основывается на следующих гипотезах:

  • нулевая гипотеза Н0: коэффициенты регрессии для всех предикторов (факторов) равны 0;
  • альтернативная гипотеза Hа: по крайне мере один из коэффициентов регрессии не равен 0.

   Значение  F в таблице равно 52 если нулевая гипотеза верна, то F- отношение удовлетворяет F-распределению с равным 7 числителем  степеней свободы и равным 41 знаменателем степеней свободы.

   Проверка  значимости уравнения регрессии  с помощью F-критерия Фишера основана на вычислении статистики  F.

   Значение  коэффициента Фишера  сравнивают с  критическим значением Fкр, представляющее собой значение F-распределения (распределение Фишера-Снедекора) со степенями свободы (n-k-1), k и уровнем значимости a=1-g. Если неравенство F > Fкр выполнено, то регрессионная зависимость статистически значима, с надежностью g  (в расчетах принято g = 0,95), описывает известные рыночные данные.

   Критическое значение Fкр  вычислено  с помощью функции FРАСПОБР(0,05;7;41) в программе Excel, первым аргументом этой функции является уровень значимости, вторым – число степеней свободы регрессионного уравнения, третьим – количество факторов (число степеней свободы знаменателя). Fкр = 2,24 < F = 52, т.е. неравенство выполнено, следовательно, регрессия прошла проверку. Построенная регрессионная зависимость значима со статистической надежностью (доверительной вероятностью) 95% (g=0,95).

   2) Коэффициент детерминации R2 позволяет судить о том, какой процент дисперсии известных рыночных данных объясняется с помощью регрессионной зависимости. Иными словами, значение R-квадрата является индикатором степени подгонки модели к данным (значение R-квадрата близкое к 1.0 показывает, что модель объясняет почти всю изменчивость соответствующих переменных). При применении множественной регрессии, предпочтительнее пользоваться нормированным R2.

   В данном случае, нормированный R2 = 0,88, это означает, что 88% изменчивости цены за 1 кв.м. площади объектов-аналогов, объясняется разнообразием значений признаков (предикторов), а оставшиеся проценты объясняются случайными отклонениями.

Связь между рыночными ценами объектов-аналогов и примененными в расчетах коэффициентами значимости считается достаточной при нормированном R2 > 0,7, то есть, найденная связь удовлетворяет критерию достаточности. (шкала Чеддока, http://www.statsoft.ru/home/portal/glossary/GlossaryTwo/C/CoefficientofDetermination.htm)

 

3) Далее  следует проверка значимости отдельных регрессионных коэффициентов. Значения t-статистики указаны в утилите из EXCEL.

Критическое значение для уровня значимости 0,05 возвращается функцией СТЬЮДРАСПОБР(0,05;41) и равно 2,02. Таким образом, значимость регрессионных коэффициентов при факторах ln(X1), ln(X2), ln(X6) со  статистической надежностью 95% не подтверждается. В силу незначимости регрессионных коэффициентов исключаем их из анализа и строим модель, исходя из меньшего числа влияющих факторов.

В итоге  получены следующие результаты:

 

 

   1) Проверка значимости уравнения  регрессии с помощью нормированного R2 и Fкр подтверждает ее значимость, R2 = 0,878 > 0,7; F = 87 > Fкр = 2,58.

   2) Критическое значение для уровня  значимости 0,05 возвращается функцией  СТЬЮДРАСПОБР(0,05;44) и равно 2,02. Значения t-статистики при всех регрессионных коэффициентах по абсолютной величине больше tкр, то есть, все регрессионные коэффициенты, учитывающие вклад соответствующих факторов в стоимость объекта, статистически значимы, и подлежат учету в регрессионной модели.

   Прежде  чем производить расчет стоимости  по полученному уравнению регрессии, необходимо оценить относительную  погрешность этого уравнения (достоверность).

   Оценка  меры достоверности (D) анализируемого уравнения регрессии производится с помощью процентного соотношения стандартной ошибки уравнения, умноженной на tкр и среднеарифметического значения по результативному признаку Y. В случае, если максимальное значение D не превышает 10%, анализируемое уравнение регрессии достаточно корректно отображает корреляционную связь и может быть использовано для расчета стоимости объекта оценки.

   Стандартная ошибка составляет  0,129.

   Матожидание цен аналогов, рассчитанное по столбцу  «ln(Цена)» таблицы 1.3, составляет 10,601.

   D = 0,129*2,02/10,601 * 100 % ≈ 2,5% .

   Высокое значение достоверности (2,5%<10%) свидетельствует о возможности использования линейной зависимости вида = exp(a + b1 *ln x1 + b2 * ln x2 …. b7 *ln x7 + έ) для расчета стоимости 1 кв. м. площади оцениваемого объекта.

Информация о работе Сравнительный подход множественная регрессия