Корреляционный анализ в изучении статистической взаимосвязи показателей

Автор: Пользователь скрыл имя, 18 Ноября 2011 в 00:59, курсовая работа

Описание работы

Исследуя природу, общество, экономику, необходимо считаться со взаимосвязью наблюдаемых процессов и явлений. При этом полнота описания так или иначе определяется количественными характеристиками причинно-следственных связей между ними. Оценка наиболее существенных из них, а также воздействия одних факторов на другие является одной из основных задач статистики.
В своей работе я рассмотрю только лишь корреляционный анализ в изучении статистической взаимосвязи показателей.
Данная тема на мой взгляд актуальна, поскольку этот метод обработки статистических данных довольно прост и подлежит самостоятельному обучению, а также пригодится в дальнейшем.

Содержание

Введение
1. Методы статистического изучения взаимосвязей
2.Применение корреляционного анализа в статистическом изучении взаимосвязей показателей
2.1.Характеристика корреляционного анализа
2.2.Парная и множественная корреляция
2.3.Оценка тесноты связи между экономическими показателями
3.Применение корреляционного анализа для изучения объекта исследования
Заключение
Список литературы

Работа содержит 1 файл

курсовая статистика.docx

— 57.66 Кб (Скачать)

     Наглядным изображением корреляционной таблице  служит корреляционное поле. Оно представляет собой график, где на оси абсцисс откладывают значения Х, по оси ординат – У, а точками показывается сочетание Х и У. По расположению точек, их концентрации в определенном направлении можно судить о наличии связи.

     В итогах корреляционной таблицы по строкам  и столбцам приводятся два распределения  – одно по X, другое по У. Рассчитаем для каждого Хсреднее значение У, т.е.   , как

     Последовательность  точек (Xi,   ) дает график, который иллюстрирует зависимость среднего значения результативного признака У от факторного X, – эмпирическую линию регрессии, наглядно показывающую, как изменяется У по мере изменения X.

     По  существу, и корреляционная таблица, и корреляционное поле, и эмпирическая линия регрессии предварительно уже характеризуют взаимосвязь, когда выбраны факторный и  результативный признаки и требуется  сформулировать предположения о  форме и направленности связи. В  то же время количественная оценка тесноты связи требует дополнительных расчетов.

     Практически для количественной оценки тесноты  связи широко используют линейный коэффициент корреляции. Иногда его называют просто коэффициентом корреляции. Если заданы значения переменных Х и У, то он вычисляется по формуле

     

     Можно использовать и другие формулы, но результат  должен быть одинаковым для всех вариантов  расчета.

     Коэффициент корреляции принимает значения в  интервале от -1 до + 1. Принято считать, что если  |r| < 0,30, то связь слабая; при  |r| = (0,3÷0,7) – средняя; при  |r| > 0,70 – сильная, или тесная. Когда  |r| = 1 – связь функциональная. Если же r принимает значение около 0, то это дает основание говорить об отсутствии линейной связи между У и X. Однако в этом случае возможно нелинейное взаимодействие. что требует дополнительной проверки и других измерителей, рассматриваемых ниже.

     Для характеристики влияния изменений  Х на вариацию У служат методы регрессионного анализа. В случае парной линейной зависимости строится регрессионная модель

     

     где n – число наблюдений; 
а0, а– неизвестные параметры уравнения;  
e– ошибка случайной переменной У.

     Уравнение регрессии записывается как

     

     где Уiтеор – рассчитанное выравненное значение результативного признака после подстановки в уравнение X.

     Параметры аи аоцениваются с помощью процедур, наибольшее распространение из которых получилметод наименьших квадратов. Его суть заключается в том, что наилучшие оценки ag и а, получают, когда

     

     т.е. сумма квадратов отклонений эмпирических значений зависимой переменной от вычисленных  по уравнению регрессии должна быть минимальной. Сумма квадратов отклонений является функцией параметров аи а1. Ее минимизация осуществляется решением системы уравнений

     

     Можно воспользоваться и другими формулами, вытекающими из метода наименьших квадратов, например:

     

     Аппарат линейной регрессии достаточно хорошо разработан и, как правило, имеется  в наборе стандартных программ оценки взаимосвязи для ЭВМ. Важен смысл  параметров: а– это коэффициент регрессии, характеризующий влияние, которое оказывает изменение Х на У. Он показывает, на сколько единиц в среднем изменится У при изменении Х на одну единицу. Если а, больше 0. то наблюдается положительная связь. Если а имеет отрицательное значение, то увеличение Х на единицу влечет за собой уменьшение У в среднем на а1. Параметр аобладает размерностью отношения У к X.

     Параметр a– это постоянная величина в уравнении регрессии. На наш взгляд, экономического смысла он не имеет, но в ряде случаев его интерпретируют как начальное значение У.

     Например, по данным о стоимости оборудования Х и производительности труда У методом наименьших квадратов получено уравнение

     У = -12,14 + 2,08Х.

     Коэффициент а, означает, что увеличение стоимости  оборудования на 1 млн руб. ведет в среднем к росту производительности труда на 2.08 тыс. руб.

     Значение  функции У = a+ а1Х называется расчетным значением и на графике образует теоретическую линию регрессии.

     Смысл теоретической регрессии в том, что это оценка среднего значения переменной У для заданного значения X.

     Парная  корреляция или парная регрессия  могут рассматриваться как частный  случай отражения связи некоторой  зависимой переменной, с одной  стороны, и одной из множества  независимых переменных – с другой. Когда же требуется охарактеризовать связь всего указанного множества  независимых переменных с результативным признаком, говорят о множественной корреляции или множественной регрессии.

     Множественная корреляция — метод многомерного анализа, широко применяемый в психологии и др. поведенческих науках. Множественную корреляцию можно рассматривать как расширение двумерной корреляции, а ее коэффициент — как показатель степени связи одной переменной с оптимально взвешенной комбинацией нескольких других переменных. Веса этих переменных определяются методом наименьших квадратов, так чтобы минимизировать остаточную дисперсию.

     Коэффициент множественная корреляция принимает значения от 0 до 1 и интерпретируется аналогично коэффициенту двумерной корреляции, если справедливы допущения о прямолинейности и других характеристиках двумерных интеркорреляций, на основе которых вычисляется этот коэффициент.

     В психологии квадрат множественной  корреляции (R2) или, как его еще  наз., коэффициент множественной  детерминации, часто используется для  оценки доли дисперсии зависимой  переменной, приходящейся на совокупность независимых переменных. Родственный  метод — множественная регрессия  — используется для предсказания зависимой переменной (или критерия) по совокупности независимых переменных (или предикторов). 
 
 
 
 
 
 
 
 
 
 
 
 

     2.3.Оценка  тесноты связи  между экономическими  показателями 

     Получив оценки корреляции и регрессии, необходимо проверить их на соответствие истинным параметрам взаимосвязи.

     Существующие  программы для ЭВМ включают, как  правило, несколько наиболее распространенных критериев. Для оценки значимости коэффициента парной корреляции рассчитывают стандартную  ошибку коэффициента корреляции:

     

     В первом приближении нужно, чтобы   . Значимость rxy проверяется его сопоставлением с   , при этом получают

     

     где tрасч – так называемое расчетное значение t-критерия.

     Если  tрасч больше теоретического (табличного) значения критерия Стьюдента (tтабл) для заданного уровня вероятности и (n-2) степеней свободы, то можно утверждать, что rxy значимо.

     Подобным  же образом на основе соответствующих  формул рассчитывают стандартные ошибки параметров уравнения регрессии, а  затем и t-критерии для каждого  параметра. Важно опять-таки проверить, чтобы соблюдалось условие tрасч > tтабл. В противном случае доверять полученной оценке параметра нет оснований.

     Вывод о правильности выбора вида взаимосвязи  и характеристику значимости всего  уравнения регрессии получают с  помощью F-критерия, вычисляя его расчетное  значение:

     

     где n – число наблюдений;  
m – число параметров уравнения регрессии.

     Fрасч также должно быть больше Fтеор при v= (m-1) и v= (n-m) степенях свободы. В противном случае следует пересмотреть форму уравнения, перечень переменных и т.д.

Информация о работе Корреляционный анализ в изучении статистической взаимосвязи показателей