Корреляционный анализ в изучении статистической взаимосвязи показателей
Курсовая работа, 18 Ноября 2011, автор: пользователь скрыл имя
Описание работы
Исследуя природу, общество, экономику, необходимо считаться со взаимосвязью наблюдаемых процессов и явлений. При этом полнота описания так или иначе определяется количественными характеристиками причинно-следственных связей между ними. Оценка наиболее существенных из них, а также воздействия одних факторов на другие является одной из основных задач статистики.
В своей работе я рассмотрю только лишь корреляционный анализ в изучении статистической взаимосвязи показателей.
Данная тема на мой взгляд актуальна, поскольку этот метод обработки статистических данных довольно прост и подлежит самостоятельному обучению, а также пригодится в дальнейшем.
Содержание
Введение
1. Методы статистического изучения взаимосвязей
2.Применение корреляционного анализа в статистическом изучении взаимосвязей показателей
2.1.Характеристика корреляционного анализа
2.2.Парная и множественная корреляция
2.3.Оценка тесноты связи между экономическими показателями
3.Применение корреляционного анализа для изучения объекта исследования
Заключение
Список литературы
Работа содержит 1 файл
курсовая статистика.docx
— 57.66 Кб (Скачать)Наглядным изображением корреляционной таблице служит корреляционное поле. Оно представляет собой график, где на оси абсцисс откладывают значения Х, по оси ординат – У, а точками показывается сочетание Х и У. По расположению точек, их концентрации в определенном направлении можно судить о наличии связи.
В итогах корреляционной таблицы по строкам и столбцам приводятся два распределения – одно по X, другое по У. Рассчитаем для каждого Хi среднее значение У, т.е. , как
Последовательность точек (Xi, ) дает график, который иллюстрирует зависимость среднего значения результативного признака У от факторного X, – эмпирическую линию регрессии, наглядно показывающую, как изменяется У по мере изменения X.
По
существу, и корреляционная таблица,
и корреляционное поле, и эмпирическая
линия регрессии предварительно
уже характеризуют взаимосвязь,
когда выбраны факторный и
результативный признаки и требуется
сформулировать предположения о
форме и направленности связи. В
то же время количественная оценка
тесноты связи требует
Практически для количественной оценки тесноты связи широко используют линейный коэффициент корреляции. Иногда его называют просто коэффициентом корреляции. Если заданы значения переменных Х и У, то он вычисляется по формуле
Можно использовать и другие формулы, но результат должен быть одинаковым для всех вариантов расчета.
Коэффициент корреляции принимает значения в интервале от -1 до + 1. Принято считать, что если |r| < 0,30, то связь слабая; при |r| = (0,3÷0,7) – средняя; при |r| > 0,70 – сильная, или тесная. Когда |r| = 1 – связь функциональная. Если же r принимает значение около 0, то это дает основание говорить об отсутствии линейной связи между У и X. Однако в этом случае возможно нелинейное взаимодействие. что требует дополнительной проверки и других измерителей, рассматриваемых ниже.
Для характеристики влияния изменений Х на вариацию У служат методы регрессионного анализа. В случае парной линейной зависимости строится регрессионная модель
где
n – число наблюдений;
а0, а1 – неизвестные параметры
уравнения;
ei – ошибка случайной переменной
У.
Уравнение регрессии записывается как
где Уiтеор – рассчитанное выравненное значение результативного признака после подстановки в уравнение X.
Параметры а0 и а1 оцениваются с помощью процедур, наибольшее распространение из которых получилметод наименьших квадратов. Его суть заключается в том, что наилучшие оценки ag и а, получают, когда
т.е. сумма квадратов отклонений эмпирических значений зависимой переменной от вычисленных по уравнению регрессии должна быть минимальной. Сумма квадратов отклонений является функцией параметров а0 и а1. Ее минимизация осуществляется решением системы уравнений
Можно
воспользоваться и другими
Аппарат линейной регрессии достаточно хорошо разработан и, как правило, имеется в наборе стандартных программ оценки взаимосвязи для ЭВМ. Важен смысл параметров: а1 – это коэффициент регрессии, характеризующий влияние, которое оказывает изменение Х на У. Он показывает, на сколько единиц в среднем изменится У при изменении Х на одну единицу. Если а, больше 0. то наблюдается положительная связь. Если а имеет отрицательное значение, то увеличение Х на единицу влечет за собой уменьшение У в среднем на а1. Параметр а1 обладает размерностью отношения У к X.
Параметр a0 – это постоянная величина в уравнении регрессии. На наш взгляд, экономического смысла он не имеет, но в ряде случаев его интерпретируют как начальное значение У.
Например, по данным о стоимости оборудования Х и производительности труда У методом наименьших квадратов получено уравнение
У = -12,14 + 2,08Х.
Коэффициент а, означает, что увеличение стоимости оборудования на 1 млн руб. ведет в среднем к росту производительности труда на 2.08 тыс. руб.
Значение функции У = a0 + а1Х называется расчетным значением и на графике образует теоретическую линию регрессии.
Смысл теоретической регрессии в том, что это оценка среднего значения переменной У для заданного значения X.
Парная
корреляция или парная регрессия
могут рассматриваться как
Множественная корреляция — метод многомерного анализа, широко применяемый в психологии и др. поведенческих науках. Множественную корреляцию можно рассматривать как расширение двумерной корреляции, а ее коэффициент — как показатель степени связи одной переменной с оптимально взвешенной комбинацией нескольких других переменных. Веса этих переменных определяются методом наименьших квадратов, так чтобы минимизировать остаточную дисперсию.
Коэффициент множественная корреляция принимает значения от 0 до 1 и интерпретируется аналогично коэффициенту двумерной корреляции, если справедливы допущения о прямолинейности и других характеристиках двумерных интеркорреляций, на основе которых вычисляется этот коэффициент.
В
психологии квадрат множественной
корреляции (R2) или, как его еще
наз., коэффициент множественной
детерминации, часто используется для
оценки доли дисперсии зависимой
переменной, приходящейся на совокупность
независимых переменных. Родственный
метод — множественная
2.3.Оценка
тесноты связи
между экономическими
показателями
Получив оценки корреляции и регрессии, необходимо проверить их на соответствие истинным параметрам взаимосвязи.
Существующие программы для ЭВМ включают, как правило, несколько наиболее распространенных критериев. Для оценки значимости коэффициента парной корреляции рассчитывают стандартную ошибку коэффициента корреляции:
В первом приближении нужно, чтобы . Значимость rxy проверяется его сопоставлением с , при этом получают
где tрасч – так называемое расчетное значение t-критерия.
Если tрасч больше теоретического (табличного) значения критерия Стьюдента (tтабл) для заданного уровня вероятности и (n-2) степеней свободы, то можно утверждать, что rxy значимо.
Подобным
же образом на основе соответствующих
формул рассчитывают стандартные ошибки
параметров уравнения регрессии, а
затем и t-критерии для каждого
параметра. Важно опять-таки проверить,
чтобы соблюдалось условие tрас
Вывод о правильности выбора вида взаимосвязи и характеристику значимости всего уравнения регрессии получают с помощью F-критерия, вычисляя его расчетное значение:
где
n – число наблюдений;
m – число параметров уравнения регрессии.
Fрасч также должно быть больше Fтеор при v1 = (m-1) и v2 = (n-m) степенях свободы. В противном случае следует пересмотреть форму уравнения, перечень переменных и т.д.