Корреляционный анализ в изучении статистической взаимосвязи показателей

Автор: Пользователь скрыл имя, 18 Ноября 2011 в 00:59, курсовая работа

Описание работы

Исследуя природу, общество, экономику, необходимо считаться со взаимосвязью наблюдаемых процессов и явлений. При этом полнота описания так или иначе определяется количественными характеристиками причинно-следственных связей между ними. Оценка наиболее существенных из них, а также воздействия одних факторов на другие является одной из основных задач статистики.
В своей работе я рассмотрю только лишь корреляционный анализ в изучении статистической взаимосвязи показателей.
Данная тема на мой взгляд актуальна, поскольку этот метод обработки статистических данных довольно прост и подлежит самостоятельному обучению, а также пригодится в дальнейшем.

Содержание

Введение
1. Методы статистического изучения взаимосвязей
2.Применение корреляционного анализа в статистическом изучении взаимосвязей показателей
2.1.Характеристика корреляционного анализа
2.2.Парная и множественная корреляция
2.3.Оценка тесноты связи между экономическими показателями
3.Применение корреляционного анализа для изучения объекта исследования
Заключение
Список литературы

Скачать полностью (47.81 Кб) Сколько стоит заказать работу?

Работа содержит 1 файл

курсовая статистика.docx

— 57.66 Кб (Скачать)

Наглядным изображением корреляционной таблице служит корреляционное поле. Оно представляет собой график, где на оси абсцисс откладывают значения Х, по оси ординат – У, а точками показывается сочетание Х и У. По расположению точек, их концентрации в определенном направлении можно судить о наличии связи.

В итогах корреляционной таблицы по строкам и столбцам приводятся два распределения – одно по X, другое по У. Рассчитаем для каждого Х_iсреднее значение У, т.е. , как

Последовательность точек (X_i, ) дает график, который иллюстрирует зависимость среднего значения результативного признака У от факторного X, – эмпирическую линию регрессии, наглядно показывающую, как изменяется У по мере изменения X.

По существу, и корреляционная таблица, и корреляционное поле, и эмпирическая линия регрессии предварительно уже характеризуют взаимосвязь, когда выбраны факторный и результативный признаки и требуется сформулировать предположения о форме и направленности связи. В то же время количественная оценка тесноты связи требует дополнительных расчетов.

Практически для количественной оценки тесноты связи широко используют линейный коэффициент корреляции. Иногда его называют просто коэффициентом корреляции. Если заданы значения переменных Х и У, то он вычисляется по формуле

Можно использовать и другие формулы, но результат должен быть одинаковым для всех вариантов расчета.

Коэффициент корреляции принимает значения в интервале от -1 до + 1. Принято считать, что если |r| < 0,30, то связь слабая; при |r| = (0,3÷0,7) – средняя; при |r| > 0,70 – сильная, или тесная. Когда |r| = 1 – связь функциональная. Если же r принимает значение около 0, то это дает основание говорить об отсутствии линейной связи между У и X. Однако в этом случае возможно нелинейное взаимодействие. что требует дополнительной проверки и других измерителей, рассматриваемых ниже.

Для характеристики влияния изменений Х на вариацию У служат методы регрессионного анализа. В случае парной линейной зависимости строится регрессионная модель

где n – число наблюдений;
а₀, а₁– неизвестные параметры уравнения;
e_i– ошибка случайной переменной У.

Уравнение регрессии записывается как

где У_iтеор– рассчитанное выравненное значение результативного признака после подстановки в уравнение X.

Параметры а₀и а₁оцениваются с помощью процедур, наибольшее распространение из которых получилметод наименьших квадратов. Его суть заключается в том, что наилучшие оценки ag и а, получают, когда

т.е. сумма квадратов отклонений эмпирических значений зависимой переменной от вычисленных по уравнению регрессии должна быть минимальной. Сумма квадратов отклонений является функцией параметров а₀и а₁. Ее минимизация осуществляется решением системы уравнений

Можно воспользоваться и другими формулами, вытекающими из метода наименьших квадратов, например:

Аппарат линейной регрессии достаточно хорошо разработан и, как правило, имеется в наборе стандартных программ оценки взаимосвязи для ЭВМ. Важен смысл параметров: а₁– это коэффициент регрессии, характеризующий влияние, которое оказывает изменение Х на У. Он показывает, на сколько единиц в среднем изменится У при изменении Х на одну единицу. Если а, больше 0. то наблюдается положительная связь. Если а имеет отрицательное значение, то увеличение Х на единицу влечет за собой уменьшение У в среднем на а₁. Параметр а₁обладает размерностью отношения У к X.

Параметр a₀– это постоянная величина в уравнении регрессии. На наш взгляд, экономического смысла он не имеет, но в ряде случаев его интерпретируют как начальное значение У.

Например, по данным о стоимости оборудования Х и производительности труда У методом наименьших квадратов получено уравнение

У = -12,14 + 2,08Х.

Коэффициент а, означает, что увеличение стоимости оборудования на 1 млн руб. ведет в среднем к росту производительности труда на 2.08 тыс. руб.

Значение функции У = a₀+ а₁Х называется расчетным значением и на графике образует теоретическую линию регрессии.

Смысл теоретической регрессии в том, что это оценка среднего значения переменной У для заданного значения X.

Парная корреляция или парная регрессия могут рассматриваться как частный случай отражения связи некоторой зависимой переменной, с одной стороны, и одной из множества независимых переменных – с другой. Когда же требуется охарактеризовать связь всего указанного множества независимых переменных с результативным признаком, говорят о множественной корреляции или множественной регрессии.

Множественная корреляция — метод многомерного анализа, широко применяемый в психологии и др. поведенческих науках. Множественную корреляцию можно рассматривать как расширение двумерной корреляции, а ее коэффициент — как показатель степени связи одной переменной с оптимально взвешенной комбинацией нескольких других переменных. Веса этих переменных определяются методом наименьших квадратов, так чтобы минимизировать остаточную дисперсию.

Коэффициент множественная корреляция принимает значения от 0 до 1 и интерпретируется аналогично коэффициенту двумерной корреляции, если справедливы допущения о прямолинейности и других характеристиках двумерных интеркорреляций, на основе которых вычисляется этот коэффициент.

В психологии квадрат множественной корреляции (R2) или, как его еще наз., коэффициент множественной детерминации, часто используется для оценки доли дисперсии зависимой переменной, приходящейся на совокупность независимых переменных. Родственный метод — множественная регрессия — используется для предсказания зависимой переменной (или критерия) по совокупности независимых переменных (или предикторов).

2.3.Оценка тесноты связи между экономическими показателями

Получив оценки корреляции и регрессии, необходимо проверить их на соответствие истинным параметрам взаимосвязи.

Существующие программы для ЭВМ включают, как правило, несколько наиболее распространенных критериев. Для оценки значимости коэффициента парной корреляции рассчитывают стандартную ошибку коэффициента корреляции:

В первом приближении нужно, чтобы . Значимость r_xyпроверяется его сопоставлением с , при этом получают

где t_расч– так называемое расчетное значение t-критерия.

Если t_расчбольше теоретического (табличного) значения критерия Стьюдента (t_табл) для заданного уровня вероятности и (n-2) степеней свободы, то можно утверждать, что r_xyзначимо.

Подобным же образом на основе соответствующих формул рассчитывают стандартные ошибки параметров уравнения регрессии, а затем и t-критерии для каждого параметра. Важно опять-таки проверить, чтобы соблюдалось условие t_расч> t_табл. В противном случае доверять полученной оценке параметра нет оснований.

Вывод о правильности выбора вида взаимосвязи и характеристику значимости всего уравнения регрессии получают с помощью F-критерия, вычисляя его расчетное значение:

где n – число наблюдений;
m – число параметров уравнения регрессии.

F_расчтакже должно быть больше F_теорпри v₁= (m-1) и v₂= (n-m) степенях свободы. В противном случае следует пересмотреть форму уравнения, перечень переменных и т.д.

Информация о работе Корреляционный анализ в изучении статистической взаимосвязи показателей