Анализ статистической совокупности

Автор: Пользователь скрыл имя, 16 Декабря 2010 в 17:40, курсовая работа

Описание работы

Цель работы – освоить методику анализа исследования статистической совокупности по предложенному Показателю, используя данные «Российского статистического ежегодника 2008».
В работе рассмотрен порядок проведения вариационного анализа статистической совокупности по исследуемому показателю. Проведена бесповторная выборка и описана процедура её проведения. Выявлены и исследованы особенности проведения корреляционно-регрессионного анализа и анализа рядов динамики. Сделаны выводы на основании произведённых вычислений и графического материала.

Содержание

ВВЕДЕНИЕ 6
1 ЗАДАЧА №1 9
2 ЗАДАЧА №2 12
3 ЗАДАЧА №3 24
4 ЗАДАЧА №4 30
5 ЗАДАЧА №5 38
6 ЗАДАЧА №6 61
ЗАКЛЮЧЕНИЕ 92
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 95

Работа содержит 1 файл

Курсовая по статистике.doc

— 808.50 Кб (Скачать)

   Также медиану можно найти графически по кумуляте. Для этого находим на оси ординат точку, соответствующую половине накопленных частот (в нашем случае 39,5), проводим через неё прямую, параллельно оси Ох, и от точки её пересечения с кумулятой проводим перпендикуляр к оси х. (рис. 2.4).

   Рисунок 2.4 – Графическое нахождение медианы

   Мода - это наиболее часто встречающееся  значение признака, т.е. значение признака с наибольшей частотой. Для интервального ряда мода находится по формуле:

    ,               (2.3)

   где x0 - начальное значение модального интервала,

          f – частота появления признака в модальном интервале,

         fMo-1 – частота в интервале, предшествующем модальному,

         fMo+1 – частота в интервале, следующем за модальным,

         l – длина интервала.

   Модальный интервал – это интервал с наибольшей частотой. Из таблицы 2.3 (столбец «количество  субъектов») видно, что модальным интервалом в данном случае является также интервал № 2 с частотой 37 единиц. По формуле рассчитываем значение моды:

   

.

   Мода, равная 13 622,64 руб., означает не то, что  в большинстве субъектов ровно  такой объем платных услуг на душу населения, так как в совокупности может и не быть субъектов с таким значением, а то что в большинстве субъектов приблизительно такой объем услуг на душу населения. Также моду можно найти графически по гистограмме (рис. 2.5).

   

   Рисунок 2.5 – Графическое нахождение моды

   Следующим этапом изучения вариации признака в  совокупности является измерение характеристик  силы, величины вариации. Насколько велики абсолютный и относительный разбросы значений признака оценивают при помощи следующих показателей: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение.

   Размах  вариации – абсолютная разность между  максимальным и минимальным значениями признака из имеющихся в изучаемой  совокупности значений. Перед расчетом размаха вариации следует проверить совокупность на наличие аномальных значений, но так как мы уже исключили аномальные значения в начале задания 2, и построенный интервальный ряд уже не содержит таких единиц, то рассчитываем размах по формуле: 

     R = xmaxxmin ,                                                   (2.4) 

   где  xmax – максимальное значение признака в ряду,

         xmin – минимальное значение признака в ряду.

   Рассчитаем  размах для данного интервального  ряда: 

   R = 46 000 – 4 000 = 42 000. 

   Таким образом, можно сказать, что амплитуда значений в данном вариационном ряду составляет 42 000 руб.

   Поскольку величина размаха характеризует  лишь максимальное различие значений признака, она не может измерять закономерную силу его вариации во всей совокупности. В этом может помочь следующий показатель – среднее линейное отклонение. Он представляет собой средний модуль отклонения значений в совокупности от среднего значения:

    ,                                                   (2.5)

   где xi – значения признака,

          - среднее значение признака в совокупности,

           fi – частота появления признака.

   Для того, чтобы рассчитать этот и другие показатели, нам потребуется среднее значение признака в данном интервальном ряду. Среднее значение рассчитываем по формуле средней арифметической взвешенной:

    ,                                                        (2.6)

   где - среднее значение признака в совокупности,

          xi – значения признака,

          fi – частота появления признака.

   За  xi для каждого интервала принимаем значение, лежащее в середине между верхней и нижней границей интервала. Таблица Б.1 с расчетом средней величины приведена в Приложении Б, итоговое значение: 

   

= 18 240,51. 

   Вернемся  к расчету среднего линейного  отклонения. Таблица Б.2 с вычислениями приведена в Приложении Б, итоговое значение: 

   

.

   Это означает, что в среднем объем платных услуг на душу населения по субъектам РФ отклоняется от среднего объема платных услуг на душу населения на 6 331,38 руб.

   Рассмотрим  третий важный показатель силы вариации – дисперсию. Дисперсия – это  средняя величина квадратов отклонений. Дисперсия рассчитывается по формуле:

    ,                                               (2.7)

   где xi – значения признака,

          - среднее значение признака в совокупности,

          fi – частота появления признака.

   Таблица Б.3 c расчетом дисперсии приведена в приложении Б, а ее итоговое значение:

   

.

   Дисперсия измеряет изменение признака совокупности под влиянием всех факторов, обуславливающих  эту вариацию.

   Четвертым показателем силы вариации является среднее квадратическое отклонение (СКО). СКО – это обобщенная характеристика вариации признака совокупности. Формула для СКО фактически является квадратом из дисперсии:

    ,                                            (2.8)

   где xi – значения признака,

          - среднее значение признака в совокупности,

          fi – частота появления признака.

   Расчет  СКО приведен в приложении, его  значение для данного ряда:

   

 руб.

   Если  фактическое распределение близко к нормальному, то выполняется равенство:

   

.

   Для нашего вариационного ряда:

   

.

   На  основании этого можно предположить, что гипотеза о нормальном распределении не подтвердится.

   Для оценки интенсивности вариации и для  сравнения ее в разных совокупностях  и тем более для разных признаков необходимы относительные показатели вариации. Они вычисляются как отношения абсолютных показателей силы вариации к средней арифметической величине признака. Рассмотрим следующие показатели:

  • относительный размах вариации

   

;

  • относительное среднее линейное отклонение

   

;

  • коэффициент вариации

   

. 

 

   3 ЗАДАЧА №3

   Выдвигаем гипотезу о нормальном распределении  генеральной совокупности, предполагая, что оно подчиняется определенному  закону. Для проверки гипотезы воспользуемся критерием согласия Пирсона, заключающемся в расчете и оценке обобщенного показателя отклонений фактических значений частоты появления признака от их теоретических значений (показателя χ2). Чем больше величина этих отклонений, тем меньше оснований считать распределение близким к теоретическому.

   Фактическое значение χ2 вычисляется по формуле

                               χ2 = ∑ (fэмп j – fт j)2 / fт j ,  (3.1)

   где fэмп j и fт j – частота попадания признака в j-й интервал соответственно в эмпирическом и теоретическом рядах распределения. Эмпирическая частота – частота распределения признака в фактическом вариационном ряду, а теоретическая частота определяется по формуле

                               fт j = (∑f j) * l/σ * fj (t),  (3.2)

   где     l– длина интервала;

         σ – среднее квадратическое отклонение признака; fj (t) – плотность вероятности нормального нормированного распределения, определяющаяся по значению нормированного отклонения (t), которое рассчитывается по формуле

                                t = (xi – x) / σ.  (3.3)

   Воспользуемся вспомогательной таблицей для расчета среднего значения признака и среднего квадратического отклонения от среднего значения:

   Таблица 3.1 – Расчет среднего значения признака и СКО

   хi    fi    хi*fi    
хi - х
   
i - х)2
   
i - х)2*fi
   7000    5    35000    11240,51    126348983,0    631744913
   13000    37    481000    5240,51    27462906,6    1016127544
   19000    16    304000    759,49    576830,6    9229290
   25000    12    300000    6759,49    45690754,7    548289056
   31000    4    124000    12759,49    162804679,0    651218715
   37000    3    111000    18759,49    351918603,0    1055755808
   43000    2    86000    24759,49    613032527,0    1226065054
   х    79    1441000    х    х    5138430380
 

    Среднее значение признака рассчитываем как среднюю арифметическую взвешенную, так как данные сгруппированы:

   х = 1441000 / 79 = 18240,51 руб.

   Среднее квадратическое отклонение от среднего значения:

   σ = = 8064,95

   Рассчитываем  значения нормированного отклонения для  каждого интервала:

   t1 = (7000 - 18240,51) / 8064,95 = -1,39;

   t2 = (13000 – 18240,51) / 8064,95 = -0,65 и т.д.

   По  рассчитанным значениям нормированного отклонения по таблице находим соответствующие значения плотности вероятности нормального распределения:

   t1 = -1,39 => f(t) = 0,1518; t2 = -0,65 => f(t) = 0,323 и т.д.

   Рассчитываем  значения теоретической частоты:

   f т1 = 79*6000/8064,95*0,1518 = 9;

   f т2 = 79*6000/8064,95*0,323 = 19 и т.д.

   Расчеты значений теоретической частоты сведены в таблицу 3.2:

   Таблица 3.2 – Расчет значений теоретических  частот распределения признака

     хi    fi    t    f(t)    f т
4000-10000    7000    5    -1,39    0,1518    9
10000-16000    13000    37    -0,65    0,3230    19
16000-22000    19000    16    0,09    0,3973    23
22000-28000    25000    12    0,84    0,2803    16
28000-34000    31000    4    1,58    0,1145    7
34000-40000    37000    3    2,33    0,0264    2
40000-46000    43000    2    3,07    0,0036    0
   Итого:    х    79    х    х    76

Информация о работе Анализ статистической совокупности