Автор: Пользователь скрыл имя, 18 Января 2012 в 11:51, реферат
Целью моей работы является изучение нормального закона распределения и критерий согласия.
В связи с этим передо мной поставлены следующие задачи: рассмотреть нормальный закон распределения, то есть в чем заключается его суть и определить, какие существуют критерии согласия.
ВВЕДЕНИЕ. 3
1. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ 5
2. СТАТИСТИЧЕСКАЯ ГИПОТЕЗА 5
3. ОШИБКИ ПЕРВОГО И ВТОРОГО РОДА. УРОВЕНЬ ЗНАЧИМОСТИ 6
4. СТЕПЕНЬ СВОБОДЫ ПАРАМЕТРА 7
5. КРИТИЧЕСКАЯ ОБЛАСТЬ. ОБЛАСТЬ ПРИНЯТИЯ ГИПОТЕЗЫ. 7
6.КРИТЕРИИ СОГЛАСИЯ 8
6.1.КРИТЕРИЙ СОГЛАСИЯ ПИРСОНА. 9
6.2.КРИТЕРИЙ СОГЛАСИЯ КОЛМОГОРОВА- СМИРНОВА 10
ЗАКЛЮЧЕНИЕ. 13
ГЛОССАРИЙ. 14
СПИСОК ЛИТЕРАТУРЫ. 15
Оглавление
В
качестве самостоятельной семестровой
научно-исследовательской
закон широко распространен в технике, биологии, социологии, психологии и многих других сферах человеческих знаний.
«Закон помогает научиться не привязываться, не оценивать и принимать тот порядок вещей, который существует. На графике он выглядит как колоколообразная кривая. Смысл графика заключается в том, что все характеристики живой и неживой материи в этом мире распределяются по этому закону. Куда бы вы ни посмотрели, с чем бы вы ни столкнулись, вы всюду встречаетесь с законом нормального распределения»1
Целью моей работы является изучение нормального закона распределения и критерий согласия.
В связи с этим передо мной поставлены следующие задачи: рассмотреть нормальный закон распределения, то есть в чем заключается его суть и определить, какие существуют критерии согласия.
Нормальное (гауссовское) распределение занимает центральное место в теории и практике вероятностно-статистических исследований. В качестве непрерывной аппроксимации к биномиальному распределению его впервые рассматривал А.Муавр в 1733 г. Через некоторое время нормальное распределение снова открыли и изучили К.Гаусс (1809 г.) и - П.Лаплас, которые пришли к нормальной функции в связи с работой по теории ошибок наблюдений.
Цель их объяснения механизма формирования нормально распределенных случайных величин заключается в следующем. Постулируется, что значения исследуемой непрерывной случайной величины формируются под воздействием очень большого числа независимых случайных факторов, причем сила воздействия каждого отдельного фактора мала и не может превалировать среди остальных, а характер воздействия - аддитивный (т.е. при воздействии случайного фактора F на величину а получается величина, где случайная "добавка" мала и равновероятна по знаку).
Во многих случайных величинах, изучаемых в технике и других областях, естественно видеть суммарный аддитивный эффект большого числа независимых причин. Но центральное место нормального закона не следует объяснять его универсальной приложимостью.
В этом смысле нормальный закон - один из многих типов распределения, имеющихся в природе, однако с относительно большим удельным весом практической приложимости.
Однако полнота теоретических исследований, относящихся к нормальному закону, а также сравнительно простые математические свойства делают его наиболее привлекательным и удобным в применении. Даже в случае отклонения исследуемых экспериментальных данных от нормального закона существует, по крайней мере, два пути его целесообразной эксплуатации: во-первых, использовать нормальный закон в качестве первого приближения (при атом нередко оказывается, что подобное допущение дает достаточно точные с точки зрения конкретных целей исследования результаты); во-вторых, подобрать такое преобразование исследуемой случайной величины, которое видоизменяет исходный "не нормальные" закон распределения, превращая его в нормальный.
Удобно для статистических приложений и свойство "самовоспроизводимости" нормального закона, заключающееся в том, что сумма любого числа нормально распределенных случайных величин тоже подчиняется нормальному закону распределения. Кроме того, с помощью закона нормального распределения выведен целый ряд других важных распределений, построены различные статистические критерии.
В приложениях статистики чаще всего используется нормальное (гауссовское) распределение. Непрерывная случайная величина Х называется распределенной по нормальному закону с параметрами, если ее плотность распределения есть
Часто необходимо знать закон распределения генеральной совокупности. Если он неизвестен, но есть основания предположить, что он имеет определенный вид (назовем его А), выдвигают гипотезу: генеральная совокупность распределена по закону А. Таким образом, в этой гипотезе речь идет о виде предполагаемого распределения. Возможен случай, когда закон распределения известен, а его параметры неизвестны. Если есть основания предположить, то неизвестный параметр Q равен определенному значению Q0 , выдвигают гипотезу: Q = Q0. Таким образом, в этой гипотезе речь идет о предполагаемой величине параметра одного известного распределения.
Возможны и другие гипотезы: о равенстве параметров двух или нескольких распределений, о независимости выборок и многие другие.
Статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений.
Например, статистическими будут гипотезы; генеральная распределена по закону Пуассона, дисперсии двух нормальных совокупностей равны между собой.
В первой гипотезе сделано предположение о виде неизвестного распределения, во второй - о параметрах двух известных распределений.
Наряду с выдвинутой гипотезой рассматривают и противоречивую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, имеет место противоречащая гипотеза. По этой причине эти гипотезы необходимо различать.
Нулевой (основной) называют выдвинутую гипотезу Н0.
Конкурирующей (альтернативной) называют гипотезу Н1, противоречащую нулевой.
Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость проверить ее. Поскольку проверку производят статистическими методами, ее называют статистической. В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т.е. могут быть допущены ошибки двух родов.
Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза.
Ошибка второго рода состоит в том» что будет принята неправильная гипотеза.
Правильное решение может быть принято также в двух случаях: гипотеза принимается; причем и в действительности она правильная; гипотеза отвергается, причем и в действительности она неверна.
Вероятность совершить ошибку первого рода принято обозначать q. Ее называют уровнем значимости. Наиболее часто уровень значимости принимают равным 0,05 или 0,01. Если, например, принят уровень значимости, равный 0,05, то это означает, что в пяти случаях из ста мы рискуем допустить ошибку первого рода (отвергнуть правильную гипотезу).
Степень свободы
у какого-либо параметра
Для проверки нулевой гипотеза используют специально подобранную случайную величину, точное или приближенное распределение которой известно. Ее обозначают t если она распределена по закону Стюдента, X2 - по закону Пирсона, F- по закону Фишера, G - по закону Кохрэна. Обозначим эту величину К.
Статистическим критерием (или просто критерием) называется случайная величина К, служащая для проверки нулевой гипотезы.
Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин и таким образом получают частное (наблюдаемое) значение критерия.
Наблюдаемым значением (Кнабл) называют значение критерия, вычисленное по выборкам.
После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества; одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другое - при которых она принимается.
Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.
Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.
Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области - гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы - гипотезу принимают.
Поскольку критерий К - одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами, и, следовательно, существуют точки, которые их разделяют.
Критическими точками Ккр называют точки, отделяющие критическую область от области принятия гипотезы.
Различают, одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.
Правосторонней называют критическую область, определяемую неравенством К>Ккр , где Ккр- положительное число.
Левосторонней называют критическую область, определяемую неравенством К<Ккр , где Ккр- отрицательное число.
Односторонней называют правостороннюю или левостороннюю критическую областью.
Двусторонней называют критическую область, определяемую неравенствами K<K1, K>K2, где К2>К1.
В статистике применяется большое количество различных критериев согласия. Среди них наиболее популярными являются критерии хи-квадрат Пирсона, Колмогорова-Смирнова, t-критерий Стьюдента и др.
Критерий Пирсона, или критерий χ2 — наиболее часто употребляемый критерий для проверки гипотезы о законе распределения. Во многих практических задачах точный закон распределения неизвестен, то есть является гипотезой, которая требует статистической проверки.
Обозначим через X исследуемую случайную величину. Пусть требуется проверит гипотезу H0 о том, что эта случайная величина подчиняется закону распределения F(x). Для проверки гипотезы произведём выборку, состоящую из n независимых наблюдений над случайной величиной X. По выборке можно построить эмпирическое распределение F * (x) исследуемой случайной величины. Сравнение эмпирического F * (x) и теоретического распределений производится с помощью специально подобранной случайной величины — критерия согласия. Одним из таких критериев и является критерий Пирсона.
Для проверки критерия вводится статистика:
где — предполагаемая вероятность попадания в i-й интервал, — соответствующее эмпирическое значение, ni — число элементов выборки из i-го интервала.
Эта величина в свою очередь является случайной (в силу случайности X) и должна подчиняться распределению χ2.
Перед тем, как сформулировать правило принятия или отвержения гипотезы необходимо учесть, что критерий Пирсона обладает правосторонней критической областью.
Правило.
Если полученная статистика превосходит
квантиль закона распределения
заданного уровня значимости
с
или с
степенями свободы, где k — число наблюдений
или число интервалов (для случая интервального
вариационного ряда), а p — число оцениваемых
параметров закона распределения, то гипотеза
отвергается. В противном случае гипотеза
принимается на заданном уровне значимости
.