Скачать

Доверительный интервал. Проверка статистических гипотез

Доверительный интервал.

Проверка статистических гипотез


1. Доверительный интервал

Точечные оценки являются приближенными, так как они указывают точку на числовой оси, в которой должно находиться значение неизвестного параметра. Однако оценка является приближенным значением параметра генеральной совокупности, которая при разных выборках одного и того же объема будет принимать разные значения, поэтому в ряде задач требуется найти не только подходящее значение параметра а, но и определить его точность и надежность.

Для этого в математической статистике используется два понятия – доверительный интервал и доверительная вероятность. Пусть для параметра а из опытных данных получена несмещенная оценка  Требуется определить возможную при этом величину ошибки и вероятность того, что оценка не выскочит за пределы этой ошибки (надежность).

Зададимся некоторой вероятностью b (например, b = 0,99) и найдем такое значение e > 0, для которого

Представим это выражение в виде

Это значит, что с вероятностью b точное значение параметра а находится в интервале  le

                                                                                le

Здесь параметр а – неслучайная величина, а интервал  le  является случайным, так как  - случайная величина.  Поэтому вероятность b лучше толковать, как вероятность того, что случайный интервал le накроет точку а. Интервал leназывают доверительным интервалом, а вероятность b - доверительной вероятностью (надежностью).

Пример.  Если при измерении какой-то величины Х указывается абсолютная погрешность Dх, то это, по существу, означает, что погрешность измерения, являясь случайной величиной, равномерно распределена в интервале (-Dх, Dх) и  где Х* - измеренная величина, а х – ее точное значение.  Здесь b = 1, e = Dх и  le = (x*- Dх, x* + Dх).

1.1 Доверительный интервал для математического ожидания

В качестве еще одного примера рассмотрим задачу о доверительном интервале  для математического ожидания.  Пусть проведено n независимых опытов измерения случайной величины Х с неизвестным математическим ожиданием mx и дисперсией s2.  На основании опытных данных Х1, Х2, ... , Хn построим выборочные оценки

Требуется построить (найти) доверительный интервал le, соответствующий доверительной вероятности b, для среднего генерального mx.

Так как среднее выборочное  представляет сумму n независимых одинаково распределенных случайных величин  то при достаточно большом  объеме выборки согласно центральной предельной теоремы ее закон близок к нормальному.  Существует эмпирическое правило, по которому при объеме выборки   n ³ 30 выборочное распределение можем считать нормальным.

Ранее было показано, что   Найдем теперь такую величину e(b) > 0,  для которой выполняется равенство

Считая случайную величину  нормально распределенной, имеем

После замены    имеем

По табличным значениям функции Лапласа Ф*(z) находим аргумент, при котором она равна b.  Если этот аргумент обозначить Zb, то тогда

Среднее квадратичное значение  приближенно можно заменить

  где 

Таким образом, доверительный интервал для среднего генерального равен:


le =

Если пользоваться табличными значениями интеграла вероятностей

то доверительный интервал принимает вид

le =

1.2 Распределение Стьюдента

При малом объеме выборки (n < 30) полученный доверительный интервал для среднего генерального, использующий нормальное распределение случайной величины , может быть очень грубым.

Для более точного получения доверительного интервала необходимо знать закон распределения случайной величины  при малом объеме выборки.  Для этого воспользуемся следующим результатом.  Пусть Х1, Х2, ... , Хn – выборка нормально распределенной случайной величины Х, тогда, как доказано, случайная величина

подчиняется распределению Стьюдента c  n – 1 степенью свободы, плотность распределения которого имеет вид

где  - гамма функция.  Эта плотность, как видно из формулы, зависит только от числа опытов n.  Ниже представлены графики плотностей нормированной (mx = 0,  s = 1) нормально распределенной и с распределением Стьюдента (n = 4) случайных величин.


нормальное распределение