Понятия о Проверке статистических гипотез



страница3/3
Дата25.05.2018
Размер231 Kb.
1   2   3
p0 = P{  w| H0 } = P{ || || 2 > R 2 | H0 } = 1 – 0.99 = 0.01.

Если же верна альтернатива K (особенно если 2 >> 1), то



P{ || || 2 > R 2 | K} = p1 >> p0 .

Так, если 2 = 2, то p1 = 0.3, а при 2 = 4 эта вероятность равна 0.8316 (все числа в нашем примере были вычислены с помощью функций ХИКВ и ХИКВОБР в Microsoft Excel).

Требуемую вероятность 0.01 при верной H0 можно было бы обеспечить, взяв шар квадрата радиуса r 2 = 2.358. Тогда
p'0 = P{| || 2  r 2 | H0 } = 0.01.

Но такой выбор не хорош тем, что при K соответствующая вероятность



p'1 = P{| || 2  r 2 | K } << p'0 . 
Теперь вернёмся от этого маленького примера к изложению основной идеи проверки параметрических гипотез. Выберем такую статистику T = T() и такое число T 0 , чтобы вероятность p0 = P{ T  T 0 | H0} была мала: p0 << 1, но если K:  = 1 , то эта вероятность существенна:

p1 = P{ T  T 0 |  = 1} = 1 –  ,  << 1. (i)
Мы можем вычислить по наблюдавшимся данным = (x1 , …, x n) значение T = T(). Будем рассуждать так: если наше предположение H0 : = 0 верно, то крайне маловероятно (скажем, p0 = 0.01), чтобы T  T 0 – так будет только в одном случае из ста. Если, тем не менее, это произошло, то, видимо, наше предположение не верно, и следует отвергнуть гипотезу H0 . Такова основная идея правила (критерия) проверки гипотезы H0 .

Говоря подробнее, для задания критерия нужно:



  1. Сформулировать проверяемую гипотезу H0 .

  2. Задать возможную альтернативу K.

  3. Выбрать, какая статистика T() будет использоваться.

  4. Задать размер критерия (уровень значимости) – малую вероятность

  5. Указать критическое множество w

p0() = P{ T()  w | H0 }  (ii)

(число p0() называют ошибкой первого рода; величина в (i) называется ошибкой второго рода).



  1. Формулируется процедура принятия решения: гипотеза H0 отклоняется на основании полученных данных , если T()w ; в противном случае данные не противоречат H0 .

Оживим это формальное описание демонстрацией конкретного примера. Пусть наблюдаются значения с.в.  и было получено n = 100 наблюдений x1 , x2 , …, x 100 . Проверяется гипотеза H0 : 0 = 2.5. В качестве альтернативы рассматривается K : 1 0 . Мы знаем из предшествующих лекций, что является хорошей оценкой для , и что  . Следовательно, Var{ } = 1/100, а () = = 1/10. "Шкалированная" статистика

u =  N(0, 1) . (iii)

Из вида K достаточно очевидно, что критические множества будут принадлежать верхнему (правому) "хвосту ф.п.в. w(x) для N(0, 1) . Выберем размер критерия  = 0.01. Вычисляя критическое значение u 1 – как



= 1 –  (iv)

(например, вы можете сделать это в Excel, применив функцию НОРМСТОБР), найдём u1 – = 2.3263. Пусть данные таковы, что получилось = 2.8. Если H0 верна, т.е. 0 = 2.5, то u = 3, что превышает критическое значение  H0 отвергается.

На этом же примере можно посмотреть, каковы возможные альтернативы. Нас интересовала альтернатива больших , т.е. K :  0 ; критерий односторонний. Но можно было бы задать альтернативой K ':   0 , и в таком случае мы имели бы двусторонний критерий (критическое множество образуют значения u как на левом, так и на правом хвосте N(0, 1)). В случае двусторонних критериев обычно придают одинаковое значение как нижнему, так и верхнему хвосту распределения, так что для вычисления критических значений величину "ополовинивают": берут  = /2 и вычисляют пару критических значений как

=  , = 1 –  . (v)
Если для вычисленного u будет выполняться одно из неравенств u  u или u  u1 –  , то H0 отвергается.

Вернёмся ещё раз к нашему примеру. Если бы мы взяли в качестве критического множества значения u на нижнем хвосте распределения (скажем, w' = {u < u = – u1 – = -2.3263}, то вероятность



P{ u  w' | H0 } =,

но нетрудно сообразить, что



P{ u  w' | K } < .

Наш критерий оказался смещённым. Обычно рассматривают несмещённые критерии, для которых



P{T  w | K } > P{T  w | H0 }. (vi)
Другое важное свойство "разумного" критерия – состоятельность: для T = T(x1 , …, x n ) при возрастании n P{T  w | K } = 1.

Выбор используемой статистики T() можно сделать различными способами, и от него будет зависеть эффективность (мощность – вероятность в правой части (i)) используемого критерия. Так, в нашем примере вместо можно было использовать выборочную медиану. Обычно стремятся использовать наиболее мощные критерии.

В зависимости от того, является ли множество параметров в гипотезе H0 ­ одноточечным или состоит из более чем одной точки, гипотезы делятся на простые и сложные; то же самое касается и альтернативы K . Так, гипотеза в нашем примере простая: 0 = 2.5, зато альтернатива сложная: 1 0 – целый полубесконечный интервал возможных значений . Мы могли бы взять простую альтернативу, назначив какое-то конкретное значение, скажем, 1 = 2.9. Так вот, показано, что наиболее мощные критерии существуют только в случае, когда проверяется простая гипотеза против простой альтернативы. В сложных гипотезах или (и) альтернативах наиболее мощных критериев не существует.

Однако если число наблюдений n , можно указать метод, который даёт асимптотически наиболее мощные критерии ­– метод отношения правдоподобия (ОП). Пусть наша выборка x1 , …, x n порождена непрерывной с.в. с ф.п.в. f(x; ), = – ( r + s) = k-мерный вектор параметров (r  1, s  0 ). Мы хотим проверить гипотезу H0 : = 0 , которая при s  0 является сложной, против H1 : 0 . По методу ОП вначале требуется найти оценки максимального правдоподобия (МП-оценки) вектора (,) , дающие безусловный максимум функции правдоподобия (ФП)

L(| ) = ;

пусть эти оценки суть ,, а значение ФП в этой точке равно L( ,|). Найдём также МП-оценки для в предположении, что имеет место H0 , при которых достигается условный максимум ФП L(0 , | ).

Рассмотрим теперь отношение правдоподобия

 = . (vii)

Поскольку это отношение условного максимума к безусловному, очевидно, что 0    1. Интуитивно понятно, что является разумной статистикой критерия для проверки H0 . Действительно, она представляет собой максимум правдоподобия при гипотезе H0 , отнесённый к своей наибольшей возможной величине, и большое значение указывает на то, что разумно принять H0 . Критическая область этого критерия имеет, следовательно, вид

  c , (viii)


где c определяется по распределению g() статистикитак, чтобы получить критерий размера :

=  .

Оказывается, что при n  величина -2 ln будет иметь 2-распределение.



Но этим асимптотическим результатом не всегда пользуются. Как мы увидим в дальнейших лекциях, часто поступают так: находят такую функцию h(), которая 1) является строго монотонной по ; 2) имеет простой вид и известное (из таблиц или математических программ) распределение, если верна гипотеза H0 . И тогда принятие решения по критерию ОП, исходя из неравенства (viii) заменяют проверкой, попадает ли h() в соответствующую критическую область.
Каталог: materials -> study -> 7%20sem
7%20sem -> Огюст Конт и возникновение позитивистской социологии
7%20sem -> Этапы развития социологической мысли
7%20sem -> Джордж Мид и символический интеракционизм
7%20sem -> Чикагская социологическая школа
7%20sem -> Колумбийская школа
7%20sem -> Британская школа социальной антропологии
7%20sem -> Теория социального обмена и бихевиористская социология: Джордж Хоманс и Питер Блау
7%20sem -> Социальная система Толкотта Парсонса и структурный функционализм
7%20sem -> Социологическая концепция Фердинанда Тенниса
7%20sem -> Билеты по социологии


Поделитесь с Вашими друзьями:
1   2   3


База данных защищена авторским правом ©znate.ru 2019
обратиться к администрации

    Главная страница