1 / 50

Лекция 1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ.

Лекция 1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ. КРИТЕРИИ, ОСНОВННЫЕ НА ОТНОШЕНИИ ПРАВДОПОДОБИЯ. Книга Бытие, глава 8 Воды убывали; ворон; выпуск голубя (1-14) …

Download Presentation

Лекция 1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ.

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Лекция 1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ. КРИТЕРИИ, ОСНОВННЫЕ НА ОТНОШЕНИИ ПРАВДОПОДОБИЯ

  2. Книга Бытие, глава 8Воды убывали; ворон; выпуск голубя (1-14) … 8 Потом выпустил от себя голубя, чтобы видеть, сошла ли вода с лица земли,9 но голубь не нашел места покоя для ног своих и возвратился к нему в ковчег, ибо вода была еще на поверхности всей земли; и он простер руку свою, и взял его, и принял к себе в ковчег.10 И помедлил еще семь дней других и опять выпустил голубя из ковчега.11 Голубь возвратился к нему в вечернее время, и вот, свежий масличный лист во рту у него, и Ной узнал, что вода сошла с земли.12 Он помедлил еще семь дней других и выпустил голубя; и он уже не возвратился к нему.13 Шестьсот первого года к первому дню первого месяца иссякла вода на земле; и открыл Ной кровлю ковчега и посмотрел, и вот, обсохла поверхность земли.14 И во втором месяце, к двадцать седьмому дню месяца, земля высохла.

  3. Проверка гипотезы о виде распределения Пусть x1, x2, x3,… - последовательность независимых наблюдений случайной величины ξ. Гипотезы о виде распределения ξ: • Критерий Неймана-Пирсона (1933) • Критерий Вальда (1947) • Проблема Кифера-Вейсса (1957) • Критерий Айвазяна (1965) • Критерий Лордена (1976)

  4. Критерий Вальда (SPRT) Абрахам Вальд (1902-1950) Статистика критерия: 1 2 3 4 5 6 Области принятия проверяемых гипотез и область неопределенности:

  5. Оптимальность критерия Вальда Теорема 1. (А.Вальд, Дж. Вольфовиц, 1948) Пусть T – последовательный критерий отношения вероятностей с критическими границами - <c0<0<c1<+ , с вероятностями ошибок первого и второго рода  и , а Т- другой критерий с вероятностями ошибок первого и второго рода  и . Если   и  и (1) E[n|H0]< и E[n|H1]<  (2) Тогда E[n|H0]  E[n|H0] и E[n|H1]  E[n|H1] (3) Г. Саймонс (1976) доказал возможность заменитьусловие (1) на (4) + + (4)

  6. Потеря оптимальности критерия Вальда 1. Проверка сложной гипотезы J. Kiefer and L. Weiss. Some properties of Generalized Sequential Probability Ratio Tests.Ann. Math. Stat., 28(1):57–75, March 1957. 2. Нарушение предположений об независимости наблюдений Matthew Finkelman (2008): The Wald–Wolfowitz Theorem Is Violated in SequentialMastery Testing, Sequential Analysis: Design Methods and Applications, 27:3, 293-303

  7. Средний объем выборки в критерии Вальда Теорема 2. (Вальда, 1947) Оценка снизу среднего числа наблюдений для любого последовательного критерия с вероятностями ошибок α и β имеет вид: Теорема 3. (С.А.Айвазян, 1959). Если f0(x)=f1(x)и 1 0, то при выполнении ряда условий

  8. Распределение объема выборки в критерии Вальда при проверке гипотез «нормальное-логистическое» Средний объем выборки по 100000 реализаций равен 267 (при H0) и 232 (при H1)

  9. Усечение последовательного критерия отношения правдоподобия 1. Потеря оптимальности 2. Нестатистические причины прекращения эксперимента • Высокая стоимость экспериментов • Этические причины в клинических испытаниях • …

  10. Обобщенный последовательный критерий отношения правдоподобия (GSPRT) L. Weiss. Testing one simple hypothesis against another // Ann. Math. Stat., 24(1953): pp. 273-281. Области принятия проверяемых гипотез и область неопределенности:

  11. Armitage, P. (1957). Restricted sequential procedures. Biometrika, 44, 9–56.

  12. Hemanta K. Baruah & G.P. Bhattacharjee (1980): A generalization of anderson's modified sequential probability ratio test, Journal of Statistical Computation and Simulation, 11:3-4, 197-208

  13. Jennison C., Turnbull B.W.: Group sequentialmethods with applications to clinical trials.Boca Raton, Chapman & Hall, 2000.

  14. 1 2 3 4 5 6 Критерий Айвазяна - граница усечения Айвазян С.А. Области принятия проверяемых гипотез и область неопределенности: Anderson, T.W. (1960). A modification of the sequential probability ratio test toreduce the sample size. Ann. Math. Statist., 31, 165–197. Айвазян С.А. Различение близких гипотез о виде распределения в схеме обобщенного последовательного критерия // Теория вероятностей и ее применения Том X, №4 (1965) с. 713-725

  15. Критерий Лордена (2-SPRT) Гарри Лорден Статистики критерия: Области принятия проверяемых гипотез и область неопределенности:

  16. Оценивание точных критических границ методом Монте-Карло В работе Canner, P.L. (1977). Monitoring treatment differences in long-term clinical trials. Biometrics, 33, 603–615. применялся метод Монте-Карло для нахождения точных критических границ в последовательном критерии для биномиального закона распределения. В работах Гродзенской И.С. (2004) применялся метод Монте-Карло для сравнения критериев Вальда, Айвазяна, Лордена и Павлова. Постовалов С. Н. Проверка простых и сложных гипотез с использованием последовательного критерия Вальда// ДОКЛАДЫ АН ВШ РФ. - 2011. - № 2(17). - С.140-150. Постовалов С. Н. Проверка простых и сложных гипотез с использованием последовательных критериев Лордена и Айвазяна / С. Н. Постовалов, М. Р. Шахмаметова // Научный вестник НГТУ. - Новосибирск, 2011. - № 3 (44). - C. 17-28. 16

  17. Вычисление вероятностей ошибок первого и второго рода для критерия Вальда Если нам нужно найти точные границы, мы должны вычислить вероятности ошибок первого и второго рода: еслиi>j. Но это представляет собой сложную задачу, т.к. зависит от

  18. Вычисление вероятностей ошибок первого и второго рода для критерия Вальда методом Монте-Карло • Выбирается область моделирования. • Строится сетка с маленьким шагом на выбранной области. • Моделируется случайная величина по H0. • Вычисляется статистика критерия. • Проверяется условие выхода для каждой точки сетки (с0,с1). • Если для какой-то точки сетки условие выхода не выполнено, то перейти на шаг 3. • Шаги 3-6 повторяются N раз. • Для каждой точки сетки вероятность ошибки вычисляется по формуле

  19. Выбор числа повторений N Какое число повторений надо взять, чтобы отклонение эмпирической вероятности ошибки первого рода от истинного значения не превосходило заданного уровня ? Согласно центральной предельной теореме где m – количество ошибок первого рода в серии из N повторов. Отсюда Например, если тогда 19

  20. Проверяемые гипотезы Нормальный закон распределения: Логистический закон распределения:

  21. Расчет параметров критериев Лордена и Айвазяна Критерий Лордена Критерий Айвазяна 21

  22. (с0, с1)

  23. (с0, с1)

  24. Вычисление точных критических границ для критерия Вальда

  25. Вычисление точных критических границ для критерия Вальда 25

  26. Вычисление точных критических границ для критерия Лордена 26

  27. Вычисление точных критических границ для критерия Лордена 27

  28. Вычисление точных критических границ для критерияАйвазяна, n*=964 28

  29. Вычисление точных критических границ для критерияАйвазяна, n*=964 29

  30. Распределение объема выборки в критерии Вальда при использовании приближенных границ Средний объем выборки по 100000 реализаций равен 267 (при H0) и 232 (при H1) 30

  31. Распределение объема выборки в критерии Вальда при использовании оценок точных границ Средний объем выборки по 100000 реализаций равен 251 (при H0) и 206 (при H1) Сокращение среднего объема выборки на 6% (при H0) и на 11% (при H1) 31

  32. Распределение объема выборки в критерии Лордена при использовании оценок точных границ Ср. объем выборки по 100000 реализаций равен 367 (при H0) и 318 (при H1) – приб. Ср. объем выборки по 100000 реализаций равен 268 (при H0) и 223 (при H1) –точн. Сокращение среднего объема выборки на 27% (при H0) и на 30% (при H1) 32

  33. Распределение объема выборки в критерии Айвазяна при использовании оценок точных границ (n*=964) Ср. объем выборки по 100000 реализаций равен 355 (при H0) и 312 (при H1) – приб. Ср. объем выборки по 100000 реализаций равен 265 (при H0) и 214 (при H1) –точн. Сокращение среднего объема выборки на 25% (при H0) и на 31% (при H1) 33

  34. Сравнение среднего объема выборки для разных критериев (при H0, вероятности ошибок первого и второго рода равны 0.05)

  35. Сравнение распределений объема выборки для разных критериев (при H0, вероятности ошибок первого и второго рода равны 0.05) – приближенные границы 35

  36. Сравнение распределений объема выборки для разных критериев (при H0, вероятности ошибок первого и второго рода равны 0.05) – точные границы 36

  37. Сравнение среднего объема выборки для разных критериев (при H1, вероятности ошибок первого и второго рода равны 0.05) 37

  38. t-критерий Стьюдента Пусть x1, x2, x3,… - последовательность независимых наблюдений случайной величины ξ, подчиненной нормальному закону распределения N(,). У. Госсет Гипотезы о параметрах распределения ξ: Параметр  - неизвестен, альтернатива не фиксирована (1-неизвестна) Статистика критерия имеет вид: Гипотеза H0не отвергается, если где Fn-1 – функция распределения Стьюдента с (n-1) степенью свободы

  39. Последовательный t-критерий (Вальд) Гипотезы о параметрах распределения ξ: Параметр  - неизвестен, альтернатива не фиксирована (1-неизвестна) Статистика критерия имеет вид:

  40. Последовательный t-критерий (Вальд) ; Гипотезы Н0 принимается, если Гипотезы Н1 принимается, если Производятся дополнительные наблюдения до тех пор, пока выполняются неравенства

  41. Вычисление оценок точных критических границ

  42. Вычисление оценок точных критических границ при Таблица 1. Приближенные критические границы (B,A) Таблица 2. Оценки точных критических границ

  43. Проблемы при оценивании точных границ последовательного t-критерия Есть зависимость от расстояния между гипотезами Есть зависимость от , 43

  44. План выступления Обзор последовательных критериев проверки гипотез Алгоритм построения оценок точных критических границ методом Монте-Карло Сравнение среднего объема выборки Проверка сложных гипотез. Последовательный t-критерий Стьюдента Группированные и цензурированные наблюдения Применение последовательных критериев 44

  45. Использование последовательных критериев по случайно цензурированным наблюдениям • Для всех наблюдений известно время начала наблюдения; • Для всех наблюдений известно время окончания наблюдения, либо время выбытия из-под наблюдения; • Выбор выбывших наблюдений производится случайно. 45

  46. Модификация критерия Вальда по случайно цензурированным наблюдениям ,j=0,1. 46 Введем обозначение: тогда статистика критерия или

  47. Актуальные области применения процедуры последовательной проверки гипотез о виде распределения • Задачи приемочного контроля качества • Вальд А. Последовательный анализ. //М.: Физматгиз, 1960. - 325 с. • Page E.S. Continuous inspection schemes // Biometrika, 1954, v. 41, p. 100-114. • Задачи статистического управления технологическими операциями • Бендерский А.М. Статистическое регулирование технологических процессов методом кумулятивных сумм. – М.: Знание, 1973 – 70 c.

  48. Актуальные области применения процедуры последовательной проверки гипотез о виде распределения • Задачи построения рациональных планов испытаний на надежность • Гродзенская И. С., Гродзенский С. Я., Томилин Н. А. Рационализация контроля надежности элементов и систем // Наукоемкие технологии, 2003, № 2, с. 85-87. • Клинические испытания • Armitage P. Sequential medical trials. Oxford: Blackwell, 1961. 105 p. 48

  49. Актуальные области применения процедуры последовательной проверки гипотез о виде распределения • Радиолокационные задачи различения сигнала при наличии помех в системах, основанных на накоплении полезного сигнала • Гродзенская И. С. Разработка и исследование методов обнаружения радиосигналов при наличии помех на основе оптимальных статистических последовательных критериев // Тезисы докладов Научно-технической конференции студентов, аспирантов и молодых специалистов МИЭМ. – М.: МИЭМ, 2006, с. 257. 49

  50. Заключение • Использование оценок точных критических границ дает ощутимый выигрыш в среднем числе наблюдений, особенно для модификаций критерия Вальда – критериев Айвазяна и Лордена. • В рассмотренном примере в случае использования приближенных критических границ несколько лучше работает критерий Айвазяна, однако при использовании оценок точных критических границ критерии Айвазяна и Лордена становятся практически эквивалентными. • Вычисление оценок точных критических границ требует определенных вычислительных затрат, а также разработки программного обеспечения, поэтому применять этот метод имеет смысл в случае проведения дорогостоящих, трудоемких и длительных экспериментов. • Нахождение оценок точных критических границ возможно и в более сложных случаях: при проверке сложных гипотез, при цензурировании и при группировании наблюдений. 50

More Related