1 / 28

«АКТУАЛЬНЫЕ ПРОБЛЕМЫ ЭЛЕКТРОННОГО ПРИБОРОСТРОЕНИЯ» АПЭП – 2010

«АКТУАЛЬНЫЕ ПРОБЛЕМЫ ЭЛЕКТРОННОГО ПРИБОРОСТРОЕНИЯ» АПЭП – 2010. Исследование распределений статистик критериев однородности по многократно цензурированным выборкам фиксированного объема. Ишалина М.А., Постовалов С.Н. Факультет прикладной математики и информатики

demont
Download Presentation

«АКТУАЛЬНЫЕ ПРОБЛЕМЫ ЭЛЕКТРОННОГО ПРИБОРОСТРОЕНИЯ» АПЭП – 2010

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. «АКТУАЛЬНЫЕ ПРОБЛЕМЫЭЛЕКТРОННОГО ПРИБОРОСТРОЕНИЯ»АПЭП – 2010 Исследование распределений статистик критериев однородности по многократно цензурированным выборкам фиксированного объема Ишалина М.А., Постовалов С.Н. Факультет прикладной математики и информатики Новосибирский государственный технический университет ishalina@ngs.ru, postovalov@ngs.ru

  2. Сравнение двух кривых жизни • Сравнение двух кривых жизни на сегодняшний день не является какой-то новой проблемой, так как уже на протяжении многих лет встречается в анализе выживаемости и теории надежности. • К примеру, в анализе выживаемости - это сравнение действенности лекарственного препарата на двух группах больных, причем это может быть сравнение двух разных препаратов. • Также, может быть сравнение разных доз одного препарата, а возможны и такие опыты, когда одной группе заболевших совсем не дают никаких лекарств. • В теории надежности - это сравнение двух групп деталей на надежность, когда необходимо определить является ли новая модель или модификация какой-либо детали надежней своей предшественницы. 2

  3. Критерии сравнения двух кривых жизней Основная проблема анализа данных выживаемости в том, что часто нет возможно наблюдать каждый объект на протяжении всего времени, до конца. Таким образом, мы имеем цензурирование или неполные данные. Для таких случаев требуются специальные статистические методы. Рассматриваемые критерии: • Критерий Гехана (1965) • Логарифмический ранговый критерий(1972) • Критерий Кокса-Мантела (1966) 3

  4. Проверяемая гипотеза и Пусть имеется две выборки и соответственно. объемами Где это полное или цензурированное наблюдение. - функция выживаемость для - функция выживаемость для Основная гипотеза имеет вид (1) и альтернативы к ней 4

  5. Вычисление статистик критериев Объединим выборки T1и Т2 и отсортируем полученную выборку по возрастанию. где n=n1+n2 Пусть (2) и (3) 5

  6. Критерий Гехана , Каждого больного из первой группы сравнивают с каждым больным из второй группы. (4) Затем вычислим величины: (5) Окончательная статистика критерия имеет вид: (6) 6

  7. Логарифмический ранговый критерий Статистика критерия имеет вид: (7) где: (8) (9)

  8. Критерий Кокса-Мантела Статистика критерия имеет вид: (10) где: (11) (12) 8

  9. Распределение статистик критериев Предельный закон распределения статистик рассмотренных критериев - стандартное нормальное распределение с функцией распределения: (13) Таким образом, основная гипотеза отвергается, если: (14) где - ошибка первого рода. 9

  10. Основная задача При каком размере выборки расстояние между распределением статистики и предельным законом не превышает заданного? (15) где - функция распределения статистики при фиксированном n - функция распределения статистики при 10

  11. Выбор Для большинства задач проверки статистических гипотез, погрешность в определении достигнутого уровня значимости может быть равна 1%. Итак, пусть (16) 11

  12. Компьютерное моделирование В работе мы получаем распределение статистик критериев с помощью компьютерного моделирования. Алгоритм: • моделируем две полные или цензурированные выборки объема n = n1 =n2по заданному распределению, • затем вычисляем значение статистики критерияи • повторяем этот процессNраз. 12

  13. Рассмотренная модель В работе выборки моделировались по закону распределения Вейбулла с функцией распределения: (17) гдеα=2и λ=1. 13

  14. Выбор N - объема выборки статистик Какое количество выборок нужно смоделировать, чтобы погрешность моделирования была не больше заданной? Согласно ЦПТможем построить доверительный интервал (18) где - эмпирическая функция распределения Следовательно (19) Пусть Тогда (20) 14

  15. Исследования Поскольку неизвестно, будем наблюдать расстояние (21) 15

  16. Распределение статистики критерия Гехана при малых объемах выборок и без цензурирования 11

  17. Распределение статистики критерия Гехана при малых объемах выборок с цензурирования 17

  18. Статистика критерия Гехана при различных процентах цензурирования, n1 = n2 = 20 18

  19. Dn,Nдля статистики Гехана (различных объем и степень цензурирования)

  20. ЗависимостьDn,N отnстатистики критерия Гехана 50% 0%

  21. Dn,Nдля статистики логрангового критерия

  22. ЗависимостьDnот n для статистики логарифмического рангового критерия 50% 0%

  23. Dn,Nдля статистики Кокса-Мантела 23

  24. ЗависимостьDn,Nот n для ститисики критерия Кокса-Мантела 50% 0% 24

  25. Функция распределения статистики Кокса-Мантелапри малом объеме выборок и проценте цензурирования 50%

  26. Рекомендуемый объем выборки Для того, чтобы использовать предельное распределение в критериях однородности (с заданной погрешностью 0.01) мы должны взять выборку соответствующего объема 26

  27. Выводы • Мы исследовали распространение статистик трех критериев проверки гипотезы однородности и показали, что имеется сходимость к предельному распределению. • Эта сходимость быстрая при малом проценте цензурирования и медленная при большом проценте цензурирования. • Если объем выборки превышает полученные значения, то расстояние до предельного закона не превышает 0.01. • В противном случае мы рекомендуем определять достигаемый уровень значимости с помощью метода Монте-Карло, вместо предельного закона. 27

  28. Спасибо за внимание! 28

More Related