1.24k likes | 2.9k Views
Статистические критерии, проверка гипотез. Д.т.н., профессор кафедры мед.кибернетики и информатики Новокузнецкого ГИУВа Жилина Наталья Михайловна. Типы признаков:. Количественные признаки измеряются числовыми значениями (например, возраст, рост, вес, давление).
E N D
Статистические критерии, проверка гипотез Д.т.н., профессор кафедры мед.кибернетики и информатики Новокузнецкого ГИУВа Жилина Наталья Михайловна
Типы признаков: • Количественные признаки измеряются числовыми значениями (например, возраст, рост, вес, давление). • Порядковые признаки – могут быть измерены в шкалах (например, школьные оценки, степень тяжести заболевания – легкая (1), средняя (2), тяжелая (3) и т.д.). • Качественные признаки – характеризуют некоторое состояние объекта, но не могут быть измерены количественно (например, пол, профессия, диагноз).
Параметрические и непараметрические критерии:
Принцип действия критериев: • Сравниваются нужные признаки в соответствующем виде эксперимента. • Проверяется нулевая гипотеза. Находится фактическая вероятность ошибки отклонить верную нулевую гипотезу (Р). Говоря упрощенно, Р это вероятность справедливости нулевой гипотезы. • Максимальную приемлемую вероятность отвергнуть нулевую гипотезу называют уровнем значимостии обозначают . Обычно в медико-биологических исследованиях принимают = 0.05. • ЕслиР < 0,05нулевая гипотеза отвергается, следовательно найдено статистически значимое различие в сравниваемых группах.
Условия нормальности распределения количественного признака: • 95% значений заключаются в пределах двух стандартных отклонений (±2σ); • 68% - в пределах одного стандартного отклонения (±σ); • медиана близка к среднему значению (расхождение не более 20%), то есть распределение симметрично.
Проверка нормальности распределения количественного признака: • Проверить близость среднего и медианы (с помощью вычислений или расчета описательных статистик в пакетах Биостатистика, SPSS или Statistica); • Вычислить критерий Колмогорова-Смирнова (в пакетах SPSS или Statistica); • Если распределение нормально, можно применять параметрические критерии; • Если распределение не является нормальным, нужно пользоваться непараметрическими критериями.
Выбор критерия Колмогорова-Смирнова в пакете SPSS: Выбрать в меню «анализ» Критерий К-С на одном примере Непарамет- рические тесты
КРИТЕРИЙ СТЬЮДЕНТА • Критерий Стьюдента применяется, если нужно сравнить только две группыколичественных признаков с нормальным распределением (частный случай дисперсионного анализа). • Примечание:этим критерием нельзя пользоваться, сравнивая попарно несколько групп, в этом случае необходимо применять дисперсионный анализ. • Ошибочное использование критерия Стьюдента увеличивает вероятность «выявить» несуществующие различия. Например, вместо того, чтобы признать несколько методов лечения равно эффективными (или неэффективными), один из них объявляют лучшим.
Формула для вычисления критерия Стьюдента: • Где M1, m1– среднее значение признака и ошибка среднего в основной группе; • M2, m2- среднее значение признака и ошибка среднего в группе сравнения. • ν = (n1 + n2 - 2) – число степеней свободы.
Правила применения критерия Стьюдента: • Критерий Стьюдента может быть использован для проверки гипотезы о различии средних только для двух групп; • Если число групп больше двух, необходимо применять дисперсионный анализ; • Если критерий Стьюдента был использован для проверки различий между несколькими группами, то истинный уровень значимости можно получить, умножив полученный уровень значимости на число возможных сравнений (для корректности применения нужно использовать поправку Бонферрони).
Поправка Бонферрони: • Если число сравниваемых групп больше 2-х, можно применить поправку Бонферрони, то есть взять за критический уровень значимости различий p=0.05/число сравнений. • Например, при сравнении 3-х групп, число сравнений равно 3, то есть р=0.05/3=0.018. • Если число попарных сравнений велико (при пяти группах их уже 10), то получаем слишком жесткое требование для уровня значимости: можно не найти различий там, где они есть. • Лучше применить дисперсионный анализ.
Пример критерия Стьюдента: • Пусть есть две группы независимых наблюдений. Признаки – количественные с нормальным распределением (среднее пульсовое давление); • Среднее в первой группе равно 64, среднее во второй группе равно 55; • В первой и во второй группах по 15 пациентов; • Стандартные ошибки среднего в первой группе 3.6, во второй группе 1.8; • Определить статистическую значимость различия между группами.
Вычисление результата: • Вычисляем по формуле Стьюдента: __________ • t = (64-55) / 3.62 + 1.82 = 2.26 • ν = n1 + n2 - 2 = 28 • По таблице Стьюдента для критических значений находим, что для уровня значимости P = 0.05 и степени свободы 28, критическое значение t = 2.05. • 2.26 > 2.05 – верное неравенство. • Следовательно, существует статистически значимое различие в группах с уровнем значимости 0.05.
Применение стат. пакетов для вычисления критерия (Биостат): ВЫБОР НУЖНОГО КРИТЕРИЯ В МЕНЮ
Выбор типа данных, пакет Биостатистика, версия 4.03: ОЦЕНИТЕ ФОРМАТ ВАШИХ ДАННЫХ И ВЫБЕРИТЕ НУЖНУЮ СТРОКУ:
Ввод данных для расчета критерия Стьюдента: ВВОДИТЬ ДАННЫЕ ЗДЕСЬ
Результаты вычислений: То есть, различия статистически значимы.
Формат представления данных для расчета критерия в SPSS: • Переменная анализа (например, частота пульса) должна быть в одной графе; • Группирующая переменная (например, принадлежность к основной группе (1) или контрольной группе (2)) - в другой графе базы данных; • Аналогичный формат должен быть и для непараметрических аналогов критерия Стьюдента (критериев Манна-Уитни, Колмогорова-Смирнова, Крускала-Уоллиса).
Расчет критерия Стьюдента в статистическом пакете SPSS. Выбор метода анализа:
Расчет критерия Стьюдента в SPSS. Отбор переменных.
Парный критерий Стьюдента: • Парный критерий Стьюдента применяется, если нужно сравнить связные (зависимые) группы по количественному признаку с нормальным распределением; • Например, изменение веса пациентов после проведенного лечения. То есть единицы наблюдения (больные) одни и те же, показатель – в динамике.
Алгоритм парного критерия Стьюдента: • Вычисляется величина изменения (d)каждого больного. • Вычисляется среднее этих изменений Md и его стандартная ошибка m. • Вычисляется значение критерия Стьюдента: t= Md/m • Полученное значение сравнивается с критическим для числа степеней свободы ν=n-1 . • Если обычный критерий Стьюдента требует нормального распределениясамих данных, то парный критерий Стьюдента требует нормального распределения их изменений.
Расчет критерия для связных выборок количественного признака с нормальным распределением: • В статистических пакетах выбор критерия осуществляется с помощью меню критериев; • Обязательно выбрать парный критерий Стьюдента. • Непараметрическим аналогом парного критерия Стьюдента является критерий Уилкоксона.
Формат данных для парного критерия Стьюдента (SPSS): Вес до лечения Вес после лечения
Расчет парного критерия Стьюдента в SPSS. Отбор переменных.
Результаты расчета парного критерия Стьюдента (SPSS): Значение парного критерия Число степеней свободы Уровень значимости различия (р)
Аналог критерия Стьюдента для качественных признаков: Z-критерий • Z-критерий применяется для сравнения двух групп дихотомических качественных или порядковых признаков, выраженных в относительных показателях (долях). • Формула для вычисления критерия: • где Р1 , Р2 – относительные значения показателей в сравниваемых группах (периодах); • m1, m2 – средние ошибки относительных показателей.
Формулы для средних ошибок : • где p– относительное значение показателя, • q = 100 – p, для показателей, вычисляемых в процентах; • q = 1000 – p, для показателей, вычисляемых в промилле и т.д.; • n – число наблюдений (записей в БД для требуемого показателя). • Формула корректна при n 30; • При n 30 в знаменателе под корнем (n-1).
Пример вычисления Z-критерия: • По данным социально-гигиенического мониторинга в г. Новокузнецке: • в 2000 г. значение показателя санитарного фона было 9% на 40 смывов, • в 2001 г. 30% на 50 смывов. • Произошло ли за год статистически значимое изменение в группах по данному показателю?
Решение в пакете Биостатистика: • В меню Критерии выбираем Z-критерий. Появляется шаблон для ввода данных группы 1. Заполняем численность группы 1 – 40 смывов, доля показателя санитарного фона - 0.09, что соответствует 9% • Далее на экране появляется шаблон для ввода значений группы 2. • Вводим в шаблон цифры 50 – число смывов во второй группе, 0.3 – доля показателя (соответствует 30%). • Входные данные введены.
Результат и интерпретация: Поскольку уровень значимости Р = 0.029 (Р < 0,05), нуле- вая гипотеза, предполагающая, что различия в группах статистически не значимы, отвергается. Таким образом, в 2001 году значение показателя санитарного фона по смывам в г. Новокузнецке значимо возросло по сравнению с 2000 г.
Непараметрический аналог критерия Стьюдента: критерий Манна-Уитни: • Если распределение количественных признаков в двух независимых группах не является нормальным, можно воспользоваться критерием Манна Уитни; • Данные обеих групп объединяются и упорядочиваются по возрастанию. Ранг 1 присваивается наименьшему из всех значений, ранг 2 – следующему и так далее. Наибольший ранг присваивается самому большому среди значений в обеих группах. Если значения совпадают, им присваивают один и тот же средний ранг (например, два значения поделили 3-е и 4-е места, обоим присваивается ранг 3,5); • Для меньшей группы вычисляется Т – сумма рангов ее членов. Если численность групп одинакова, Т вычисляется для любой из них. • Полученное значение сравнивается с критическими значениями стандартных таблиц. В зависимости от результата сравнения нулевая гипотеза отвергается (различия статистически значимы) или принимается.
Пример применения критерия Манна-Уитни: • Была исследована проницаемость сосудов сетчатки в двух группах – здоровых (Х) и больных (Y). • Х={0.5, 0.7, 0.7, 1.0, 1.0, 1.2, 1.4, 1.4, 1.6, 1.6, 1.7, 2.2}; • Y={1.2, 1.4, 1.6, 1.7, 1.7, 1.8, 2.2, 2.3, 2.4, 6.4, 19.0, 23.0}. • Определить, значимы ли различия в группах.
Проверка в Биостат нормальности распределения признаков: В МЕНЮ «КРИТЕРИИ» ВЫБИРАЕМ «ОПИСАТЕЛЬНАЯ СТАТИСТИКА» Во второй группе медиана значительно (в 2,7 раза) отличается от среднего значения, следовательно, распределение не является нормальным. Таким образом, в данном случае мы не имеем права применять параметрические методы.
Результат и интерпретация Вероятность ошибки отвергнуть справедливую нулевую гипотезу, предполагающую, что различия в группах незначимы, меньше 0,05: p=0,002. Следовательно, критерий Манна-Уитни выявил значимые различия по признаку проницаемости сосудов сетчатки между группой больных и здоровых.
Решение примера в SPSS: • Формат данных: все значения признаков, то есть значения проницаемости сосудов сетчатки как у больных, так и у здоровых, должны быть в одной графе; • Группирующая переменная должна описывать, к какой группе относится пациент, например, в нашем случае: «здоров»=1, «болен»=2; • Аналогичный формат данных должен быть для вычисления в SPSS и других критериев, если рассматриваются независимые группы.
РЕЗУЛЬТАТЫ РАСЧЕТА В SPSS: В ПЕРВОЙ ТАБЛИЦЕ РАССЧИТАНЫ РАНГИ: Т=203, ВО ВТОРОЙ УРОВЕНЬ ЗНАЧИМОСТИ: P=0.002 РЕЗУЛЬТАТ СОВПАДАЕТ С ПОЛУЧЕННЫМ В БИОСТАТИСТИКЕ
Анализ качественных признаков.Критерий хи-квадрат (2): • Критерий для сравнения двух или болеегрупп качественных признаков; • Если признак может принимать одно из двух возможных значений, он называется дихотомическим; • Критерий может применяться как для дихотомических, так и для признаков с большим числом возможных значений. • Число возможных сочетаний числа выборок и значений признака называется таблицей сопряженности.
Формула критерия хи-квадрат: Для таблиц сопряженности 22 применяется поправка Йейтса: в числителе вычитается ½ для компенсации излишнего «оптимизма» (несколько ужесточает критерий).
Правомерность применения: • Применение критерия 2для таблиц размерности 22 правомерно, если ожидаемое число в любой из ячеек таблицы больше или равно 5; • В противном случае нужно использовать более точныйкритерий Фишера (перебор всех возможных вариантов заполнения таблицы сопряженности при данной численности групп).
Правомерность применения: • Для таблиц сопряженности размерности больше, чем 22, критерий 2применим, если все ожидаемые числа не меньше 1, и доля клеток с ожидаемыми числами меньше 5 не превышает 20%. • При невыполнении этих условий критерий может дать ложные результаты. • В этом случае нужно объединить несколько строк или столбцов, то есть преобразовать таблицы сопряженности.
Пример критерия хи-квадрат: • Пусть есть две группы: не вакцинированных и вакцинированных по 20 человек в каждой. В первой группе заболело 12 человек, а во второй – 4 человека. Определить значимо ли различие в группах, то есть эффективна ли вакцинация?
Таблица сопряженности: Ожидаемые значения – при условии справедливости нулевой гипотезы
Решение задачи в пакете Биостатистика: Признак качественный («заболел» с возможными значениями «да» или «нет»), две независимых группы. Следовательно, необходимо воспользоваться критерием χ2. Важно: в условии задачи дана численность всей группы и число заболевших. Во входную таблицу для пакета «Биостатистика» необходимо по группам ввести число заболевших и не заболевших (как разность между общей численностью группы и числом заболевших). Для таблиц сопряженности 22 в пакете автоматически вычисляется поправка Йейтса
Результат и интерпретация: • Результат вычислений представлен на рисунке. • Интерпретация результата. Нулевая гипотеза предполагает, что между числом заболевших в группах нет статистически значимого различия. В пакете «Биостатистика» вычислена вероятность ошибки Р = 0,024. • Р < 0,05, следовательно, нулевая гипотеза отвергается. То есть, найдено статистически значимое различие по признаку «заболел гриппом» между группой вакцинированных и не вакцинированных. Значит вакцинация эффективна.
Качественные признаки, связные группы: Критерий Мак-Нимара • Критерий предназначен для анализа повторных измерений качественных признаков, достаточно часто встречающихся в медицине, например, диагноз – типичный качественный признак. • Критерий Мак-Нимара, подобно парному критерию Стьюдента, часто используется для выявления изменений в наблюдениях типа «до-после», когда интересующий признак принимает одно из двух значений «есть-нет».
Шаги критерия Мак-Нимара: • Исключаются из рассмотрения больные, реакция которых неизменна, и подсчитывается число тех, чья реакция изменилась. • Полученное число делится пополам. • Вычисляется мера отклонения наблюдаемого числа меняющих реакцию больных от ожидаемого, используя критерий 2 с поправкой Йейтса. • Сравнивается полученное значение 2 с критическим, имеющим одну степень свободы.