380 likes | 662 Views
Статистическое моделирование экспериментального плана. Лекция №3. Анализ таблиц с одним входом Однофакторный дисперсионный анализ для несвязных выборок Оценка контрастов post hoc и планируемое сравнение групп. Вопросы для обсуждения. Вопрос №1. Анализ таблиц с одним входом.
E N D
Статистическое моделирование экспериментального плана Лекция №3
Анализ таблиц с одним входом • Однофакторный дисперсионный анализ для несвязных выборок • Оценка контрастов post hocи планируемое сравнение групп Вопросы для обсуждения
Вопрос №1 Анализ таблиц с одним входом
Подготовка и проведение эксперимента предполагает выделениенезависимой переменной, описывающей характер экспериментального воздействия, и измерениезависимой переменной. • Независимая переменная, как правило, описывается номинативной или порядковой шкалой. • Зависимая переменная, в идеале, должна быть задана в метрической шкале. Экспериментальный план
С точки зрения математической статистики, простейшим экспериментальным планом является межгрупповой план. • В межгрупповом плане уровни (значения) независимой переменной варьируются между группами испытуемых, т.е. в каждой экспериментальной группе уровень (значение) независимой переменной оказывается неизменным для всех испытуемых. • Результаты межгруппового эксперимента могут быть представлен в виде таблицы с одним входом. Межгрупповой план
Сравнение нескольких выборок (Winer, 1962)
Где - среднее по группе испытуемых, т.е. Внутригрупповой суммарный квадрат
Где - среднее значение зависимой переменной по всем выборкам, т.е. Межгрупповой суммарный квадрат
Суммарный разброс данных внутри экспериментальных групп оказался равным 85,875 • Разброс данных между экспериментальными группами оказался равным 50,125 • Общий разброс данных по экспериментальной выборке составил 136 • Т.е. SStotal= SSwithin_group + SSbetwееn_group По нашим данным…
Непосредственное сравнение внутригруппового и межгруппового квадратов является некорректным, т.к. эти статистики имеют различное число степеней свободы. • Число степеней свободы может быть оценено путем вычитания числа линейных ограничителей статистики из числа элементов, для которых оценивается дисперсия. Степени свободы
Число степеней свободы для статистики SSbeetwеn_groupравно k-1 • Число степеней свободы для статистики SSwithin_groupравно k(n-1) • Число степеней свободы для статистики SStotalбудет равно kn-1 • Заметим, что dftotal= dfwithin_group+ dfbeetwеn_group Подсчет степеней свободы
Число степеней свободы для внутригрупповой оказалось равным 21 • Число степеней свободы для межгруппового суммарного квадрат оказалось равным 2 • Общее число степеней свободы – 23 df по нашим данным…
В дисперсионном анализе дисперсия обозначается термином средний квадрат • Средний квадрат находится путем деления суммарного квадрата на соответствующее ему число степеней свободы: Средний квадрат
25,06 Найдем средние квадраты
Для сравнения внутригрупповой и межгрупповой дисперсий применим F-тест Фишера: Сравнение дисперсий
F(2, 21) = 6,13; p<0,01 • Таким образом, исходя из полученных данных мы можем сделать вывод о статистически надежных (достоверных) различиях между группами Итоговые результаты
Вопрос №2 Однофакторный дисперсионный анализ для несвязных выборок
Дисперсионный анализ (ANOVA) Р. Фишер (1890-1962)
Фиксированная Случайная Модель с двумя случайными признаками Независимая переменная является случайной, т.е. принимает в эксперименте лишь некоторые возможные значения Зависимая переменная случайна • Модель с одним случайным признаком • Независимая переменная является фиксированной, т.е. принимает в эксперименте все возможные значения • Зависимая переменная случайна Структурная модель
Всякое конкретное значение зависимой переменной, полученное в эксперименте, состоит из нескольких аддитивных частей: xij= μ+τj+ij • Здесь xij- значение зависимой переменной для i-ого испытуемого в j-ой группе,μ – популяционная средняя (математическое ожидание зависимой переменной),τj – эффект независимой переменной на j-ом уровне,ij– случайная экспериментальная ошибка. Фиксированная модель
Поскольку значениеτjвнутри экспериментальной группы постоянно, внутригрупповая дисперсия (σ2j) должна быть равна дисперсии экспериментальной ошибки (σ2εj). • Дисперсия ошибки не зависит от эффекта независимой переменной. • Иными словами, предполагается, что величинаεпостоянна для всех экспериментальных групп, т.е. справедливо соотношение σ2j = σ2εj • Экспериментальная ошибка распределена по нормальному закону с математическим ожиданием 0 и дисперсиейσ2εj Уточнения
Нулевая - H0 Альтернативная - H0 τ1 ≠ τ2 ≠ … ≠ τj ≠ .. ≠ τk E(F) > 1 • τ1 = τ2 = … = τj = .. = τk • E(F) = 1 Гипотезы
Единственное отличие модели с двумя случайными признаками состоит в том, что в ней ожидаемое значение для статистики MSbetween groupравно (1-k/K)n+σ2ε, где K - общее число уровней независимой переменной в генеральной совокупности, а k - число уровней независимой переменной, выбранных для эксперимента. • Поскольку в реальном эксперименте k практически всегда много меньше K, дробь k/K оказывается величиной настолько незначительной, что ею можно пренебречь. • Таким образом, модель с двумя случайными признаками может быть сведена к фиксированной модели. Случайная модель
Вопрос №3 Оценка контрастов post hocи планируемое сравнение групп
Априорное Апостериорное Осуществляет выделение контрастных групп на основе уже полученных данных Обычно обозначается как анализ post hoc • Предполагает наличие математическое модели, описывающей характер связи независимой и зависимой переменных • Обозначается как планируемое сравнение групп Множественное сравнение
Анализ post hoc является аналогом t-теста Стьюдента, т.е. осуществляет попарного сравнение групп, однако в отличие от t-теста оценивает внутригрупповую дисперсию по всем данным: • Разработаны несколько вариантов тестов post hoc. Отличия между ними заключаются, главным образом, в способах оценки надежности (значимости) данной статистики Анализ Post Hoc
Метод наименьших значимых различий (LSD) • Тест Шеффе (Scheffé) • Тест Тьюки (Tukey) • Тест Дункана(Duncan) • Тест Бонферрони (Bonferroni) Тесты Post Hoc
Метод наименьших значимых различий (LSD)был разработан Р. Фишером и является аналогом t-теста • Оценка значимости статистики t’ осуществляется на основе двустороннего теста Стьюдента. • Использование данного метода оценки контрастных групп связано с повышенным риском ошибки первого рода, т.е. это наиболее либеральный тест Метод наименьших значимых различий
Тест Шеффе (Scheffé) считается наиболее консервативным. • Полученное значение t’сравнивается с критическим значением, которое находится на основе критического значения F-распределенияс соответствующими экспериментальной модели степенями свободы: Тест Шеффе
Тесты Тьюки (Tukey), Дункана (Duncan), Бонферрони (Bonferroni) и т.п. являются, как правило оптимальным выбором, являясь менее консервативными по сравнению с тестом Шеффе, при этом не тяготея к ошибке первого рода Тьюки, Дункан, Бонферрони…
Планируемое сравнение осуществляется на основе метода априорных контрастов. • Контрастом называется сумма (где - коэффициенты контраста такие, что Априорные контрасты
Предположим, что переменная Y линейно зависит от переменной X • Если имеются данные, относящиеся к четырем группам испытуемых, то коэффициенты контраста могут быть заданы следующим образом: -1,5 -0,5 0,5 1,5 Y 1,5 0,5 -0,5 -1,5 1 2 3 4 X Априорные контрасты: пример