170 likes | 382 Views
Первинна обробка результатів спостережень. Закон розподілу даних. Основні положення та завдання. Розподіл імовірностей випадкових величин. Числові характеристики ВВ. Перевірка статистичних гіпотез. Перевірка наявності грубих промахів.
E N D
Первинна обробка результатів спостережень. Закон розподілу даних • Основні положення та завдання. • Розподіл імовірностей випадкових величин. • Числові характеристики ВВ. • Перевірка статистичних гіпотез. • Перевірка наявності грубих промахів.
Результати спостережень – випадкова величина, тобто змінна величина, яка в результаті випробувань з випадковими наслідками набуває одного із своїх можливих, наперед невідомих, значень. • Дискретна – це ВВ, яка приймає окремі ізольовані значення, що визначаються цілим числом, з певними ймовірностями. Кількість можливих значень дискретної ВВ є скінченою або нескінченою. • Неперервна ВВ приймає будь-які значення на деякому числовому проміжку, відповідно, кількість можливих значень неперервної ВВ є нескінченою.
Результати спостережень утворюють статистичну сукупність. • Генеральна сукупність – повний набір усіх можливих значень ВВ. • Вибірка (вибіркова сукупність) – це множина випадково відібраних елементів із генеральної сукупності. • Повторна вибірка формується за умов, якщо відібраний елемент після досліджень повертають до вибірки перед відбором наступного. • Безповторна вибірка формується за умов неповернення відібраних елементів до вибірки.
Репрезентативна вибірка - це вибірка, яка відображає властивості генеральної сукупності з достатньою точністю. Згідно закону великих чисел вибірка репрезентативна, якщо її елементи відібрано випадково, тобто ймовірність потрапляння у вибірку кожного елементу є однакова.
Без розбиття генеральної сукупності на частини: Простий випадковий безповторний Простий випадковий повторний З розбиттям генеральної сукупності на частини: Типовий, якщо вибірку формують із типових частин генеральної сукупності Механічний, якщо генеральну сукупність механічно ділять на стільки груп, скільки слід відібрати елементів, і з кожної групи відбирають по одному елементу Серійний, якщо елементи відбирають серіями за умови, що досліджувана ознака суттєво не відрізняється між серіями Способи відбору вибірок
Переваги вибіркового методу: • Менша витрата ресурсів • Можливість швидкого одержання результатів • Можливість ЕД, якщо суцільне дослідження взагалі неможливе • Зменшення суб'єктивних помилок за рахунок меншої кількості виконавців
При статистичному аналізі даних дослідник зіштовхується з такими проблемами: • Який обсяг ВС і спосіб її формування • Достовірність перенесення висновків, зроблених на основі ВС, на ГС • Вибір оптимальних способів оцінювання • Вибір способів узагальнення, класифікації та представлення ЕД
Висновки, зроблені на основі ВС, є достовірні за умови достатнього обсягу ВС, тобто в силу вступає закон великих чисел і шукані характеристики втрачають властивість випадковості: • Наприклад,
Закон розподілу ВВ описує зв’язок між значеннями ВВ і ймовірностями їх появи p=f(y). Закон розподілу задається: • Таблицями • Формулами • Графіками
Емпіричний, одержаний на основі ЕД, залежить від статистичної природи ВВ. Теоретичний (типовий), який характерний для певної групи процесів та виду ВВ (дискретна чи неперервна). Розподіл ВВ є
Методи перевірки гіпотез про вид розподілу ВВ • За критерієм Пірсона • За критерієм Колмогорова • За критерієм Колмогорова-Смирнова • За критерієм Вілкоксона • За знаковим критерієм • За показниками асиметрії та ексцесу
Характеристики одновимірних розподілів ВВ • Характеристики розташування: середнє, медіана, мода • Характеристики розсіювання: розмах, дисперсія, середньоквадратичне відхилення, коефіцієнт варіації • Характеристики форми: асиметрія, ексцес
Оцінки параметрів повинні відповідати вимогам. • Незміщенність полягає в тому, що оцінка параметра прямує до істинного значення параметра при великому обсязі ВС. Зміщенність оцінки виникає за наявності систематичної похибки. • Повнота полягає в тому, що оцінка параметра прямує до істинного значення параметра при великому обсязі ВС з імовірністю 100 %. • Ефективність полягає у мінімальній дисперсії оцінки. • Достатність полягає в тому, що оцінка параметра повинна містити всю необхідну інформацію.
Послідовність перевірки статистичних гіпотез • Сформулювати статистичну модель. • Сформулювати нульову Н0 та альтернативну (конкуруючу) Н1 гіпотезу. • Вибрати критеріальну статистику, що відповідає статистичній моделі. • Розрахувати обраний критерій для ЕД. • Вибрати рівень значущості та визначити критичне значення критерію. • Порівняти розрахункове та критичне значення критерію. • Зробити висновки про прийняття чи відхилення гіпотези Н0 (Н1).
При перевірці гіпотез виникають похибки • Першого роду – нульова гіпотеза Н0 відхиляється, коли вона вірна • Другого роду – нульова гіпотеза Н0 приймається, коли вірна альтернативна Н1
Послідовність перевірки вибірок на наявність грубих промахів • Визначити сумнівний елемент вибірки ус(або сумнівні). • Для значень, що залишились, обчислити середнє значення та середньоквадратичне відхилення. • Розрахувати критерій Стьюдента, підставляючи у формулу той із сумнівних елементів, що є найближче до середнього значення: • Прийняти рівень значущості та визначити критичне значення критерію t(q, f). • Якщо виконується умова tрозр<=tкр, то сумнівний елемент не є грубим промахом і включається до вибірки. Решта сумнівних значень перевіряється аналогічно, враховуючи включений до вибірки елемент. • Якщо ж виявиться, що tрозр>tкр, то всі сумнівні елементи є грубими промахами і виключаються із вибірки.
Задача • При прийнятті дизайнера на роботу , його конкурсну роботу оцінювали 10 працівників дизайнерського відділу за 100-бальною системою. Чи можна вважати думку експертів неупередженою, якщо оцінки такі: 60, 55, 35, 40, 70, 70, 65, 75, 75, 80.