1 / 14

Статистичні висновки

Статистичні висновки. П еревірка статистичних гіпотез. Статистичні висновки – це висновки про ВСЮ генеральну сукупність зроблені на основі вибіркових даних з використанням теорії ймовірностей. Репрезентативна вибірка. Генеральна сукупність. * + + .. + * * : . + + * * . . - + -

gerard
Download Presentation

Статистичні висновки

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Статистичні висновки

  2. Перевірка статистичних гіпотез Статистичні висновки – це висновки про ВСЮ генеральну сукупність зроблені на основі вибіркових даних з використанням теорії ймовірностей. Репрезентативна вибірка Генеральна сукупність • * + + .. + * * : . • + + * * . . - + - • . + * - - * * • - + . . * + + * * . . - Вибірка Ймовірнісні концепції

  3. Центральна гранична теорема Для випадкової вибірки з n елементів з будь-якої генеральної сукупності розподіл середнього значення наближається до нормального при збільшенні n. Причому, середнє вибірки стає рівним математичному сподіванню генеральної сукупності, а стандартна похибка середнього значення

  4. Центральна гранична теорема Приклад. У супермаркеті в середньому покупець витрачає 20 грн з стандартним відхиленням 15 грн. За годину магазин обслуговує 500 покупців. Яка ймовірність, що сумарна виручка від 500 покупців перевищить 10 500 грн? Маємо, мат.сподівання сумарної виручки = 500*20=10 000 грн. Стандартне відхилення= = 335.4 грн Тому, ймовірність, що сумарна виручка від 500 покупців перевищить 10 500 грн =1-NORMDIST(10500;10000;335.4;1)=1-0.932=0.068

  5. Якщо невідоме стандартне відхилення Якщо невідоме стандартне відхилення генеральної сукупності, то його ми можемо апроксимувати через стандартну похибку вибірки, тобто В такому випадку для аналізу варто використовувати не нормальний розподіл, а подібний до нього розподіл Стьюдента (t-розподіл). В Excel відповідні формули: =TDIST чи =СТУДРАСП і обернені формули =TINV чи =СТУДОБР. Фактично, t-розподіл подібний до стандартного нормального.

  6. Якщо невідоме стандартне відхилення Приклад. Якщо б в попередній задачі було невідоме станд. відхилення генеральної сукупності, а ми його оцінили в 16 грн за рахунок вибірки, то ймовірність, що сумарна виручка від 500 покупців перевищить 10 500 грн була б рівна =TDIST((10500-10000)/357.8;499;1)=0.0815, де 357.8= , а величина (10500-10000)/357.8 – це фактично перехід від нормального до стандартного нормального розподілу.

  7. Довірчі інтервали Коли ми, базуючись на вибірці, робимо судження про всю генеральну сукупність, то це веде до неточності в оцінках, тому зазвичай використовують не точкові оцінки, а інтервальні, тобто будують довірчий інтервал для параметрів генеральної сукупності. Довірчий інтервал для математичного сподівання рівний Де - значення t-розподілу для двостороннього рівня довіри - це ймовірність прийняти помилкове рішення, отже - це рівень довіри тесту.

  8. Довірчі інтервали: задаємо точність Як бачимо, при збільшені обсягу вибірки, довірчий інтервал зменшується, тому задавши наперед необхідну точність оцінки – довжину довірчого інтервалу ми можемо знайти необхідний для цього обсяг вибірки. Формула для знаходження n така де е – задана довжина довірчого інтервалу.

  9. Довірчі інтервали: приклад Припустимо банк для оптимізації готівкових коштів вирішив оцінити денну потребу в готівці. Для цього він взяв статистику за випадкових п’ять днів по кількості готівки, що приносили клієнти (Х) та кількості готівки, що забирали клієнти (Y), вони отримали такі дані Чи можна стверджувати на основі цих даних, що з ймовірністю помилки 5% їм не буде бракувати готівки? Знайдемо 95% довірчий інтервал для мат.сподівання отримання та видачі готівки. Маємо Стандартні похибки для X I Yрівні, відповідно, 8.246 і 7.483.

  10. Довірчі інтервали: приклад Тому 95% довірчий інтервал для мат.сподівання ортимання готівки рівний Для мат.сподівання видачі готівки Оскільки мінімальне значення мат.сподівання отримання готівки (19.763) менше за максимальне значення мат.сподівання видачі готівки (22.922), то ми не можемо стверджувати, що з ймовірністю помилки в 5% банку щоденно буде вистачати готівки.

  11. Довірчі інтервали прогнозу Довірчі інтервали можна використовувати для прогнозу можливого наступного значення генеральної сукупності. Для цього достатньо скоректувати стандартну похибку таким чином Отже, довірчий інтервал прогнозу складе Зауважте, тут замість стоїть s, оскільки нас цікавить не що в середньому станеться, а ЩО станеться.

  12. Довірчі інтервали прогнозу: приклад Вам потрібно постійно замовляти певні комплектуючі для виробництва. Ви не хочете замовляти багато наперед, оскільки сплачуєте відсотки за кредит, тим більше ви не хочете зупинки виробництва через відсутність комплектуючих. Дані за останні вісім поставок показали такі терміни виконання ваших замовлень в днях: 10, 9, 7, 10, 3, 9, 12, 5. Середнє значення = 8.125, стандартне відхилення s=2.94897. Скоректована стандартна похибка прогнозу рівна = 3.12786. Тому, 95% двосторонній довірчий інтервал рівний (t-значення =2.365) Від 0.728=8.125-2.365*3.12786 до 8.125+2.365*3.12786=15.52. Оскільки вас цікавить лише верхня межа, то можна порахувати односторонній довірчий інтервал прогнозу (t-значення = 1.895): 8.125+1.895*3.12786=14.05

  13. Тестування гіпотез Інший спосіб прийняття рішень щодо генеральної сукупності на основі вибіркових даних. Якщо ми хочемо порівняти мат.сподівання генеральної сукупності з наперед заданим числом, то сформулюємо це як гіпотезу: Щоб протестувати таку гіпотезу достатньо обчислити t-статистику І порівняти це значення з критичним (табличним) значенням t-розподілу для заданої точності оцінки (ймовірності помилки). Якщо t-статистика >t-критичне, то нульова гіпотеза відкидається.

  14. Завжди присутня можливість помилки При статистичних висновках завжди є присутня помилка, вона буває двох видів: Істина

More Related