320 likes | 455 Views
ЦЖР/ИОО Журналистские расследования - Общественная Школа Финансов, Баку, 14-16 апреля 2011. Статистические модули Инструктор: Эд Суирс-Хеннесси. Средняя величина или Среднее значение. Среднее значение вычисляется путём суммирования значений и деления суммы на количество переменных.
E N D
ЦЖР/ИОО Журналистские расследования- ОбщественнаяШкола Финансов, Баку, 14-16 апреля 2011 Статистические модули Инструктор: Эд Суирс-Хеннесси
Средняя величинаилиСреднее значение • Среднее значение вычисляется путём суммирования значений и деления суммы на количество переменных. В задаче по математике на «множества», количество правильных ответов из 10 были: Значения: 3,4,5,5,4,10,4,10,4,6,4,7,10,3,10,5,4,6,10,5
Средняя величина или Среднее значение • Сумма 20 значений составляет 119 • Среднее количество 119/20 = 5.95
Мода (Статистика) • Рассортируйте числа в группах, учитывая сколько людей собрали 3 балла, сколько 4 балла и т.д. Это называется распределение чисел. См. Excel пример
Медиана (Статистика) • Сортируйте значения от меньшего к большему. • Подсчитайте количество значений. • Если у вас нечетное число значений, медианой является среднее значение. • Если число значений четное, медиана является средним числом от двух средних значений. See Excel examples
Сумма • Данные переменных потока и запаса • Добавьте данные о запасах • Будьте осторожны с данными потока – их можно добавить, но будьте осторожны с описанием.
Вероятность • Количество между 0 и 1 • 0 = невозможное событие • 1 = определенное событие • 0,5 = событие которое может произойти и непроизойти
Вероятность • 0 = невозможное событие - все мы позавтракали сегодня в Лондоне • 1 = определенное событие - все встали с постели сегодня • 0,5 = событие может произойти, или не произойти - монета упала на одну из сторон
Вероятность • Несмещённые кости • Все шесть сторон имеют равную вероятность выподания • Вероятность = 1 / 6 = 0,1666
Вероятность Отметим суммувероятностей всех вариантов = 1
Вероятность - возрастно-половая пирамида
Вероятность - эксперименты типа да / нет ; биномиальное распределение
Вероятность -Невероятные события; распределение Пуассона
Вероятность - Нормальное распределение, например, для зарплаты на определенном уровне
Интерпретация данных, полученных с помощью вопросника • Не все люди отвечают • Цена опроса высока – поэтому рассматриваются образцы опросов с малым количеством респондентов • Различные образцы могут давать отличающиеся результаты • Результатам присваивают меру надежности - доверительный интервал.
Интерпретация данных, полученных с помощью вопросника X X X X X X X X X X X X X Реальная стоимость X X X X X X X X X Выборочная оценка
Интерпретация данных, полученных с помощью вопросника X X X X X X X X Реальная стоимость X X Выборочная оценка
Интерпретация данных, полученных с помощью вопросника • Статистика это среднее арифметическое от всех наблюдений плюс-минус погрешность измерения • Для 67% доверия к результату???, средний плюс или минус одно (1х)стандартное отклонение. • Для 95% доверия к результату????, средний плюс или минус двукратное (2x)стандартное отклонение. • Для 99% доверия к результату, средний плюс или минус трехкратное (3x)стандартное отклонение.
Интерпретация данных, полученных с помощью вопросника • Пример возраста
Ошибки в данных • Примените проверку смысла (sense check) • Если вы не уверены, ищите альтернативные источники • Существует ли показатель предыдущего года? • Является ли изменения по годам допустимым? • Правильно ли отображаются единицы измерения?
Ошибки в данных • Два примера, где данные не были проверены • 1. Население Таджикистана не составляет 7595 млн. (это больше, чем населения земного шара!)
Ошибки в данных • Два примера, где данные не были проверены • 1. Население Таджикистана не составляет 7,595,000,000 (это больше, чем населения земного шара!) • 2. Ошибка произошла из-за неправильного применения точки и запятой в дробях
Ошибки в данных • Два примера, где данные не были проверены • 1. Население Таджикистана не составляет 7,595,000,000 • 2. Не так много людейнетрудоспособны.
Доверительные интервалы - сравнение результатов Поэтому статистически не значительно отличается 33.6 31.2 30.3 32.9 Совпадение
Индекс • Используется для описания тенденций в экономике, в частности, в ценах и торговле • Полезен для сравнения разрозненных рядов данных. • Позволяет сравнивать перемены во времени относительно постоянной точки.