3.01k likes | 3.34k Views
ЛЕКЦИЯ 1. Введение в эконометрику. В современных программах подготовки экономистов курс эконометрики занял одно из ключевых мест, поскольку сегодня деятельность в любой области экономики требует от специалиста применения современных методов оценки, анализа и интерпретации экономических данных.
E N D
ЛЕКЦИЯ 1 Введение в эконометрику
В современных программах подготовки экономистов курс эконометрики занял одно из ключевых мест, поскольку сегодня деятельность в любой области экономики требует от специалиста применения современных методов оценки, анализа и интерпретации экономических данных.
Сегодня эконометрические методы применяются в качестве • стандартных в различных отраслях прикладной экономики, изучающей • все, начиная от расходов домашних хозяйств и предпринимательских • инвестиций и заканчивая организацией производств, рынков труда и • проблемами государственной политики.
Эконометрика – это взаимодействие экономической теории, наблюдаемых данных и статистических методов.
присуждение шести нобелевских премий по экономике за разработки в этой области: премия 1969 г. была присуждена Р. Фишеру и Я.Тинбергену за разработку математический методов анализа экономических данных; премия 1980 г. – Л.Клейну за построение макроэконометрических моделей, основанных на системах эконометрических уравнений; премия 1981 г. – Д.Тобину за регрессию с цензурированной зависимой переменной, которую по его имени называют тобит
премия 1989 г. – Т. Хаавелмо за анализ и оценивание систем одновременных уравнений; премия 2000 г. – Дж. Хекману и Д. Макфаддену за разработку теорию и методов, широко использующихся • в статистическом анализе поведения индивидуумов и семейных хозяйств; премия 2003 г. – Р. Энглу и К. Грэнжеру за работы в области коинтеграции временных рядов
Применение эконометрических методов на практике невозможно представить без соответствующих программных средств. Перечислим некоторые из распространенных средств, применяемых в этой области:
MS Excel Statgraphics Statistica SPSS SAS Эвриста STATA Eviews STADIA MatLab
Пакет Statgraphicsимеет достаточно длинную историю. Широко использовалась, в свое время, его DOS версия, обладавшая очень неплохим набором возможностей. Мы познакомимся с двумя версиями этого пакета: • STATGRAPHICS Plus for Windows 2.1 • которая предъявляет весьма небольшие требования к ресурсам, и в которой присутствуют большинство возможностей Win версий этого пакета, а также с более современной версией STATGRAPHICS Centurion XV, в которой добавлены некоторые современные методы (например-нейронные сети).
Мощный специализированный эконометрический пакет . EVIEWS , по которому есть весьма полная документация на английском языке, поставляемая вместе с пакетом. • Мы будем работать с достаточно новой версией этого пакета • –Eviews 5.1 • В изучаемом курсе ( и в практикуме по курсу) Вы получите первичные навыки работы с этим пакетом.
Для задач, связанных с конструированием оптимальных портфелей, а также для некоторых других задач используются возможности MS Excel.
Для более сложных задач, возникающих в приложениях, можно порекомендовать пакет STATA. • Пакет STATA достаточно сложен для освоения начинающим пользователем, хотя желающие могут это сделать, используя замечательные лекции С.Коленикова • [. http://www.komkon.org/~tacik/science/ ].
В курсе прикладной статистики мы научились строить оценки параметров распределений, доверительные интервалы, проверять статистические гипотезы и выявлять связи для различных типов признаков. При этом мы использовали пакет Statgraphics.
Связь между ростом, весом, размером обуви
ЛЕКЦИЯ 2 Модель парной линейной регрессии (ЛР).Свойства оценок в модели парной ЛР.
Парная регрессия и корреляция • Парная регрессия представляет собой регрессию между двумя переменными – и , т. е. модель вида: • где – зависимая переменная (результативный признак); – независимая, или объясняющая, переменная (признак-фактор).
Знак «^» означает, что между переменными и нет строгой функциональной зависимости, поэтому практически в каждом отдельном случае величина складывается из двух слагаемых:
где – фактическое значение результативного признака; – теоретическое значение результативного признака, найденное исходя из уравнения регрессии; –возмущение, случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии.
В парной регрессии выбор вида математической функции может быть осуществлен тремя методами: • графическим; • аналитическим, т.е. исходя из теории изучаемой взаимосвязи; • экспериментальным.
В практических исследованиях, как правило, имеет место некоторое рассеяние точек относительно линии регрессии. Оно обусловлено влиянием прочих, не учитываемых в уравнении регрессии, факторов. Иными словами, имеют место отклонения фактических данных от теоретических .
Величина этих отклонений и лежит в основе расчета остаточной дисперсии:
Чем меньше величина остаточной дисперсии, тем меньше влияние не учитываемых в уравнении регрессии факторов и тем лучше уравнение регрессии подходит к исходным данным (т.е. лучше «подгонка» модели).
Считается, что число наблюдений должно в 7-8 раз превышать число рассчитываемых параметров при переменной .
1. Линейная модель парной регрессии и корреляции • Линейная регрессия сводится к нахождению уравнения вида • или (1.1)
Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК).
МНК позволяет получить такие оценки параметров и , при которых сумма квадратов отклонений фактических значений результативного признака от теоретических минимальна: • (1.2)
Рис. 1.2. Линия регрессии с минимальной дисперсией остатков.
Чтобы найти минимум функции (1.2), надо вычислить частные производные по каждому из параметров и и приравнять их к нулю. • Обозначим через , тогда:
, • Где - ковариация признаков и • - дисперсия признака
, • ,
Параметр называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу.
Оценка качества «подгонки» модели • Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции , который можно рассчитать по следующим формулам:
Линейный коэффициент корреляции находится в пределах: . • Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции , называемый коэффициентом детерминации .
Коэффициент детерминации характеризует долю дисперсии результативного признака , объясняемую регрессией, в общей дисперсии результативного признака: • =
Соответственно величина характеризует долю дисперсии , вызванную влиянием остальных, не учтенных в модели, факторов. Чем ближе коэффициент детерминации к единице, тем лучше точки на регрессионном поле укладываются на линию регрессии, т.е. тем выше уровень «подгонки» модели.
После того как найдено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров.
Чтобы иметь общее суждение о качестве модели из относительных отклонений по каждому наблюдению, определяют среднюю ошибку аппроксимации: • Средняя ошибка аппроксимации не должна превышать 8–10%.
Значимость регрессионной модели в целом • Оценка значимости уравнения регрессии в целом производится на основе -критерия Фишера, которому предшествует дисперсионный анализ.
Согласно основной идее дисперсионного анализа, общая сумма квадратов отклонений переменной от среднего значения раскладывается на две части – «объясненную» и «необъясненную»:
Где - общая сумма квадратов отклонений; • - сумма квадратов отклонений, объясненная регрессией (или факторная сумма квадратов отклонений); • - остаточная сумма квадратов отклонений, характеризующая влияние неучтенных в модели факторов.
Схема дисперсионного анализа: • Определяются дисперсии на одну степень свободы, что приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину -критерия Фишера:
Фактическое значение -критерия Фишера сравнивается с табличным значением при уровне значимости и степенях свободы и . При этом, если фактическое значение -критерия больше табличного, то признается статистическая значимость уравнения в целом.
Для парной линейной регрессии , поэтому
Величина - критерия связана с коэффициентом детерминации , и ее можно рассчитать по следующей формуле: