980 likes | 1.5k Views
Автокорреляция. Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные данные).
E N D
Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные данные). Положительная автокорреляция вызывается направленным постоянным воздействием некоторых неучтенных в модели факторов.
Отрицательная автокорреляция фактически означает, что за положительным отклонением следует отрицательное и наоборот
Основные причины, вызывающие появление автокорреляции: - ошибки спецификации; - инерцию в изменении экономических показателей; - эффект паутины; - сглаживание данных.
Ошибки спецификации • Неучет в модели какой-либо важной объясняющей переменной либо неправильный выбор формы зависимости обычно приводит к системным отклонениям точек наблюдений от линии регрессии, что может обусловить автокорреляцию. Пример Анализируется зависимость предельных издержек МС от объема выпуска Q. • Если для ее описания вместо реальной квадратичной модели МС = β0 + β1Q + β2Q2 + ε выбрать линейную модель МС=β0+β1Q+ε, то совершается ошибка спецификации.
Инерция • Многие экономические показатели (например, инфляция, безработица, ВНП и т. п.) обладают определенной цикличностью, связанной с волнообразностью деловой активности. Действительно, экономический подъем приводит к росту занятости, сокращению инфляции, увеличению ВНП и т.д. Этот рост продолжается до тех пор, пока изменение конъюнктуры рынка ряда экономических характеристик не приведет к замедлению роста, затем остановке и движению вспять рассматриваемых показателей. В любом случае эта трансформация происходит не мгновенно, а обладает определенной инертностью.
Эффект паутины • Во многих производственных и других сферах экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом). Например, предложение сельскохозяйственной продукции реагирует на изменение цены с запаздыванием (равным периоду созревания урожая). Большая цена сельскохозяйственной продукции в прошедшем году вызовет (скорее всего) ее перепроизводство в текущем году, а, следовательно, цена на нее может снизится и т.д.
Сглаживание данных • Зачастую данные по некоторому продолжительному временному периоду получают усреднением данных по составляющим его подынтервалам. Это может привести к определенному сглаживанию колебаний, которые имелись внутри рассматриваемого периода, что в свою очередь может послужить причиной автокорреляции.
Последствия автокорреляции 1. Оценки параметров, оставаясь линейными и несмещенными, перестают быть эффективными. Следовательно, они перестают обладать свойствами наилучших линейных несмещенных оценок. 2. Дисперсии оценок являются смещенными. Часто дисперсии, вычисляемые по стандартным формулам, являются заниженными, что влечет за собой увеличение t-статистик. Это может привести к признанию статистически значимыми объясняющие переменные, которые в действительности таковыми могут и не являться.
3. Оценка дисперсии регрессии является смещенной оценкой истинного значения σ2 , во многих случаях занижая его. 4. В силу вышесказанного выводы по t- и F-статистикам, определяющим значимость коэффициентов регрессий и коэффициента детерминации, возможно, будут неверными. Вследствие этого ухудшаются прогнозные качества модели.
Обнаружение автокорреляции • В силу неизвестности значений параметров уравнения регрессии неизвестными будут также и истинные значения отклонений εt. Поэтому выводы об их независимости осуществляются на основе оценок et, t = 1, 2, ..., Т, полученных из эмпирического уравнения регрессии.
Методы определения автокорреляции: • графический метод; • метод рядов; • критерий Дарбина—Уотсона;
Графический метод • Необходимо увязать отклонения et с моментами t их получения (их порядковыми номерами i). Для этой цели строятся так называемые последовательно-временные графики: по оси абсцисс обычно откладываются либо время (момент) получения статистических данных, либо порядковый номер наблюдения, а по оси ординат — отклонения εt(либо оценки отклонений et).
Вывод • На рис. а—г имеются определенные связи между отклонениями, т.е. автокорреляция имеет место. Отсутствие зависимости на рис. д скорее всего свидетельствует об отсутствии автокорреляции. • Например, на рис. 4, б отклонения вначале в основном отрицательные, затем положительные, потом снова отрицательные. Это свидетельствует о наличии между отклонениями определенной зависимости. Более того, можно утверждать, что в этом случае имеет место положительная автокорреляция остатков. Она становится весьма наглядной, если график на рис. б дополнить графиком зависимости etот et-1.
Зависимость etот et-1 для случая, приведенного на рис. б
Подавляющее большинство точек на этом графике расположено в I и IIIчетвертях декартовой системы координат, подтверждая положительную зависимость между соседними отклонениями.
Метод рядов • Необходимо последовательно определлитьзнаки отклонений et, t = 1, 2, ..., Т. Например, (– – – – –) (+ + + + + + +) (– – –) (+ + + +) (–), т.е. 5 «–», 7 «+», 3 «–», 4 «+», 1 «–» при 20 наблюдениях. • Ряд определяется – как непрерывная последовательность одинаковых знаков. Количество знаков в ряду называется длиной ряда.
Визуальное распределение знаков свидетельствует о неслучайном характере связей между отклонениями. Если рядов слишком мало по сравнению с количеством наблюдений n, то вполне вероятна положительная автокорреляция. Если же рядов слишком много, то вероятна отрицательная автокорреляция. • Для более детального анализа предлагается следующая процедура. Пусть • п — объем выборки; • п1— общее количество знаков «+» при п наблюдениях (количество положительных отклонений et); • п2— общее количество знаков «-» при п наблюдениях (количество отрицательных отклонений et); • k — количество рядов.
При достаточно большом количестве наблюдений (n1 > 10, п2> 10) и отсутствии автокорреляции СВ k имеет асимптотически нормальное распределение с Тогда, если M(k)– uα/2D(k) < k < M(k) + uα/2D(k), то гипотеза об отсутствии автокорреляции не отклоняется.
Для небольшого числа наблюдений (п1< 20, п2 < 20), были разработаны таблицы критических значений количества рядов при nнаблюдениях. Суть таблиц в следующем. • На пересечении строки n1и столбца n2определяются нижнее k1и верхнее k2значения при уровне значимости α = 0,05. • Если k1<k< k2,то говорят об отсутствии автокорреляции. • Если k ≤ k1, то говорят о положительной автокорреляции остатков. • Если k ≥ k2, то говорят об отрицательной автокорреляции остатков. • В нашем примере n= 20, n1 = 11, п2=9, k = 5. По таблицам определяем k1 = 6, k2= 16. Поскольку k = 5 < 6 = k1, то принимается предположение о наличии положительной автокорреляции при уровне значимости α = 0,05.
Критерий Дарбина—Уотсона • Метод определения автокорреляции на основе статистикиДарбина—Уотсона (DW) состоит в том, что на основе вычисленной статистики DW Дарбина—Уотсона делается вывод об автокорреляции.
Статистика Дарбина—Уотсона тесно связана с выборочным коэффициентом корреляции: • Таким образом, 0 ≤ DW ≤ 4, и ее значения могут указать на наличие либо отсутствие автокорреляции. Действительно, если≈0 (автокорреляция отсутствует), то DW ≈2. Если ≈ 1 (положительная автокорреляция), то DW ≈ 0. Если ≈ –1 (отрицательная автокорреляция), то DW ≈ 4.
Общая схема критерия Дарбина—Уотсона 1. По построенному эмпирическому уравнению регрессии yt =b0 +b1хt1+...+bтхtm определяются значения отклонений et= yt– для каждого наблюдения t, t = 1, 2, ..., Т. 2. Рассчитывается статистика DW.
3. По таблице критических точек Дарбина—Уотсона определяются два числа d1и duи осуществляют выводы по правилу: • 0 ≤ DW <d1— существует положительная автокорреляция, • d1≤DW < du— вывод о наличии автокорреляции не определен, • du ≤ DW ≤4 – du— автокорреляция отсутствует, • 4 – du < DW < 4 – d1— вывод о наличии автокорреляции не определен, • 4 – d1≤DW ≤ 4 — существует отрицательная автокорреляция.
При использовании критерия Дарбина—Уотсона необходимо учитывать следующие ограничения: 1. Критерий DW применяется лишь для тех моделей, которые содержат свободный член. 2. Предполагается, что случайные отклонения εtопределяются по итерационной схеме: εt =ρεt-1 + vt, называемой авторегрессионной схемой первого порядка АЕ(1).Здесь vt— случайный член. 3. Статистические данные должны иметь одинаковую периодичность (т.е. не должно быть пропусков в наблюдениях).,
4. Критерий Дарбина—Уотсона не применим для регрессионных моделей, содержащих в составе объясняющих переменных зависимую переменную с временным лагом в один период, т.е. для так называемых авторегрессионных моделей вида: yt =β0 + β 1хt1+...+ β тхtm+γ yt-1+ εt .
Для авторегрессионных моделей разработаны специальные тесты обнаружения автокорреляции, в частности h-статистика Дарбина, которая определяется по формуле где — оценка ρ авторегрессии первого порядка, D(g)— выборочная дисперсия коэффициента при лаговой переменной yt-1, n — число наблюдений.
При большом объеме выборки nи справедливости нулевой гипотезы Н0:ρ = 0 статистика h имеет стандартизированное нормальное распределение. Поэтому по заданному уровню значимости α определяется критическая точка uα/2 из условия Ф(uα/2)= (1- α)/2 и сравнивается h с uα/2. Если > uα/2, то нулевая гипотеза об отсутствии автокорреляции должна быть отклонена. В противном случае она не отклоняется. • Отметим, что обычно значение рассчитывается по формуле = 1- 0,5DW, a D(g)равна квадрату стандартной ошибкиоценки g коэффициента γ.Поэтому h легко вычисляется на основе данных оцененной регрессии. • Основная проблема при использовании этого теста заключается в невозможности вычисления h при nD(g) > 1.
Методы устранения автокорреляции • Используется авторегрессионное преобразование. • В линейной регрессионной модели наиболее целесообразным и простым преобразованием является авторегрессионная схема первого порядка AR(1).
Рассмотрим модель парной линейной регрессии Y = β0 + β1x+ ε. • Тогда наблюдениям t и (t -1) соответствуют : yt = β0 + β1 xt +et, yt-1 = β0 + β1xt-1 +et-1.
Пусть случайные отклонения подвержены воздействию авторегрессии первого порядка: εt=ρεt-1 + vt, где vt, t = 2, 3, ... , Т— случайные отклонения, удовлетворяющие всем предпосылкам МНК, а коэффициент ρ известен.
После преобразований получим: yt– ρyt-1 = β0(1–ρ)+ β1(xt–xt-1) +(εt– εt-1) Положив получим:
Так как по предположению коэффициент ρ известен, то очевидно, yt* , xt*, vtвычисляются достаточно просто. В силу того что случайные отклонения vtудовлетворяют предпосылкам МНК, оценки β0* и β1 будут обладать свойствами наилучших линейных несмещенных оценок.
Недостатки 1) На практике значение коэффициента ρ обычно неизвестно и его необходимо оценивать. 2) Данный способ вычисления уt*, хt* приводит к потере первого наблюдения (если мы не обладаем предшествующим ему наблюдением). Число степеней свободы уменьшится на единицу, что при больших выборках не так существенно, но при малых выборках может привести к потере эффективности.
Авторегрессионное преобразование может быть обобщено на произвольное число объясняющих переменных, т.е. использовано для уравнения множественной регрессии. • Авторегрессионное преобразование первого порядка AR(1) может быть обобщено на преобразования более высоких порядков AR(2), AR(3) и т.д.
Определение ρ на основе статистики Дарбина—Уотсона • Статистика Дарбина—Уотсона тесно связана с коэффициентом корреляции между соседними отклонениями через соотношение (2):
В качестве оценки коэффициента ρ может быть взят коэффициент r = ret,e(t-1) • Этот метод оценивания весьма неплох при большом числе наблюдений. В этом случае оценка r параметра ρ будет достаточно точной.
Метод Кохрана—Оркатта 1. Оценивается по МНК линейная регрессия и для нее определяются оценки etотклонений εt, t = 1, 2, ..., Т. 2. С использованием авторегрессионной схемы первого порядка оценивается регрессионная зависимость et=ρ1et-1 + vt, • где ρ1 — оценка коэффициента ρ.
3. На основе данной оценки строится уравнение: yt– ρ1yt-1 = α (1–ρ1)+ β(xt–ρ1xt-1) +(εt–ρ1εt-1) с помощью которого оцениваются коэффициенты α и β (в этом случае значение ρ1 известно). 4. Значения β0 = α (1 – ρ1) и β1 = β подставляются в уравнение регрессии. Вновь вычисляются оценки etотклонений и процесс возвращается к этапу 2.
Чередование этапов осуществляется до тех пор, пока не будет достигнута требуемая точность, т.е. пока разность между предыдущей и последующей оценками ρ не станет меньше любого наперед заданного числа.
Метод Хилдрета—Лу По данному методу регрессия yt – ρyt-1 = β0 (1–ρ)+ β1 (xt – xt-1) +(εt –ε t-1) оценивается для каждого возможного значения ρ из отрезка [-1, 1] с любым шагом (например, 0,001; 0,01 и т.д.). Величина ρ1, дающая наименьшую стандартную ошибку регрессии, принимается в качестве оценки коэффициента ρ. И значения β0 и β1 оцениваются из уравнения регрессии именно с данным значением ρ1. Этот итерационный метод широко используется в пакетах прикладных программ.
Метод первых разностей Вслучае, когда есть основание считать, что автокорреляция отклонений очень велика, можно использовать метод первых разностей. Для временных рядов характерна положительная автокорреляция остатков. Поэтому при высокой автокорреляции полагают р = 1, и, следовательно, уравнение принимает вид yt – yt-1 = β1 (xt – xt-1) +(εt –ε t-1) или yt – yt-1 = β1 (xt – xt-1) +vt
Обозначив Δyt = yt– yt-1, Δxt = xt – xt-1, получим Δyt = β1 Δxt + vt. Изэтого уравнения по МНКоценивается коэффициент β1. Заметим, что коэффициент β0 в данном случае не определяется непосредственно. Однако из МНК известно, что β0 = у – β1x. В случае ρ = –1, можно получить следующее уравнение регрессии: yt +yt-1 =2 β0 + β1(xt–xt-1) +vt или 0,5(yt +yt-1) =β0 + 0,5β1(xt– xt-1) +vt
Однако метод первых разностей предполагает слишком сильное упрощение (ρ = ±1). Поэтому более предпочтительными являются приведенные выше итерационные методы.
Вывод • В силу ряда причин (ошибок спецификации, инерционности рассматриваемых зависимостей и др.) в регрессионных моделях может иметь место корреляционная зависимость между соседними случайными отклонениями. Это нарушает одну из фундаментальных предпосылок МНК. Вследствие этого оценки, полученные на основе МНК, перестают быть эффективными.
Это делает ненадежными выводы по значимости коэффициентов регрессии и по качеству самого уравнения. • Поэтому достаточно важным является умение определить наличие автокорреляции и устранить это нежелательное явление. Существует несколько методов определения автокорреляции, среди которых были выделены графический, метод рядов, критерий Дарбина—Уотсона.