1 / 88

Автокорреляция

Автокорреляция. Автокорреляция (последовательная корреляция) опреде­ляется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные данные).

Download Presentation

Автокорреляция

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Автокорреляция

  2. Автокорреляция (последовательная корреляция) опреде­ляется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные данные). Положительная автокорреляция вызывается направленным постоянным воздействием некоторых неучтенных в модели факторов.

  3. Пример автокорреляции

  4. Отрицательная автокорреляция фактически означает, что за положительным отклонением следует отрицательное и на­оборот

  5. Основные причины, вызывающие появление автокор­реляции: - ошибки спецификации; - инерцию в изменении экономических показателей; - эффект паутины; - сгла­живание данных.

  6. Ошибки спецификации • Неучет в модели какой-либо важ­ной объясняющей переменной либо неправильный выбор фор­мы зависимости обычно приводит к системным отклонениям точек наблюдений от линии регрессии, что может обусловить автокорреляцию. Пример Анализируется зависимость предельных издержек МС от объема выпуска Q. • Если для ее описания вместо реальной квадратичной модели МС = β0 + β1Q + β2Q2 + ε выбрать линейную модель МС=β0+β1Q+ε, то совершается ошибка спецификации.

  7. Инерция • Многие экономические показатели (например, ин­фляция, безработица, ВНП и т. п.) обладают определенной цик­личностью, связанной с волнообразностью деловой активности. Действительно, экономический подъем приводит к росту занято­сти, сокращению инфляции, увеличению ВНП и т.д. Этот рост продолжается до тех пор, пока изменение конъюнктуры рынка ряда экономических характеристик не приведет к замедлению роста, затем остановке и движению вспять рассматриваемых показателей. В любом случае эта трансформация происходит не мгновенно, а обладает определенной инертностью.

  8. Эффект паутины • Во многих производственных и других сферах экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом). Например, предложение сельскохозяйственной продукции реагирует на изменение цены с запаздыванием (равным периоду созревания урожая). Большая цена сельскохозяйственной продукции в прошедшем году вызовет (скорее всего) ее перепроизводство в текущем году, а, следовательно, цена на нее может снизится и т.д.

  9. Сглаживание данных • Зачастую данные по некоторому про­должительному временному периоду получают усреднением данных по составляющим его подынтервалам. Это может при­вести к определенному сглаживанию колебаний, которые име­лись внутри рассматриваемого периода, что в свою очередь мо­жет послужить причиной автокорреляции.

  10. Последствия автокорреляции 1. Оценки параметров, оставаясь линейными и несмещен­ными, перестают быть эффективными. Следовательно, они пе­рестают обладать свойствами наилучших линейных несмещен­ных оценок. 2. Дисперсии оценок являются смещенными. Часто дис­персии, вычисляемые по стандартным формулам, являются заниженными, что влечет за собой увеличение t-статистик. Это может привести к признанию статистически значимыми объяс­няющие переменные, которые в действительности таковыми могут и не являться.

  11. 3. Оценка дисперсии регрессии является смещенной оценкой истинного значения σ2 , во многих случаях занижая его. 4. В силу вышесказанного выводы по t- и F-статистикам, определяющим значимость коэффициентов регрессий и коэффициента детерминации, возможно, будут неверными. Вследст­вие этого ухудшаются прогнозные качества модели.

  12. Обнаружение автокорреляции • В силу неизвестности значений параметров уравнения рег­рессии неизвестными будут также и истинные значения откло­нений εt. Поэтому выводы об их независимости осуществляются на основе оценок et, t = 1, 2, ..., Т, полученных из эмпирического уравнения регрессии.

  13. Методы определения автокорреляции: • графический метод; • метод рядов; • критерий Дарбина—Уотсона;

  14. Графический метод • Необходимо увязать отклонения et с моментами t их получения (их порядковыми номерами i). Для этой цели строятся так называемые последовательно-вре­менные графики: по оси абсцисс обычно отклады­ваются либо время (момент) получения статистических дан­ных, либо порядковый номер наблюдения, а по оси ординат — отклонения εt(либо оценки отклонений et).

  15. Пример применения графического метода

  16. Вывод • На рис. а—г имеются определенные связи между отклонениями, т.е. автокорреляция имеет место. Отсутствие зависимости на рис. д скорее всего свидетельствует об отсутствии автокорреляции. • Например, на рис. 4, б отклонения вначале в основном отрицательные, затем положительные, потом снова отрицательные. Это свидетельствует о наличии между отклонениями определенной зависимости. Более того, можно утверждать, что в этом случае имеет место положительная автокорреляция остатков. Она становится весьма наглядной, если график на рис. б дополнить графиком зависимости etот et-1.

  17. Зависимость etот et-1 для случая, приведенного на рис. б

  18. Подавляющее большинство точек на этом графике распо­ложено в I и IIIчетвертях декартовой системы координат, подтверждая положительную зависимость между соседними отклонениями.

  19. Метод рядов • Необходимо последовательно определлитьзнаки отклонений et, t = 1, 2, ..., Т. Например, (– – – – –) (+ + + + + + +) (– – –) (+ + + +) (–), т.е. 5 «–», 7 «+», 3 «–», 4 «+», 1 «–» при 20 наблюдениях. • Ряд определяется – как непрерывная последовательность оди­наковых знаков. Количество знаков в ряду называется длиной ряда.

  20. Визуальное распределение знаков свидетельствует о неслу­чайном характере связей между отклонениями. Если рядов слишком мало по сравнению с количеством наблюдений n, то вполне вероятна положительная автокорреляция. Если же ря­дов слишком много, то вероятна отрицательная автокорреля­ция. • Для более детального анализа предлагается следующая процедура. Пусть • п — объем выборки; • п1— общее количество знаков «+» при п наблюдениях (ко­личество положительных отклонений et); • п2— общее количество знаков «-» при п наблюдениях (ко­личество отрицательных отклонений et); • k — количество рядов.

  21. При достаточно большом количестве наблюдений (n1 > 10, п2> 10) и отсутствии автокорреляции СВ k имеет асимптотиче­ски нормальное распределение с Тогда, если M(k)– uα/2D(k) < k < M(k) + uα/2D(k), то гипоте­за об отсутствии автокорреляции не отклоняется.

  22. Для небольшого числа наблюдений (п1< 20, п2 < 20), были разработаны таблицы критических значений количе­ства рядов при nнаблюдениях. Суть таблиц в следующем. • На пересечении строки n1и столбца n2определяются ниж­нее k1и верхнее k2значения при уровне значимости α = 0,05. • Если k1<k< k2,то говорят об отсутствии автокорреляции. • Если k ≤ k1, то говорят о положительной автокорреляции остатков. • Если k ≥ k2, то говорят об отрицательной автокорреляции остатков. • В нашем примере n= 20, n1 = 11, п2=9, k = 5. По таблицам определяем k1 = 6, k2= 16. Поскольку k = 5 < 6 = k1, то принимается предположение о наличии положительной ав­токорреляции при уровне значимости α = 0,05.

  23. Критерий Дарбина—Уотсона • Метод оп­ределения автокорреляции на основе статистикиДарбина—Уотсона (DW) состоит в том, что на осно­ве вычисленной статистики DW Дарбина—Уотсона делается вы­вод об автокорреляции.

  24. Статистика Дарбина—Уотсона тес­но связана с выборочным коэффициентом корреляции: • Таким образом, 0 ≤ DW ≤ 4, и ее значения могут указать на наличие либо отсутствие автокорреляции. Действительно, если≈0 (автокорреляция отсутствует), то DW ≈2. Если ≈ 1 (положительная автокорреляция), то DW ≈ 0. Если ≈ –1 (отрицательная автокорреляция), то DW ≈ 4.

  25. Общая схема критерия Дарбина—Уотсона 1. По построенному эмпирическому уравнению регрессии yt =b0 +b1хt1+...+bтхtm определяются значения отклонений et= yt– для каждого наблюдения t, t = 1, 2, ..., Т. 2. Рассчитывается статистика DW.

  26. 3. По таблице критических точек Дарбина—Уотсона опреде­ляются два числа d1и duи осуществляют выводы по правилу: • 0 ≤ DW <d1— существует положительная автокорреляция, • d1≤DW < du— вывод о наличии автокорреляции не определен, • du ≤ DW ≤4 – du— автокорреляция отсутствует, • 4 – du < DW < 4 – d1— вывод о наличии автокорреляции не определен, • 4 – d1≤DW ≤ 4 — существует отрицательная автокорре­ляция.

  27. При использовании критерия Дарбина—Уотсона необходимо учитывать следующие ограничения: 1. Критерий DW применяется лишь для тех моделей, кото­рые содержат свободный член. 2. Предполагается, что случайные отклонения εtопреде­ляются по итерационной схеме: εt =ρεt-1 + vt, называемой авто­регрессионной схемой первого порядка АЕ(1).Здесь vt— слу­чайный член. 3. Статистические данные должны иметь одинаковую пе­риодичность (т.е. не должно быть пропусков в наблюдениях).,

  28. 4. Критерий Дарбина—Уотсона не применим для регресси­онных моделей, содержащих в составе объясняющих перемен­ных зависимую переменную с временным лагом в один период, т.е. для так называемых авторегрессионных моделей вида: yt =β0 + β 1хt1+...+ β тхtm+γ yt-1+ εt .

  29. Для авторегрессионных моделей разработаны специальные тесты обнаружения автокорреляции, в частности h-статистика Дарбина, которая определяется по формуле где — оценка ρ авторегрессии первого порядка, D(g)— выборочная дисперсия коэффициента при лаговой переменной yt-1, n — число наблюдений.

  30. При большом объеме выборки nи справедливости нулевой гипотезы Н0:ρ = 0 статистика h имеет стандартизированное нормальное распределение. Поэтому по заданному уровню значимости α определяется критическая точка uα/2 из условия Ф(uα/2)= (1- α)/2 и сравнивается h с uα/2. Если > uα/2, то нулевая гипотеза об отсутствии автокорреляции должна быть отклонена. В противном случае она не отклоняется. • Отметим, что обычно значение рассчитывается по форму­ле = 1- 0,5DW, a D(g)равна квадрату стандартной ошибкиоценки g коэффициента γ.Поэтому h легко вычисляется на основе данных оцененной регрессии. • Основная проблема при использовании этого теста заклю­чается в невозможности вычисления h при nD(g) > 1.

  31. Методы устранения автокорреляции • Используется авторегрессионное преобразование. • В линейной регрессионной модели наиболее целесообразным и простым преобразованием является авторегрессионная схема первого порядка AR(1).

  32. Рассмотрим модель парной линейной регрессии Y = β0 + β1x+ ε. • Тогда наблюдениям t и (t -1) соответствуют : yt = β0 + β1 xt +et, yt-1 = β0 + β1xt-1 +et-1.

  33. Пусть случайные отклонения подвержены воздействию авторегрессии первого порядка: εt=ρεt-1 + vt, где vt, t = 2, 3, ... , Т— случайные отклонения, удовлетворяющие всем предпосылкам МНК, а коэффициент ρ известен.

  34. После преобразований получим: yt– ρyt-1 = β0(1–ρ)+ β1(xt–xt-1) +(εt– εt-1) Положив получим:

  35. Так как по предположению коэффициент ρ известен, то очевидно, yt* , xt*, vtвычисляются достаточно просто. В силу того что случайные отклонения vtудовлетворяют предпосылкам МНК, оценки β0* и β1 будут обладать свойствами наилучших линейных несмещенных оценок.

  36. Недостатки 1) На практике значение коэффициента ρ обычно неизвестно и его необходимо оценивать. 2) Данный способ вычисления уt*, хt* приводит к потере первого наблюдения (если мы не обладаем предшествующим ему наблюдением). Число степеней свободы уменьшится на единицу, что при больших выборках не так существенно, но при малых выборках может привести к потере эффективности.

  37. Поправка Прайса-Винстена

  38. Авторегрессионное преобразование может быть обобщено на произвольное число объясняющих переменных, т.е. использовано для уравнения множественной регрессии. • Авторегрессионное преобразование первого порядка AR(1) может быть обобщено на преобразования более высоких поряд­ков AR(2), AR(3) и т.д.

  39. Определение ρ на основе статистики Дарбина—Уотсона • Статистика Дарбина—Уотсона тесно связана с коэффициентом корреляции между соседними отклонениями через соотношение (2):

  40. В качестве оценки коэффициента ρ может быть взят коэффициент r = ret,e(t-1) • Этот метод оценивания весьма неплох при большом числе наблюдений. В этом случае оценка r параметра ρ будет достаточно точной.

  41. Метод Кохрана—Оркатта 1. Оценивается по МНК линейная регрессия и для нее определяются оценки etотклонений εt, t = 1, 2, ..., Т. 2. С использованием авторегрессионной схемы первого порядка оценивается регрессионная зависимость et=ρ1et-1 + vt, • где ρ1 — оценка коэффициента ρ.

  42. 3. На основе данной оценки строится уравнение: yt– ρ1yt-1 = α (1–ρ1)+ β(xt–ρ1xt-1) +(εt–ρ1εt-1) с помощью которого оцениваются коэффициенты α и β (в этом случае значение ρ1 известно). 4. Значения β0 = α (1 – ρ1) и β1 = β подставляются в уравнение регрессии. Вновь вычисляются оценки etотклонений и процесс возвращается к этапу 2.

  43. Чередование этапов осуществляется до тех пор, пока не будет достигнута требуемая точность, т.е. пока разность между предыдущей и последующей оценками ρ не станет меньше любого наперед заданного числа.

  44. Метод Хилдрета—Лу По данному методу регрессия yt – ρyt-1 = β0 (1–ρ)+ β1 (xt – xt-1) +(εt –ε t-1) оценивается для каждого возможного значения ρ из отрезка [-1, 1] с любым шагом (например, 0,001; 0,01 и т.д.). Величина ρ1, дающая наименьшую стандартную ошибку регрессии, принимается в качестве оценки коэффициента ρ. И значения β0 и β1 оцениваются из уравнения регрессии именно с данным значением ρ1. Этот итерационный метод широко используется в пакетах прикладных программ.

  45. Метод первых разностей Вслучае, когда есть основание считать, что автокорреляция отклонений очень велика, можно использовать метод первых разностей. Для временных рядов характерна положительная автокорреляция остатков. Поэтому при высокой автокорреляции полагают р = 1, и, следовательно, уравнение принимает вид yt – yt-1 = β1 (xt – xt-1) +(εt –ε t-1) или yt – yt-1 = β1 (xt – xt-1) +vt

  46. Обозначив Δyt = yt– yt-1, Δxt = xt – xt-1, получим Δyt = β1 Δxt + vt. Изэтого уравнения по МНКоценивается коэффициент β1. Заметим, что коэффициент β0 в данном случае не определяется непосредственно. Однако из МНК известно, что β0 = у – β1x. В случае ρ = –1, можно получить следующее уравнение регрессии: yt +yt-1 =2 β0 + β1(xt–xt-1) +vt или 0,5(yt +yt-1) =β0 + 0,5β1(xt– xt-1) +vt

  47. Однако метод первых разностей предполагает слишком сильное упрощение (ρ = ±1). Поэтому более предпочтительными являются приведенные выше итерационные методы.

  48. Вывод • В силу ряда причин (ошибок спецификации, инерционности рассматриваемых зависимостей и др.) в регрессионных моделях может иметь место корреляционная зависимость между соседними случайными отклонениями. Это нарушает одну из фундаментальных предпосылок МНК. Вследствие этого оценки, полученные на основе МНК, перестают быть эффективными.

  49. Это делает ненадежными выводы по зна­чимости коэффициентов регрессии и по качеству самого уравнения. • Поэтому достаточно важным является умение определить наличие автокорреляции и устранить это нежелательное явление. Существует несколько методов определения автокор­реляции, среди которых были выделены графический, метод рядов, критерий Дарбина—Уотсона.

More Related