330 likes | 497 Views
Информационно осигуряване на иконометричния анализ. Типове данни. 3 типа данни Времеви редове Крос-секшън данни Панелни данни Въвеждане Чрез импорт от ексел В самата система Или текстови формат (аски код) (ASCII). Времеви редове.
E N D
Информационно осигуряване на иконометричния анализ
Типове данни • 3 типа данни • Времеви редове • Крос-секшън данни • Панелни данни • Въвеждане • Чрез импорт от ексел • В самата система • Или текстови формат (аски код)(ASCII)
Времеви редове • Определение – : Стойностите, които даден показател приема в различни моменти на даден период от време, като тези моменти могат да бъдат през равни, или различни времеви интервали се нарича времеви ред • Пример: • През равни интервали от време • През различни интервали от време
Времеви редове … • Характеристики: • Брой елементи– въз основа на него и броя на факторите за анализ се определят степените на свобода [пример: от първата таблица = 18] • Средно на реда • Вероятностно разпределение • Вариация • Стандартно отклонение Степени на свобода се определят като разлика от броя на елементите и брояна факторите използвани в анализа, увеличени с 1; те всъщност показватброя на свободните елементи, които подобряват качеството на оценките
Времеви редове … • Видове: количествени и качествени показатели • Качествени показатели: елементите приемат 2 или повече, но ограничен брой стойности • Примери • Трудово правоотношение (зает, безработен; трудов договор, служебен договор) • Образование (основно, средно, професионален бакалавър ...)
Времеви редове … • Изразяване на качествените променливи • С двоични променливи (наличието на даденото качество 1, отсъствието му – 0) • Пример: трудов статус (зает/безработен)
Времеви редове … • Изразяване на качествените променливи • При повече от две състояния - с 1 или повече променливи • Пример: образование (основно (1); средно (2); професионален бакалавър (3); бакалавър (4); магистър (5)) • С повече от една променлива: основно образование(0/1); средно (0/1); професионален бакалавър (0/1); бакалавър (0/1); магистър (0/1))
Включване на качествените променливи в модели • Модели само с качествени променливи (модели на анализ на вариациите или ANOVA модели ) • Задават се по същия начин както и моделите с количествени променливи
Включване на качествените променливи в модели • Пример: Да се определи работна заплата на новоназначен служител със средно образование, при налична информация за образованието и работната заплата на останалите служители (със средно образование, бакалавър и магистър и друго образование)
Включване на качествените променливи в модели • Данни за примера
Включване на качествените променливи в модели • Х1 – средно образование • Х2 – бакалавър • Х3 – магистър • Модел: Yi = a0 +a1X1i+a2x2i +a3x3i+ u
Включване на качествените променливи в модели • Графично изображение: а3 .... с образование магистър ..... образование бакалавър …. с образование бакалавър ..... средно образование а2 С колко средната заплана на хората със средно образование се различава оттази на хората с други образование (показано е нагоре, но дали е или зависи) а1 а0 Средна заплата на служител без образование или с др.
Включване на качествените променливи в модели • Интерпретация на резултатите • а0 – средна заплата на работещите с друго образование • а1 – с колко заплатата на работещите със средно образование е по-голяма от заплатата на работещите с друго образование • а2 - с колко заплатата на работещите с образование бакалавър е по-голяма от заплатата на работещите със средно образование • И т.н. * Качествените променливи се включват в моделите по същия начин като количественитемодели, които ползват само качествен показател се наричат модели за анализ на вариациитеили ANOVA
Приложение на ANOVA моделите • Маркетинговите и социологическите модели (наличие на качествени и субективни показатели) • По - рядко в икономическите изследвания
Модели с качествени и количествени показатели • Наричат се модели за анализ на ковариациите или ANCOVA модели • В горния пример да се отрази и влиянието на трудовия стаж • Модел: Yi = a0 +a1X1i+a2x2i +a3x3i +a4x4i + u Х4 – трудов стаж (в години)
ANCOVA модели • Графично изображение: a2 a1 a4 a0 * Отстъпките на всяко едно от тези стъпълца се определя от параметъра накачествените променливи* А наклона – от количествените променливи включени в модела
ANCOVA модели • Интерпретация на резултатите • а0 – средна заплата на работещите с друго образование • а1 – с колко заплатата на работещите със средно образование е по-голяма от заплатата на работещите с друго образование • И т.н. • А4 – с колко се променя заплатата на всеки с увеличаване на трудовия стаж
Дъми променливи • По същество – качествени променливи • Специфични двоични променливи, които приемат стойност 1 при точно определени условия и стойност 0 във всички останали случаи. • Бележат се с “D”. • Използват се в следните два основни случая: • за отчитане на сезонни колебания; • за изключване на определени периоди с анормални изменения на средата. (dummy) - тези периоди по отношение на данните се наричат структурно прекъсване на данните
Сезонни дъми променливи • Броят им зависи от периодичността на данните, с които се работи • При тримесечни данни – 4 дъми променливи • При месечни данни – 12 дъми променливи • При работа с месечни данни – дълъг ред от наблюдения – броя на независимите променливи се увеличава с 12
Сезонни дъми променливи • Тримесечни дъми променливи • Използват се – при силни сезонни колебания • При слаби колебания – изглаждане на данните • Включват се в модела по стандартния начин
Добавен slide от Боби • “Използват се – при силни сезонни колебания” - тогава е оправдано използването на модела • “При слаби колебания – изглаждане на данните” – позволяват да се подобри качеството на оценката като по определени методи се обработват първични данни, за да се поизчистят сезонните колебания; най-често използвания метод за изглаждане е мотода на местещите се средни (ММС) • ММС = средните, които се получават за всеки един от елементите на основа на елементите пред или след него като се използва симетричен интервал; ако използваме период от 3 елемента, то новия ред няма да има 1 елемент, 2-рия елемент ще се получи като разлика или частно на 2-рия елемент на предишния ред и средно аритметичното на тези 3 елемента [по този начин самото средно се мести; 2-((1+2+3)/3)]; от вида на модела, т.е. от начина по който съответната променлива ще бъде включена в модела зависи дали ще е “разлика” или “частно”
Сезонни дъми променливи • Интерпретация на коефициента пред тях • Изменението на зависимата променлива от периода – пример: потреблението на свинско месо през декември
За изключване на определени периоди при оценката • Използват се - когато в периода, който анализираме е настъпило някакво събитие в резултат, на което стойностите на показателя рязко са се променили (стачка, криза, война, ...)съществен момент е за колко време след приключване на случайното събитие се усеща неговото влияние • За тези периоди – структурно прекъсване на данните • Имат стойност 1 само за критичния период и 0 за всички останали
За изключване на определени периоди при оценката • Включват се в модела по стандартния начин • Интерпретация на коефициента пред тях– обират ефекта на конкретното събитие
Проблеми при работа с времеви редове • Основен проблем – серийната автокорелация на грешкатаКазваме, че в 1 ред има серийна автокорелация тогава, когато текущата стойност на показателя зависи от една или няколко негови предходни стойности; това означава, че примерно състоянието на БВП тази година зависи в някаква степен от състоянието му през миналата или предходните няколко години; серийната автокорелация произтича от самата логика/инерция на икономическите процеси • При определени случаи – проблем с постоянната условна вариация на грешкатаВариацията в реда на грешката изчислена на база първи 3/4/5... елемента трябва да бъде една и съща!
Крос-секшън данни • Данни за един или повече показатели събрани по два или повече критерия в даден момент от времето • Примери – данните при анкета; преброяване на населението и т.н. • Използват се • Когато няма регулярно събирани данни за анализирания проблем – разработват се анкети
Крос-секшън данни • Използват се – маркетингови и социологически проучвания • Икономически анализи – на фирмено или национално ниво при отсъствие на информация • Проблеми: с постоянната условна вариация на грешката • Серийната автокорелация на грешката
Панелни данни • Комбинация от крос-секшън данни (данни по 2 показателя) и времеви редове (по единият от тях) • Използват се: • Анализ на пазара (регионални различия или интегриран) • Анализ на безработицата • Чисто изкуствено – за увеличаване на броя на наблюденията
Панелни данни • Позволяват да се анализират 4 случая • За всички панели – процесът започва от общо начално положение и се развива с еднаква скорост (оценените параметри за отделните панели са еднакви) • Процесът започва от общо начално положение, но не се развива с еднаква скорост, еднакъв темп и/или посока (еднакъв свободен член и различни коефициенти пред променливите)
Панелни данни • Процесът започва от различно начално положение, но се развива с еднаква скорост (различен свободен член и еднакви коефициенти пред променливите) • Процесът започва от различно начално положение и не се развива с еднаква скорост (различен свободен член и различни коефициенти пред променливите)
Панелни данни • Проблеми • Серийна автокорелация на грешката • Постоянна условна вариация на грешката