260 likes | 659 Views
Applied Econometrics Second edition. Dimitrios Asteriou and Stephen G. Hall. Πολυσυγγραμμικότητα. 1. Τέλεια πολυσυγγραμμικότητα 2. Συνέπειες τέλειας πολυσυγγραμμικότητας 3. Ατελής πολυσυγγραμμικότητα . 4. Συνέπειες ατελούς πολυσυγγραμμικότητας 5 . Διάγνωση πολυσυγγραμμικότητας
E N D
Applied EconometricsSecond edition Dimitrios Asteriou and Stephen G. Hall
Πολυσυγγραμμικότητα 1. Τέλεια πολυσυγγραμμικότητα 2. Συνέπειες τέλειας πολυσυγγραμμικότητας 3. Ατελής πολυσυγγραμμικότητα. 4. Συνέπειες ατελούς πολυσυγγραμμικότητας 5. Διάγνωση πολυσυγγραμμικότητας 6. Επίλυση/αντιμετώπιση πολυσυγγραμμικότητας
Στόχοι μαθήματος 1. Αναγνώριση του προβλήματος της πολυσυγγραμμικότητας στοCLRM. 2. Διάκριση μεταξύ τέλειας και ατελούς πολυσυγγραμμικότητας. 3. Κατανόηση και εκτίμηση των συνεπειών της τέλειας και ατελούς πολυσυγγραμικότητας στις εκτιμήσεις OLS. 4. Διάγνωση προβληματικής πολυσυγγραμμικότητας με τη χρήση οικονομετρικού λογισμικού. 5. Εύρεση τρόπων επίλυσης της προβληματικής πολυσυγγραμμικότητας.
Πολυσυγγραμμικότητα Η υπόθεση νο.8 τουCLRM απαιτεί ότι δεν υπάρχουν ακριβείς γραμμικές σχέσεις μεταξύτων τιμών των ερμηνευτικών μεταβλητών στο δείγμα (τα X). Άρα, όταν οι ερμηνευτικές μεταβλητές είναι υψηλά συσχετιζόμενες η μία με την άλλη (συντελεστής συσχέτισης πολύ κοντα στο1 ήστο -1) τότε υπάρχει το πρόβλημα της πολυσυγγραμμικότητας.
Τέλεια πολυσυγγραμμικότητα • Όταν υπάρχει τέλεια γραμμική σχέση. • Υποθέστε ότι έχουμε το ακόλουθο μοντέλο: Y=β1+β2X2+ β3X3+e Όπου οι τιμές του δείγματος για ταX2καιX3είναι:
Τέλεια πολυσυγγραμμικότητα • Παρατηρούμε ότι X3=2X2 • Έτσι, παρότι φαίνεται να υπάρχουν δύο ερμηνευτικές μεταβλητές, στην πραγματικότητα υπάρχει μία. • Κι αυτό γιατί η X2είναι μια ακριβής γραμμική συνάρτηση τηςX3ή γιατί οι X2 και X3είναι τέλεια συγγραμμικές.
Τέλεια πολυσυγγραμμικότητα Όταν συμβαίνει αυτό, τότε η εξίσωση: δ1X1+δ2X2=0 μπορεί να ικανοποιηθεί για μη-μηδενικές τιμές τωνδ1και δ2. Στο παράδειγμά μας έχουμε ότι: (-2)X1+(1)X2=0 Άρα δ1=-2καιδ2=1.
Τέλεια πολυσυγγραμμικότητα Προφανώς, εάν η μόνη λύση είναι: δ1=δ2=0 (συνήθως ονομάζεται τετριμμένη λύση) τότε οι δύο μεταβλητές είναι γραμμικά ανεξάρτητες και δεν υπάρχει προβληματική πολυσυγγραμμικότητα.
Τέλεια πολυσυγγραμμικότητα Στην περίπτωση περισσότερων από δυο ερμηνευτικών μεταβλητών, τότε τότε η μία μεταβλητή μπορεί να εκφραστεί ως μια ακριβής γραμμική συνάρτηση μιας άλλης ή περισσότερων ή ακόμα και όλων των άλλων μεταβλητών. Τότε, εάν έχουμε5 ερμηνευτικές μεταβλητές, έχουμε: δ1X1+δ2X2 +δ3X3+δ4X4 +δ5X5=0 Για καλύτερη κατανόηση, μια εφαρμογή είναι η παγίδα των ψευδομεταβλητών (εξήγηση στον πίνακα).
Συνέπειες της τέλειας πολυσυγγραμμικότητας • Με τέλεια πολυσυγγραμμικότητα, οι εκτιμητέςOLS απλώς δεν υπάρχουν. (απόδειξη στον πίνακα) • Εάν προσπαθήσετε να εκτιμήσετε μια εξίσωση στοEviewsκαι οι προδιαγραφές τις εξίσωσης χαρακτηρίζονται από τέλεια πολυσυγγραμμικότητα, τοEviewsδεν θα δώσει αποτελέσματα, αλλά θα δώσει ένα μήνυμα σφάλματος, με το οποίο επισημαίνει την πολυσυγγραμμικότητα.
Ατελής πολυσυγγραμμικότητα • Η ατελής πολυσυγγραμμικότητα (ή σχεδόνπολυσυγγραμμικότητα) υπάρχει όταν οι ερμηνευτικές μεταβλητές σε μια εξίσωσησυσχετίζονται, αλλά αυτή η συσχέτιση είναι λιγότερο από τέλεια. • Αυτό εκφράζεται ως εξής: X3=X2+v Όπου vμια τυχαία μεταβλητή, η οποία μπορεί να παρατηρηθεί ως ένα «λάθος» στην ακριβή γραμμική σχέση.
Συνέπειες της ατελούς πολυσυγγραμμικότητας • Στις περιπτώσεις της ατελούς πολυσυγγραμμικότητας, οι εκτιμητέςOLS μπορούν να ληφθούν και να είναι επίσηςBLUE. • Όμως, παρότι οι γραμμικοί αμερόληπτοι εκτιμητές με την ιδιότητα της ελάχιστης διακύμανσης να ισχύει, οι διακυμάνσεις OLS είναι συχνά μεγαλύτερες από αυτές που λαμβάνονταιυπό την απουσία πολυσυγγραμμικότητας.
Συνέπειες της ατελούς πολυσυγγραμμικότητας Για την εξήγηση, θεωρείστε την εξίσωση που δίνει την διακύμανση της μερικής κλίσης της μεταβλητήςXj: Όπου r2είναι το τετράγωνο του συντελεστή συσχέτισης του δείγματος μεταξύX2και X3.
Συνέπειες της ατελούςπολυσυγγραμμικότητας Επεκτείνοντας σε περισσότερες από δύο ερμηνευτικές μεταβλητές, έχουμε: Και συνεπώς, ονομάζεται συντελεστής πληθωρισμού διακύμανσης (VIF)
Ο Συντελεστής Πληθωρισμού Διακύμανσης • Οι τιμές του VIF που ξεπερνούν το10 θεωρούνται γενικά απόδειξη της ύπαρξης προβληματικής πολυσυγγραμμικότητας. • Αυτό συμβαίνει γιαR2j >0.9 • Τόσο μεγάλα τυπικά σφάλματα θα οδηγούν σε μεγάλε διαστήματα εμπιστοσύνης. • Επίσης, μπορεί να έχουμε t-στατιστικά τα οποία να είναι εντελώς λανθασμένα.
Συνέπειες της ατελούς πολυσυγγραμμικότητας Συνοψίζοντας, όταν υπάρχει ατελής πολυσυγγραμμικότητα, έχουμε: • Οι εκτιμήσεις τηςOLS μπορεί να είναι ανακριβής εξαιτίας των μεγάλων τυπικών σφαλμάτων. • Οι επηρεασμένη συντελεστές μπορεί να αποτύχουν στην επίτευξη στατιστικής σημαντικότητας λόγω των χαμηλών t-στατιστικών. • Μπορεί να υπάρχει εναλλαγή προσήμου. • Πρόσθεση ή αφαίρεση λίγων παρατηρήσεων μπορεί να οδηγήσει σε ουσιαστικές αλλαγές στους εκτιμημένουςσυντελεστές.
Διάγνωση Πολυσυγγραμμικότητας • Ο ευκολότερος τρόπος μέτρησης το μέγεθος της πολυσυγγραμμικότητας είναι απλώς να δούμε των πίνακα των συσχετίσεωνμεταξύ των ανεξάρτητων μεταβλητών. • Στην περίπτωση των περισσότερων από δύο ερμηνευτικών μεταβλητών, θα πρέπει να «τρέξουμε» βοηθητικές παλινδρομήσεις. Εάν υπάρχει σχεδόν γραμμική εξάρτηση, η βοηθητική παλινδρόμηση θα αναπαριστά μια μικρή εξίσωση τυπικού σφάλματος, έναμεγάλο R2και ένα στατιστικά σημαντικόF-value.
Επίλυση Πολυσυγγραμμικότητας • Προσεγγίσεις, όπως η παλινδρόμηση κορυφογραμμής ή η μέθοδος των κύριων συνιστωσών. Αλλά δημιουργούν περισσότερο προβλήματα απ’ αυτά που επιλύουν. • Μερικοί οικονομέτρες αμφισβητούν ότι εάν το μοντέλο είναι όπως πρέπει, απλά την αγνοούμε. Σημειώστε ότι πάντα θα έχετε ένα βαθμό πολυσυγγραμμικότητας, ειδικά σε δεδομένα χρονολογικών σειρών.
Επίλυση Πολυσυγγραμμικότητας • Ο ευκολότερος τρόπος «θεραπείας» αυτών των προβλημάτων είναι: • η παράλειψη μίας από τις συγγραμικές μεταβλητές • η μετατροπή των υψηλά συσχετιζόμενων μεταβλητών σε ένα λόγο • η συλλογή περισσότερων δεδομένων • η συλλογή μακροπρόθεσμων • η μεγαλύτερη συχνότητα στα δεδομένα
Παραδείγματα Έχουμε τριμηνιαία δεδομένα για: Εισαγωγές(IMP) Ακαθάριστο Εθνικό Προϊόν(GDP) Δείκτης τιμών καταναλωτή (CPI) και Δείκτης τιμών παραγωγού (PPI)
Παραδείγματα Πίνακας συσχετίσεων IMP GDP CPI PPI IMP 1 0.979 0.916 0.883 GDP 0.979 1 0.910 0.899 CPI 0.916 0.910 1 0.981 PPI 0.883 0.8998 0.981 1
Παραδείγματα – μόνο CPI ΜεταβλητήΣυντελεστής Τυπικό σφάλμα t-Statistic Πιθανότητα C 0.631870 0.344368 1.834867 0.0761 LOG(GDP) 1.926936 0.168856 11.41172 0.0000 LOG(CPI) 0.274276 0.137400 1.996179 0.0548 R-squared 0.966057 Mean dependent var 10.81363 Adjusted R-squared 0.963867 S.D. dependent var 0.138427 S.E. of regression 0.026313 Akaike info criterion -4.353390 Sum squared resid 0.021464 Schwarz criterion -4.218711 Log likelihood 77.00763 F-statistic 441.1430 Durbin-Watson stat 0.475694 Prob(F-statistic) 0.000000
Παραδείγματα–CPI μεPPI ΜεταβλητήΣυντελεστής Τυπικό σφάλμα t-Statistic Πιθανότητα C 0.213906 0.358425 0.596795 0.5551 LOG(GDP) 1.969713 0.156800 12.56198 0.0000 LOG(CPI) 1.025473 0.323427 3.170645 0.0035 LOG(PPI) -0.770644 0.305218 -2.524894 0.0171 R-squared 0.972006 Mean dependent var 10.81363 Adjusted R-squared 0.969206 S.D. dependent var 0.138427 S.E. of regression 0.024291 Akaike info criterion -4.487253 Sum squared resid 0.017702 Schwarz criterion -4.307682 Log likelihood 80.28331 F-statistic 347.2135 Durbin-Watson stat 0.608648 Prob(F-statistic) 0.000000
Παραδείγματα – μόνοPPI ΜεταβλητήΣυντελεστής Τυπικό σφάλμα t-Statistic Πιθανότητα C 0.685704 0.370644 1.850031 0.0739 LOG(GDP) 2.093849 0.172585 12.13228 0.0000 LOG(PPI) 0.119566 0.136062 0.878764 0.3863 R-squared 0.962625 Mean dependent var 10.81363 Adjusted R-squared 0.960213 S.D. dependent var 0.138427 S.E. of regression 0.027612 Akaike info criterion -4.257071 Sum squared resid 0.023634 Schwarz criterion -4.122392 Log likelihood 75.37021 F-statistic 399.2113 Durbin-Watson stat 0.448237 Prob(F-statistic) 0.000000
Παραδείγματα – Η βοηθητική παλινδρόμηση ΜεταβλητήΣυντελεστής Τυπικό σφάλμα t-Statistic Πιθανότητα C -0.542357 0.187073 -2.899177 0.0068 LOG(CPI) 0.974766 0.074641 13.05946 0.0000 LOG(GDP) 0.055509 0.091728 0.605140 0.5495 R-squared 0.967843 Mean dependent var 4.552744 Adjusted R-squared 0.965768 S.D. dependent var 0.077259 S.E. of regression 0.014294 Akaike info criterion -5.573818 Sum squared resid 0.006334 Schwarz criterion -5.439139 Log likelihood 97.75490 F-statistic 466.5105 Durbin-Watson stat 0.332711 Prob(F-statistic) 0.000000