510 likes | 925 Views
فصل يازدهم. ناهمساني واريانس. فهرست. فرضيه همساني واريانس ماهيت ناهمساني واريانس. برخي از دلايل وقوع ناهمساني. در مدلهاي يادگيري از طريق خطا با افزايش تمرين به مرور زمان خطا كاهش مييابد. يعني 2 σ كاهش مييابد. بهبود روشهاي جمعآوري دادهها
E N D
فصل يازدهم ناهمساني واريانس فهرست
فرضيه همساني واريانس ماهيت ناهمساني واريانس
فصل يازدهم: ناهمساني واريانس برخي از دلايل وقوع ناهمساني • در مدلهاي يادگيري از طريق خطا با افزايش تمرين به مرور زمان خطا كاهش مييابد. يعني2σكاهش مييابد. • بهبود روشهاي جمعآوري دادهها • مشكل ناهمساني در دادههاي مقطعي متداولتر از دادههاي سري زماني ميباشد.
فصل يازدهم: ناهمساني واريانس (دو برابر جملات مزدوج + تخمين زنهاي OLSدر صورت وجود ناهمساني واريانس
فصل يازدهم: ناهمساني واريانس در صورت فرض عدم همبستگي سريالي داشتيم: پس داريم: و چون ik ها معلوم هستند داريم : در آنجا كه داريم : لذا داريم :
فصل يازدهم: ناهمساني واريانس ويژگي تخمين زن اگر ساير فروض مدل كلاسيك برقرار باشد، تخمين زنندة خطي بدون تورش ميباشد وليديگرحداقل واريانس را ندارد لذا كارا نيست.
فصل يازدهم: ناهمساني واريانس روش OLS به تمام مشاهدات وزن يكساني ميدهد ولي در روش GLSبه مشاهداتي كه اطراف مقدار متوسط جامعه جمع شدهاند وزن بيشتري داده و براي مشاهداتي كه در اطراف متوسط خويش به طور گسترده پراكنده شدهاند وزن كمتري قايل ميشويم. علت استفاده از روش GLS به جاي OLS
فصل يازدهم: ناهمساني واريانس كه براي رفع نقض جبري آن مي توان نوشت: (كه در آنX0i=1 ) روش حداقل مربعات تعميم يافته (GLS)
فصل يازدهم: ناهمساني واريانس علت تبديل مدل: از آنجا كه2σ iها معلوم هستند: و چون ميدانيم2 σ i2 )= u iE( : پس با تبديل انجام شده *1βو*2βتخمين زنهاييBLUE ميباشند .
فصل يازدهم: ناهمساني واريانس در چنين حالتي معادله زير را حداقل ميكنيم: واگر باشد: حال با ديفرانسيلگيري نسبت به 1*βو2*βخواهيم داشت:
فصل يازدهم: ناهمساني واريانس معادلات نرمال:
فصل يازدهم: ناهمساني واريانس با حل همزمان معادلات نرمال داريم:
فصل يازدهم: ناهمساني واريانس ب) تخمين OLS بدون توجه به وجود ناهمساني واريانس الف) تخمين OLS با علم به وجود ناهمساني واريانس (I) واريانس در صورت عدم ناهمساني واريانس: II )( واريانس محاسباتي از روش (I) تخمين تورشداري از واريانس محاسباتي از رابطه (II) ميباشد. يعني واريانس را كمتر و يا بيشتر از حد محاسبه ميكند پس فواصل اعتماد محاسبه شده ازآزمونهاي F و t قابل اعتماد نيست. فاصله اعتماد برحسب بيش از حد لازم بزرگ است و در نتيجهآزمونهاي t و F احتمالاً نتايج غلطي را به ماميدهند، چرا كه واريانسغالباً بزرگ بوده و از لحاظ آماري ضريب معنيدار نميشود زيرا مقدار t كوچكتر از مقدار مناسب آْن است. نتايج و كاربرد روش OLS در شرايط وجود ناهمساني واريانس
فصل يازدهم: ناهمساني واريانس • به جزچند قاعده تجربي و سرانگشتي هيچ قاعده سريع و مطمئني براي تشخيص ناهمساني وجود ندارد. • غالباً ماهيت مسئله مورد بررسي بيانگر ناهمساني احتمالي است كه با آن برخورد ميشود. • در دادههاي مقطعي كه شامل واحدهاي گوناگون ميباشند، ناهمساني يك اصل است تا يك اشتباه. كشف ناهمساني واريانس روشهاي كشف ناهمساني • آزمون همساني واريانس بارتلت • آزمون بروچ- پاگان • آزمون پيك • آزمون ناهمساني عمومي وايت • آزمون Cusumsq • روش ترسيمي • آزمون پارك • آزمون گلچسر • آزمون همبستگي رتبهاي اسپيرمن • آزمون گلدفلد-كوانت
فصل يازدهم: ناهمساني واريانس ابتدا رگرسيون را براساس فرض عدم ناهمساني تحليل كرده و سپس مجذور باقيماندههاي تخمين زده شدة را مورد بررسي قرار ميدهيم تا ببينيم كه چه الگوي سيستماتيك و منظمي را نشان ميدهد. ei2 ei2 X روش ترسيمي
فصل يازدهم: ناهمساني واريانس • گرچهei2هاهمانui2هانيستند، ولي ميتوان از آنها بهعنوان جانشين استفاده نمود، مخصوصاً اگر حجم نمونه به حد كافي بزرگ باشد. • به جاي قراردادن ei2درمقابلميتوان σi2را در برابر متغيرهاي توضيحي قرار داد. بهخصوص اگر قرار دادن ei2در تعامل شكلي شبيه شكل (a) در قسمت قبل را به ما ارائه دهد. در اين جا نيز، ممكن است با نمودارهاي شبيه آنچه در الگوهاي قبل ارائه شد روبه رو شويم. • در حالت دو متغير قراردادن σi2درمقابل مساوي است با قراردادن آن در مقابل Xi. اما در مدلهايي كه دارايدو يا چند متغير Xميباشند، چنين حالتي اتفاق نميافتد و ميتوان را در مقابل هر متغير X موجود در مدل قرار داد.
فصل يازدهم: ناهمساني واريانس آزمون پارك محققي به نام پارك روش گرافيكي را در قالب فرمول بيان داشته است:
فصل يازدهم: ناهمساني واريانس آزمون پارك فرآيندي دو مرحلهاي ميباشد: مرحله اول: روش OLS را بدون در نظر گرفتن ناهمساني به كار ميبريم و از اين رگرسيون ei2را بهدست ميآوريم. مرحله دوم: رابطه زير را رگرس ميكنيم. ايراد روش پارك: گلدفلد و كوانت" بحث ميكنند كه جزء خطاي vi ممكن است فروض OLS را تامين نكرده و در نتيجه خود موجب ناهمساني شود. لذا از آزمون پارك ميتوان تنها بهعنوان يك روش پيشنهادي استفاده كرد.
فصل يازدهم: ناهمساني واريانس آزمون گلچسر • از لحاظ ماهيت شبيه آزمون پارك است. • پس از بهدست آوردن باقيماندهها( ei ها) از رگرسيون OLS، گلچسر پيشنهاد ميكند كه قدر مطلق e iها، يعني |ei|، را روي متغير X رگرس كنيم كه تا حد زيادي با Xدر ارتباط است. در اين آزمون وي از شكل توابع روبرو استفاده ميكند:
فصل يازدهم: ناهمساني واريانس روش گلچسر يك حالت تجربي و يا عملي ميباشد. اما "گلدفلدكوانت" اشاره ميكنند كه جزء خطاي vi دچار مشكلاتي است همچون اميد غير صفر، همبستگي پيوسته، و ناهمساني شديد. مشكل ديگر در اين آزمون مدلهايي مثل: كه از نظر پارامترها غيرخطي بوده و نميتوان با روش OLS معمول آنها را تخمين زد. در نمونههاي بزرگ چهار مدل اول براي تشخيص ناهمساني نتايج رضايتبخشي حاصل ميكنند و در نمونههاي كوچك ممكن است منحصراً بهعنوان وسيلهاي كيفي بهمنظور فراگيري مطالبي دربارة ناهمساني بهكار گرفته شود.
فصل يازدهم: ناهمساني واريانس آزمون همبستگي رتبهاي اسپيرمن ضريب همبستگي رتبهاي عبارتست از: di: تفاوت در رتبههاي نسبت داده شده به دو مشخصة مختلف i امين فرد يا پديده :Nتعداد افراد يا پايدههاي رتبهبندي شده مرحله اول:y را بروي X رگرس ميكنيم و باقيماندههاي eiرا بهدست ميآمديم. مرحله دوم: با صرف نظر كردن از علامت ei، قدر مطلق eiرا گرفته و هد در | ei| و Xi را بهترتيب صعودي يا نزولي رتبهبندي كرده و ضريب همبستگي رتبهاي اسپيرمن را محاسبه ميكنيم. مرحله سوم: معنيدار بودن rsنمونه را با استفاده از آزمون t بررسي ميكنيم: • اگر مدل رگرسيون بيش از يك متغير X داشته باشد rs را ميتوان بين | ei| و هر كدام از متغيرهاي بهطور جداگانه محاسبه نموده و معنيدار بودن آماري آن را بهوسيله آزمون t مذكور آزمود.
فصل يازدهم: ناهمساني واريانس آزمون گلدفلد-كوانت اين آزمون زماني بهكار ميرود كه فرض شود واريانس ناهمساني i2σ ، بهطور مثبت با "يكي" از متغيرهاي توضيحي موجود در مدل رگرسيون ارتباط دارد. فرض كنيد كه در مدل زير i2σبهطور مثبت با Xi مرتبط باشد:
فصل يازدهم: ناهمساني واريانس مرحله اول: مشاهدات را متناسب با 1X مرتب يا ردهبندي ميكنيم. اين عمل را بايد از كوچكترين مقدار X صورت داد. مرحله دوم: تعداد C مشاهده از مشاهدات قرار گرفته در وسط كل مشاهدات را حذف كرده (c را بايد بهنحو مناسبي از قبل مشخص نمود) و سپس بقيه مشاهدات (N-C) را به دو گروه تقسيم كرده كه در هر گروه تعداد[(N-C)/2] مشاهده قرار ميگيرد. مرحله سوم: براي هر كدام از دو گروه بهطور جداگانه رگرسيون OLS را بهكار برده و نوع مجذور باقيماندههاي RSS2 و 1RSS را بهدست ميآوريم.1RSS بين رگرسيون منطبق بر مقاديرXiكوچكتر و RSS2بين رگرسيون منطبق بر مقادير Xiبزرگتر ميباشد. درجه آزادي براي هر گروه: [(N-C)/2]-k(k تعداد پارامترهاي تخمين زده شده است كه شامل عرض از مبدأ نيز ميباشد) مرحله چهارم: نسبت را محاسبه ميكنيم: اگر محاسباتي در سطح معنيداري بزرگتر از مقدار F بحراني باشد، ميتوان فرضيه همساني را مردود شمرد.
فصل يازدهم: ناهمساني واريانس • انتخابC مناسب از حساسيت بالايي برخوردار است. مدل تجربي دو متغيره "مونت كارلو" كه بهوسيله گلدفلد- كوانت صورت گرفته نشان ميدهد كه اگر 30=N باشد C حدود 8 ميباشد و اگر 8 =N باشد، C حدود 16 خواهد بود. ولي فرد ديگري به نام "جاج" متوجه شد كه اگر 30=N باشد 4=C و اگر N حدود 60 باشد 10=C خواهد بود. • هنگامي كه با بيش از يك متغير X در مدل مواجهيم ابتدا رگرسيون زير را صورت داده: • سپس ميتوان دادهها را برحسب هر يك از X ها ردهبندي يا رديف كرد. اگر در ابتداندانيم كه كدام متغير X مناسب است، ميتوان براي هر متغير X اين آزمون يا آزمون "پارك" را به ترتيب برروي هر X انجام داد.
فصل يازدهم: ناهمساني واريانس اقدامات ممكن جهت رفع مشكل در بخش بعد بعضي از اين تبديلات با استفاده از مدل دو متغيره تشريح ميكنيم. "روش حداقل مربعات وزني" الف) وقتي كه معلوم است بايد مدل را به گونهاي تبديل كنيم كه مشكل ناهمساني حل شود. ب) وقتي كه مجهول است
فصل يازدهم: ناهمساني واريانس فرض 1: اگر معتقد باشيم كه واريانس Ui متناسب با مربع متغير توضيحي X است يعني: b1 Y u i i = + b2 + X X Xi i i حال اگر واريانس جزء اخلال vi را محاسبه كنيم داريم:
فصل يازدهم: ناهمساني واريانس 2 = s E ( u2 ) x i i فرض 2:
فصل يازدهم: ناهمساني واريانس فرض 3: با اين وجود اين مدل تبديلي فاقد اعتبارست، زيرا E(Yi) وابسته بهβ1 و β2است كه مجهول ميباشند. اما قطعاً ميدانيم كهتخمين E(Yi| Xi)است. بنابراين تبديل را ميتوان در دو مرحله انجام داد:
فصل يازدهم: ناهمساني واريانس مرحله اول: رگرسيون OLS معمول را بدون در نظر گرفتن مشكل ناهمساني انجام داده و را بهدست ميآوريم. مرحله دوم: با استفاده ازتخمين زده شده، مدل زير را تخمين ميزنيم. گر چند ها دقيقاًE(Yi| Xi)نيستند ولي تخمينزنهاي سازگاري ميباشند يعني هر چه حجم نمونه بهسمت بينهايت ميل كند،ها بهE(Yi )های واقعي نزديكتر ميشوند.
فصل يازدهم: ناهمساني واريانس فرض 4: تبديل لگاريتمي • غالباً ناهمساني كاهش مييابد زيرا مقياسهاي اندازهگيري متغيرها را تحت تاثير قرار ميدهد در نتيجه هر 10 اختلاف بين دو متغير به دو اختلاف كاهش مييابد. • ضريب زاويهβ2 ، كشش Y نسبت به X را اندازهگيري ميكند. در حاليكه در مدل اصلي β2تنها نرخ تغيير متوسط Y را براي هر واحد تغيير در X اندازهگيري ميكند.
فصل يازدهم: ناهمساني واريانس مشكلات و مسايل مربوط به تبديلات • هنگاميكه از مدل بيش ازدو متغيراستفاده ميكنيم، از كداميك ازمتغيرهاي X براي تبديل دادهها انتخاب كنيم؟ • تبديل لگاريتمي در زمانيكه بعضي از مقادير X و Y، صفر ويا منفي باشند، كاربرد ندارد. • مشكل همبستگي ساختگي نيز وجود دارد. اين حالت كه توسط "كارل پيرسون" مطرح گرديد ميگويد كه ممكن است بينX وY در مدل همبستگي وجود نداشته باشد اما درمدل بينغالباً همبستگي وجود دارد.
فصل يازدهم: ناهمساني واريانس • وقتي كه σi2دقيقاً معلوم نباشد و از راه يك يا چند تبديل مذكور تخمين زده شود، تمام حجم فرآيندهاي آزموني از آزمون t و F و غيره استفاده ميكنند ولي فقط زماني معتبرند كه حجم نمونهها بزرگ باشند.
فصل يازدهم: ناهمساني واريانس خلاصه 1) ناهمساني واريانس، ويژگيهاي بدون تورش بودن و سازگاري تخمينزنهاي OLS معمول را از بين نميبرد اما اين تخمينزنها داراي حداقل واريانس يا كارايي نيستند اين تخمينزنها، حتي بهصورت مجانبي نيز كارآ نميباشند. بهعبارت ديگر، آنها Blue نيستند. 2) اگر در حالت ناهمساني به استفاده از تخمين زنهاي OLS معمولي ادامه دهيم واريانسهاي بهدست آمده ديگر حداقل نبوده، لذا فاصله اعتماد براساس اين واريانس بياندازه بزرگ شده و آزمونهاي مربوطه معنيدار بودن، اعتبار خود را از دست خواهند داد. 3) هر چند استفاده از استنتاجات نظري ناهمساني سادهتر است، اما تخمين آن به سادگي امكانپذير نيست، چرا كه در بررسيهاي اقتصادسنجي غالباً مقدار Y برحسب Xمفروض وجود دارد، كه بدين ترتيب پيدا كردن i2σاز يك مشاهده امكانپذير نيست.
فصل يازدهم: ناهمساني واريانس • 4) بعضي از روشهاي غيرمستقيم و نامنظم براي تشخيص ناهمساني اختراع شدهاند، اين روشها عموماً باقيماندههاي بهدست آمده از روش حداقل مربعات را در نظر ميگيرند تا دريابند كه آيا الگوي منظمي را نشان ميدهند يا نه. اگر چنين الگويي را نشاندهنده اين روشها طرق تبديل مدل اصلي را بهنحوي ارائه ميكنند كه اجزاء اخلال معادلة تبديل شده داراي واريانس ثابت باشند. • 5) گر واريانسهاي ناهمسان معلوم باشند، آسانترين روش حل مشكل ناهمساني، روش حداقل مربعات وزني است كه اهميت مشاهدات افراطي را با دادن وزن به آنها متناسب با عكس واريانسشان به حداقل ميرساند. • 6) عموماً اطلاعات ما در مورد σi2ناچيز ميباشد و در نتيجه فرضهاي توجيهكنندهاي راجع به ماهيت ساخته و دادهها را بهنحوي تبديل ميكنيم كه اجزاء اخلال در دادههاي تبديل شده همسان باشند. در فصل حاضر چند تبديل مورد استفاده را بررسي كرده و به حالتهاي خاص آنها نيز اشاره كرديم. همچنين بعضي از مشكلات و مسايل مربوط به چنين تبديلهايي را مورد توجه قرار داديم.