210 likes | 451 Views
למדנו לבצע בדיקת השערות לממוצע מדגם. על מנת לבצע בדיקת השערות עלינו לדעת: את ממוצע האוכלוסייה "הרגילה". סטיית התקן של האוכלוסייה (הרגילה או עם הטיפול מאחר והנחנו שוויון שונויות). הבעיה היא שלרב אנו לא יודעים את הפרמטרים של האוכלוסייה. ומה כאשר סטיית התקן של האוכלוסייה לא ידועה?.
E N D
למדנו לבצע בדיקת השערות לממוצע מדגם. • על מנת לבצע בדיקת השערות עלינו לדעת: • את ממוצע האוכלוסייה "הרגילה". • סטיית התקן של האוכלוסייה (הרגילה או עם הטיפול מאחר והנחנו שוויון שונויות) הבעיה היא שלרב אנו לא יודעים את הפרמטרים של האוכלוסייה
ומה כאשר סטיית התקן של האוכלוסייה לא ידועה? אם בונים התפלגות דגימה של סטיות תקן ((Sn, התוחלת של סטיות התקן תהיה שונה מסטיית התקן של האוכלוסייה ממנה נדגמו המדגמים(). מכאן ש- Sn הוא אומדן מוטה ל-. ניתן להוכיח ש-Sn-1הוא אומד חסר הטיה ל-. applet מה תהיה צורתה של התפלגות הדגימה של סטיות תקן?
התפלגות t כאשר ו- ידועים, התפלגות הדגימה של ממוצעים עבור n מספיק גדול תתפלג נורמלית אבל לרב הפרמטרים של האוכלוסייה אינם ידועים. אם ידוע אך לא, ניתן לאמוד אותה. אומד חסר ההטיה ל-2 הוא אומד חסר הטיה הוא אומד שממוצע התפלגות הדגימה שלו שווה לפרמטר האוכלוסייה. במקרה הפרטי, אם נדגום אינסוף מדגמים בגודל n ונחשב בכל מדגם את האומדן הממוצע של כל האומדנים יהיה שווה ל-2.
לכן: אם סטיית התקן של האוכלוסייה אינה ידועה ניתן להשתמש באומדן שלה: אם כבר חישבנו את Sn אזי: כי:
ובחזרה להתפלגות הדגימה של ממוצעים. מאחר ואנו משתמשים באומדן לסטיית התקן במקום בפרמטר, יש גורם נוסף לטעות. מכאן שסטיית התקן של התפלגות הדגימה תהיה גדולה יותר. הפתרון הוא שימוש בהתפלגות אחרת, התפלגות "רחבה" יותר מההתפלגות הנורמלית. התפלגות זאת קרויה התפלגות t. עכשיו הסטטיסטי שלנו עבור תצפית בודדת יהיה: t אינו מתפלג נורמלית אלא מתפלג t שהיא התפלגות רחבה יותר. יתרה מכך התפלגות t היא בעצם משפחה של התפלגויות כפונקציה של דרגות החופש (ד"ח=d.f.=n-1)ככל שמספר התצפיות גדול יותר, כך האומדן שלנו (s) מדויק יותר (קרוב יותר ל-) והתפלגות t צרה יותר ושואפת לנורמלית. William Gosset: Student’s t למה df=n-1? Guinness's brewery
ובהתפלגות דגימה של ממוצעים: יתפלג t? מתי • כאשר x מתפלג נורמלית • או כאשר n>30
=TDIST(t,df,tails) 1 מבחן חד-צדדי 2 מבחן דו-צדדי מכאן, תהליך בדיקת ההשערות זהה לחלוטין לבדיקת השערות על ממוצע כפי שלמדנו עם z. 1) או 2) הנחות: x מתפלג נורמלית, או n>30. 3) חישוב הסטטיסטי 4) השוואת הסטטיסטי t לערך הקריטי בטבלה, או חישוב p באמצעות EXCEL מקבל ערכים חיוביים בלבד! NORMSDIST TDIST 1-
דוגמא ידוע שההכנסה הממוצעת של משפחה ישראלית היא 6500 ₪ . כלכלן ממשרד האוצר טוען (לפני איסוף הנתונים) שתושבי הצפון מרוויחים מעל לממוצע האוכלוסייה. הוא דגם מקרית 40 מתושבי הצפון ומצא שממוצע ההכנסה שלהם עמד של 0007 ₪ ו-s=700 . האם טענת הכלכלן מוצדקת ברמת מובהקות של 0.05? 1) 2) מכוון ש n>30, התפלגות הדגימה היא t. 3) טבלה הערך הקריטי עבור =0.05 חד-צדדי עם df=39 הוא 1.697(לכל היותר) 4) לכן ניתן לדחות את H0 ולומר שהכלכלן צדק. =TDIST(4.52,39,1)=2.8E-05
H0 H1 6500 6900 =TINV(,df) דו צדדי 5) מהי עוצמת המבחן שביצע הכלכלן אם מתברר שכלל תושבי הצפון מרוויחים בממוצע 6900 ₪? TINV(0.1,39)=1.68 לשים לב! הפקודה היא דו-צדדית, לכן בהשערה חד-צדדית יש להכפיל את ב-2. 0.03=TDIST(1.93,39,1)
אם כבר חישבנו את Sn, הראנו ש: לכן: כי
רווח בר סמך לממוצע האוכלוסייה אם סטיית התקן של האוכלוסייה אינה ידועה, אזי נוכל לבנות רווח בר סמך בהתבסס על התפלגות t . =TINV(,df) דוגמה: במדגם בגודל n=30 נמצא שההכנסה הממוצעת היתה 4000 עם אומדן לסטיית התקן 0s=300. ברמת בטחון של 95% ((=0.05, מהו ממוצע ההכנסה של כלל האוכלוסייה? 2.045=(TINV(0.05,29
דוגמא: שרת החינוך רוצה לדעת מהו הממוצע בחשבון של כלל התלמידי י"ב בישראל. לשם כך היא דגמה באופן מקרי 10 תלמידי י"ב. בהנחה שציוני חשבון מתפלגים נורמלית, מהו ממוצע באוכלוסייה ברמת בטחון של 95%? להלן הנתונים: 70,60,80,90,60,73,76,81,90,65. לא נעסוק ב-n מינימלי בהתפלגות t מאחר ומדובר בתהליך איטרטיבי.
מבחן t הוא הבסיס למשפחת הסטטיסטיקה הפרמטרית: • ניתוח שונות • רגרסיה • זו הסטטיסטיקה הרווחת בשוק. • דרישות: • משתנים בסולם רווח/יחס (מבוססת על ממוצעים) • התפלגות דגימה נורמלית • למרות שרב המשתנים במדעי החברה לא עונים לדרישות אלו, הסטטיסטיקה הרווחת היא פרמטרית.
דגימה מקרית: • כל המבחנים הסטטיסטיים מבוססים על דגימה מקרית. דגימה שבה לכל פרט באוכלוסייה יש סיכוי זהה להיכלל במדגם. • זו הנחה שכמובן לרב לא מתקיימת. אי קיומה פוגעת גם ביכולת ההכללה של הממצאים (תוקף חיצוני). • לכל מחקר ארבעה סוגי תוקף עיקריים: • תוקף מבנה - עד כמה ההגדרה האופרציונלית של המשתנים תואמת את ההגדרה התיאורטית. • תוקף פנימי - האם המשתנה הבלתי תלוי הוא הסיבה למשתנה התלוי או שמא ישנם משתנים חיצוניים המתערבים במחקר. • תוקף המסקנה הסטטיסטית - עוצמת המבחן, טעות מסוג I, בחירת המבחן הסטטיסטי. • תוקף חיצוני - יכולת הכללה של הממצאים (דגימה מייצגת)