230 likes | 518 Views
התפלגות הדגימה בכל תא נורמאלית. Chi2. Chi2. אין יותר מ-20% מהתאים בהם השכיחות הצפויה קטנה מ-5. Fisher exact test. Chi2. Yates’ continuity correction : ביקורת. תלוי ב-2 התוצאות הקודמות. במקרה של df=1 עבור חי בריבוע לטיב התאמה. השערה חד צדדית. ולגבי התפלגות שונויות.
E N D
התפלגות הדגימה בכל תא נורמאלית. Chi2 Chi2 • אין יותר מ-20% מהתאים בהם השכיחות הצפויה קטנה מ-5. Fisher exact test Chi2 • Yates’ continuity correction: ביקורת.
כאשר אנו במצעים מבחן חי בריבוע עבור יותר מדרגת חופש אחת אנו נוכל להגיע למסקנה ש: • במקרה של 2לטיב התאמה - המדגם אינו לקוח מאוכלוסייה בעלת התפלגות (פרופורציות) נתונה. לדוגמא: סטודנטים לפסיכולוגיה הם בעלי סוג התקשרות שונה מזה של כלל האוכלוסייה. • במקרה של 2לאי תלות - המדגם לקוח מאוכלוסייה שבה קיים קשר בין 2 משתני המחקר. לדוגמא: בקרב סטודנטים לפסיכולוגיה, קיים הבדל בין סוג ההתקשרות של בנים לזה של בנות. מבחן האומניבוס משמעות דחיית H0 היא שהמדגם לקוח מאוכלוסייה השונה בלפחות תא אחד מהאוכלוסייה עליה מבוססת H0. • השאלה המתבקשת היא מהו מקור ההבדל: • איזה קבוצות הן החורגות מאוכלוסיית H0? • בין איזה קבוצות קיימים הבדלים בין בנים לבנות?
בחינת מקור ההבדל ע"מ לחקור את מקור ההבדל במבחן אומניבוס (אשר נמצא מובהק), קיימות מספר גישות, לדוגמה: השוואות (contrasts) לאחר מעשה (a-posteriori/post-hoc comparisons). על מנת שלא לנפח את ההסתברות לטעות מסוג ראשון, במבחנים שלאחר מעשה נהוג להקטין את ערך ה- של כל השוואה ע"מ לשמור על רמת ה- הכללית. לדוגמה, תיקון Bonferroni: קובעים את ה- הכללית ומחלקים אותה בהתאם למספר ההשוואות. לדוגמא: אם =0.05 ומבצעים 4 השוואות, עבור כל השוואה =0.0125 =pc לכל השוואה. =pe לניסוי כולו. c= מספר ההשוואות לביצוע.
ניתוח שאריות מתוקננות (standardized residuals analysis) השיטה פותחה ע"י Haberman (1973). דרך זו בוחנת מהם התאים התורמים למובהקותו של 2. השארית המתוקננת (Ri) עבור כל תא שווה ל: ניתן להוכיח ש- Riמתפלג נורמלית סטנדרטית, לכן תאים בעלי |Ri|>Z/2יחשבו לתאים שתרומתם למובהקותו של 2 אינה מקרית (הם מקור ההבדל). עודף/חוסר מקרים (נצפה מול צפוי) בתא מסוים יתבטא בתא/ים אחר/ים, אך ייתכן תא בודד בעל פער מובהק. ייתכן מצב בו אף תא לא ימצא בעל פער מובהק.
עבור כל i דוגמא חוקרת רצתה לדעת האם קיימת "העדפה" לנשים ללדת ביום/ימים מסוים/ים בשבוע. היא דגמה מקרית 200 אמהות ורשמה את היום בשבוע בו ילדו. מה תהיה מסקנתה ברמת בטחון של 95%? לכן ניתן לדחות את H0. ע"פ ערכי ה-Ri ניתן לראות כי מקור ההבדל הוא בכך שביום שבת יש יותר לידות מאשר בשאר ימי השבוע (זהו היום היחיד שבו |Ri|>1.96)
מבחן McNemar נניח שחוקר רוצה לדעת כיצד תעמולת בחירות משפיעה על דעותיהם של הבוחרים. הוא דוגם מקרית קבוצה של אנשים, בודק את עמדותיהם, חושף אותם לתעמולה ובודק שנית את עמדותיהם ע"ם לראות האם השתנו. במצב כזה אסור לנו לבצע מבחן חי בריבוע לאי תלות (האם קיים הבדל בין הדעות לפני לבין הדעות שאחרי התעמולה), זאת מאחר והתצפיות תלויות, דבר המפר הנחה של המבחן. קיימת גרסה של חי בריבוע למדגמים תלויים המתאימה אך ורק לטבלה 2 x 2. זהו מבחן McNemar. מבחן זה בוחן האם מספר האנשים ששינו את דעותיהם (לטובה) שונה ממספר האנשים ששינו את דעותיהם לרעה.
מדידה II מדידה I מובהקותו של McNemar כמו זו של 2 עם ד"ח 1. המבחן בעצם בודק רק את השינויים, ובוחן האם הם מתחלקים חצי חצי. פיתוח: כמובן שניתן גם לבצע את הבדיקה באמצעות מבחן הבינום
דוגמא במפעל מסוים החליטו לבחון האם טיול ישפר את תחושת המחויבות של העובדים לעבודה. 150 העובדים נשאלו לפני ואחרי הטיול האם הם מרגישים או לא מחויבים לעבודתם. מה תהיה מסקנת ההנהלה ברמת בטחון של 95%? H0: אין יותר שינויים לכוון המחויבות H1: יש יותר שינויים לכוון המחויבות השערה חד צדדית 2(1)=8, p=.005<0.025 לכן ניתן לדחות את H0, לאחר הטיול ישנם יותר עובדים החשים מחויבים לעבודתם. גם במקרה זה ניתן לבצע תיקון לרציפות.
בדיקת נורמליות ניתן להשתמש במבחן חי בריבוע לטיב התאמה ע"מ לבחון האם מדגם לקוח מאוכלוסייה בעלת התפלגות נתונה. בפרט נוכל לבדוק האם מדגם לקוח או לא מאוכלוסייה בעלת התפלגות נורמלית. מבחן זה משמש בין השאר לצורך בחינת הנחת הנורמליות תרם ביצוע מבחנים פרמטרים. קיימים מבחנים משוכללים יותר כמו: Kolmogorov-Smirnov או Anderson-Darling. השערת ה-0 טוענת שהמדגם לקוח מאוכלוסייה נורמלית, לכן מטרת החוקר היא לא לדחות את H0. על מנת לחשב את הסטטיסטי עלינו לחלק את הנתונים לקטגוריות, זאת כדי שבכל קטגוריה נוכל לחשב את fo ואת fe. גודל הקטגוריות (bins) עלול להשפיע על תוצאות המבחן. חיסרון של המבחן הוא שדרוש גודל מדגם מינימלי על מנת שהקירוב של חי בריבוע יהיה תקף.
OBS EXP
בהתבסס על ממוצע וסטיית התקן של המדגם, ניתן לחשב כמה ערכים אמורים ליפול בכל קטגוריה בהנחת נורמליות. נבדוק עד כמה הערכים הנצפים סוטים מהערכים הצפויים. שלבים: מחלקים את הנתונים לקטגוריות (רצוי שוות רוחב). חישוב הערכים הצפויים לכל קטגוריה: כאשר F היא פונקצית ההתפלגות הנורמלית המצטברת, xhh הוא הגבול העליון האמיתי של הקטגוריה ו-xll הוא הגבול התחתון האמיתי.
את ערכי הפונקציה ניתן לחשב ב-EXCEL או להיעזר בטבלת ההתפלגות הנורמלית (לאחר המרת גבולות הקטגוריות לציוני z). =NORMDIST(x,mean,stdevp,TRUE) דוגמא: להלן נתוני המחקר לאחר שקובצו ל-6 קטגוריות (לצורך הדוגמא בלבד - בחיים רצוי 10 קטגוריות ומעלה). האם ניתן לומר ברמת בטחון של 95% שלקוחים מאוכלוסייה המתפלגת נורמלית? NORMDIST(xll,mean,sn,TRUE) NORMDIST(xhh,mean,sn,TRUE)
H0: המדגם לקוח מהתפלגות נורמלית. H1: המדגם אינו לקוח מהתפלגות נורמלית. לכן לא ניתן לדחות את H0. לא ניתן לומר שהמדגם אינו לקוח מאוכלוסייה בעלת הת' נורמלית.
סיכום ביניים האם מדגם לקוח מהתפלגות נתונה? סולם מדידה? שמי רווח/יחס מספר ערכים? שונות האוכלוסייה ידועה? 2 ערכים: מבחן הבינום יותר מ-2 ערכים: 2לטיב התאמה לא כן np>5 מבחן t מבחן z לא כן קירוב נורמלי של הבינום חישוב ידני של הבינום
האם קיים הבדל בין 2 מדגמים תלויים/מזווגים? סולם מדידה? רווח/יחס סדר לא האם מתקיימת ההנחה שהתפלגות הדגימה של ממוצעי ההפרשים (d) מתפלגת t? מבחן Wilcoxon למדגמים תלויים כן מבחן t למדגמים תלויים
האם קיים הבדל בין 2 מדגמים בלתי תלויים? סולם מדידה? סדר רווח/יחס לא האם מתקיימת ההנחה שהתפלגות הדגימה של ההפרש הממוצעים מתפלגת t? מבחן Wilcoxon למדגמים בלתי תלויים כן האם מתקיימת ההנחה בדבר שוויון שונויות? W סכום הדירוגים של הקבוצה הקטנה לא כן מבחן t למדגמים בלתי תלויים ללא הנחת שוויון שונויות מבחן t למדגמים בלתי תלויים עם הנחת שוויון שונויות