190 likes | 383 Views
מדדי פיזור. פיזור מצביע על מידת ההטרוגניות או ההומוגניות של ההתפלגות. פיזור הוא מדד יחסי, כיוון שאפשר לומר אם הפיזור בהתפלגות רחב או צר, רק ביחס לפיזור בהתפלגות אחרת. מדובר ב מרחק שבין הערכים לבין עצמם , ולפי הגדרה נוספת, ב מרחק שבין הערכים לערך מרכזי בהתפלגות (למשל, השכיח או הממוצע.
E N D
מדדי פיזור פיזור מצביע על מידת ההטרוגניות או ההומוגניות של ההתפלגות. פיזור הוא מדד יחסי, כיוון שאפשר לומר אם הפיזור בהתפלגות רחב או צר, רק ביחס לפיזור בהתפלגות אחרת. מדובר במרחק שבין הערכים לבין עצמם, ולפי הגדרה נוספת, במרחק שבין הערכים לערך מרכזי בהתפלגות (למשל, השכיח או הממוצע.
5 מדדי פיזור: • אחוז התצפיות שסוטות מהקטגוריה השכיחה • טווח / תחום/ range = הערך המקסימלי של ההתפלגות פחות הערך המינימלי שבה. • טווח בין רבעוני = טווח ההתפלגות הכולל את כל התצפיות מהאחוזון ה-25 ועד לאחוזון ה-75. הוא נוצר כדי להחליף את הטווח (מהסעיף הקודם), מאחר שזה מושפע מאוד מערכים קיצוניים. • שונות, variance = ממוצע ריבועי הסטיות מן הממוצע. המטרה של השונות היא לראות עד כמה מרוחקות התצפיות השונות בהתפלגות מן הממוצע. ככל שהשונות גדולה יותר, כך הפיזור בהתפלגות רחב יותר (ושוב, יש לזכור שמדובר במדד יחסי). • סטיית תקן, standard deviation = השורש החיובי של השונות. מדובר, למעשה, במדד שמראה את אותו הדבר שמראה השונות, רק בערכים קטנים יותר (לאחר הוצאת השורש), המתאימים לערכי ההתפלגות. לכן, מדווחים על סטיית התקן, ולא על השונות.
טווח בין רבעוני • נבקש מאונים על פי רבעונים – דוגמא רבעונים של גיל: כך נדע כי התחום הבין רבעוני של משתנה גיל הוא בין 32 (q1) ובין 60 (q3).
טווח, שונות וסטיית תקן Analyze > descriptive statistics > frequencies > statistics
סטיית תקן שונות טווח יש לנו אפשרות לבקש גם הצגה של ערכי המינימום והמקסימום ומדד נוסף בשם אחוז הסטייה מן הממוצע (S. E. mean), שבו לא ניגע, בעיקרון.
חשוב לזכור לסמן ולבקש מדדי פיזור הרלוונטיים למשתנה, על פי הסולם שבו הוא נמדד, כאשר: • טווח וטווח בין רבעוני ניתנים להצגה מסולם סדר. • שונות וסטיית תקן ניתן לחשב רק מסולם קוואזי רווח ומעלה (שכן מדובר במדד המתייחס לממוצע ההתפלגות).
דוגמא: משתנה גיל חשוב להציג ממוצע אם אנו מציגים שונות וסטיית תקן, כיוון ששני מדדים אלה מתייחסים אליו. כמו כן, הם חסרי משמעות אם לא נציג אותם לגבי התפלגויות אחרות על מנת להשוות ביניהן.
crosstabs Analyze > descriptive statistics > crosstabs Row – משתנה בלתי תלוי Column(s) – משתנה תלוי
statistics חי בריבוע פי וקרמר
cells מסמנים רק את observed – טבלת התצפיות שצפינו בהם בפועל. הצגת אחוזים – לסמן הכל
output 1. טבלת סיכום
2. טבלת צילווח משתנה סדר – האם החיים: מלהיבים, שגרתיים, משעממים סה"כ מין הנחקר סה"כ
טבלת צילווח המשך במספרים כמה גברים דיווחו על חיים מלהיבים, שגרתיים, משעממים מתוך סה"כ הגברים האחוז מכל טור מתוך 100% הגברים מתוך כלל המדגם כמה בכל טור הם גברים כמה אחוזים גברים יש בכל טור מתוך סה"כ המדגם
המשך • 213 – מספר הגברים שענו כי החיים מלהיבים • 50.1% ענו כי החיים מלהיבים מתוך סה"כ הגברים. • 49.1% - הם גברים מתוך הסה"כ שענו כי החיים מלהיבים. • 21.7% - אחוז הגברים שענו כי החיים מלהיבים מתוך כל המדגם ( נשים וגברים יחד).
3. טבלת chi square tests מובהקות: אם קטן מ 0.05 הקשר הוא מובהק אנו צריכים לדעת רק את ערך החי בריבוע דרגות חופש