720 likes | 1.17k Views
آشنايی با آمار توصيفي. ارائه دهنده: سپیده فارسي نژاد كارشناس ارشد گروه آمار واطلاعات وزارت نيرو دانشجوي دوره دكتراي آمار ( فرايندهاي تصادفي). پيشگفتار:.
E N D
آشنايی با آمار توصيفي ارائه دهنده: سپیده فارسينژاد كارشناس ارشد گروه آمار واطلاعات وزارت نيرو دانشجوي دوره دكتراي آمار ( فرايندهاي تصادفي)
پيشگفتار: در عصر حاضر كسي نميتواند منكر این واقعیت باشد كه آمار نقشي لاینفک در زندگي روزمره ما بازي ميكند. اخبار روزانه رسانههاي گروهی با گزارشی از وضع هوا به پایان ميرسندو در طول اخبار، به جریانهای بازار بورس و سهام اشاره ميشود و روزنامهها خبر از افزایش نرخ اجناس ميدهندو... آمار به عنوان پايه يك روش و راه موثر در بررسی مسائل موجود، در بسیاری از زمينههاي علمي از جمله جامعه شناسي، کشاورزی، فيزيك و....به كار گرفته ميشود. در دانش امروزي، معمولا سعی ميشود كه اطلاعات موجود در يك زمينه خاص، در قالب اعداد نمایش داده شود تا به هنگام تجزیه و تحلیل اطلاعات، فهم بهتری از پدیده مورد مطالعه به دست آمده و امکان مقایسه فراهم گردد. در يك جمله آمار مجموعهاي از روشهای جمع آوری، تهيه وتنظیم و تجزیه و تحلیل اطلاعات است كه براي كسب يك يا چند نتیجه به خدمت گرفته ميشود.
فهرست مطالب: • آمار توصيفي • جدولهاي آماري • نمودارهاي آماري • معيارهاي مركزي • معيارهاي پراكندگي • منحنيهاي فراواني
آمار توصيفي: براي اينكه نتايج مناسب و مطلوب از اطلاعات كه در آمار گيريها جمع آوري ميكنيم، به دست آيد بايد: • اعداد نماينده واقعي مشاهدات بوده و غيرواقع يا غلط نباشند • به نحو مفيدي تهيه و تنظيم شوند • به نحو صحيح تجزيه و تحليل گردند • قابل نتيجه گيري صحيح باشند آمار توصیفی: به طور كلي، روشهايي را كه به وسيله آنها ميتوان اطلاعات جمع آوري شده را تنظيم كرده و خلاصه نمود، آمار توصيفي ميناميم و در يك كلام آمار توصيفي عبارت از مجموعه روشهايي است كه پردازش دادهها را فراهم ميسازد. اطلاع از اصطلاحات زير در آمار ضروري است.
آمار توصيفي: داده مقياسهاي اندازهگيري نمونه متغير جمعيت مجموعه افراد يا اشيايي را كه ميخواهيم يك يا چند خصوصيت مشترك آنها را مورد بررسی قرار دهيم، جمعيت يا جمعيت آماري ميناميم. مثال: اندازه قد يا وزن دانشجويان بيست ساله يك شهر، تعداد لامپهاي سالم و يا ناسالم توليد شده در يك كارخانه و در يك روز معين، مثالهايي از جمعيتهاي آماري هستند. نكته: معمولا مطالعه ويژگيهاي مورد نظر، به هنگامی كه جمعیت آماری بسیار گسترده باشد، مستلزم صرف هزینه و وقت زيادي ميباشد و در بسیاری از مواقع، اين امر اصولا امکان پذیر نیست. بنابراین در چنین موردی، براي مطالعه ویژگی مورد نظر، به قسمتی از جمعیت آماری اکتفا ميكنيم.
آمار توصيفي: متغير داده مقياسهاي اندازهگيري جمعيت نمونه قسمتي از جمعيت را كه طبق قاعده و ضوابط خاصي، براي مطالعه خصوصيتي از جمعيت انتخاب ميشود، يك نمونه از جمعيت ميناميم. نمونه نکته اين نمونه وقتي مفيد و قابل قبول خواهد بود كه بتواند نماينده خوبي براي كل جمعيت مورد مطالعه باشد. با توجه به اهميت اين موضوع شاخهاي از آمار تحت عنوان نظريه نمونهگيري با بررسي نمونهاي به اين امر مهم ميپردازد. در بسياري از موارد، معمولا نمونه تصادفي ساده را در نظر ميگيرند. مثال: براي بررسی اندازه قد دانشجویان بیست ساله يك شهر، انتخاب مثلا 150 نفر از بین اين جمعیت به طور تصادفی، يا انتخاب 100 لامپ به تصادف از لامپهاي توليدي يك کارخانه در يك روز معین، براي تعيين كيفيت لامپهاي توليدي اين کارخانه مثالهايي از نمونه تصادفی هستند.
آمار توصيفي: نمونه داده مقياسهاي اندازهگيري جمعيت متغير خصوصیت مورد مطالعه، از فردی به فرد دیگر، يا از شي به شي دیگر در جمعیت آماری تغيير ميكند، كه آن را اصطلاحا متغير ميناميم. معمولا دو نوع متغير در آمار مورد نظر هستند: • متغيرهاي گروهي، نظير رنگ، نژاد، شغل و گروه خوني كه شامل چند گروه يا طبقه ميباشند. • متغيرهاي عددي كه ممكن است نتيجه شمارش باشد، مانند تعداد احشام هر خانوار در يك روستا،تعداد حوادث در يك كارخانه در روزهاي مختلف، و يا نتيجه اندازهگيري باشد، مثل قد دانشجويان بيست ساله در يك شهر، حجم شربت مولتي ويتامين با استاندارد خاص.
آمار توصيفي: نمونه داده مقياسهاي اندازهگيري جمعيت متغير متغير: متغيرهاي گروهي متغيرهاي عددي كه از راه شمارش بهدست آمده اند متغيرهاي گسسته متغيرهايي را كه از طريق اندازهگيري به دست آمده باشند متغيرهاي پیوسته
آمار توصيفي: متغير نمونه داده جمعيت مقياسهاي اندازهگيري در بسیار از مسائل پيشرو، اندازهگيري ویژگی يك متغیر مستلزم آگاهی و شناخت خاصي است. به طور كلي چهار نوع مقیاس براي اندازه گيري وجود دارد: • مقياس اسمي • مقياس ترتيبي • مقياس فاصلهاي • مقياس نسبتي
آمار توصيفي: متغير نمونه داده جمعيت مقياسهاي اندازهگيري مقياس اسمي: اين نوع مقياس اندازهگيري عمدتا براي طبقه بندي دادهها به كار ميرود و منظور از آن اتلاق يك عدد طبيعي به دادههاي متفاوت است. اختصاص اعداد 1 تا 4 به گروههاي خونيA,B, AB, O. مثال: توجه داشته باشيد كه: اين اعداد را نميتوان براي مقايسه يا چهار عمل اصلي به كار برد
آمار توصيفي: متغير نمونه داده جمعيت مقياسهاي اندازهگيري اين اعداد تنها براي مقايسه به كار ميروند و نميتوان با آنها چهار عمل اصلي را انجام داد. مقياس ترتيبي: اين نوع مقياس اندازهگيري عموما براي طبقه بندي دادهها به منظور يك نوع برتري به كار ميرود. مثال: در يك كارخانه ممكن است كارگران را به سه دسته ساده، نيمه ماهر و ماهر تقسيم بندي كنيم. اتلاق به ترتيب اعداد 1 تا 3 به اين سه دسته يك مقياس ترتيبي است. توجه داشته باشيد كه:
آمار توصيفي: متغير نمونه داده جمعيت مقياسهاي اندازهگيري اين نوع مقياس اندارزهگيري عموما در زمينههاي كه علاوه بر حفظ ترتيب به نحوي فاصله بين ويژگيها را نيز حفظ ميكند. به عبارت ديگر در چنين مقياسي نسبت تفاضلها ثابت ميماند. مقياس فاصله اي: مثال: اندازهگيري ضريب هوشي دانش آموزان كلاس اول دبستان در شهر اصفهان. توجه داشته باشيد كه: در اين نوع مقياس، عدد صفر يك مفهوم قراردادي است.
آمار توصيفي: متغير نمونه داده جمعيت مقياسهاي اندازهگيري اين نوع مقياس اندازهگيري علاوه بر حفظ فاصله، نسبت را نيز حفظ ميكند. به عبارت ديگر در اين نوع اندازهگيري نسبت دو مقدار بستگي به واحد اندازهگيري ندارد. مقياس نسبتي:
آمار توصيفي: مقياسهاي اندازهگيري متغير نمونه جمعيت داده اطلاعاتي كه از مطالعه يك متغير به دست ميآيند، معمولا شامل انبوهي عدد يا علامت ميباشند كه آنها را داده ميناميم. دادهها را نسبت به نوع متغيري كه اندازه گيري ميكنيم به دو دسته داده گسسته و دادههاي پيوسته تقسيم ميكنيم. معمولا به دادههاي جمع آوري شده كه انبوهي عدد است و هيچ نوع پردازشی روي آنها انجام نشده است داده خام ميگويند. داده خام
آمار توصيفي: مقياسهاي اندازهگيري متغير نمونه جمعيت داده مواردي كه در ارتباط با يك مجموعه از دادههاي ميبايستي مد نظر قرار داد،عبارتاند از: • خلاصه كردن و توضيح دادهها به وسيله تنظيم جداول و رسم نمودارها. • محاسبه مقادير عددي، براي دست يافتن به معيارهايي كه تمركز و يا پراكندگي دادهها را نشان دهد. در آمار،براي اينكه از دادههاي خام واقعيتهاي موجود را استخراج كنيم،آنها را به نحوي مناسب دستهبندي كرده و جدولهايي به نام جدولهاي آماري تهيه مينماييم. متداولترين جدول در آمار، جدول فراواني است. پيش از آنكه نحوه تنظيم جدول فراواني را بيان نماييم،اطلاع از اصطلاحات زير ضروري است.
جدولهاي آماري: فراواني نسبي فراواني نسبي تجمعي فراواني تجمعي فراواني هرگاه داده از نوع ، با فرض ، به ترتيب با تعدادهاي تشكيل شده باشند،آنگاه را فراواني ميگوييم. به عبارت ديگر تعداد دفعاتي را كه در دادههاي تكرار ميشود، فراواني ميناميم و آن را با نماد نمايش ميدهيم. به خاطر داشته باشيد كه اگر اندازه نمونه برابر باشد، آنگاه براي
جدولهاي آماري: فراواني فراواني نسبي تجمعي فراواني تجمعي فراواني نسبي مثال: دادههاي زير ميزان تصادف منجر به مرگ رد 30 منطقه را نشان ميدهد. فراواني دادها را تعيين نماييد. 7 6 6 3 4 3 5 5 6 8 3 4 8 4 7 5 8 5 5 3 6 5 5 6 6 5 6 7 8 2 مشاهده ميشود كه دادههاي تكرار اعداد 2،3،4،5،6،7،8 ميباشند،بنابراين جدول زير را براي فراواني دادهها خواهيم داشت: 2 3 4 5 6 7 8 1 4 3 8 7 3 4 19 21 23 31
جدولهاي آماري: فراواني فراواني نسبي تجمعي فراواني تجمعي فراواني نسبي نسبت فراواني به اندازه نمونه را فراواني نسبي ميناميم. اگر فراواني در يك نمونه با اندازه n ، برابر باشد، آنگاه فراواني نسبي را با نماد نمايش خواهيم داد، به طوري كه: به خاطر داشته باشيد كه براي
0.033 0.133 0.100 0.267 0.233 0.100 0.133 2 3 4 5 6 7 8 2 3 4 5 6 7 8 1 4 3 8 7 3 4 جدولهاي آماري: فراواني فراواني نسبي تجمعي فراواني تجمعي فراواني نسبي 17
جدولهاي آماري: فراواني فراواني نسبي فراواني نسبي تجمعي فراواني تجمعي با توجه به تعريف فراواني، فراواني تجمعي رديف i را با نماد نمايش ميدهيم و به صورت زير تعريف ميكنيم: به خاطر داشته باشيد كه براي اندازه نمونه n و آنگاه
جدولهاي آماري: فراواني فراواني نسبي فراواني نسبي تجمعي فراواني تجمعي 1 5 8 16 23 26 30 2 3 4 5 6 7 8 2 3 4 5 6 7 8 1 4 3 8 7 3 4 17
به خاطر داشته باشيد كه براي اندازه نمونه n و آنگاه جدولهاي آماري: فراواني فراواني تجمعي فراواني نسبي فراواني نسبي تجمعي با توجه به تعريف فراواني نسبي، فراواني نسبي تجمعي رديف iرا با نماد نماد نمايش ميدهيم و به صورت زير تعريف ميكنيم:
جدولهاي آماري: فراواني فراواني تجمعي فراواني نسبي فراواني نسبي تجمعي 2 3 4 5 6 7 8 17
تعداد ارقام گرد شده جدولهاي آماري: فراواني فراواني نسبي تجمعي فراواني تجمعي فراواني نسبي مثال: معدل 50 دانشجوي دانشگاه با تقريب تا يك رقم اعشار، به شرح زير است: 1/2 9/1 6/1 2/2 1/2 2/2 4/2 8/1 5/1 9/2 8/1 3/2 8/1 7/1 3/2 3/2 0/2 5/2 1/2 6/2 8/1 1/2 9/1 7/1 7/1 0/2 9/1 2/2 6/2 4/1 9/2 4/2 8/1 9/1 2/2 2/2 5/2 0/2 0/2 0/2 4/1 5/2 9/1 8/1 6/1 4/2 9/2 9/1 6/1 4/1 تشکیل جدول فراوانی برای داده های پیوسته چون دادهها تا يك رقم اعشار گرد شدهاند، بنابراين ميتوان گفت كه اندازه واقعي معدلها در فاصله [1/35,2/95] 31
كلاس 55/1_35/1 75/1_55/1 95/1_75/1 15/2_95/1 35/2_15/2 55/2_35/2 75/2_55/2 95/2_75/2 جمع 08/0 20/0 44/0 62/0 78/0 90/0 94/0 00/1 _ 4 10 22 31 39 45 47 50 _ 08/0 12/0 24/0 18/0 16/0 12/0 04/0 06/0 00/1 45/1 65/1 85/1 05/2 25/2 2/45 65/2 85/2 4 6 12 9 8 6 2 3 50 جدولهاي آماري: فراواني فراواني نسبي تجمعي فراواني تجمعي فراواني نسبي تعداد طبقات 27 29
نمودارهاي آماري: • معمولا دادهها را با نمودارهاي مختلف نمايش ميدهند. عموما اين نمودارها در ارتباط با دادههاي پيو.سته به كار گرفته مي شود و منظور از نمايش آنها،تجسم عيني اطلاعات نهفته در دادهها است. در اين بخش به معرفي چند نمودار معروف اكتفا ميكنيم: • هيستوگرام • چندبر فراواني • چندبر فراواني تجمعي • منحنيهاي فراواني و فراواني تجمعي • نمايش نمودار تنه و شاخه • نمودار جعبهاي
نمودارهاي آماري: نمايش نمودار تنه و شاخه چندبر فراواني منحنيهاي فراواني و..... چندبر فراواني تجمعي هيستوگرام ارتفاع هر مستطيل برابر فراواني نسبي عرض مستطيل برابر طول واقعي كلاس 24/0 مركز هر مستطيل نماينده كلاس 12/0 04/0 55/1 75/1 95/1 15/2 35/2 55/2 95/2 75/2 15/1 35/1 15/3 25
نمودارهاي آماري: نمايش نمودار تنه و شاخه هيستوگرام منحنيهاي فراواني و..... چندبر فراواني تجمعي چندبر فراواني 24/0 12/0 04/0 55/1 75/1 95/1 15/2 35/2 55/2 95/2 95/2 75/2 25/1 35/1 05/3
از اتصال نقاطي كه طول آنها مرز كلاس و عرض آنها فراواني نسبي تجمعي تا آن مرز باشد، يك خط شكسته به دست ميآيد كه آن را چندبر فراواني تجمعي مينامند نمودارهاي آماري: نمايش نمودار تنه و شاخه چندبر فراواني هيستوگرام منحنيهاي فراواني و..... چندبر فراواني تجمعي 00/1 94/0 90/0 78/0 62/0 44/0 2/0 08/0 55/1 75/1 95/1 15/2 35/2 55/2 95/2 95/2 75/2 25/1 35/1 05/3 25
نمودارهاي آماري: چندبر فراواني تجمعي نمايش نمودار تنه و شاخه چندبر فراواني هيستوگرام منحنيهاي فراواني و..... نمودار منحني فراواني 1 نمودار منحني فراواني تجمعي
4/1 5/1 6/1 7/1 8/1 9/1 0/2 ½ 2/2 3/2 4/2 5/2 6/2 7/2 8/2 9/2 *** * *** *** ****** ****** ***** **** ***** *** *** *** ** *** 2 3 4 5 6 7 8 ** **** *** ******** ******* *** **** نمودارهاي آماري: منحنيهاي فراواني و..... چندبر فراواني تجمعي چندبر فراواني هيستوگرام نمايش نمودار تنه و شاخه فراواني
5 6 7 8 9 0 9 7 0 8 3 5 2 0 9 2 3 2 0 8 1 7 7 2 5 5 6 1 8 7 4 5 1 2 5 1 6 5 6 9 4 8 6 6 1 8 7 2 8 5 4 5 3 3 3 5 5 8 8 9 9 5 3 5 8 5 8 1 7 2 9 2 8 0 4 6 3 5 5 3 0 4 7 9 نمودارهاي آماري: منحنيهاي فراواني و..... چندبر فراواني تجمعي چندبر فراواني هيستوگرام نمايش نمودار تنه و شاخه نمرات 80 دانشجو در امتحانات نهايي درس احتمال و آمار به شرح زير است: 93 76 88 62 90 68 82 75 84 68 75 85 59 71 93 60 73 88 79 73 72 63 78 95 62 74 87 75 65 61 60 68 74 69 77 94 75 82 78 66 71 83 79 60 95 75 61 89 78 99 75 71 65 76 85 78 97 67 62 79 74 50 76 62 78 88 57 73 80 65 77 85 75 76 63 72 81 73 67 86 تنه شاخه
5 6 7 8 9 9 7 0 9 8 8 7 6 5 5 5 3 3 2 2 2 2 1 1 0 0 0 9 9 9 8 8 8 8 8 7 7 6 6 6 6 5 5 5 5 5 5 5 4 4 4 3 3 3 3 2 2 1 1 1 9 8 8 8 7 6 5 5 5 4 3 2 2 1 0 9 7 5 5 4 3 3 0 نمودارهاي آماري: منحنيهاي فراواني و..... چندبر فراواني تجمعي چندبر فراواني هيستوگرام نمايش نمودار تنه و شاخه پس از ساختن نمودار اوليه معمولا بهتر است مقادير هر شاخه را از كوچك به بزرگ، با تعداد دفعات تكرار،مرتب كرد، به صورت زير:
معيارهاي مركزي: ميانگين ميانه نما چندكها با استفاده از جدول فراواني و رسم نمودارها ميتوانيم دادهها را به نحو مطلوبي تنظيم كرده و اطلاعات نهفته را تا حدودي مشخص كنيم. با اين حال براي ارايه يك گزارش مناسب،بهتر است آنها را در يك يا چند عدد مناسب نيز خلاصه كنيم. چنين عددي ميتواند معيار مركزي باشد. مهمترين معيارهاي مركزي ميانگين، ميانه و نما است كه در بخش این به شرح هر يك از آنها خواهيم پرداخت. هرگاه داده از نوع ، با فرض ، به ترتيب با تعدادهاي تشكيل شده باشند، آنگاه را فراواني ميگوييم.
معيارهاي مركزي: ميانگين نما چندكها ميانه اگر دادهها را از كوچك به بزرگ مرتب نماييم،عدد mرا ميانه اين دادهها ميناميم،اگر نصف دادهها در سمت چپ و نصف داده در سمت راست اين عدد قرار گيرد محاسبه ميانه براي دادههاي گسسته فرض كنيد دادههاي ما باشند و شكل مرتب شده آنها را با نمايش دهيم آنگاه اگر nفرد باشد M= اگر n زوج باشد
معيارهاي مركزي: ميانگين نما چندكها ميانه محاسبه ميانه براي دادههاي پيوسته كلاس 55/1_35/1 75/1_55/1 95/1_75/1 15/2_95/1 35/2_15/2 55/2_35/2 75/2_55/2 95/2_75/2 جمع 4 10 22 31 39 45 47 50 _ 45/1 65/1 85/1 05/2 25/2 2/45 65/2 85/2 4 6 12 9 8 6 2 3 50 طول هر رده
معيارهاي مركزي: ميانه ميانگين نما چندكها • چندك يك معيار كليتر از ميانه است و درعنوان حالت خاص ميانه را نيز در بر ميگيرد. اگر pيك عدد حقيقي بين صفر و يك باشد،آنگاه عدد را چندك مرتبه p ميناميم هر گاه p 100% • دادهها سمت چپ و (p -1) 100% دادهها سمت راست باشند. • چندكهاي معروف عبارتند از : • چاركها • چاركها به ازاي 75/0 ، 5/0 ، 25/0 =p به دست ميآيند و آنها را به ترتيب با نماد (چارك اول)، (چارك دوم) و (چارك سوم)نشان ميدهند. دهكها دهكها به ازاي 9/0، .....،2/0 ،1/0=p به دست ميآيند و آنها را به ترتيب با نماد (دهك اول)، (دهك دوم)،...... و (دهك نهم) نشان ميدهند. صدكها صدكها به ازاي 99/0،.....02/0، 01/0=p به دست ميآيند و آنها را به ترتيب با نماد (صدك اول)، (صدك دوم)،.....و (صدك نود و نهم) نشان ميدهند.
معيارهاي مركزي: ميانه ميانگين نما چندكها محاسبه چندك براي دادههاي گسسته فرض كنيد دادههاي ما باشند و شكل مرتب شده آنها را با نمايش دهيم. براي محاسبه چندك صحيح باشد صحيح نباشد
نمودارهاي آماري: ميانه ميانگين نما چندكها محاسبه چندك براي دادههاي پيوسته كلاس با توجه به ستون فراواني تجمعي در جدول فراواني، كلاسي را كه چندك در آن قرار دارد مشهص ميكنيم. 45/1 65/1 85/1 05/2 25/2 2/45 65/2 85/2 4 6 12 9 8 6 2 3 50 4 10 22 31 39 45 47 50 _ 55/1_35/1 75/1_55/1 95/1_75/1 15/2_95/1 35/2_15/2 55/2_35/2 75/2_55/2 95/2_75/2 جمع
نمودارهاي آماري: چندكها ميانه ميانگين نما محاسبه نما براي دادههاي گسسته دادهاي كه فراواني آن نسبت به ديگر دادهها بيشتر باشد، نما يا مد ناميده ميشود و آن را با نماد Mنمايش ميدهيم. براي به دست آوردن نما، نخست فراواني دادهها را پيدا ميكنيم و دادهاي را كه فراواني آن بيشتر باشد، به عنوان نما اختيار ميكنيم و اگر دو داده، داراي فراواني يكسان و بيش از ديگر فراوانيها باشند، هر دو را به عنوان نما اختیار ميكنيم و دادهها را دو نمايي ميگوييم، به شرط آن كه اين دو داده در يك صف غير نزولي،كنار هم نباشند. در صورتي كه اين دو داده در يك صف غير نزولي،كنار هم باشند نصف مجموع آنها را به عنوان نما اختيار ميكنيم. اگر تمام داده داراي فراواني يكسان باشند،ميگوييم دادهها بدون نما هستند. به ياد داشته باشيد كه نما، به عنوان يك معيار تمركز در دادههاي گروهي به كار گرفته ميشود.
نمودارهاي آماري: چندكها ميانه ميانگين نما مثال: براي دادههاي 2، 2، 5، 7، 9، 9، 9، 10، 10، 11، 12و 18 نما برابر 9=M است، زيرا فراواني داده 9 بيش از فراواني ديگر دادهها است. مثال: براي دادهها 2، 3، 4، 4، 4، 5، 5، 7، 7، 7و 9، دو داده 4 و 7 به عنوان نما اختيار ميشوند، زيرا فراواني اين دو داده، بيش از فراواني دادههاي ديگر است. مثال: براي دادههاي 3، 5، 8، 10، 12، 15و 16، نما وجود ندارد، زيرا تمام دادهها داراي فراواني يكسان هستند. مثال: براي دادهها 2، 3، 4، 4، 4، 5، 5، 5، 7، 7و 9دو داده 4و 5 را كه داراي بيشترين فراواني هستند به عنوان نما بر ميگزينيم،اما از آنجا كه اين دو داده در يك صف غير نزولي در كنار يكديگر قرار دادند،نصف مجموف دو داده به عنوان نما اختيار ميشود، يعني 5/4=M.
نمودارهاي آماري: چندكها ميانه ميانگين نما محاسبه تما براي دادههاي پيوسته كلاس از روي جدول ملاحظه ميشود كه فراواني رده 95/1_75/1 داراي بيشترين فراواني است بنابراين به عنوان رده نما در نظر ميگيريم. 45/1 65/1 85/1 05/2 25/2 2/45 65/2 85/2 08/0 12/0 24/0 18/0 16/0 12/0 04/0 06/0 00/1 55/1_35/1 75/1_55/1 95/1_75/1 15/2_95/1 35/2_15/2 55/2_35/2 75/2_55/2 95/2_75/2 جمع 4 6 12 9 8 6 2 3 50 12/0-24/0 18/0-24/0
معيارهاي پراكندگي: با وجود این كه در بسیاری از موارد، میانگین توصیف نسبتا كاملي از مجموعه دادهها ارائه ميدهد، اما گاهي وجود اطلاعات بیشتر در مورد دادهها ضروری است. يك مفهوم مهم در ارتباط با دادههاي آماری، ميزان تغييرات آنهاست،بدين معني كه اندازهگيريها تا چه اندازه از فردي به فرد ديگر يا شيي به شيي ديگر تغيير ميكنند. در اين بخش، به بررسي و محاسبه ميزان تغيرات به عنوان معیارهای پراکندگی خواهيم پرداخت. مهمترین معیارهای پراكندگي عبارتند از دامنه، ميانگين انحراف ها از میانگین يا از میانه، ميان دامنه چاركها، دامنه صدكي، واريانس و انحراف معيار است. علاوه بر مطالب فوق، در اين بخش دادههاي استاندارد و ضريب تغيرات را نيز معرفی خواهیم كرد.
معيارهاي پراكندگي: اگرچه دامنه يك وسيله ساده براي اندازهگيري اختلاف و پراكندگي در يك سري از دادهها است، اما در بيشتر موارد رضايتبخش نيست. دادههاي بسيار بزرگ يا بسيار كوچك مانع از آنند كه دامنه، معرف واقعي ميزان انحراف باشد. در چنين مواردي، واريانس يك معيار مورد قبول همگان به شمارميرود. با توجه به اينكه در محاسبه واريانس دادهها را مربع ميكنيم، بدين جهت ريشه دوم مثبت آن را كه انحراف معيار يا انحراف استاندارد ميناميم، به عنوان يك معيار پراكندگي بر مبناي مقياس اندازهگيري به كار ميبريم. ضريب تغيير عبارت است از اندازه نسبي انحراف معيار در مقايسه با ميانگين. ضريب همبستگي به واحد اندازهگيري وابسته نيست و براي مقايسه جمعيتهاي يكسان به كار ميرود. در مقايسه هر اندازه كه ضريب تغيير ويژگي جمعيتي كمتر باشد،ويژگي آن چمعيت بهتر ارزيابي ميشود.
معيارهاي پراكندگي: اگر نمايانگر دادههاي خام باشند، براساس جدول فراواني تا از ها برابر ، تا برابر ،.......و تا برابر است. ميدانيم كه و به ترتيب ميانگين و انحراف معيار داده است. اگر از هر داده را كم و بر تقسيم كنيم ، يعني دادههاي استاندارد آنگاه با فراوانيهاي به ترتيب را دادههاي استاندارد ميناميم. به سادگي ميتوان نشان داد كه دادههاي استاندارد داراي ميانگين برابر با صفر و واريانس برابر با يك 1 هستند و به واحد اندازهگيري بستگي ندارند.
معيارهاي پراكندگي: چون ، بنابراين نتيجه ميگيريم كه دانشجويان در امتجان دوم نمرات مطلوبتري را كسب كردهاند. ب) براي مقاسه، ابتدا نمرات دانشجو را استاندارد ميكنيم چون ، بنابراين نمره آزمون دوم دانشجو د رمقايسه از موقعيت بهتري برخوردار است.
معیارهای پراکندگی • فرض كنيد يك دسته از دانشجويان در دو امتحان شركت كردهاند و خلاصه نتاسج آزمونها به شرح زير است. • آزمون اول: ميانگين نمرات برابر 60، انحراف معيار برابر 6، ماكزيمم نمره از 100 • آنمون د.م: ميانگين نمرات 700، انحراف معيار برابر 7، ماكزيمم نمره از 1000 • الف- چگونه اين دو نتيجه را با هم مقيسه و ارزيابي ميكنيد؟ • ب- اگر دانشجويي در آزمون اول نمره 65 و در آزمون دوم نمره 720 را كسب كرده باشد، وضعيت دانشجو در كدام آزمون مطلوبتر است؟ • حل: الف) با محاسبه ضريب تغيير دو آزمون معلوم ميشود كه
منحنيهاي فراواني: پخ نامتقارن/ چوله به چپ نامتقارن/ چوله به راست منحنيهاي فراواني در طبيعت تنوع زيادي دارند، اما بسياري از منحنيهاي فراواني تك نمايي يا متقارن هستند يا چوله و يا برجسته و يا پخ. ايده آلترين منحني فراواني متقارن، منحني فراواني نرمال استاندارد است. براي منحنيهاي فراواني كاملا متقارن تك نمايي مقادير ميانگين،ميانه و نما بر هم منطبق ميشوند. در طبيعت،عموما منحني فراواني متقارن ايده آل كمتر يافت ميشود و بسياري از منحنيهاي فراواني موجود در طبيعت نامتقارن برجسته يا پخ هستند. ميزان انحراف از تقارن ايده آل را معمولا با دو معيار چولگي و برجستگي ميسنجند. برجسته منحني نرمال استانداد
ضریب چولگی اول پیرسن منحنيهاي فراواني: به راست يا مثبت چولگي: به چپ يا منفي معیار اندازه گیری چولگی:
ضریب برحستگی صدکی ضریب برحستگی صدکی منحنيهاي فراواني: میزان کشیدگی یا پخی منحنی فراوانی را یسبت به منحنی نرمال استاندارد، برجستگی منحنی فراوانی می نامیم. فرمول زیر را می توان به عنوان معیار برجستگی به کار برد. نشان داده شده است که برای منحنی فراوانی نرمال استاندارد k=0.263 ، بنابراین معمولا ضریب برجستگی را به صورت زیر تعریف می کنند: برحسب آن که این مقدار مثبت یا منفی باشد گوییم منحنی فراوانی برجسته یا پخ است.