3.6k likes | 4.01k Views
آمار مقدماتی و پیشرفته مدرس: دکتر بریم نژاد دانشیار واحد کرج. آمار چیست؟
E N D
آمار مقدماتی و پیشرفتهمدرس: دکتر بریم نژاددانشیار واحد کرج
آمار چیست؟ • آمار به عنوان يك موضوع علمي، امروزه شامل مفاهيم و روشهائي است كه در تمام پژوهشهايي كه مستلزم جمعآوري دادهها به وسيلة يك فرآيند آزمايش و مشاهده و انجام استنباط و نتيجهگيري به وسيلة تجزيه و تحليل اين دادهها هستند، اهميت بسيار دارند. • آمار هنر و علم جمعآوري، تعبير و تجزيه و تحليل دادهها و استخراج تعميمهاي منطقي در مورد پديدههاي تحت بررسي است. • معادل كلمة آمار در زبان انگليسي Statisticsاست كه از لحاظ تاريخي، از كلمة لاتينstatusمشتق شده و يكي از معاني كلمة اخير، دولت است. • در طول چندين دهه، آمار فقط با بيان اطلاعات و مقادير عددي دربارة اقتصاد، جمعيت شناسي و اوضاع سياسي حاكم در يك كشور، سر و كار داشت. • حتي امروز، بسياري از نشريات و گزارشهاي دولتي كه تودهاي از آمار و ارقام را در بردارند و تحت عناويني از قبيل « آمار توليد مزارع» و «آمار كارگران» منتشر ميشوند، معني اولية كلمة آمار را در ذهن زنده ميكنند. اكثر افراد معمولي هنوز اين تصور غلط را دربارة آمار دارند كه آن را منحصر به ستونهاي عددي سرگيجهآور و گاهي يك سري شكلهاي مبهوتكننده ميدانند. • بنابراين، يادآوري اين نكته ضروري است كه نظريه و روشهاي جديد آماري، از حد ساختن جدولهاي اعداد و نمودارها بسيار فراتر رفتهاند. نمايشهاي عددي به صورت جنبهاي فرعي از آمار درآمدهاند.
ديدگاههاي زير را درمورد آمار بخوانيد.آيا علم آمار اينگونه است؟ دیدگاههایی درمورد آمار: • تهيه آمار كاري وقتگير و زمان بر و اصولاً كسالتآور است. • آمار گورستاني از اعداد و ارقام است كه در هر اداره و سازمان نمونهاي از آن پيدا ميشود. • آمار مجموعهاي از روابط و فرمولهاي رياضي پيچيده و گيجكننده است. آمار شامل نمودارها و جدولهايي از اعداد است.
آمار فرايندي است كه در آن هر ده سال افرادي را به منازل فرستاده و اطلاعات خانوارها مانند تعداد فرزندان، سن افراد خانوار را از آنها كسب ميكنند. • آمار ابزاري است كه بسياري با توسل به آن افكار عمومي را به نفع خود جلب ميكنند. • آمار مفهومي است كه براي ثبت و نمايش اطلاعات عددي به كار ميرود، مانند تعداد بيكاران، كارمزد حمل كالا به وسيلة كشتي در 15 سال گذشته، جمعيت نواحي جنوب شهر تهران، تعداد افراد تلف شده در اثر شيوع يك بيماري يا مقدار مسافت طي شده در زمان معيني به وسيلة برندة مسابقة دو.
مثالهائي از مطالعات آماري: مثالهای زیر، نشاندهندة مواردي نوعي هستند كه در آنها، فرايند كسب آگاهي در بررسي يك پديده شامل گردآوري و تجزيه و تحليل دادههاست و اين خود مستلزم استفاده از روشهاي آماري است. پرورش گياه : • آزمايش پيوندزدن انواعي از گياهان كه از نظر ژنتيكي متفاوتند، بهمنظور توليد گياهان پيوندي پر محصول، مورد علاقة شديد متخصصان كشاورزي است. بهعنوان يك مثال ساده، فرض كنيد كه قرار است ميزان محصول دو نوع گياه پيوندي تحت آب و هوا و شرايط اقليمي مشخص با هم مقايسه شوند. تنها راه كسب اطلاع از ميزان باروري اين دو نوع گياه نسبت بهيكديگر عبارت است از پروراندن آنها در تعدادي از كرتها، گردآوردن دادهها دربارة ميزان محصول آنها و سپس تجزيه و تحليل دادههاي مزبور.
تشخيص بيماريها • براي انجام موفقيتآميز معالجة بسياري از انواع سرطان با عمل جراحي، تشخيص بموقع بيماري از اهميت خاصي برخوردار است و از اينرو لازم است كه براي انجام معاينات پزشكي مرتباً به بيمارستان مراجعه شود. چون مراجعة مرتب به بيمارستان و انجام معاينات پزشكي گران و مشكل است، پزشكان در جستجوي نوعي روش تشخيص مؤثر بيماري هستند كه خود شخص بتواند آن را انجام دهد. براي ارزيابي قابليت يك روش جديد تشخيص بيماري برحسب درصد موفقيت آن در تشخيص درست موارد بيماري و اجتناب از تشخيصهاي اشتباه، روش موردنظر بايد روي افراد زيادي آزمايش شود و نتيجه با معاينات بيمارستاني مقايسه شود. برنامههاي تربيتي و آموزشي • برنامهاي تربيتي وآموزشي كه براي انواع متقاضيان(از قبيل دانشجويان دانشگاه، كارگران كارخانه، گروههاي اقليت، افراد ناقصالعضو، كودكان عقبافتاده) در بسياري از زمينهها طرح ميشوند، دائماً مورد بررسي، ارزيابي و اصلاح قرار ميگيرند تا سودمندي آنها براي جامعه افزايش يابد. براي كسب اطلاع از كارائي برنامههاي مختلف در مقايسه با يكديگر، ضرورت دارد كه دادههائي دربارة موفقيتها يا رشد مهارت افرادي كه برنامه در مورد آنها اجرا ميگردد، گردآوري شود.
تحقيقات اجتماعي- اقتصادي: در بسياري از قلمروهاي جامعهشناسي، اقتصاد، علوم سياسي. مطالعاتي در زمينههاي مربوط به رفاه اقتصادي گروههاي قومي گوناگون. هزينههاي مصرفكنندگان در سطوح مختلف درآمد و نظرات گوناگون در هنگام وضع يك قانون و زمينههايي نظير اينها انجام ميگيرد. اين مطالعات نوعاً بر مبناي دادههايي انجام ميگيرند كه از راه مصاحبه يا تماس با نمونهاي از افراد بهدست ميآيند، كه اين نمونه به وسيلة روشهاي آماري از كل جامعهاي كه قلمرو مطالعه را تشكيل ميدهد، انتخاب ميشوند. سپس اين دادهها مورد تجزيه و تحليل قرار ميگيرند و تغييراتي از موضوع مورد نظر به عمل ميآيد. بازاريابي: با گسترش صنايع مختلف و بحث بازار رقابتي در قرن بيست و یک بسياري از صنايع به دنبال يافتن روشهائي در شناسائي بازار و خواستههاي مشتري به طريق علمي گرديدهاند. نتايج حاصل همواره با استفاده از مطالعات آماري روي مشتريان و يا مراكزي كه مشتري با آنها در ارتباط است صورت ميپذيرد. بهعنوان مثال يك شركت توليدكنندة پودر لباسشوئي پس از تحقيق دربارة ميزان فروش فروشگاههاي يك منطقه سهم فروش پودر ... را درمييابد. پس از اعمال تبليغات جديد و به فاصلة زماني مناسب اينكار مجددا صورت گرفته و سهم افزايش فروش بررسي ميگردد. و يا در همين مقوله براي كسب اطلاع از اينكه در توليد مايع ظرفشوئي آيا از لحاظ مصرفكنندگان، بوي اسانس ليمو با توتفرنگي تفاوتي وجود دارد، از 400 نفر مصاحبه ميشود كه 145 نفربوي اسانس ليمو و بقيه توتفرنگي را ترجيح ميدهند. كنترل كيفيت: پيشرفتهاي آماري در بخش صنايع بيشتر مربوط به مسائل كنترل كيفي است. استفاده از مفهوم آزمون فرضهاي آماري در بحث كنترل حين توليد محصولات توليدي، استفاده از روشهاي نمونهكيري جهت پذيرش براي شناسائي محصول مطابق درخواست با استفاده از يك نمونه از محصول به جاي بازرسي صددرصد و استفاده از ابزارهاي ساده آماري در كنترل فرآيند آماري (Statistical Process Control ) مانند هيستوگرام، نمودار پراكنش، نمودار ميلهاي و استفاده از بحث طراحي آزمايشهاي مناسب و جمعآوري اطلاعات و بسياري روشهاي آماري كه به صور مختلف مورد استفاده واقع ميشوند بخشي از تلاش مسئولين كيفي صنايع را به خود اختصاص داده است.
آمارشناسها چه میکنند؟ جهان به سوی کمی شدن اطلاعات پیش می رود. در بسیاری از حرفهها و شغلها، تصمیمگیریها به اندازهگیریهای عددی و داده بستگی دارند. داده ها تنها شامل اعداد نیستند، بلکه اعداد خود حامل اطلاعاتی در مورد یک سیستم مشخص هستند و احتیاج دارند که در سیستم مربوطه تفسیر شوند. با توجه به این رشد در استفاده از دادهها، نیاز و تقاضا برای وجود آمارشناسهایی که در زمینههای زیر کارشناس باشند، احساس می شود: • ارائه و تولید دادههای قابل اعتماد • تجزیه و تحلیل دادهها به منظور روشن و واضح ساختن معنای آنها • ارائه استنتاجهای عملی از دادهها آمارشناسها از تواناییهای کمّی، علم آمار و مهارتهای روابط عمومی وبرقراری ارتباط برای حل بسیاری از مشکلات و مسایل موجود در جامعه استفاده میکنند. آمارشناسها در تعیین روشهای نمونهگیری و جمعآوری دادهها، نظارت بر اجرای مطالعه، پردازش دادهها و نظر دادن درمورد نتایج مطالعات بدستآمده کمک میکنند.
فعالیت آمارشناسها در زمینه مطالعه و بررسی نمونهای • فعالیت آمارشناسها در مراکز دولتیبرخی زمینههای فعالیت برای آماریها در مراکز دولتی • فعالیت آمارشناسها در زمینه پژوهشهای علمی • فعالیت آمارشناسها در زمینه صنعت و تجارت • برخی زمینههای فعالیت برای آماریها در صنعت و تجارت • فعالیت آمارشناس ها در زمینه بهداشت، پزشکی و سلامت
مشخصههای شغلی آمارشناسها • استفاده از دادهها برای حل مشکلات و مسایل • استفاده از دانش ریاضی و آمار خود در حل مشکلات اجتماعی، اقتصادی، پزشکی، زیست محیطی، سیاسی و ... • کارکردن هم به صورت انفرادی و هم به صورت عضوی از یک گروه • استفاده از علم ارتباطات در برقراری رابطه با متخصصین علوم دیگر و مشورت با آنها و ادامه دادن مستمر فعالیتهای آموزشی • گسترش مرزها و قلمرو آمار و احتمال از طریق آموزش و تحقیق
سواد آماری چیست؟ سواد آماری یک توانایی/قابلیت است: • توانایی فکر کردن منتقدانه درمورد استدلالها با به کار بردن آمار به عنوان سند یا مدرک • قابلیت خواندن و تفسیر دادهها، قابلیت فهم آنچه که خوانده میشود. • توانایی فهم و تفسیر آمارهایی که هر فرد در زندگی روزمره با آنها سروکار دارد. • توانایی استفاده صحیح از آمار توسط همه افراد جامعه سواد آماری، بر تصمیمگیریها با استفاده از آمار به عنوان سند و مدرک متمرکز شده است، همانگونه که سوادخواندن و نوشتن بر استفاده از کلمات به عنوان مدرک متمرکز شده است. سواد آماری بیشتر درمورد سؤالات است تا جوابها. سوادآماری جوابهای زیادی ندارد. اما میتواند کمک کند تا سؤالات بهتری پرسش شود و در نتیجه تصمیمها و قضاوتهای بهتری صورت گیرد. سواد آماری یک هنر است، هنر تصمیمگرفتن و قضاوت کردن تحت شرایط نامطمئن.
با سواد آماری کیست؟ • با سواد آماری کسی است که قادر باشد تفاوت بین رابطه معمولی و رابطه علت و معلولی را از یکدیگر تشخیص دهد. • او کسی است که وقتی با جملاتی همانند جملات زیر روبرو میشود، درست یا غلط بودن جمله دوم را مدرکی مستند برای درست یا غلط بودن جمله سوم نداند: جمله اول: افرادیکه وزن بیشتری دارند بلندقدتر از افرادی هستند که وزن کمتری دارند. جمله دوم: وزن یک رابطه مثبت با قد دارد. جمله سوم: اگر شما وزن بیشتری بدست آورید، انتظار میرود که قدتان نیز بلندتر شود. • واضح است که برای بزرگسالان جمله سوم غلط است. اما نمیتوان نتیجه گرفت که اگر جمله سوم غلط باشد آنگاه جمله دوم نیز غلط خواهد بود. درستی جمله دوم مدرکی است برای درستی جمله سوم، اما درستی جمله دوم برای اثبات درستی جمله سوم کافی نیست.
با سواد آماری کیست؟ (ادامه) • با سواد آماری کسی است که قادر باشد تفاوت بین عبارت “نسبت دادنی” را از عبارت “نسبت داده شده” تشخیص دهد .مثال90درصد خودکشی ها را افراد متاهل مرتکب می شوند. این آمار به افراد متاهل نسبت داده شده است، اما این بدین معنا نیست که اگر افراد ازدواج نکنند این نسبت کاهش خواهد یافت. • با سواد آماری کسی است که فرق آماری که بر اساس نمونه به دست آمده را از پارامتر جمعیت تشخیص دهد. • باسواد آماری کسی است که بتواند برداشت درستی از درصدها، میزان ها و نرخ ها داشته باشد مثال: درصد رانندهها در میان زنان همانند درصد راننده هایی که زن هستند، نیست. درصد بیمارانی که نتیجه آزمایش آنها در مورد نوعی بیماری مثبت است همانند درصد افرادی که نتیجه آزمایش مثبت دارند و بیمار هستند، نیست.
تعریف هر تیمار (متغیر) تاحد امکان به صورت ویژه
کدگذاری برای دادههای قیاسی یعنی تعیین عدد برای هر طبقه یا دسته.جنسیتزن 1مرد 2
مشخص کردن روشن واحدهای اندازهگیری وزن شما چقدر است؟ (برحسب کیلوگرم، پوند، گرم) دیشب چند ساعت تلویزیون تماشا کردید؟ (ساعت، دقیقه)
نوشتن سؤالات بدون اریب با اریب: آیا شما موافقید که افزایش مصرف کود باعث کاهش عملکرد میشود؟ بدون اریب: نظر شما در مورد مصرف کود بر عملکرد محصول چیست؟
سؤالات خود را در یک مطالعة پیلوت قبل از انجام مطالعة اصلی امتحان نمایید (8 تا 10 مورد یا واحد از افراد، دانشآموزان، درختان و ...)
انواع دادهها دادههای قیاسی دادههای معیاری
دادههای قیاسی موضوعات و صفات مورد بررسی به طبقاتی بر اساس بعضی از صفات کیفی گروهبندی میشوند.
مثال: دادههای قیاسی رنگ مو بلوند، قهوهای، قرمز، سیاه، غیره نظر دانشجویان در مورد نحوة تدریس ناراحت، خنثی، خوشحال وضعیت سیگارکشیدن سیگاری، غیرسیگاری
طبقهبندی دادههای قیاسی به صورت:اسمی، ترتیبی و دوتایی دادههای قیاسی دادههای اسمی دادههای ترتیبی دودویی غیردودویی دودویی غیردودویی
دادههای اسمی یک نوع از دادههای قیاسی است که صفات در طبقههای غیرمرتب قرار میگیرند.
مثال: دادههای اسمی رنگ مو بلوند، قهوهای، مشکی، قرمز، غیره نژاد هندی، افریقایی، آمریکایی، غیره
دادههای ترتیبی نوعی از دادههای قیاسی میباشند که رتبة آنها مهم است
مثال: دادههای ترتیبی طبقه خیلی کم، کم، متوسط، زیاد، خیلی زیاد شدت بیماری نظر دانشجویان دربارة درس
دادههای دودویی شکلی از دادههای قیاسی که تنها دارای دو طبقه هستند. دادههای دودویی میتوانند یا اسمی یا ترتیبی باشند.
مثال: دادههای دودویی وضعیت سیگاری بودن سیگاری، غیرسیگاری حضور حاضر، غایب
دادههای سنجشی اهداف مورد مطالعه بر اساس بعضی از صفات کمی قابل اندازهگیری میباشند. دادهها به صورت اعداد میباشند.
مثال: دادههای سنجشی سطح کلسترول قد سن میزان عملکرد تعداد دانشجویانی که درکلاس دیر حاضر میشوند. زمان لازم برای انجام تکالیف درسی در منزل
دادههای سنجشی تقسیم میشوند بهگسسته یا پیوستهDiscrete or Continuous دادههای سنجشی گسسته پیوسته
دادههای سنجشی گسسته تنها مقادیر معینی را خواهند داشت (شکافی بین مقادیر ممکن وجود دارد) دادههای سنجشی پیوسته از نظر تئوریک، هر مقداری در درون یک فاصله را میتوان با ابزارهای اندازهگیری دقیق محاسبه نمود.
دادههای گسسته - شکاف بین مقادیر ممکن 0 1 2 3 4 5 6 7 دادههای پیوسته - از نظر تئوریکی هیچ شکافی بین مقادیر ممکن وجود ندارد 0 1000
مثالهادادههایی با معیارهای گسسته نمرات آمار تعداد دانشجویانی که دیر به کلاس میآیند تعداد جرائمی که به مراکز پلیس گزارش شده است. تعداد دفعاتی که از یک کلمه استفاده میشود. عموماً دادههای گسسته قابل شمارش هستند.
مثالها:دادههای معیاری پیوسته سطح کلسترول قد سن زمان لازم برای انجام تکالیف مدرسه عموماً دادههای پیوسته از اندازهگیری بدست میآیند
انواع دادههای جمعآوری شده در یک مطالعه تعیینکنندة نوع تحلیل آماری مورد استفاده میباشد
برای مثال ... دادههای قیاسی عموماً با استفاده از درصد (یا نسبتها) خلاصه میشوند. 11درصد دانشجویان دارای خالکوبی میباشند. 2٪، 33٪،39٪ و 26٪ دانشجویان درکلاس به ترتیب جدیدالورود، سال دوم، سال سوم و سال چهارم
و برای مثال ... دادههای معیاری به طور مثال با استفاده از متوسط (یا میانگین) خلاصه میشوند. متوسط وزن مردان در بین 250 دانشجوی درس آمار در پاییز 1387، 173 پوند است متوسط وزن زنان در بین 250 دانشجوی درس آمار در پاییز 1387، 138 پوند است
آمار توصیفی توصیف دادهها با اعداد معیارهای مکانی
چه چیزی توصیف میشود؟ • مکان یا مرکز دادهها چیست؟ (معیارهای مکانی) • دادهها چگونه تغییر میکنند؟ (معیارهای تغییرپذیری)
معیارهای مکانی • میانگین • میانه • مد
میانگین • نام دیگر متوسط • اگر میانگین یک جمعیت را توصیف کنیم با نمایش داده میشود. • اگر میانگین نمونه را توصیف کنیم با x-bar نمایش داده میشود. • مناسب برای توصیف دادههای سنجشی • به میزان زیادی تحتتأثیر مقادیر غیرمعمول که «برونهشت» یا outliers نام دارند، قرار میگیرد.
محاسبة میانگین نمونه فرمول: یعنی جمع تمام دادهها و تقسیم به تعداد آنها
میانه • نام دیگر برای صدک 50ام • مناسب برای توصیف دادههای سنجشی • مناسب برای دادههای برونهشت، یعنی تحتتأثیر مقادیر غیرمعمول قرار نمیگیرد.
محاسبة میانة نمونه مرتب کردن دادهها از کوچک به بزرگ اگر تعداد دادهها فرد باشد، میانه مقدار وسط میباشد. دادهها: 2 8 3 4 1 دادههای مرتب شده: 12 3 4 8 میانه
محاسبة میانة نمونه مرتب کردن دادهها از کوچک به بزرگ اگر تعداد دادهها زوج باشد، میانه متوسط دو مقدار وسطی است دادهها:2 8 3 4 1 8 دادههای مرتب شده: 12 3 4 8 8 میانه= (3+4)/2 = 3.5
مد • مقادیری که بیشترین فراوانی را دارند. • یک مجموعه داده میتواند چندین مد داشته باشد • برای تمام انواع داده مناسب است اما بیشتر برای دادههای قیاسی یا دادههای گسسته با تعداد اندکی از مقادیر ممکن مفید است.