خوش آموز درخت تو گر بار دانش بگیرد، به زیر آوری چرخ نیلوفری را


آمار پایه (Basic Statistics)

آمار پایه (Basic Statistics)
نویسنده : امیر انصاری
آمار (Statistics) دانش جمع آوری داده ها و ترسیم نتایج آنها می باشد، به نحوی که داده ها به صورت عینی (objectively) - مبتنی بر حقایق - در یک روش بی طرفانه و قابل بازتولید، اندازه گیری گردند. یک آمار واحد یک نتیجه گیری است که از روی این داده ها ترسیم می گردد. در اینجا چند مثال داریم:

سیستم یکپارچۀ سازمانی راهکار



  • به طور متوسط افراد شاغل روزانه 3.7 فنجان قهوه می نوشند.
  • فقط 52% از افرادیکه وارد مدرسه حقوق می شوند، فارغ التحصیل می شوند.
  • گربه محبوبترین حیوان خانگی در ایالات متحده آمریکا می باشد.
  • در سال گذشته، هزینۀ یک تلویزیون باکیفیت به طور میانگین 575$ کاهش یافته است.

آمارگیران (Statisticians) کار خودشان را با شناسایی یک جمعیت (population) که تمایل به مطالعه اش دارند، انجام می دهند. جامعۀ افراد شاغل، جامعۀ دانشجویان حقوق، جامعۀ صاحبان حیوانات خانگی، جامعۀ خریداران لوازم الکترونیکی، و ... . از آنجا که بیشتر جوامع خیلی بزرگتر از آن هستند که بشود با آنها کار کرد، یک آمارگیر داده هایش را از یک نمونه جمعیتی کوچکتر که به صورت تصادفی از بین این جامعه گزینش کرده است، جمع آوری می کند. بخش عمده ای از نگرانی های آمار، جمع آوری داده های دقیق و قابل اعتماد است. برای کسب اطلاعات بیشتر در مورد این مسأله می توانید کتاب "آمار برای احمقها" (Statistics For Dummies) را مطالعه نمایید.

یادداشت مترجم: امیدوارم در آینده توفیقی حاصل گردد تا کتاب "آمار برای احمقها" (Statistics For Dummies) را نیز ترجمه کرده و از طریق سایت خوش آموز به رایگان در اختیار علاقه مندان قرار دهم.

در این بخش، یک مقدمۀ کوتاه از جنبه های ریاضی آمار را به شما ارائه می دهم.

درک تفاوت بین داده های کیفی و داده های کمی


داده ها (Data) - اطلاعاتی که در آمار استفاده می شوند - می توانند کیفی یا کمی باشند. داده های کیفی (Qualitative data)، یک منبع داده (data set) - نتایج نظرسنجی که شما جمع آوری کرده اید - را بر اساس یک ویژگی خاص به بخش های مجزا تقسیم می کنند. برای مثال، در یک کلاس از دانش آموزان، داده های کیفی می توانند شامل موارد زیر باشند:

  • جنسیت هر کودک
  • رنگ مورد علاقۀ او
  • آیا او حداقل یک حیوان خانگی دارد یا خیر
  • او چگونه به مدرسه رفت و آمد می کند

یادتان باشد: شما می توانید داده های کیفی را با توجه کردن به اینکه یک ویژگی - یعنی یک کیفیت - به هر کدام از اعضاء منبع داده متصل شده است، شناسایی کنید. برای مثال، چهار ویژگی اِما (Emma) اینست که او زن است، رنگ مورد علاقۀ او سبز است، او یک سگ دارد، و پیاده به مدرسه می رود.

از سوی دیگر، داده های کمی (quantitative data) شامل اطلاعات عددی می باشند - یعنی اطلاعاتی دربارۀ مقادیر. برای مثال، داده های کمی در همان کلاس مثال بالا، می تواند شامل موارد زیر باشد:

  • قد هر کودک در واحد اندازه گیری اینچ
  • وزن او در واحد پوند
  • تعداد خواهر و برادرهایش
  • تعداد کلماتی که او در آخرین امتحان املاء درست نوشته است

یادتان باشد: شما می توانید داده های کمی را با توجه به اینکه به هر عضو از منبع داده یک عدد متصل می باشد، شناسایی کنید. برای مثال، کارلوس (Carlos) قدش 55 اینچ است، وزنش 68 پوند است، سه خواهر و برادر دارد، و 18 کلمه را به درستی نوشته است.

کار کردن با داده های کیفی


داده های کیفی معمولاً یک نمونه را به تکه های مجزا تقسیم می کنند. در نمونۀ من - که کاملاً ساختگی است - از 25 دانش آموز در کلاس پنجم خواهر اِلِنا (Elena) استفاده می کنم. برای مثال فرض کنید، تمامی 25 کودک موجود در کلاس خواهر النا، سه سوال با پاسخ بله یا خیر موجود در جدول 1-19 را پاسخ داده اند.

آمار پایه (Basic Statistics)
ترجمۀ جدول:
Are you an only child: آیا شما تنها فرزند خانواده هستید؟
Do you own any pets: آیا حیوان خانگی دارید؟
Do you take the bus to school: آیا با اتوبوس به مدرسه می روید؟

دانش آموزان همچنین سوال "رنگ مورد علاقۀ شما چیست؟" را با نتایجی که در جدول 2-19 می بینید، پاسخ داده اند.

آمار پایه (Basic Statistics)
با وجود اینکه اطلاعاتی که هر دانش آموز ارائه کرده است، عددی نمی باشد، شما می توانید با شمارش تعداد پاسخ های مشترک دانش آموزان، این اطلاعات را به صورت عددی مدیریت کنید، و با این اعداد کار کنید.

با توجه به این اطلاعات، شما هم اکنون می توانید صرفاً با خواندن جدول ها، اظهارات آگاهانه ای در مورد دانش آموزان این کلاس، بیان کنید. برای نمونه:

  • دقیقاً 20 دانش آموز حداقل یک برادر یا خواهر دارند.
  • نُه دانش آموز با اتوبوس به مدرسه نمی آیند.
  • تنها یک دانش آموز داریم که رنگ مورد علاقه اش زرد است.

کار با درصدها (percentages)


شما می توانید با پیدا کردن درصد نمونه هایی که ویژگی خاصی دارند، اظهارات آماری پیچیده تری را در مورد داده های کیفی بیان کنید. در اینجا چگونگی انجام این کار را بیان می کنیم:

  1. بیانیه ای بنویسید که شامل تعداد اعضاء دارای آن ویژگی و نیز تعداد کل نمونه ها باشد.

    فرض کنید می خواهید بدانید چند درصد از دانش آموزان کلاس خواهر النا، تنها فرزند خانواده هستند. جدول به شما می گوید که، 5 دانش آموز خواهر و برادر ندارند، و شما می دانید که 25 دانش آموز در کلاس هستند. بنابراین شما می توانید شروع به پاسخ دادن به این سوال به شرح زیر کنید:

    پنج تا از 25 دانش آموز کلاس تنها فرزند خانواده هستند.

  2. این بیانیه را مجدداً بنویسید، اعداد را به کسر تبدیل کنید:

    آمار پایه (Basic Statistics)
    Number who share attribute: تعداد دانش آموزان دارای ویژگی مشترک
    Number in sample:تعداد کل موجود در نمونه

    در این مثال 5/25 از دانش آموزان تنها فرزند خانواده شان هستند.

  3. با استفاده از روشی که در فصل 12 یاد گرفتید، کسر را به درصد تبدیل کنید.

    از آنجا که:

    آمار پایه (Basic Statistics)
    بنابراین، 20% از دانش آموزان تنها فرزند خانواده شان هستند.

به طرز مشابهی، فرض کنید می خواهید بدانید چند درصد از دانش آموزان با اتوبوس به مدرسه می روند. این بار جدول به شما می گوید که 16 دانش آموز با اتوبوس می روند، پس می توانید بیانیه زیر را بنویسید:

شانزده نفر از 25 دانش آموز با اتوبوس به مدرسه می روند.

حالا این بیانیه را به شکل زیر بازنویسی کنید:

16/25 از دانش آموزان با اتوبوس به مدرسه می روند.

در نهایت این کسر را به درصد تبدیل کنید.
16 ÷ 25 = 0.64
0.64 = 64%

پس 64% از دانش آموزان با اتوبوس به مدرسه می روند.

پیدا کردن مُد (mode)


مد (mode) رایجترین پاسخ به یک سوال آماری را به شما می گوید. به عنوان مثال در نظر سنجی کلاس خواهر النا، (جدول 1-19 و جدول 2-19 را ببینید) گروههای مد (mode groups) بچه هایی هستند که:

  • حداقل یک خواهر یا برادر دارند (20 دانش آموز)
  • حداقل یک حیوان خانگی دارند (14 دانش آموز)
  • با اتوبوس به مدرسه می روند (16 دانش آموز)
  • رنگ آبی را به عنوان رنگ محبوبشان انتخاب کرده اند (8 دانش آموز)

یادتان باشد: هنگامی که یک سوال منبع داده ای را به دو قسمت تقسیم می کند (مانند تمامی سوالاتی که پاسخ بله یا خیر دارند)، گروه مد نشان دهندۀ بیش از نیمی از داده ها می باشد. اما هنگامیکه یک سوال داده ها را به بیش از دو گروه تقسیم کند، مد الزاماً بیش از نیمی از داده ها را نمایندگی نمی کند.

برای مثال، 14 دانش آموز حداقل صاحب یک حیوان خانگی هستند، و سایر 11 دانش آموز باقیمانده حیوان خانگی ندارند. بنابراین گروه مد (دانش آموزانی که حیوان خانگی دارند) بیش از نیمی از کلاس می باشد. از سوی دیگر 8 نفر از 25 دانش آموز، رنگ آبی را به عنوان رنگ محبوبشان برگزیده اند. بنابراین، با وجودیکه این یک گروه مد می باشد، کمتر از نصفه کلاس این رنگ را انتخاب کرده اند.

نکات فنی: در یک نمونه کوچک، ممکن است بیش از یک مد داشته باشید، به عنوان مثال، شاید تعداد دانش آموزانی که رنگ قرمز را دوست دارند با تعداد دانش آموزانی که رنگ آبی را دوست دارند، برابر باشد. با این حال، در نمونه های بزرگتر معمولاً مدهای چندگانه رایج نیست، چرا که به ندرت اتفاق می افتد دقیقاً تعداد یکسانی از مردم اولویت های یکسانی داشته باشند.

کار کردن با داده های کمی


داده های کمی (Quantitative data) به هر عضو از نمونه یک مقدار عددی را نسبت می دهند. در نمونه من - که باز تاکید می کنم ساختگی است - از پنج عضو تیم بسکتبال خواهر النا استفاده کرده ام. فرض کنید اطلاعات موجود در جدول 3-19 در مورد قد و آخرین امتحان املاء اعضاء هرکدام از تیم ها جمع آوری شده باشد.

آمار پایه (Basic Statistics)
در این بخش به شما نشان می دهم چگونه با استفاده از این داده ها میانگین (mean) و میانه (median) را برای هر دو مجموعه داده بیابید. هر دوی این اصطلاحات به روشهایی برای محاسبه مقدار میانگین در یک مجموعه دادۀ کمی اشاره دارند. یک میانگین به شما یک ایده کلی در این باره می دهد که بیشتر واحدها در مجموعه داده شما در کجا قرار می گیرند بنابراین شما خواهید دانست، چه نوع داده هایی استاندارد می باشند. برای مثال، احتمالاً میانگین قد تیم بسکتبال خواهر النا از میانگین قد تیم بسکتبال "لوس آنجلس لیکرز" (Los Angeles Lakers) کمتر است. همانطور که در ادامه این بخش مطرح خواهم کرد، در برخی موارد میانگین (average) می تواند ما را گمراه کند، بنابراین دانستن اینکه در چه زمانهایی باید از میانگین (mean) در مقابل میانه (median) استفاده کرد، مهم می باشد.

پیدا کردن میانگین (mean)


یادتان باشد: میانگین (mean) رایج ترین روش بدست آوردن حد وسط می باشد. در واقع هر وقت مردم دربارۀ میانگین گیری صحبت می کنند، منظورشان این روش میانگین گیری است.

در اینجا چگونگی پیدا کردن میانگین یک مجموعه داده را می بینید:

  1. تمام اعداد موجود در مجموعه را با هم جمع بزنید.

    برای مثال، برای پیدا کردن میانگین قد پنج عضو تیم، ابتدا قد همۀ آنها را با هم جمع بزنید:

    آمار پایه (Basic Statistics)
  2. حاصل جمع بدست آمده را بر مجموع تعداد اعضاء آن مجموعه تقسیم کنید.

    عدد 295 را بر 5 تقسیم کنید (یعنی بر تعداد پسرهای عضو تیم):

    آمار پایه (Basic Statistics)
    بنابراین میانگین (mean) قد پسرها در تیم خواهر النا 59 اینچ می باشد.

به طرز مشابهی، برای پیدا کردن میانگین (mean) تعداد کلماتی که پسرها درست نوشته اند، ابتدا تعداد کلماتی که به درستی نوشته شده است را با یکدیگر جمع بزنید:

آمار پایه (Basic Statistics)
حالا این نتایج را بر 5 تقسیم کنید:

آمار پایه (Basic Statistics)
همانطور که می بینید، هنگامیکه تقسیم می کنید، نتیجه یک عدد اعشاری خواهد بود. اگر آن را به نزدیکترین عدد صحیح گرد کنید، میانگین تعداد کلماتی که این پنج پسر به درستی نوشته اند حدود 17 کلمه خواهد شد. (برای کسب اطلاعات بیشتر در مورد گرد کردن، فصل 2 را ببینید.)

هشدار: اگر در داده هایتان یک انحراف شدید - یعنی یک یا چند مقدار خیلی کوچک یا خیلی بزرگ داشته باشید که بسیار متفاوت از سایر داده ها باشد - داشته باشید، میانگین (mean) می تواند شما را گمراه سازد.

برای مثال، فرض کنید که رئیس یک شرکت به شما بگوید "میانگین حقوق سالیانه در شرکت ما $200,000 می باشد!" اما در روز اول کاریتان متوجه می شوید که حقوق سالیانه رئیس شرکت $19,010,000 و حقوق سالیانه هر کدام از سایر 99 کارمند دیگر $10,000 می باشد. برای محاسبه میانگین، حقوق ها را با هم جمع بزنید:

آمار پایه (Basic Statistics)
حالا این عدد را بر تعداد افرادی که آنجا کار می کنند، تقسیم کنید:

آمار پایه (Basic Statistics)
بنابراین رئیس شرکت دروغ نگفته است. با این وجود انحراف شدید موجود در مقادیر حقوقها باعث ایجاد این گمراهی شده است.

پیدا کردن میانه (median)


یادتان باشد: هنگامی که مقادیر داده ها دارای انحراف باشند (هنگامیکه چندتا از اعداد خیلی بزرگ یا خیلی کوچک باشند و به صورت معناداری با بقیه داده ها متفاوت باشند)، میانه (median) می تواند به شما تصویر دقیقتری از آنچیزی که استاندارد است، بدهد.

در اینجا چگونگی پیدا کردن میانه (median) یک مجموعه از داده ها را می بینید:

  1. مجموعه را از کوچک تا بزرگ مرتب کنید.

    برای پیدا کردن میانه (median) قد پسرها در جدول 3-19، پنج مقدار قد پسرها را به ترتیب از کوچک به بزرگ سازماندهی کنید.

    آمار پایه (Basic Statistics)
  2. عدد وسطی را انتخاب کنید.

    عدد وسطی که در اینجا 59 می باشد، میانه (median) قد پسرها می باشد.

برای پیدا کردن میانه تعداد کلماتی که پسرها به درستی نوشته اند (جدول 3-19 را ببینید)، امتیاز آنها را از کوچکترین تا بزرگترین مرتب کنید:

آمار پایه (Basic Statistics)
این بار عدد وسطی 18 می باشد، بنابراین 18 میانه امتیاز می باشد.

یادتان باشد: اگر شما یک تعداد زوج از اعداد را در منبع داده تان داشته باشید، اعداد را مرتب کنید و سپس میانگین (mean) دو عدد وسطی در لیست را بدست آورید.

برای مثال، موارد زیر را در نظر بگیرید:

آمار پایه (Basic Statistics)
دو عدد میانی 5 و 7 می باشند. آنها را با هم جمع بزنید تا به 12 برسید و سپس آن را بر 2 تقسیم کنید تا میانگین (mean) بدست آید. میانه (median) در این لیست 6 می باشد.

حالا آن رئیس شرکتی را که سالی $19,010,000 حقوقش بود و 99 کارمند دیگرش سالی $10,000 می گرفتند را به خاطر بیاورید. اطلاعات آن شرکت بعد از مرتب سازی به شکل زیر خواهند شد:

آمار پایه (Basic Statistics)
همانطور که می بینید، اگر تمامی 100 حقوق سالیانه را بنویسید، واضح است که هر دو عددی که در وسط قرار می گیرند برابر با 10,000 خواهند بود. حقوق سالیانه میانه (median) در این شرکت $10,000 می باشد و اگر شما در این شرکت کار کنید متوجه خواهید شد که این نتیجه دقیقتر بازتاب دهندۀ اوضاع واقعی حقوق این شرکت می باشد.



نمایش دیدگاه ها (0 دیدگاه)

دیدگاه خود را ثبت کنید:

انتخاب تصویر ویرایش حذف
توجه! حداکثر حجم مجاز برای تصویر 500 کیلوبایت می باشد.