هیستوگرام

نمودار ستونی،[۱] بافتنگاشت[۲] یا هیستوگرام نمایشی از توزیع دادههای کمی پیوستهاست که میتواند تخمینی از توزیع احتمال باشد و نخستین بار توسط کارل پیرسون به کار گرفته شد.[۳]بافتنگاشت یکی از ۷ ابزار کنترل کیفیت است. تفاوت بافتنگاشت (نمودار ستونی) با نمودار میلهای در آن است که نمودار میلهای مربوط به توزیع دو متغیر تصادفی است ولی بافتنگاشت مربوط به یک متغیر است.
برای رسم بافتنگاشت ابتدا باید دادهها را به بازههای کوچک افراز (معمولاً طول بازهها برابر در نظر گرفتهمیشود)، سپس تعداد دادههای هر بازه را محاسبه کرد.[۴]
پس از آن اگر طول بازهها برابر بود، روی هر بازه یک مستطیل با ارتفاع متناسب فراوانی آن بازه کشیده میشود.
اگر طول بازهها برابر نبود، روی هر بازه یک مستطیل با مساحت متناسب فراوانی آن بازه کشیده میشود. در این حالت محور عمودی دیگر نشاندهنده فراوانی نیست، بلکه نشاندهنده چگالی فراوانی - تعداد پیشامدها بر واحد متغیر تصادفی روی محور افقی - است.
تعریف ریاضیاتی بافتنگاشت
بافت نگاشت مجموعهای از توابع است که تعداد پیشامدهای مشاهدهشده از هر بازه را برمیگرداند؛ لذا نمودار بافتنگاشت فقط یک راه از نمایش بافتنگاشت است. اگر تعداد کل پیشامدهای مشاهدهشده و تعداد بازهها باشد، آنگاه معادلهٔ زیر برای بافتنگاشتهای برقرار است: الگو:چپچین الگو:پایان چپچین
بافتنگاشت تجمعی

بافت نگاشت تجمعی مجموعهای از توابع است که فراوانی تجمعی پیشامدهای مشاهدهشده هر بازه را برمیگرداند پس بافتنگاشت تجمعیِ بافتنگاشت به صورت زیر تعریف میشود: الگو:چپچین الگو:پایان چپچین
تعداد و طول بازهها
حالتهای مختلفی برای تعیین بازهها وجود دارد که هرکدام ویژگیهای مختلفی از داده را آشکار میکنند لذا برهم برتری ندارند. هرچه طول بازهها بیشتر باشد، تراکم نقاط کمتر میشود و نویز ناشی از نمونهگیری تصادفی را کاهش میدهد. از طرف دیگر هرچه طول بازهها کمتر باشد، تخمین بهتری از توزیع میتوان پیدا کرد. بعضی تلاش کردهاند تا مقداری بهینه برای تعداد بازهها بیابند، ولی این روشها معمولاً شامل فرضی قوی روی توزیعاند. با توجه به توزیع واقعی دادهها و اهداف تحلیل آنها، مقدار متفاوتی برای طول بازهها مناسب خواهدبود.[۵]
مجذور
الگو:چپچین [۶] الگو:پایان چپچین
فرمول استرجس
برای استفاده از فرمول استرجس دادهها باید توزیع تقریباً نرمال داشته باشند. معمولاً این فرمول در حالتی که باشد یا توزیع دادهها نرمال نباشد، کاربردی ندارد.[۷] الگو:چپچین الگو:پایان چپچین
قانون رایس
الگو:چپچین [۸] الگو:پایان چپچین
فرمول دوآن
فرمول دوآن بهبودیافتهٔ فرمول استرجس است که کابرد فرمول استرجس را برای دادههای غیرنرمال افزایش دادهاست. الگو:چپچین الگو:پایان چپچین که تخمین گشتاور سوم چولگی توزیع است و الگو:چپچین [۹] الگو:پایان چپچین
قانون اسکات
که انحراف معیار دادهها و طول بازه است.[۱۰] قانون اسکات برای دادههای با توزیع نرمال بهینه است و خطای میانگین مربعات تخمین چگالی را کمینه میکند.[۱۱]
قانون فریدمن - دیاکونیس
الگو:چپچین الگو:پایان چپچین که IQR، دامنه بین چارکی دادههاست.[۱۲]
قانون شیمازاکی و شینوموتو
این قانون براساس کمینه کردن تخمین تابع هزینه است که در آن میانگین دادهها و واریانس اریب دادههاست. الگو:چپچین الگو:پایان چپچین و الگو:چپچین الگو:پایان چپچین
منابع
- ↑ در متون علمی از histo ستون و diagram نمودار
- ↑ واژههای مصوب فرهنگستان - Histogram https://wiki.apll.ir/word/index.php/Histogram
- ↑ الگو:یادکرد وب
- ↑ الگو:یادکرد کتاب
- ↑ الگو:یادکرد کتاب
- ↑ الگو:یادکرد وب
- ↑ الگو:یادکرد وب
- ↑ الگو:یادکرد وب
- ↑ الگو:یادکرد ژورنال
- ↑ الگو:یادکرد کتاب
- ↑ الگو:Cite journal
- ↑ الگو:Cite journal