نمودار ویولن Violin Plot
مقدمه ای بر نمودار ویولن Violin Plot :
نمودار ویولن Violin Plot : نقشه ویولن برای بصری سازی توزیع دیتا و تراکم احتمالی آن استفاده میشود. این نمودار شکل توزیع دیتا را نمایش میدهد. نمودار ویولنی روشی برای رسم کردن دادههای عددی است. این نمودار، نموداری مناسب برای به تصویر کشیدن توزیع پایهای دادههاست و برای مقایسه ی دادههای آماری به صورت خلاصه (ماننده بازهها و چارکها) کاربرد دارد، که به شما امکان مشاهده ی تغییرات و اختلافات در داده را میدهد.
طرح ویولن یک روش قدرتمند تجسم داده است، زیرا به شما امکان مقایسه و رتبه بندی چندین گروه و هم توزیع آنها را میدهد. ویولنها به ویژه هنگامی سازگار میشوند که مقدار داده بسیار زیاد باشد و نمایش مشاهدات فردی غیرممکن باشد. و این امکانات در نمودار جعبه ای که شباهت زیادی به نمودار ویولن دارد وجود ندارد.
نمودار ویولن
از انجایی که سادگی بصری نمودار جعبه ای تمایل به پنهان سازی جزئیات مهم چگونگی توزیع مقادیر در دیتا را دارد، این نقشه ها در نمایش دیتا محدود هستند. برای مثال، در این نقشه ها نمیتوان دید که آیا توزیع دوحالته است یا چندحالته. درحالیکه نقشه ویولن میتواند اطلاعات بیشتری را از نمودار جعبه ای به ما بدهد. این نمودار ترکیبی از یک نمودار جعبه ای و یک نمودار چگالی است تا شکل توزیع داده ها را نشان دهد. برای درک بهتر نمودار ویولن در شکل زیر به بررسی اجزای اصلی نمودار ویولن Violin Plot میپردازیم.
اجزای اصلی نمودار ویولن Violin Plot
Median: دایره سفید رنگ کوچک وسط جعبه ی رسم شده داخل نمودار، نشاندهنده ی میانه است. که در بعضی از نمودارها با یک خط نشان داده میشود.
Interquartile range: مستطیل مشکی در مرکز شکل، نشاندهنده ی بازه ی میان چارکی است.
Upper adjacent: خط سیاه نازک وسط نشان دهنده مقادیر مجاور بالا (حداکثر) در داده ها است.
Lower adjacent: خط سیاه نازک وسط نشان دهنده مقادیر مجاور پایین (حداقل) در داده ها است.
کاربرد نمودار ویولن Violin Plot
کاربرد نمودار ویولن Violin Plot – طرح ویولن امکان تجسم توزیع یک متغیر عددی برای یک یا چند گروه را فراهم میکند و همچنین تجسم توزیع داده ها و چگالی احتمال آن استفاده میشود. هر “ویولن” نماینده یک گروه یا یک متغیر است.
شکل ویولن چگالی متغیر را نشان میدهد: هرچه نقاط داده در یک محدوده خاص بیشتر باشد، ویولن برای آن دامنه بزرگتر است به عبارتی دیگر در هر قسمت از نمودار که عرض ویولن بیشتر شده نمودار نشاندهنده ی این است که نمونهها در داده ی مورد نظر با احتمال بیشتری این مقدار را میتوانند بگیرند و هر چه برای یک مقدار این عرض کوچکتر باشد احتمال آن کمتر است.
در نمودار ویولن Violin Plot، چنانچه تعداد نمونهها بسیار زیاد نباشد، بخش درونی میتواند تمام نقاط نمونهها را (با یک راس یا خط برای هر نمونه) نشان دهد.
گاهی میانگین و میانه برای درک و شناخت یک مجموعه داده به تنهایی کافی نیستند. لازم است اطلاعاتی در مورد اینکه که بیشتر مقادیر نمونهها حول میانه دستهبندی شدهاند یا اینکه بیشتر مقادیر اطراف بیشینه و کمینه قرار دارند بدست آوریم که بتوانیم تصمیمات بهتری اتخاذ کنیم. اطلاعات بدست امده از نمودار ویولنی نشان دهنده ی اوجها و توزیعها در دادهاست. برای حالتی که نمونهها دارای چند نقطه ی اوج باشند، نمودار ویولنی به صورت واضح وجود چند نقطهی اوج، مختصات آنها و نوسان نسبیشان را نشان میدهد که در نمودار جعبهای این امکان را نداریم.
مثال برای نمودار ویولن Violin Plot
مثال برای نمودار ویولن Violin Plot : در ادامه مطلب نمودار ویولن به بررسی یک مثال برای درک بهتر این نمودار میپردازیم. نمودار زیر نشان دهنده خریدهای اینترنتی تعدادی از مشتریان یک فروشگاه اینترنتی میباشد که تعدادی اقا و تعداد خانم مورد مطالعه قرار گرفتند. این نمودار ویولن Violin Plot نشان دهنده تعدادخریدهای اینترنتی خانمها و اقایان است.
بر اساس نمودار زیر 2 خرید در ماه توسط خانم با احتمال بیشتر انجام میشود و میانه خرید به سمت 2 خرید در ماه نزدیکتر است و احتمال 3 خرید برای اقایان در ماه بیشترین امکان را دارد در نمودار متعلق به اقایان داده های پرت بیشتری وجود دارد کشیدگی خط عمودی وسط نشان این داده های پرت و دور از قسمت عریض نمودار است.
در مثال دوم به بررسی هزینه خرید نوشیدنی در چهار روز هفته در یک فروشگاه زنجیره ای میپردازیم. در این پژوهش تعدادی از اقایان و تعدادی از خانم ها مورد مطالعه قرار گرفتند. همان طور که از نمودار مشخص میشود داده های مربوط به خانمها با رنگ ابی و داده های مربوط به اقایان با رنگ نارنجی نشان داده میشود. نتایج حاصل از بررسی این نمودار نشان دهنده ی این است که بیشترین میزان در هر روز برای خانمها و اقایان متعلق به قسمت عریضتر نمودار است.در روز پنج شنبه و جمعه میانه حدود 15 است و در روزهای بعد افزایش مییابد. در روز شنبه داده های پرت بیشتری موجود میباشد.
جمعبندی نمودار ویولن Violin Plot
همانطور که در مطالب بالا اشاره شد نمودار ویولن Violin Plot برای تجسم توزیع داده ها، نمایش دامنه، متوسط و توزیع داده ها استفاده میشود. نمودارهای ویولن همان آمار خلاصه نمودارهای جعبه را نشان میدهد، اما همچنین شامل برآورد تراکم دادهها در هسته است.
طرح ویولن اجازه میدهد تا توزیع یک متغیر عددی را برای یک یا چند گروه تجسم کرد و سپس آنها را مقایسه کرد. به ویژه به دلیل عملکرد ویولن برای ساختن آن سازگار است. قطعات ویولن در مقایسه با نمودارهای جعبهایی که گاهی اوقات میتوانند ویژگیهای داده ها را پنهان کنند، شایسته توجه بیشتری هستند.
مقالات مرتبط:
نمودار عنکبوتی Spider Chart
نمودار قیفی Funnel Chart
نمودار پراکندگی Scatter Plot
نویسنده: تیم پژوهش راهبرد
منابع
towardsdatascience.com
datavizcatalogue.com
data-to-viz.com
دیدگاهتان را بنویسید