نمودار ویولن Violin Plot


نمودار ویولن Violin Plot

مقدمه ای بر نمودار ویولن Violin Plot :

نمودار ویولن Violin Plot : نقشه ویولن برای بصری­ سازی توزیع دیتا و تراکم احتمالی آن استفاده می­شود. این نمودار شکل توزیع دیتا را نمایش می­دهد. نمودار ویولنی روشی برای رسم کردن داده‌های عددی است. این نمودار، نموداری مناسب برای به تصویر کشیدن توزیع پایه‌ای داده‌هاست و برای مقایسه ­ی داده‌های آماری به صورت خلاصه (ماننده بازه‌ها و چارک­ها) کاربرد دارد، که به شما امکان مشاهده­ ی تغییرات و اختلافات در داده را می‌دهد.

طرح ویولن یک روش قدرتمند تجسم داده است، زیرا به شما امکان مقایسه و رتبه­ بندی چندین گروه و هم توزیع آن­ها را می­دهد. ویولن­ها به ویژه هنگامی سازگار می­شوند که مقدار داده بسیار زیاد باشد و نمایش مشاهدات فردی غیرممکن باشد. و این امکانات در نمودار جعبه­ ای که شباهت زیادی به نمودار ویولن دارد وجود ندارد.

نمودار ویولن Violin Plot

نمودار ویولن

از انجایی که سادگی بصری نمودار جعبه ­ای تمایل به پنهان­ سازی جزئیات مهم چگونگی توزیع مقادیر در دیتا را دارد، این نقشه ­ها در نمایش دیتا محدود هستند. برای مثال، در این نقشه ­ها نمی­توان دید که آیا توزیع دوحالته است یا چندحالته. درحالیکه نقشه ویولن می­تواند اطلاعات بیشتری را از نمودار جعبه­ ای به ما بدهد. این نمودار ترکیبی از یک نمودار جعبه­ ای و یک نمودار چگالی است تا شکل توزیع داده ­ها را نشان دهد. برای درک بهتر نمودار ویولن در شکل زیر به بررسی اجزای اصلی نمودار ویولن Violin Plot می­پردازیم.

نمودار ویولن Violin Plot

اجزای اصلی نمودار ویولن Violin Plot

Median: دایره سفید رنگ کوچک وسط جعبه ­ی رسم شده داخل نمودار، نشان‌دهنده ­ی میانه است. که در بعضی از نمودارها با یک خط نشان داده می­شود.

Interquartile range: مستطیل مشکی در مرکز شکل، نشان‌دهنده ­ی بازه­ ی میان چارکی است.

Upper adjacent: خط سیاه نازک وسط نشان دهنده مقادیر مجاور بالا (حداکثر) در داده ­ها است.

 Lower adjacent: خط سیاه نازک وسط نشان دهنده مقادیر مجاور پایین (حداقل) در داده­ ها است.

کاربرد نمودار ویولن Violin Plot

کاربرد نمودار ویولن Violin Plot – طرح ویولن امکان تجسم توزیع یک متغیر عددی برای یک یا چند گروه را فراهم می­کند و همچنین تجسم توزیع داده­ ها و چگالی احتمال آن استفاده می­شود. هر “ویولن” نماینده یک گروه یا یک متغیر است.

شکل ویولن چگالی متغیر را نشان می­دهد: هرچه نقاط داده در یک محدوده خاص بیشتر باشد، ویولن برای آن دامنه بزرگتر است به عبارتی دیگر در هر قسمت از نمودار که عرض ویولن بیشتر شده  نمودار نشان‌دهنده­ ی این است که نمونه‌ها در داده­ ی مورد نظر با احتمال بیشتری این مقدار را می‌توانند بگیرند و هر چه برای یک مقدار این عرض کوچکتر باشد احتمال آن کمتر است.

در نمودار ویولن Violin Plot، چنانچه تعداد نمونه‌ها بسیار زیاد نباشد، بخش درونی می‌تواند تمام نقاط نمونه‌ها را (با یک راس یا خط برای هر نمونه) نشان دهد.

نمودار ویولن Violin Plot

گاهی میانگین و میانه برای درک و شناخت یک مجموعه داده به تنهایی کافی نیستند. لازم است اطلاعاتی در مورد اینکه که بیشتر مقادیر نمونه‌ها حول میانه دسته‌بندی شده‌اند یا اینکه بیشتر مقادیر اطراف بیشینه و کمینه قرار دارند بدست آوریم که بتوانیم تصمیمات بهتری اتخاذ کنیم. اطلاعات بدست امده از نمودار ویولنی نشان دهنده­ ی اوج‌ها و توزیع‌ها در دادهاست. برای حالتی که نمونه‌ها دارای چند نقطه ­ی اوج باشند، نمودار ویولنی به صورت واضح وجود چند نقطه­ی اوج، مختصات آن‌ها و نوسان نسبیشان را نشان می‌دهد که در نمودار جعبه­ای این امکان را نداریم.

مثال برای نمودار ویولن Violin Plot

مثال برای نمودار ویولن Violin Plot : در ادامه مطلب نمودار ویولن به بررسی یک مثال برای درک بهتر این نمودار می­پردازیم. نمودار زیر نشان دهنده خریدهای اینترنتی تعدادی از مشتریان یک فروشگاه اینترنتی می­باشد که تعدادی اقا و تعداد خانم مورد مطالعه قرار گرفتند. این نمودار ویولن Violin Plot نشان دهنده تعدادخریدهای اینترنتی خانم­ها و اقایان است.

بر اساس نمودار زیر  2 خرید در ماه توسط خانم­ با احتمال بیشتر انجام می­شود و میانه خرید به سمت 2 خرید در ماه نزدیک­تر است و احتمال 3 خرید برای اقایان در ماه بیشترین امکان را دارد ­در نمودار متعلق به اقایان داده­ های پرت بیشتری وجود دارد کشیدگی خط عمودی وسط نشان این داده­ های پرت و دور از قسمت عریض نمودار است.

 

نمودار ویولن Violin Plot 

 در مثال دوم به بررسی هزینه خرید نوشیدنی در چهار روز هفته در یک فروشگاه زنجیره ­ای می­پردازیم. در این پژوهش تعدادی از اقایان و تعدادی از خانم­ ها مورد مطالعه قرار گرفتند. همان طور که از نمودار مشخص می­شود داده­ های مربوط به خانم­ها با رنگ ابی و داده ­های مربوط به اقایان با رنگ نارنجی نشان داده­ می­شود. نتایج حاصل از بررسی این نمودار نشان دهنده ­ی این است که بیشترین میزان در هر روز برای خانم­ها و اقایان متعلق به قسمت عریض­تر نمودار است.در روز پنج شنبه و جمعه میانه حدود 15 است و در روزهای بعد افزایش می­یابد. در روز شنبه داده­ های پرت بیشتری موجود می­باشد.

 

نمودار ویولن Violin Plot 

جمع­بندی نمودار ویولن Violin Plot

همان­طور که در مطالب بالا اشاره شد نمودار ویولن Violin Plot برای تجسم توزیع داده­ ها، نمایش دامنه، متوسط ​​و توزیع داده ­ها استفاده می­شود. نمودارهای ویولن همان آمار خلاصه نمودارهای جعبه را نشان می­دهد، اما همچنین شامل برآورد تراکم داده­ها در هسته است.

طرح ویولن اجازه می­دهد تا توزیع یک متغیر عددی را برای یک یا چند گروه تجسم کرد و سپس آ­ن­ها را مقایسه کرد. به ویژه به دلیل عملکرد ویولن برای ساختن آن سازگار است. قطعات ویولن در مقایسه با نمودارهای جعبه­ایی که گاهی اوقات می­توانند ویژگی­های داده ها را پنهان کنند، شایسته توجه بیشتری هستند.

نویسنده: تیم پژوهش راهبرد

 

منابع

towardsdatascience.com

datavizcatalogue.com

data-to-viz.com

5/5 - (1 امتیاز)

هیچ نظری وجود ندارد