نمودار پراکندگی Scatter Plot
مقدمه ای بر نمودار پراکندگی Scatter Plot
بصری سازی داده ها یکی از مهمترین موارد در تحلیل و انالیز داده ها است. رسم داده ها باعث ایجاد یک دید کلی نسبت به شرایط حاکم بر داده ها و باعث ایجاد تسلطی بر داده ها میشود. در این مطلب به بررسی نمودار پراکندگی Scatter Plot میپردازیم. ننمودار پراکندگی Scatter Plot ، برای نمایش مقدارهای عددی و متغیرهای کمی به کار میرود. به این ترتیب میتوان رابطه بین متغیرهای کمی را درک و نمایش داد.
نمودار پراکندگی
نمودار پراکندگی از نمودارهایی است که در ابتدای کار معمولا بسته به داده ی موجود مورد بررسی قرار میگیرد. به وسیله ی این نمودار، پراکندگی دادهها، توزیع دادهها و محدوده ی آنها را میتوان بر اساس نمودارهای پراکندی مشاهده کرد. از نمودار پراکندگی برای ایجاد یک دید کلی از روابط بین دادهها استفاده میشود نه برای مشاهده جزییات داده. به وسیله نمودار پراکندگی میتوان رابطه ی بین دو متغیر عددی را نمایش داد و بررسیهای اولیه را انجام داد.
نمودار پراکندگی از نقاط برای نشان دادن مقادیر دو متغیر مختلف عددی استفاده میکند و نمودار از نمایش یک نقطه به ازای هر جفت متغیر در دستگاه مختصات دکارتی به دست میآید. موقعیت هر نقطه در محور افقی و عمودی مقادیر مربوط به یک داده را نشان می دهد نقطه حاصل ارتباط بین متغیر کنترل و متغیر پاسخ میباشد.
نمودار معمولاً برای نمایش نحوه پاسخ یک متغیر (متغیر پاسخ یا وابسته) به تغییرات متغیر دیگر (متغیر کنترل یا مستقل) به کار میرود. مقدار یکی از متغیرها (متغیر کنترل) به عنوان مقدار محور افقی و مقدار متغیر دیگر (متغیر پاسخ) به عنوان مقدار محور عمودی در نظر گرفته میشود.
رسم نمودار پراکندگی Scatter Plot
رسم نمودار پراکندگی Scatter Plot > نقاط رسم شده در نمودار پراکندگی نه تنها نقاط داده را گزارش میکند، بلکه الگوی پراکندگی داده ها را به صورت کلی بیان میکند. و با یک نگاه میتوان وضعیت دادهها را نسبت به هم بررسی کرد. نمودارهای زیر بیان حالتهای کلی قرارگیری دادهها نسبت به یکدگیر در نمودار هستند.
نمودار اول نشاندهنده ی این است که داده ها به دو دسته یا خوشه (Cluster) تقسیم شده اند و این میتواند اطلاعاتی از وضعیت داده ها نسبت به یکدیگر به ما بدهد تا در بررسی ها با دید دقیقتری به داده ها نگاه کنیم. نمودار پراکندگی همچنین میتواند برای شناسایی الگوهای دیگر در داده ها مفید باشد. ما میتوانیم نقاط داده را به گروه هایی تقسیم کنیم که در مجموعه ی نقاط از یکدیگر به هم نزدیکتر هستند. در نمودار دوم داده های موجود دارای نقاط خارج از محدوده (outlier) میباشد که باید در تحلیل از این نقاط غافل نشد.
به این دلیل که ممکن است نتایج را به سمتی نادرست سوق دهد. نمودار سوم نشان دهنده یک فاصله ی معنا دار در بین داده های موجود میباشد به عبارتی این نمودار پراکندگی همچنین میتوانند در صورت وجود شکاف های غیر منتظره در داده ها را نشان دهند.
کاربردهای نمودار پراکندگی Scatter Plot
یکی دیگر از کاربردهای نمودار پراکندگی Scatter Plot، شناسایی روابط همبستگی در مقادیر داده است. همبستگی میزان ارتباط داده ها با یک دیگر است. اغلب متغیر را در محور افقی مشاهده خواهید کرد که متغیر مستقلی را نشان میدهد و متغیر در محور عمودی متغیر وابسته را نشان میدهد. روابط همبستگی بین متغیرها را میتوان از بسیاری جهات توصیف کرد: مثبت یا منفی، قوی یا ضعیف.
همبستگی خطی چیست ؟
همبستگی خطی چیست ؟ هنگامی که دو دسته از دادهها شدیداً به هم مرتبط و وابسته باشند، میگوییم که آنها همبستگی بالایی دارند و همبستگی زمانی مثبت است که مقادیر نسبت به هم افزایش یابند (شیب خط به سمت بالا باشد). همبستگی زمانی منفی است که یک دسته از دادهها با افزایش دسته دیگر، کاهش یایند(شیب خط به سمت پایین باشد).
مثال برای نمودار پراکندگی Scatter Plot
مثال برای نمودار پراکندگی Scatter Plot : یکی از کاربردهای اصلی نمودار پراکندگی یافتن ارتباط دو متغیر با یک دیگر است. در ابتدا با مثالی از بررسی رضایت مشتری بر اساس زمان پاسخ گویی به مشتری شروع میکنیم. محور افقی که به عبارتی مربوط به متغییر مستقل میباشد نشان دهنده زمان پاسخ گویی است و محور عمودی که نشان دهنده متغییر عمودی است نشان دهنده میزان رضایت مشتری میباشد.
با دقت در مقادیر نقاط رسم شده مشخص میشود که هر چه زمان پاسخ گویی کمتر بوده میزان رضایت مشتری بیشتر است. به طور مثال زمانی که پاسخ مشتری در کمتر از 7.5 دقیقه داده میشود رضایت حداکثری مشتری را خوایم داشت و کمترین میزان رضایت مشتری متعلق به زمان 15 دقیقه به بعد است.
در مثال دوم نمودار پراکندگی Scatter Plot به بررسی میزان فروش نوشیدنی بر اساس دمای هوا میپردازیم. در این مثال متغیر مستقل دمای هوا می باشد که در نمودار افقی نشان داده شده است و متغیر وابسته میزان فروش نوشیدنی است که در نمودار عمودی نشان داده شده است. همان طور که در نمودار مشاهده میکنید با افزایش دما میزان فروش نوشیدنی افزایش پیدا کرده است و بیشترین میزان فروش مربوط به دمای 25 درجه میباشد و کمترین میزان فروش متعلق به دمای 12 درجه میباشد. با افزایش دما و گرمتر شدن هوا میزان فروش نوشیدنی افزایش پیدا کرده است.
استفاده از زبان نمودارها باعث افزایش خوانایی و سرعت دریافت اطلاعات از داده ها میشود. نمودار پراکندگی یکی از مهمترین نمودارها برای این منظور است. کاربردهای نمودار پراکندگی Scatter Plot شامل نمایان شدن ارتباط بین متغیرها، یافتن الگوی حاکم بر داده ها و بررسی میزان همبستگی داده ها میباشد.
جمع بندی نمودار پراکندگی Scatter Plot
استفاده از زبان نمودارها باعث افزایش خوانایی و سرعت دریافت اطلاعات از داده ها میشود نمودار پراکندگی Scatter Plot، یکی از مهمترین نمودارها برای این منظور است. کاربردهای نمودار پراکندگی Scatter Plot شامل نمایان شدن ارتباط بین متغیرها، یافتن الگوی حاکم بر داده ها و بررسی میزان همبستگی داده ها میباشد. نمودار گانت را نیز مطالعه کنید.
نویسنده: تیم پژوهش راهبرد
منابع
https://chartio.com/learn/charts/what-is-a-scatter-plot/
دیدگاه (4)
سلام. وقتتون بخیر. من سه تاستون دارم. یک ستون متغيرها و دوتاستون که مقدار دارند. میخوام اون دوتا ستون مقدارها روی محورها قرار بگیرند و نقاطی که اون دو مقدار رو توی نمودار نشون میدن، نام متغيرها رو داشته باشه… امیدوارم منظورم رو به درستی رسانده باشم و ممنون میشم راهنمایی بفرمایید
سلام. جهت راهنمایی به واتس اپ پشتیبان ما پیام دهید.
عالی بود
سپاسگزاریم.