سری زمانی در داده کاوی

سری زمانی در داده کاوی

سری زمانی در داده کاوی

سری زمانی در داده کاوی

سری زمانی در داده کاوی : ارزش و اهمیت مجموعه داده ­ها و انواع مختلف داده به دلیل کاربردهای فراوان بر کسی پوشیده نیست. یکی از مهم­ترین و پرکاربردترین انواع داده، داده­ های سری زمانی است. مجموعه­ های داده ­ای وجود دارد که در آنها ویژگی هدف وابسته به زمان است، زیرا با دنباله­ ای از دوره ­های متوالی در طول بعد زمان مرتبط است. در چنین شرایطی گفته می­شود که مقادیر متغیر هدف نشان دهنده یک سری زمانی است. از این نوع داده برای پیش­بینی کردن استفاده می­شود. در واقع سری زمانی به کشف الگو  رفتار داده­ ها درگذشته و پیش بینی رفتار آینده از روی این نوع داده است. این داده­ها در داده کاوی برای پیش بینی کردن بسیار با اهمیت هستند.

یک سری زمانی مجموعه ای از مشاهدات درباره ی یک متغیر است که در نقاط گسسته ای از زمان که معمولا فاصله های مساوی دارند، اندازه گیری شده و بر حسب زمان مرتب شده اند. بنابراین یک سری زمانی از مشاهده یک پدیده در طول زمان بدست می آید. سری زمانی یک کلاس مهم از داده ­های زمانی است. سری زمانی مجموعه مشاهداتی است که به ترتیب زمان انجام شده است.

داده ­های سری زمانی دارای ویژگی­هایی مثل : حجم بالای داده، ابعاد بالا و بروزرسانی مداوم است؛ علاوه بر این، داده های سری زمانی که با ماهیت عددی و پیوسته مشخص می­شوند و به عنوان یک کل در نظر گرفته می­شود. افزایش استفاده از داده های سری زمانی تلاشهای تحقیق و توسعه زیادی را در زمینه داده کاوی آغاز کرده است.

اخیراً، استفاده روز افزون از داده­ های زمانی باعث افزایش فعالیت­های تحقیق و توسعه مختلفی در زمینه داده کاوی شده است. به عنوان نمونه ­هایی از سری زمانی می­توان از ثبت دمای روزانه هوا، مجموع فروش هفتگی یک فروشگاه و قیمت صندوق­های سرمایه گذاری و سهام نام برد. حجم بالای این داده ­ها در طول زمان، برای داده کاوی بسیار اهمیت دارد. استخراج الگوها و اطلاعات مفید از دل این حجم اطلاعات اهمیت سری زمانی را نشان می­دهد.

تعریف سری زمانی

تعریف سری زمانی : دنباله‌ای از اطلاعات و داده ­ها که در یک بازه­ ی زمانی مشخص که مربوط به یک موضوع جمع‌آوری شده‌‌اند، یک سری زمانی را می­سازند. داده ­های تشکیل دهنده سری زمانی نمایانگر تغییرات پدیده­ی مورد بررسی در طول زمان است؛ بنابراین می­توانیم داده­ های سری زمانی را، داده ­هایی وابسته به زمان بدانیم. اگر یک بردار در نظر بگیریم و  نشان دهنده زمان باشد می­توانیم سری زمانی را اینگونه تعریف کنیم:

 

 

 بنابر معادله فوق زمان   می­تواند زمان شروع یک پدیده یا زمان ثبت اولین اطلاعات مربوط به حوزه تحت پژوهش باشد. بنابراین  یک متغیر تصادفی است و  مقدار  را در لحظه ا­ی  نشان­ می­دهد.

مثال حل شده سری زمانی

مثال حل شده سری زمانی

مثال 1) تصویر زیر نشان دهنده­ ی یک سری زمانی است که مربوط به مجموعه داده ­های استخدامی توصیف شده در سال2003 در ایتالیا می­باشد و نشان دهنده درصد افراد شاغل در جمعیت جوانان ایتالیایی درهر دو جنس خانم و اقا که بین سنین 15 تا 24 است  و بازه ­زمانی ثبت این اطلاعات از سه ماهه چهارم سال 1992 تا سه ماهه چهارم سال 2003 هر سه ماه ثبت شده است.

 

نمودار افراد شاغل در ایتالیا در بازه زمانی 1992 تا 2003

 

در این مثال متغیر t برابر سال و متغیر X برابر درصد افراد شاغل است و  X(t) نشان دهنده مقدار افراد شاغل در زمان t  است.

مثال2) سری های زمانی معمولاً برای پیش بینی مصرف در صنعت تاسیسات استفاده می­شوند. سری زمانی نشان داده شده در شکل زیر نشان دهنده مصرف برق در یک منطقه در ایتالیا است. که در ده ها میلیون کیلووات ساعت بیان شده است، بازه ثبت این اطلاعات هر دو ماه از از اول سال 1998 تا 2003 ثبت شده است. با استفاده از انالیز این نمودار و نمودارها و اطلاعات مشابه در این زمینه می­توان به افزایش یا کاهش نرخ بیکاری و اشتغال در بین جوانان و سطح رفاه افراد دست پیدا کرد و برای آینده جوانان برنامه ­های موثرتری را برنامه­ ریزی کرد.

 

نمودار مصرف برق 36 دوره در یک منطقه از ایتالیا

 

در این مثال متغیر t برابر سال و متغیر X برابر میزان برق مصرفی است و X(t) نشان دهنده برق مصرف شده در زمان t  است. با استفاده از این اطلاعات  تصویر سازی شده کاربران با حداقل اطلاعات می­توانند کلیاتی را در مورد روند میزان مصرف متوجه شوند.

انواع متغیر سری زمانی

انواع متغیر سری زمانی: اگر متغیر سری زمانی از بین ویژگی­های یک پدیده، متغیر دارای فقط یک ویژگی باشد به آن یک متغیر “تک متغیره – Univariate ” گفته می­شود که در ایجاد سری زمانی به کار رفته است. به طور مثال ثبت شاغل بودن یا بیکار بودن افراد فقط بر اساس جنسیت یا فقط بر اساس سن که باعث ایجاد یک سری زمانی با یک ویژگی می­شود.

ولی اگر متغیر از چندین ویژگی پدیده مد نظر استفاده کرده باشد برای ایجاد سری زمانی به آن سری زمانی “چند متغیره – Multivariate ” گفته می­شود. به عنوان مثال ثبت اطلاعات افراد شاغل با استفاده از ویژگی­هایی چون سن، تحصیلات، جنسیت، ملیت و غیره  با یک دیگر باعث ایجاد یک سری زمانی چند متغیره می­شود.

انواع سری زمانی

انواع سری زمانی : سری زمانی به دو نوع گسسته و پیوسته تقسیم می­شود. در واقع سری زمانی­ ای یک سری گسسته است که تغییرات پدیده و موضوع مورد مطالعه را  برای قطعه زمان‌هایی مشخص در نظر بگیریم؛ مثلاً ثبت اطلاعات بر اساس روز، ساعت، ماه و غیره نشان دهنده سری زمانی گسسته است. برای مثال، تعداد جمعیت، تولیدات کارخانه و … از نوع سری زمانی گسسته محسوب می‌شوند.

سری زمانی پیوسته به سری گفته می­شود که زمان به صورت پیوسته در مدل در نظر گرفته می­شود برای مثال ثبت دما، دبی رودخانه و … از گروه سری‌های زمانی پیوسته است.

سری زمانی ایستا یا سری زمانی مانا

سری زمانی ایستا یا سری زمانی مانا : سری زمانی که توانایی پیش‌بینی برای آن وجود دارد، یک سری زمانی  “ایستا – Stationary ” است. منظور از یک سری زمانی ایستا، در حقیقت  یک سری زمانی است که قوانین حاکم بر تغییرات مقدارها، وابسته به زمان نباشد. قوانین احتمالی حاکم بر فرایند، با زمان تغییر نمی­کند یا به عبارتی فرایند در تعادل آماری است. و این به معنی ثابت سازی واریانس و میانگین در طول زمان است.

سری زمانی ناایستا

سری زمانی ناایستا Non- Stationary ، سری زمانی است که تغییرات آن در طول زمان متفاوت است و به زمان وابسته است بنابراین اطلاعات آماری ثابتی نخواهد داشت.

 

سری زمانی ناایستا

 

تحلیل یک سری زمانی

تحلیل سری زمانی در مورد یک پدیده، ایجاد یک مدل آماری برای داده‌های وابسته به زمان براساس اطلاعات گذشته­ ی آن پدیده است. با این کار امکان پیش‌بینی در مورد آینده پدیده مورد بحث میسر می‌شود. به بیان دیگر تحلیل سری زمانی،‌ ایجاد مدلی گذشته‌نگر است تا امکان تصمیمات آینده‌نگر را فراهم سازد.

ایجاد و به کارگیری مدل‌های آماری و تصادفی در قالب تحلیل سری زمانی، امروزه به کمک رایانه‌های پرسرعت، بسیار فراگیر شده و حاصل آن مدل‌هایی است که با داشتن پارامترهای بسیار انعطاف‌پذیر، می‌توانند آینده را برای هر پدیده‌ای (در صورت وجود داده‌های مناسب در گذشته) پیش‌بینی کنند. کاربردهای تحلیل سری‌های زمانی، در زمینه‌های مختلف نظیر، کسب و کار، امور مالی، بورس، مهندسی و … دیده می‌شود.

 

داده­ ها در یک سری زمانی اگر دارای فواصل مناسب باشند برای پیش­بینی روند داده­ های اینده بسیار مفید است و همچنین وابستگی داده­ ها بسیار موضوع مهمی است در یک سری زمانی تحلیل اساسی  بررسی وابستگی داده ها به همدیگر است برای اینکه اگر داده­ ها مستقل از یک دیگر باشند نتایج مطلوبی حاصل نخواهد شد. دیتاستی که دارای داده های از دست رفته زیادی باشد یعنی داده­ هایی که به هر نحوی (خطای انسانی یا سیستمی) ثبت نشده باشد قطعا نمی­تواند پیش­بینی درستی برای ادامه روند داشته باشد.

از اهداف اصلی سری­ های زمانی می­توان ابتدا به توضیح و تفسیر پدیده ها  و در نهایت به پیش بینی پدیده ­ها اشاره کرد. با تحلیل یک سری زمانی ابتدا اطلاعاتی از روند یک پدیده می توان بدست اورد و اینکه متغیرها در هر شرایطی چه وضعیتی دارند و بعد از تفسیر یک پدیده می توان با توجه به شرایط موجود اینده پدیده را نیز پیش­بینی کرد.

اجزای یک سری زمانی

اجزای سری زمانی شامل موارد زیر است:

روند کلی Trend :  روند شامل تمایل سری زمانی به افزایش، کاهش یا حتی ثابت بودن است در تصویرهای زیر سه نمودار مربوط انواع روند است.

 

تناوب Cyclic : در سری ­های زمانی، نوسانات یکسان و مکرر در بازه­ های زمانی میان مدت را تناوب می­نامند. این چرجه ممکن است هر چند سال یا بازه­ های زمانی متفاوت تکرار شود.

سری زمانی متناوب

فصل Seasonal : تغییراتی است که در سری زمانی در بازه ­های زمانی کوتاه­تر اتفاق می­افتد به طور مثال افزایش فروش پوشاک در آستانه سال نو و همین روند در سال آینده نیز تکرار می­شود. به این تغییرات فصلی گفته می­شود.

 

تغییرات فصلی در سری زمانی

تغییرات تصادفی Irregular : تغییراتی که قابل پیش‌بینی نیستند و نظم و الگوی خاصی ندارند.

سری زمانی با تغییرات تصادفی

کاربرد سری زمانی

کاربرد سری زمانی : هدف استفاده از سری زمانی در مدل سازی از روی داده ­های موجود برای پیش­بینی مقادیر آن سری زمانی در آینده است. انالیز سری های زمانی کمک به ایجاد بینشی در مورد رفتار آینده سری زمانی و آن حوزه مربوطه می­گردد. این دنباله داده ­های معنادار کاربردهای فراوانی از جمله، نوسانات قیمت نفت و طلا که با ثبت اطلاعات قیمت­ها این سری زمانی تشکیل شده و می­توان از جنبه ­های متفاوت مورد بررسی قرار بگیرد و به طور مثال عوامل تاثیرگذار روی قیمت مشخص شود؛  یا ثبت میزان آب و برق مصرفی در یک بازه زمانی به طور مثال می­توان پیک­های مصرف را تشخیص داده و برای مشکلات احتمالی آینده برنامه ریزی کرد؛  پیش بینی بازار سرمایه، بورس و پیش بینی های موجود در صنعت نیز بر اساس اطلاعات ثبت شده به روش سری­ های زمانی می­باشد و به سرمایه ­گذاران امکان تحلیل شرایط حاکم بر بازار را می­دهد.

از کاربرهای مهم  سری­های زمانی در حوزه داده کاوی می­توان به انالیز بازارهای فروش محصولات و بازاریابی اشاره کرد، در بازاریابی یا فروش با تحلیل داده­های سری زمانی و گذشته کاربران سازمان­ها، الگوهای پنهان در رفتار آنها شناسایی شده و کاربران با اطلاعاتی مانند مشخصات خریدهای که انجام می­دهند و علاقه­ای که به محصولات نشان می­دهند به دسته­بندی کاربران کمک کرده  و اطلاعات بدست آمده و با تحلیل مشخصات آن گروه­ها بازاریابی هدفمند و بهینه­تری را به دنبال خواهد داشت و به موجب آن مسیری شفاف­تر برای تصمیم­گیری در پیش­روی مدیران قرار دهد.

از دیگر کاربردهای تحلیل سری زمانی در داده کاوی استفاده آن در سیستم بانکداری بوده و در بررسی وفاداری مشتریان در حوزه­ های مالی مورد استفاده قرار می­گیرد. بانکها و صاحبان صنایع با استناد به داده ­های موجود در لیست خرید متقاضیان ومشتریان ثبات در خرید و به عبارتی وفاداری مشتریان را در دوره­ هایی منظم بررسی می­کنند. با بررسی تراکنش­های بانکی می­توان مقاصد سودجویانه و تقلب را شناسایی کرد و هرچه سریعتر مورد پی­گیری قرار داد. با تکیه بر اطلاعات موجود از سبد خرید مشتریان به توانایی مالی، علاقه­مندی و نیازهای مشتریان را می­توان بررسی کرد. با ثبت نمرات دانش­ اموزان و دانشجویان و حتی ثبت امتیازات کارکنان ادارات و کارخانجات می­توان به روند صعودی یا نزولی رفتار تحصیلی و کاری افراد دست پیدا کرد و از این اطلاعات می­توان در راستای تقویت سیستم کاری و تحصیلی استفاده کرد. و با این سیاست می­توان با توجه به توانایی دانش ­اموزان مشاوره بهتر و مفید­تری به آن­ها داد .

استفاده از سری‌های زمانی جمعیت نگاری، اندازه‌گیری سالانه ­ی جمعیت با هدف پیش بینی تغییرات جمعیت در مدت زمان ده تا بیست سال آینده به کار می­رود. و همچنین سری­ های زمانی فیزیک، بویژه در علوم مربوط به آثار جوی و هواشناسی به طور مثال پیش­بینی میزان بارش سالیانه و فیزیک زمین که به­طور مثال به منظور پیش­بینی حدودی زمین لرزه به کار برده می­شود.

جمع ­بندی

سری زمانی در داده کاوی : بسیاری از داده ­های بکار رفته در علم داده کاوی در حوزه های مختلف متعلق به سری­ های زمانی است. تحلیل سری ­های زمانی به شناسایی هر الگوی منظمی در مشاهدات گذشته، با هدف پیش بینی برای دوره­های آینده انجام می­شود، این استخراج الگو برای چیدمان برنامه­ های آینده در حوزه کسب و کار بسیار مهم است و توانایی تصمیم­گیری برای صاحبان کسب و کار را سهل­ تر می­کند.

تجزیه و تحلیل سری­های زمانی کاربردهای بسیاری در حوزه های تجاری، اقتصادی، اجتماعی ، زیست محیطی و صنعتی دارد. بسته به کاربرد خاص، پیش بینی­ ها ممکن است به فروش محصولات و خدمات در آینده و غیر اشاره داشته باشد. با تکیه بر اطلاعات حاصل از آنالیز داده ­های سری و وابسته به زمان می­توانیم اقتصادی پویاتر و بستری بهتر برای سرمایه گذاری را در کشور فراهم کنیم.

 

نویسنده: تیم پژوهش راهبرد

5/5 - (2 امتیاز)

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *