داده کاوی data mining فرایند تجزیه و تحلیل حجم عظیمی از داده ها برای کشف هوش تجاری است؛ این فرایند توسط شرکتها برای تبدیل داده های خام به اطلاعات مفید و همچنین شامل کاوش و تجزیه و تحلیل انبوهی از اطلاعات برای به دست آوردن الگوها و روندهای معنی دار، مورد استفاده قرار میگیرد. کاوش در داده به شرکتها در حل مشکلات، کاهش خطرات و استفاده از فرصتهای جدید کمک میکند. این شاخه از علم داده، نام خود را از شباهتهای جستجوی اطلاعات ارزشمند در یک پایگاه داده بزرگ با استخراج از کوه برای یافتن سنگ معدن گرفته است. برای یافتن ارزشهای پنهان، هر دو فرآیند نیاز به غربال کردن در حجم وسیع دارند.
آینده برای داده کاوی و علم داده بسیار روشن است زیرا مقدار داده فقط افزایش مییابد. تا سالهای آتی مدیران و کاربران سازمانها در جهان داده های دیجیتال با انباشتی از داده ها رو به رو خواهند شد که مدیریت این دادهها برای سازمان بسیار حیاتی است که توسط علم داده امکانپذیر خواهد بود. به دلیل پیشرفت در فناوری، فناوریهای استخراج اطلاعات ارزشمند از داده ها بسیار پیشرفت خواهد کرد. تا چند دهه قبل فقط سازمانهایی مانند ناسا میتوانستند از ابر رایانه های خود برای تجزیه و تحلیل داده ها استفاده کنند هزینه ذخیره سازی و محاسبه داده ها بسیار زیاد بوده و در توان کمپانیهای کوچک نبود اما اکنون، شرکتها انواع کارهای مختلف را با یادگیری ماشین، هوش مصنوعی و یادگیری عمیق با هزینه های مناسب تر و حجم انبوهی از دادهها در کوتاهترین زمان ممکن انجام میدهند و این خود کمک بزرگی به تمامی کسب و کارهای کوچک و بزرگ در راستای رسیدن به موفقیت خواهد بود.