آماده سازی داده: انتخاب داده در آماده سازی برای داده کاوی

آماده سازی داده: انتخاب داده در آماده سازی برای داده کاوی

آکادمی داده

۱۳۹۷/۰۳/۲۸


  • 181 بازدید

به مجموعه عملیاتی که منجر به تولید مجموعه ای از داده های پالایش شده قابل کاوش خواهد شد، اصطلاحا آماده سازی داده گفته می شود. این عملیات از مراحل مختلفی تشکیل می شود که در این قسمت یکی از مراحل مورد اشاره قرار می گیرد. 

در این مرحله بخشی از انباره داده مرکزی ذخیره شده که هدف کاوش فرآیند داده کاوی خواهد بود، انتخاب می شود. در مسایل پزشکی - بهداشتی، فرض کنید که بخواهیم مدلی برای بیماران دیابتی بسازیم، بنابراین باید مجموعه داده مربوط به بیماران دیابتی را از انبار داده آماده شده در انبار داده پزشکی - بهداشتی بسیار حجیم است و به هیچ عنوان نباید برای کشف دانش مربوط به بیماران دیابتی دخالت داده شود انتخاب گردد. داده همان انبار داده پزشکی نیست زیرا علاوه بر آنکه هیچ ارتباطی به بیماری دیابت ندارد. به دلیل حجیم بودن داده های مورد پردازش، سبب خواهد شد که الگوریتم یادگیری دریافتن نظم حاکم بر داده های بیمار دیابتی کاملا سردرگم شده و در نهایت به احتمال زیاد ناموفق عمل کند. بنابراین در مرحله انتخاب داده، مجموعه داده هایی که مستقیماً به مساله مورد بررسی مربوط هستند، از انباره داده مرکزی انتخاب شده و به مرحله پیش پردازش داده معرفی می‌شوند.

داده کاوی کاربردی، صنیعی آباده

کپی برداری بدون ذکر منبع، براساس قانون جرایم اینترتی و مادۀ 12 فصل سوم قانون جرایم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 

اگر در زمینه داده کاوی در حال تحقیق یا پیاده سازی پروژه تجاری یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.