سیری در مفهوم دسته بندی در داده کاوی

سیری در مفهوم دسته بندی در داده کاوی

آکادمی داده

۱۳۹۷/۰۳/۲۰


  • 53 بازدید

پایگاه داده ها منبع بسیار غنی از اطلاعات پنهان است که می توان به کمک این اطلاعات تصمیمات هوشمندی را اتخاذ نمود. در این میان دسته بندی و تخمین دو شکل از تحلیل داده ها محسوب می شوند که می توان به کمک آنها مدلی جهت توصیف داده ها استخراج کرد و یا برای داده های بعدی جهتی متصور شد . بدین وسیله داده هایی با حجم بالا نیز بهتر فهمیده می شوند.
روش هایی مانند دسته بندی و تخمین تلاش می کنند تا رابطه میان صفحات خاصه ورودی (که گاه متغیرهای مستقل نامیده می شوند ) را با یک یا چندین صفت خاصه هدف ( که گاه متغیر وابسته نامیده می شوند ) کشف کنند. در نهایت این رابطه با یک ساختار به عنوان مدل نمایش داده می شود.
با کمک این مدل و با شرط داشتن صفات خاصه ورودی می توانیم مقدار صفت خاصه هدف (برچسب کلاس) را تخمین بزنیم. به عبارت دیگر با کمک مدل قادر هستیم نمونه ها را به یکی از چندین دسته تعریف شده منتسب و یا مقدار تعیین شده ای را برای صفت خاصه هدف تعیین کنیم. 
فرایند ساخت مدل یک فرایند دو مرحله ای است، که در مرحله اول با کمک مجموعه داده های آموزشی که برچسب کلاس تمام نمونه های آن مشخص است، مدل ساخته می شود. این مرحله به نام مرحله یادگیری شناخته می شود. در مرحله دوم با کمک مجموعه داده های آزمایشی که در آن معمولا برچسب کلاس نامعلوم است، مدل بدست آمده اعتبارسنجی می شود. درواقع ارزشیابی مدل با توجه به اینکه کلاس چه تعداد از نمونه داده های آزمایشی درست تخمین زده شده است، محاسبه می شود.
روش های متعددی برای دسته بندی داده ها وجود دارند که از این میان میتوان به درخت تصمیم ، روش آماری بیز ، روش های تولید قواعد ، svm ، نزدیکترین همسایه و رگرسیون اشاره کرد. برای هریک از این روش ها شما میتوانید در Rapidminer عملگرهای مختلفی را پیدا کنید و استفاده آنها تقریبا یکسان و بسیار مشابه است.

آموزش گام به گام داده کاوی با رپید ماینر، اسماعیلی

کپی برداری بدون ذکر منبع، براساس قانون جرایم اینترتی و مادۀ 12 فصل سوم قانون جرایم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 

اگر در زمینه داده کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله، گپ و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.