مقدمه ای بر طبقه بندی وخوشه بندی در داده کاوی

مقدمه ای بر طبقه بندی وخوشه بندی در داده کاوی

آکادمی داده

۱۳۹۷/۰۳/۰۵


  • 130 بازدید

به عنوان دو وظیفه اصلی در داده کاوی می توانند از روش های اجماع به دو دلیل بهره گیرند بالا بردن کارایی و خاصیت توزیع شدگی آنها. داده کاوی توزیعی می تواند کمیته ای از یاد گیرنده ها، درخت تصمیم توزیع شده و یا جمع آوری داده های گوناگون آموزش یک رده بند بر هر کدام باشد. چارچوبی توصیفی مسئله رده بندی توزیع شده در سه بعد قابل بررسی هستند. سه بعد اصلی مذکور شامل بعد داده ای، بعد یادگیرنده ها و بعد سطح ارتباط یادگیرنده ها می باشند. برای ایجاد تنوع روش های زیادی پیشنهاد شده است. مثال سعی می شود تا زیر مجموعه های متفاوتی از نمونه ها آموزشی تولید شود و رده بندهای مستقل روی آنها ایجاد شود. از جمله معروف ترین این روش ها می توان به روش های کیسه ای وتقویتی اشاره کرد. دراین روش ها، بجای استفاده از تمام نمونه ها، از زیر مجموعه ای از آنها برای آموزش رده بندهای پایه استفاده می شود.

 در سطح دیگر، از ویژگی ها برای ایجاد تنوع میان دسته ها استفاده می شود، به این صورت که هر رده بند از زیر مجموعه ای از ویژگی ها استفاده می کند. از نگاهی دیگر، می توان از انواع مختلفی از رده بند ها استفاده کرد تا آنها متفاوت باشند. در تمام روش های قبل اگر رده بند های زیادی ایجاد کنیم این امکان وجود دارد که بعضی از آنها همواره خروجی های مشابهی داشته باشند. لذا بعد از تولید تعدادی خوشه بند با هر روش دلخواهی، اعم از روش های بالا یا تصادفی، باید یک مکانیسم انتخاب رده بند های مناسب نیز استفاده شود که روش پیشنهادی یک روش موثر برای حل این مشکل است.

برخالف طبقه بندی، خوشه بندی همه رکوردها را به کالس های مختلف یا خوشه تبدیل می کند. در شرایط خوشه بند ی، تشابه در بعضی از اندازه گیری ها به صورت استاندارد می تواند در همان خوشه به حداقل برساند و در میان خوشه های مختلف به حداکثر برساند. خوشه بندی الگوریتمی است که در آن اشیا براساس ویژگی و خصوصیاتشان در قالب k گروه طبقه یا گروه بندی می شوند. K یک عدد مثبت است. گروه بندی هنگامی تمام خواهد شد که مجموعه مربعات فاصله بین داده و مرکز خوشه به حداقل برسد.

طبقه بندی وظیفه خیلی مهم در داده کاوی دارد، هدف آن این است که یک عملکرد طبقه بندی یا مدل طبقه بندی پیشنهاد دهد که بتواند اقالم داده را در پایگاه دسته بندی کند.

بررسی داده کاوی و پیرامون آن و کاربرد آن در حوزه پزشکی، خوشرفتار

کپی برداری بدون ذکر منبع، براساس قانون جرایم اینترتی و مادۀ 12 فصل سوم قانون جرایم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 

اگر در داده کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله، گپ و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.