انتخاب زیر مجموعه ویژگی ها یا انتخاب ویژگی

انتخاب زیر مجموعه ویژگی ها یا انتخاب ویژگی

آکادمی داده

۱۳۹۷/۰۳/۲۸


  • 183 بازدید

 یکی از عملیات های کاهش ابعاد،  انتخاب زیر مجموعه ای از ویژگی هاست. در این ویژگی های افزونه و غیر مرتبط حذف خواهند شد. ویژگی های افزونه به ویژگی هایی گفته می شود که با توجه به سایر ویژگی ها قابل محاسبه هستند. وجود ویژگی های افزونه باعث خواهد شد فضای الگوریتم بی جهت بزرگ شود. بنابراین انتخاب یک زیر مجموعه از ویژگی ها می تواند بسیار مفید باشد .ویژگی های غیر مرتبط ویژگی هایی هستند که هیچ ارزش اطلاعاتی برای مساله نداشته باشند.به عنوان مثال برای محاسبه احتمال مهاجرت دانشجویان به خارج از کشور ویژگی هایی از جمله شماره دانشجویی یا قد غیر مرتبط هستند. روشهای انتخاب زیر مجموعه ای از ویژگی ها عبارتند از :
-  روش ناآگاهانه
در این روش تمام زیرمجموعه‌های امکان پذیر از ویژگی ها و الگوریتم داده کاوی اعمال خواهند شد. این کار معمولا روی بخشی از داده ها انجام می شود. در نتیجه به طور تصادفی یک نمونه کوچک از داده ها انتخاب می کنیم. این روش هنگامی که تعداد ویژگی ها کم باشد مناسب است. در واقع در این روش، الگوریتم داده کاوی فقط  یادگیری مدل با تمامی زیرمجموعه‌های امکان‌پذیر از ویژگی ها را به عهده دارد و کوششی برای شناسایی هوشمندانه ویژگی های موثر نمی کند.
- روش توکار
 در این روش الگوریتم داده کاوی هم یادگیری مدل و هم انتخاب ویژگی را به صورت توأمان انجام می دهد. در واقع هنگامی که الگوریتم در حال یادگیری مدل است، ویژگی های مهم را نیز انتخاب می نماید.
- روش فیلتری
 در این روش قبل از اجرای الگوریتم داده کاوی، انتخاب ویژگی انجام می شود. سپس ویژگی های انتخاب شده در اختیار الگوریتم داده کاوی قرار می گیرند و از الگوریتم فقط برای ساخت مدل استفاده خواهد شد.
- روش انحصاری
 در این روش از الگوریتم داده کاوی تنها برای انتخاب ویژگی استفاده می شود و الگوریتم ساخت مدل را برعهده ندارد.
 یکی از کاربردهای مهم عملیات انتخاب زیر مجموعه ویژگی ها در داده کاوی، تمرکز بر برخی ویژگی ها جهت یافتن ارتباط میان آنها است. ما در این کتاب نام داده کاوی پنجره ای را برای اینکار بر می گزینیم. در واقع در داده کاوی پنجره ای، دریچه و یا پنجره ای روبه داده باز می شود و الگوریتم سعی در یافتن نظمی میان داده های آن دریچه ( بدون توجه به وجود سایر داده ها ) می کند. به عنوان مثال فرض کنید که پزشک بخواهد نظم حاکم بر فشار خون، قند خون و سن را میان بیماران دیابتی بیابد. بنابراین ما می بایست در مرحله پیش پردازش داده با انتخاب ویژگی های مطلوب، تنها از دریچه این ویژگی‌ها به کاوش داده ها بپردازیم. در داده کاوی پنجره ای امکان تمرکز برروی زیرمجموعه‌ای از رکوردها نیز وجود دارد که در بخش بعد به آن می پردازیم.

داده کاوی کاربردی، صنیعی آباده

کپی برداری بدون ذکر منبع، براساس قانون جرایم اینترتی و مادۀ 12 فصل سوم قانون جرایم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 

اگر در زمینه داده کاوی در حال تحقیق یا پیاده سازی پروژه تجاری یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.