بهبود دسته بندی متون بوسیله ترکیبی از تکنیک متن کاوی بیز ساده و درخت تصمیم

بهبود دسته بندی متون بوسیله ترکیبی از تکنیک متن کاوی بیز ساده و درخت تصمیم

آکادمی داده

۱۳۹۷/۰۵/۲۳


  • 93 بازدید

در این سلسله مقالات به مفاهیم و کاربرد های داده‌کاوی، متن کاوی و علوم مرتبط با علم داده پرداخته می‌شود. با توجه به حجم عظیم مقالات تولید شده در زبان فارسی در حوزه داده کاوی و علم داده، آکادمی داده تصمیم گرفت مقالات فارسی منتشر شده در این حوزه را خلاصه برداری کرده و در اختیار علاقه مندان قرار دهد. این مقالات ابتدا با معرفی موضوع و کارهای انجام شده آغاز می شود و سپس مجموعه داده یا دیتاست تحقیق ارائه می شود و سپس پیاده سازی انجام شده در رپیدماینر، وکا یا پایتون ارائه شده و نتایج تحلیل می شود.

در این رشته نوشته ها ابتدا خلاصه ای از مقاله ارائه شده و سپس نتیجه گیری مقاله عینا آورده می گردد و سپس فایل پی دی اف آن نیز برای دانلود در اختیار محققین و پژوهشگران عزیز قرار می گیرد. 

 

با توجه به افزایش حجم روزافزون دسترسی به منابع متنی، دسته بندی داده های متنی به امری مهم تبدیل شده است. دسته بندی خودکار متون بدین معنی است که اسناد متنی موجود را به چند دسته از قبل تعریف شده که اسناد متعلق به آنها هستند، نسبت دهیم. به طورکلی فرایند دسته بندی متون دارای دو بخش اصلی انتخاب ویژگی و الگوریتم یادگیری است. تاکنون روشهای متنوعی برای دسته بندی متون ارائه گردیده است. در این پژوهش یک روش ترکیبی ارائه شد که از روش فیلتری IG برای انتخاب ویژگی بهره می برد. دلیل استفاده از روش فیلتری کاهش پیچیدگی دسته بندی می باشد. در فاز یادگیری روش پیشنهادی از سه الگوریتم بیز، درخت تصمیم و ماشین بردار پشتیبان استفاده می کند. در این روش دسته ای برای سند متنی انتخاب می شود که تعداد دسته بند بیشتری به آن رأی داده اند. تعداد دسته بندها فرد در نظر گرفته شده است که در هنگام رأی گیری نیازی به رأی گیری دوباره نباشد. نتایج نشان می دهد که استفاده از دسته بند ترکیبی عملکرد بهتری نسبت به دسته بندهای منفرد خواهد داشت. ایده این است که تصمیم چند خبره می تواند بهتر از تصمیم یک خبره باشد. نتایج به دست آمده نشان دهنده برتری روش پیشنهادی در مقایسه با الگوریتم های منفرد می باشد.

 

این مقاله از طریق لینک قابل دسترسی است و محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند. 

اگر به دنبال مجموعه مقالات فارسی در موضوعات مختلف هستید به لینک مراجعه بفرمایید. در این لینک مجموعه مقالات فارسی در حوزه های مختلف داده کاوی و متن کاوی ارائه شده است.

اگر به پژوهش در حوزه متن کاوی علاقه مند هستید توصیه می شود حتما مجموعه بی نظیر هفتاد و چهار مقاله فارسی در زمینه متن کاوی  و مجموعه های مشابه آن را تهیه بفرمایید.

اگر در زمینه متن کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 


افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.