ارائه روشی برپایه متن کاوی برای استخراج اطلاعات آب و هوا

ارائه روشی برپایه متن کاوی برای استخراج اطلاعات آب و هوا

آکادمی داده

۱۳۹۷/۰۵/۲۳


  • 68 بازدید

در این سلسله مقالات به مفاهیم و کاربرد های داده‌کاوی، متن کاوی و علوم مرتبط با علم داده پرداخته می‌شود. با توجه به حجم عظیم مقالات تولید شده در زبان فارسی در حوزه داده کاوی و علم داده، آکادمی داده تصمیم گرفت مقالات فارسی منتشر شده در این حوزه را خلاصه برداری کرده و در اختیار علاقه مندان قرار دهد. این مقالات ابتدا با معرفی موضوع و کارهای انجام شده آغاز می شود و سپس مجموعه داده یا دیتاست تحقیق ارائه می شود و سپس پیاده سازی انجام شده در رپیدماینر، وکا یا پایتون ارائه شده و نتایج تحلیل می شود.

در این رشته نوشته ها ابتدا خلاصه ای از مقاله ارائه شده و سپس نتیجه گیری مقاله عینا آورده می گردد و سپس فایل پی دی اف آن نیز برای دانلود در اختیار محققین و پژوهشگران عزیز قرار می گیرد. 

 

در این بخش می توان با اتکا به نتایج بدست آمده ادعا نمود که روش شبکه های عصبی مصنوعی با استفاده از انتخاب ویژگی های تأثیرگذار به روش شاخص سود اطلاعاتی با کسب شاخص دقت ۹۷٪ و شاخص F برابر با ۹۶٪ از سایر مدل های رده بندی عملکرد بهتری در تشخیص متون داشته است.
در حالت کلی می توان بیان نمود که براساس نوآوری این پژوهش در نحوه بکارگیری روش ها و الگوریتم های موجود، مجموعه داده جمع آوری شده، به روش شاخص سود اطلاعاتی پیش پردازش شده و سپس انواع مختلف مدل سازی ها بر روی مجموعه داده صورت گرفت و در پایان بهترین مدل برروی مجموعه داده معرفی گردید. لازم به ذکر است بدلیل اینکه مجموعه داده موجود، جهت انجام این پژوهش جمع آوری شده است به همین دلیل این نتایج را با نتایج دیگری نمی توان مقایسه کرد. به هر حال نتایج نشان میدهد که مدل های رده بندی آزمایش شده بر روی متن های فارسی مثل متن های انگلیسی قابل سازگاری می باشد.
اگر محققان در آینده بخواهند توسعه ای بر نتایج حاصل از این تحقیق پیشنهاد دهند، می توانند موارد زیر را مدنظر قرار دهند.
 1. استفاده از روشهای تکاملی به منظور انتخاب متغییرهای بهینه، مانند روشهای الگوریتم ژنتیک، ازدحام ذرات، الگوریتم کولونی مورچگان و غیره.
 2. با توجه به اینکه در این تحقیق مشخص شد که روش انتخاب ویژگی براساس شاخص سود اطلاعاتی بهترین روش می باشد. محققان می توانند در آینده ابتدا از این روش به منظور انتخاب ویژگیها استفاده نمایند و سپس به منظور افزایش دقت مدل های مورد استفاده از سایر روش۔ های پایه رده بندی یا روش های جمعی رده بندی استفاده نمایند.
3 . با توجه به ماهیت موجود در مجموعه داده ها لازم است نتایج بدست آمده در این تحقیق برروی مجموعه داده های متنی دیگر که مربوط به سایر مسائل رده بندی می باشند نیز اعمال شده و نتایج آن گزارش گردد. 

 

این مقاله از طریق لینک قابل دسترسی است و محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند. 

اگر به دنبال مجموعه مقالات فارسی در موضوعات مختلف هستید به لینک مراجعه بفرمایید. در این لینک مجموعه مقالات فارسی در حوزه های مختلف داده کاوی و متن کاوی ارائه شده است.

اگر به پژوهش در حوزه متن کاوی علاقه مند هستید توصیه می شود حتما مجموعه بی نظیر هفتاد و چهار مقاله فارسی در زمینه متن کاوی  و مجموعه های مشابه آن را تهیه بفرمایید.

اگر در زمینه متن کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.  

 

 


افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.