بکارگیری تکنیکی از داده کاوی برای بهبود کارآیی سیستم های استخراج اطلاعات از متن

بکارگیری تکنیکی از داده کاوی برای بهبود کارآیی سیستم های استخراج اطلاعات از متن

آکادمی داده

۱۳۹۷/۰۵/۲۴


  • 68 بازدید

در این سلسله مقالات به مفاهیم و کاربرد های داده‌کاوی، متن کاوی و علوم مرتبط با علم داده پرداخته می‌شود. با توجه به حجم عظیم مقالات تولید شده در زبان فارسی در حوزه داده کاوی و علم داده، آکادمی داده تصمیم گرفت مقالات فارسی منتشر شده در این حوزه را خلاصه برداری کرده و در اختیار علاقه مندان قرار دهد. این مقالات ابتدا با معرفی موضوع و کارهای انجام شده آغاز می شود و سپس مجموعه داده یا دیتاست تحقیق ارائه می شود و سپس پیاده سازی انجام شده در رپیدماینر، وکا یا پایتون ارائه شده و نتایج تحلیل می شود.

در این رشته نوشته ها ابتدا خلاصه ای از مقاله ارائه شده و سپس نتیجه گیری مقاله عینا آورده می گردد و سپس فایل پی دی اف آن نیز برای دانلود در اختیار محققین و پژوهشگران عزیز قرار می گیرد. 

 

یکی از مراحلی که برای برای تبدیل خروجی سیستم های استخراج اطلاعات به پایگاه های داده ی مورد قبول الگوریتم C4 . 5RULES وجود داشت، یکپارچه سازی عبارات هم معنی بود. این کار در پیاده سازی صورت گرفته به صورت دستی انجام شد ولی می توان بر روی استفاده از روش های خودکار مانند محاسبه ی شباهت دو عبارت از نظر حروف تشکیل دهنده [۱۵] تحقیق کرد.
در بررسی صورت گرفته مقادیر قاب های خروجی همیشه گسسته فرض شد و برای حالتی که مقادیر پیوسته باشند مانند طول یا قیمت بحثی نشد. یافتن روش هایی برای پیشگویی مقادیر پیوسته می تواند موضوعی برای تحقیقات آتی باشد.
در این مقاله، اینکه از چه فیلدهایی از جدول برای تولید قواعد پیشگو استفاده شود به صورت ذهنی بدست آمد. اگر بتوان ارتباط میان ستون های جدول را از روی محتویات آنها پیدا کرد، می توان انتخاب فیلدهای مناسب برای یادگیری قواعد پیشگو را خودکار انجام داد.
مطمئنا در آینده تحقیقات بیشتری بر روی استفاده از تکنیک های موجود در موضوعات دیگر هوش مصنوعی برای بهبود کارآیی سیستم های استخراج اطلاعات صورت خواهد گرفت.
نتیجه گیری اینکه، همکاری استخراج اطلاعات از متن و داده کاوی می تواند برای کاربردهای مختلفی مفید باشد. سیستم استخراج اطلاعات خروجی هایی را در اختیار قرار میدهد که داده کاوی می تواند از روی آن، دانش مفیدی برای کاربردهای مختلف بویژه متن کاوی تولید کند.
متن کاوی موضوع نسبتا جدیدی است که در آن پردازش های زبان طبیعی، یادگیری ماشین و بازیابی اطلاعات با هم همکاری دارند. ادغام این روش ها می تواند منجر به ایجاد تکنیک های جدید و مفید برای استخراج دانش از مجموعه های حجیم متنی شوند.

 

این مقاله از طریق لینک قابل دسترسی است و محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند. 

اگر به دنبال مجموعه مقالات فارسی در موضوعات مختلف هستید به لینک مراجعه بفرمایید. در این لینک مجموعه مقالات فارسی در حوزه های مختلف داده کاوی و متن کاوی ارائه شده است.

کپی برداری بدون ذکر منبع، بر اساس قانون جرائم اینترنتی و مادۀ 12 فصل سوم قانون جرائم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 
اگر در زمینه متن کاوی در حال تحقیق یا پیاده سازی پروژه تجاری یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 


افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.