استخراج ارتباط معنایی در جملات با استفاده از تکنیک های متن کاوی و پردازش زبان طبیعی

استخراج ارتباط معنایی در جملات با استفاده از تکنیک های متن کاوی و پردازش زبان طبیعی

آکادمی داده

۱۳۹۷/۰۵/۲۳


  • 73 بازدید

در این سلسله مقالات به مفاهیم و کاربرد های داده‌کاوی، متن کاوی و علوم مرتبط با علم داده پرداخته می‌شود. با توجه به حجم عظیم مقالات تولید شده در زبان فارسی در حوزه داده کاوی و علم داده، آکادمی داده تصمیم گرفت مقالات فارسی منتشر شده در این حوزه را خلاصه برداری کرده و در اختیار علاقه مندان قرار دهد. این مقالات ابتدا با معرفی موضوع و کارهای انجام شده آغاز می شود و سپس مجموعه داده یا دیتاست تحقیق ارائه می شود و سپس پیاده سازی انجام شده در رپیدماینر، وکا یا پایتون ارائه شده و نتایج تحلیل می شود.

در این رشته نوشته ها ابتدا خلاصه ای از مقاله ارائه شده و سپس نتیجه گیری مقاله عینا آورده می گردد و سپس فایل پی دی اف آن نیز برای دانلود در اختیار محققین و پژوهشگران عزیز قرار می گیرد. 

 

به منظور به دست آوردن روابط خاص بین رویدادها، در این پژوهش، مدلی سه مرحله ای برای استخراج خودکار ارتباط معنایی معرفی گردید. در مرحله اول جملات سببی و غیر سببی از متن وب استخراج شد و بعد از آن با نشانه گذاری و برچسب زنی به جملات درخت نحوی و وابستگی جملات رسم شد. سپس با استخراج گره های خاص و اعمال فیلترینگ، جملات با افعال سببی خاص استخراج شدند. که از لحاظ معنایی به دلیل داشتن رویداد سبب و اثر دارای ارتباط معنایی می باشند. برای ارزیابی عملیات انجام شده یک امتیاز آماری و معرفی نموده و با معیارهای موجود مقایسه شد و با استفاده از سه معیار ارزیابی دسته بندها، دقت و کارایی امتیاز پیشنهادی در مقاله مورد بررسی قرار گرفت و مشاهده شد که در تمامی موارد امتیاز پیشنهادی در مقاله دقتی بالاتر از امتیازهای موجود دارد. در ادامه این کار تلاش بر اینست که ارتباطات سببی با دیگر نشانه های سببی یعنی قید، اسم، تابع و حرف اضافه با همین مدل استخراج گردد. همچنین با توسعه این مفاهیم به زبان فارسی، استخراج ارتباطات سیبی و رویدادهای سیب و اثر در انواع جملات سببی در زبان فارسی در ادامه ی این پژوهش مد نظر خواهد بود.

 

این مقاله از طریق لینک قابل دسترسی است و محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند. 

اگر به دنبال مجموعه مقالات فارسی در موضوعات مختلف هستید به لینک مراجعه بفرمایید. در این لینک مجموعه مقالات فارسی در حوزه های مختلف داده کاوی و متن کاوی ارائه شده است.

اگر به پژوهش در حوزه متن کاوی علاقه مند هستید توصیه می شود حتما مجموعه بی نظیر هفتاد و چهار مقاله فارسی در زمینه متن کاوی  و مجموعه های مشابه آن را تهیه بفرمایید.

اگر در زمینه متن کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.  

 

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.