ارائه یك الگوریتم متن كاوی برای چالش تشخیص مخفف ها در متون زیست پزشكی

ارائه یك الگوریتم متن كاوی برای چالش تشخیص مخفف ها در متون زیست پزشكی

آکادمی داده

۱۳۹۷/۰۵/۲۳


  • 57 بازدید

در این سلسله مقالات به مفاهیم و کاربرد های داده‌کاوی، متن کاوی و علوم مرتبط با علم داده پرداخته می‌شود. با توجه به حجم عظیم مقالات تولید شده در زبان فارسی در حوزه داده کاوی و علم داده، آکادمی داده تصمیم گرفت مقالات فارسی منتشر شده در این حوزه را خلاصه برداری کرده و در اختیار علاقه مندان قرار دهد. این مقالات ابتدا با معرفی موضوع و کارهای انجام شده آغاز می شود و سپس مجموعه داده یا دیتاست تحقیق ارائه می شود و سپس پیاده سازی انجام شده در رپیدماینر، وکا یا پایتون ارائه شده و نتایج تحلیل می شود.

در این رشته نوشته ها ابتدا خلاصه ای از مقاله ارائه شده و سپس نتیجه گیری مقاله عینا آورده می گردد و سپس فایل پی دی اف آن نیز برای دانلود در اختیار محققین و پژوهشگران عزیز قرار می گیرد. 

 

در این مقاله ، یك الگوریتم ترازبندی برای شناسایی تعاریف متناظر با مخفف ها ارائه كردیم. در تدارك برای الگوریتم ترازبندی، ما نیاز به تشخیص مخفف ها و تعریف فضای جستجو برای تعاریفشان داشتیم. از فضای جستجو یك لیست از تعاریف كاندید ساختیم، هر آیتم از این لیست با مخفف با ها استفاده از الگوریتم تراز بندی بررسی شده و سپس تعریف بهینه انتخاب شد. بدلیل استفاده از قوانینی، الگوریتم دقت بالایی را نشان می دهد. همچنین الگوریتم می تواند بعضی مخفف های بی قاعده را پیدا كرده و یك نتیجه خوبی را در متون زیست پزشكی بدست آورد . در ادامه نتایج ارزیابی الگوریتم ترازبندی قانونمند برای شناسایی تعاریف متناظر با ها مخفف ارائه گردید. الگوریتم با زبان برنامه نویسی جاوا پیاده سازی شد. برای ارزیابی الگوریتم از متون استاندارد طلایی Medstract ( قدیمی و جدید) استفاده گردید. نتایج ارزیابی نشان داد كه الگوریتم پیشنهادی نسبت به روش های پیشین از لحاظ دقت و فراخوانی و در نتیجه measure-F ، كارایی بالاتری دارد. امتیاز اصلی این الگوریتم دقت بالای آن می باشد كه این به دلیل استفاده از روشی قانونمند در الگوریتم محقق یافته است.

 

این مقاله از طریق لینک قابل دسترسی است و محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند. 

اگر به دنبال مجموعه مقالات فارسی در موضوعات مختلف هستید به لینک مراجعه بفرمایید. در این لینک مجموعه مقالات فارسی در حوزه های مختلف داده کاوی و متن کاوی ارائه شده است.

کپی برداری بدون ذکر منبع، بر اساس قانون جرائم اینترنتی و مادۀ 12 فصل سوم قانون جرائم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 
اگر در زمینه متن کاوی در حال تحقیق یا پیاده سازی پروژه تجاری یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 


افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.