مراحل خلاصه سازی مبتنی بر یادگیری ماشین - نمایش جملات بر اساس ویژگی

مراحل خلاصه سازی مبتنی بر یادگیری ماشین - نمایش جملات بر اساس ویژگی

آکادمی داده

۱۳۹۷/۰۳/۰۶


  • 81 بازدید

امروزه با رشد سریع اطلاعات و ها، داده یافتن اطلاعات مناسب و كارا از اهمیت خاصی برخوردار است. هدف از خلاصه سازی  متن، فراهم كردن ای خلاصه از محتویات مطابق با اطلاعات مورد نیاز كاربر است. بنابراین كاربران میتوانند با سرعت بیشتری به اطلاعات موجود در متن دسترسی پیدا كنند. خلاصه سازی  در اصل فرآیند فشرده سازی  یك منبع است، به كه طوری نتیجه كار شامل اطلاعات مهم آن منبع باشد. به عبارت دیگر استخراج قسمتهای مهم از یك یا چند متن را خلاصه سازی  گویند.

در گام سوم هر یك از جملات به وسیله مجموعهای از ویژگیها بیان می شود. همانطور كه قبلا نیز اشاره شد، دو نوع ویژگی وجود دارد. نوع اول ویژگیهای غیرساختاری مانند تعداد تكرار كلمات و موقعیت جمله میباشد و نوع دوم ویژگیهای ساخت یافته مانند كلمات متضاد و كلمات بیان كننده علت هستند كه این نوع ویژگی مرتبط با مفهوم متن می باشد. به عنوان مثال جملات پیچیده میتوانند به چندین بخش مجزا تقسیم شوند. بخش اصلی یك جمله را هسته و بخشهای دیگر را تابع می نامند كه توسط یك رابطه معنایی مانند كلمات اما، اگر، زیرا به هم مرتبط شده اند. در صورت مشاهده این كلمات ارتباطی باید توجه داشت جمله هسته از اهمیت بیشتری برخوردار است و در نتیجه از شانس بیشتری برای حضور در خلاصه برخوردار می باشد. بر این اساس جملات موجود در متن را با استفاده از الگوریتمهای موجود به چندین سطح تقسیم بندی نموده و هسته و تابع آن را مشخص نموده و بر این اساس به هر جمله درجه اهمیت خاصی اختصاص می دهیم. در نهایت با در نظر گرفتن هر دو نوع ویژگی و مقادیر مربوطه آنها یك بردار ویژگی برای هر جمله از متن در نظر می گیریم. البته در این تحقیق تنها ویژگیهای غیر ساخت یافته مورد استفاده قرار گرفته اند كه شامل شماره پاراگراف، آفست جمله در پاراگراف، تعداد كلمات ریشه، تعداد كلمات عنوان و متوسط تكرار كلمات در هر جمله می باشد.

خلاصه سازی متون با تكنیكهای مبتنی بر یادگیری ماشین، شهرآئینی

کپی برداری بدون ذکر منبع، براساس قانون جرایم اینترتی و مادۀ 12 فصل سوم قانون جرایم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 

اگر در زمینه خلاصه سازی متون در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله، گپ و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.