مراحل خلاصه سازی مبتنی بر یادگیری ماشین - جداسازی جملات

مراحل خلاصه سازی مبتنی بر یادگیری ماشین - جداسازی جملات

آکادمی داده

۱۳۹۷/۰۳/۰۶


  • 121 بازدید

امروزه با رشد سریع اطلاعات و ها، داده یافتن اطلاعات مناسب و كارا از اهمیت خاصی برخوردار است. هدف از خلاصه سازی  متن، فراهم كردن خلاصه ای از محتویات مطابق با اطلاعات مورد نیاز كاربر است. بنابراین كاربران میتوانند با سرعت بیشتری به اطلاعات موجود در متن دسترسی پیدا كنند. خلاصه سازی  در اصل فرآیند فشرده سازی  یك منبع است، به كه طوری نتیجه كار شامل اطلاعات مهم آن منبع باشد. به عبارت دیگر استخراج قسمتهای مهم از یك یا چند متن را خلاصه سازی  گویند.

تمام روشهای خلاصه سازی  نیازمند شناسایی مرز ها واژه و ها جمله برای جداسازی ها آن از هم هستند. در بیشتر مواقع، تعیین مرز ها جمله از طریق بررسی علایم جداكننده انجام می شود.  این علائم عبارتند از : "." ، "!" ، "؟" ، ":"

باید توجه داشت كه جستجو برای یافتن این علایم به تنهایی كافی نیست و در بسیاری موارد مشكلاتی را به همراه دارد به عنوان مثل اختصارات در فارسی با یك یا چند نقطه از هم جدا می شوند. مانند ه.ق كه مخفف هجری قمری است. بنابراین بررسی علایم به تنهایی كافی نیست و معمولا برای بهبود كارایی باید از روشهای پیچیده تری استفاده نمود.

خلاصه سازی متون با تكنیكهای مبتنی بر یادگیری ماشین، شهرآئینی

اگر به پژوهش در حوزه متن کاوی علاقه مند هستید توصیه می شود حتما مجموعه بی نظیر هفتاد و چهار مقاله فارسی در زمینه متن کاوی  و مجموعه های مشابه آن را تهیه بفرمایید.

اگر در زمینه متن کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد.

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.