طعنه کاوی چیست؟

طعنه کاوی چیست؟

آکادمی داده

۱۳۹۶/۱۱/۰۴


  • 359 بازدید

طعنه کاوی علم شناسایی و طبقه بندی طعنه ها در متن هاست. دنیای مجازی امروزه پر است از کاربرانی که در سرتاسر وب به ابراز نظر و عقیده خود می‌پردازند. در دنیای قدیم ابراز نظر ممکن بود هزینه هایی داشته باشد به طور مثال صحبت کردن غیر مثبت درباره حاکمان و سلاطین در دوره قدیم هزینه های سنگینی برای گوینده داشت. این موضوع با آمدن دنیای مجازی تا حدودی کاسته شد. افراد معتقدند می‌توانند به صورت ناشناس در فضای مجازی سیر کنند و هر آنچه می اندیشند به زبان بیاورند. این موضوع با آمدن شبکه های اجتماعی بیشتر مطرح شد. برخی معتقدند شبکه اجتماعی و فضای مجازی باعث دمکراتیزه تر شدن جوامع شده است زیرا افراد جامعه می‌توانند بدون مشکل و ترس نسبت به تمامی وقایع و مسائلی که می شناسند ابراز نظر کنند. این حجم گسترده نظرات باعث شد داده کاوان به فکر استفاده از این نظرات برای استخراج دانش باشند. این نظرات حاوی احساسات پنهانی بودند که باید شناسایی می شد و پس از شناسایی باید از آن ها دانشی استخراج می شد.

 در این مقاله سعی می شود طعنه کاوی مورد ارزیابی قرار گیرد و سپس در مقاله دیگری مجموعه داده ای برای طعنه کاوی فارسی ارائه خواهد شد .حوزه طعنه کاوی به دنبال شناسایی طعنه نهفته در متن است. در حقیقت دانشی که طعنه کاوی به دنبال آن است طعنه ای است که در یک متن وجود دارد. طعنه ها در زندگی روزمره ما به صورت گسترده وجود دارد. افراد سعی می کنند پیام های خود را در قالب طعنه ابراز نمایند. طعنه در کنار زندگی روزمره در شبکه های اجتماعی و فضای وب نیز حضور دارد. این حضور باعث شده است زمینه تحقیقاتی با نام طعنه کاوی شکل بگیرد.

در تعریف طعنه آمده است:

"عیب‌جویی کردن، توبیخ و سرزنش کردن. بیغاره؛ ملامت و گواژه. به معنی بد گفتن کسی را مجاز است و با لفظ کشیدن و بردن و زدن و کردن و داشتن و فروختن و باریدن مستعمل"

استفاده از طعنه در شبکه های اجتماعی بسیار مرسوم است زیرا انتقاد بدین ترتیب با زبان طنز ابراز می‌شود. به طور مثال: در توییت، "صحبت های روحانی خیلی قانع کننده بود خیلی خیلی" به صورت مشهود طعنه مشاهده می شود. ولی در جمله "روحانی در مورد اقدامات انجام شده گزارشی به مجلس داد." طعنه الگوریتم مشاهده نشده و جمله به صورت صریح بیان می شود.  

در طعنه کاوی متن دارای طعنه از متن بدون طعنه و صریح تمیز می شود. در واقع مدل طبقه بندی ارائه می شود که جملات با طعنه و جملات بدون طعنه را طبقه بندی می نماید. به همین دلیل در طعنه کاوی نیز روش ها و الگوریتم های متن کاوی و داده کاوی به صورت وسیع استفاده می شود. به طور مثال در کارهای اولیه انجام شده برای طعنه کاوی الگوریتم های کلاسیک یادگیری ماشین مورد استفاده قرار گرفته است. این حوزه تحقیقاتی برای زبان فارسی کمتر مورد توجه قرار گرفته است و تحقیقاتی نادری برای این حوزه انجام شده است. 

کپی برداری بدون ذکر منبع، براساس قانون جرایم اینترتی و مادۀ 12 فصل سوم قانون جرایم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است!