سرقت ادبی و تاثیر آن بر زمینه های علمی و حرفه ای با استفاده از متن کاوی

سرقت ادبی و تاثیر آن بر زمینه های علمی و حرفه ای با استفاده از متن کاوی

آکادمی داده

۱۳۹۷/۰۵/۲۳


  • 50 بازدید

در این سلسله مقالات به مفاهیم و کاربرد های داده‌کاوی، متن کاوی و علوم مرتبط با علم داده پرداخته می‌شود. با توجه به حجم عظیم مقالات تولید شده در زبان فارسی در حوزه داده کاوی و علم داده، آکادمی داده تصمیم گرفت مقالات فارسی منتشر شده در این حوزه را خلاصه برداری کرده و در اختیار علاقه مندان قرار دهد. این مقالات ابتدا با معرفی موضوع و کارهای انجام شده آغاز می شود و سپس مجموعه داده یا دیتاست تحقیق ارائه می شود و سپس پیاده سازی انجام شده در رپیدماینر، وکا یا پایتون ارائه شده و نتایج تحلیل می شود.

در این رشته نوشته ها ابتدا خلاصه ای از مقاله ارائه شده و سپس نتیجه گیری مقاله عینا آورده می گردد و سپس فایل پی دی اف آن نیز برای دانلود در اختیار محققین و پژوهشگران عزیز قرار می گیرد. 

 

در این مقاله، صحت استفاده از ارائه ی توزیع شده ی کلمات برای تعریف تشابه در اسناد را بررسی کردیم . با توجه به افزایش استفاده از کامپیوتر و اینترنت و همینطور افزایش متون دیجیتال، سرقت ادبی افزایش پیدا کرده است. به همین دلیل، روشها و رویکردهای مختلفی بر تشخیص و جلوگیری از سرقت ادبی ارائه شده است. یکی از اولین مشکلاتی که در این زمینه وجود دارد عدم وجود متون اصلی است که از این متون سرقت شده است و به متن دیگری انتقال داده شده است و به همین دلیل محاسبات الگوریتم های ارائه شده در این زمینه محدود می شود. با توجه به این مسئله، الگوریتمهایی که به متون مرجع وابسته نیستند مورد مطالعه قرار گرفته است. الگوریتم هایی که قابلیت تشخیص سرقت ادبی براساس تغییرات صورت گرفته در متن با توجه به استایلهای نوشتاری را دارند معرفی شده است و روش دیگر که مبتنی بر تشابه اسناد و با استفاده از وزن تعریف شده توسط ارائه ی توزیع شده است. . پس میتوان اینگونه نتیجه گرفت که استفاده از روش ارائه ی توزیع شده دارای کاربردهایی برای تشخیص سرقت ادبی است مخصوصا مواقعی که نیازمند تشخیص قطعی در سرقتهای ادبی پیچیده هستیم. 
کار آینده ی ما، مطالعه بر روی تاثیر و پیامدهای بکارگیری پارامترهای مختلف بر روی رفتار مدل است علی الخصوص بر روی متونی با طول کوتاه که مدل ما ضعفهایی را از خود نشان داده است است که میزان استفاده از کلمات میتواند مورد تجزیه و تحلیل قرار گیرد و بر این اساس استایلهای مختلف نوشتاری با دقت بالا تشخیص داده شود.

 

این مقاله از طریق لینک قابل دسترسی است و محققین علاقه مند می توانند آن را به صورت رایگان دریافت نمایند. 

اگر به دنبال مجموعه مقالات فارسی در موضوعات مختلف هستید به لینک مراجعه بفرمایید. در این لینک مجموعه مقالات فارسی در حوزه های مختلف داده کاوی و متن کاوی ارائه شده است.

کپی برداری بدون ذکر منبع، بر اساس قانون جرائم اینترنتی و مادۀ 12 فصل سوم قانون جرائم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 
اگر در زمینه متن کاوی در حال تحقیق یا پیاده سازی پروژه تجاری یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 


افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.