انجام پایان نامه در حوزه متن کاوی

انجام  پایان نامه در حوزه متن کاوی

آکادمی داده

۱۳۹۷/۰۲/۱۳


  • 36 بازدید

حوزه متن کاوی یکی از حوزه های بسیار مورد توجه دانشجویان برای انجام تحقیقات خود است. در هر سال هزاران دانشجو در رشته‌های مختلف از جمله روانشناسی، جامعه شناسی، اقتصاد،مدیریت، هوش مصنوعی و دهها رشته دیگر به دنبال انجام پایان نامه در حوزه متن کاوی هستند. متن ها امروزه در دنیای اینترنت و وب حضور گسترده دارند در کنار آن حضور و گسترش شبکه های اجتماعی اهمیت متن کاوی را بیشتر کرده است. با توجه به اقبال به متن کاوی بسیاری از دانشجویانی که به دنبال تحقیق در متن کاوی هستند در مورد چگونگی شروع و ادامه تحقیق در حوزه متن کاوی دارای ابهاماتی هستند در این مقاله سعی می شود دانشجویان با انجام مراحل پایان نامه در حوزه متن کاوی آشنا شوند. ابتدا تعریفی از علم متن کاوی ارائه می گردد.

متن کاوی یکی از زیر مجموعه های علوم داده کاوی است که بعضا با نام کشف دانش در متون نیز مطرح می شود .طبق تعریف فرهنگ لغت آکسفورد به فرآیند یا عملی که مجموعه بزرگی از منابع نوشته شده را به اطلاعات جدیدی تبدیل کند متن کاوی گفته می شود.

1- مشخص کردن حوزه انجام پایان نامه متن کاوی

دانشجو حوزه خود را با مشورت استاد مشخص کند. به طور مثال انجام پایان نامه در حوزه خلاصه سازی متون یکی از این گزینه ها می تواند باشد.  به طور مثال: ارائه یک الگوریتم ترکیبی با استفاده از منطق فازی برای خلاصه سازی متن می‌تواند یک عنوان کلاسیک برای متن کاوی در نظر گرفته شود. طبقه بندی متن نیز یکی از موضوعات کلاسیک و داغ در حوزه متن کاوی است که توجه محققین بسیاری را به خود جلب کرده است.  

2- مجموعه داده برای انجام پایان نامه متن کاوی

دومین مرحله و یکی از مهمترین مراحل انجام پایان نامه داده کاوی یافتن مجموعه داده مناسب و مرتبط برای متن کاوی است. در همین جهت وبسایتی برای ارائه مجموعه داده های بومی و ایرانی ایجاد شده است این وبسایت دیتاهارت نام دارد. در این وبسایت مجموعه داده های وطنی  محیا شده که محققین داخلی که به دنبال ارائه پایان نامه در حوزه متن کاوی می باشند می توانند از این مجموعه داده ها استفاده کنند. توصیه می گردد علاقه مندان به حوزه متن کاوی سعی کنند روش ها و الگوریتم های خود را برروی مجموعه داده های فارسی ارائه دهند تا روش های مبتنی بر این زبان نیز مانند زبان انگلیسی رشد کند.

3- مشخص کردن ایده کار برای استخراج دانش از متن

مرحله سوم انجام پایان نامه در حوزه متن کاوی پیدا کردن و یافتن ایده مناسب برای انجام عمل استخراج دانش از متن است.  در راه رسیدن به یک ایده منحصر به فرد باید کارهای مرتبط انجام شده در حوزه انتخابی با دقت و حوصله مطالعه گردد. با مطالعه کارهای انجام شده در این حوزه و انجام تحقیقات بیشتر می توان به یک ایده منحصر به فرد و جدید برای انجام مجموعه داده انتخابی رسید.

4- پیاده سازی ایده

بعد از انتخاب مجموعه داده و رسیدن به یک ایده منحصر به فرد و جدید نوبت به پیاده‌سازی این مجموعه داده میرسد. در این مرحله ابزارها و زبان های برنامه نویسی مختلفی می‌تواند توسط محقق مورد استفاده قرار گیرد در برخی موارد این موضوع به سلیقه پژوهشگر بستگی دارد. ولی ابزارهایی مانند وکا و رپیدماینر می‌تواند در کنار زبان های برنامه نویسی مانند پایتون و جاوا برای پیاده سازی ایده ها مورد استفاده قرار گیرد. همه این ابزارها توانایی پشتیبانی از زبان فارسی به عنوان داده خام تحقیق را دارا می باشند.

5- جمع بندی و نتیجه گیری

بعد از پیاده سازی نوبت به جمع بندی و نتیجه گیری تحقیق می رسد. در بخشی از کارهای متن کاوی که زیر مجموعه طبقه بندی متون است هدف از انجام تحقیق رسیدن به دقت طبقه بندی بالاتر است.به طور مثال  محقق به این نتیجه می‌رسد و این ادعا را به اثبات می‌رساند که استفاده از الگوریتم ماشین بردار پشتیبان دقت بالاتری نسبت به الگوریتم های مشابه برای طبقه بندی اخبار روزنامه همشهری ارائه داده است به طور مثال با استفاده از ایده جدید پیاده سازی شده دقت الگوریتم 85 درصدی در کارهای مشابه به دقت  95 درصد ارتقا پیدا کرده است.

اگر در این حوزه تحقیق می کنید و نیاز به مشاوره دارید با آکادمی داده تماس بگیرید.