بررسی کارهای انجام شده برای نظرکاوی فارسی: افزایش هوش تجاری براساس تحلیل عقاید در نقدهای فارسی، عزیزی - خادمی

بررسی کارهای انجام شده برای نظرکاوی فارسی: افزایش هوش تجاری براساس تحلیل عقاید در نقدهای فارسی، عزیزی - خادمی

آکادمی داده

۱۳۹۷/۰۳/۰۴


  • 128 بازدید

در این تحقیق یک نظرکاوی کلاسیک با استفاده از الگوریتم معروف ماشین بردار پشتیبان انجام شده است. بیشترین کار نوین این تحقیق در حوزه مجموعه داده ایجاد شده است. بنابر ادعای نویسندگان از نظرات مثبت و منفی هر کدام پانصد نظر استخراج شده و برچسب گزاری شده است.

یکی از نقاط ضعف این تحقیق در مورد استفاده از واژه هوش تجاری است زیرا با این که در عنوان تحقیق نوشته شده است در متن آن در مورد اینکه نظرکاوی چطور می تواند باعث افزایش هوش تجاری شود به صورت کلی و مبهم سخن گفته شده است و شالوده اصلی کار یک روش نظرکاوی بر اساس الگوریتم های ماشین یادگیری است. در ادامه خلاصه و نتیجه گیری تحقیق ارائه می گردد.

خلاصه:

با گسترش تجارت الکترونیک و سیستمهای مدیریت درخواست مشتری، روزانه حجم عظیمی از دادههای متنی توسط کاربران به طور مستقیم و غیرمستقیم تولید میشود. این دادههای متنی ارزش اطلاعاتی بسیار بالایی دارند و واضح و بدیهی است که بررسی تمامی آنها به طور دستی توسط انسان سخت و دشوار و در برخی موارد غیرممکن است. از طرفی خریداران یک محصول و حتی مدیران نیاز دارند تا اطلاعات جامع و کارآمدی که حاصل تمامی نظرات داده شده است را مشاهده نمایند تا بتوانند در کوتاهترین زمان تصمیم درستی در خصوص کمیت و کیفیت در راستای گسترش خرید و یا فروش آن محصول اتخاذ نمایند. بررسی نتایج نشان میدهد که هشتاد و یک درصد کاربران اینترنت قبل از خرید یک محصول یا خدمات راجع به آن جستجو نموده اند و دیگر نظرات را مطالعه کرده اند. لذا در دهه اخیر، حوزه تحلیل احساسات، نگاه بسیاری از محققان حوزه صنعت و دانشگاه را به خود معطوف کرده است اما متأسفانه بسیاری از این پژوهشها مختص زبان انگلیسی بوده و کارهای بسیار کمی در زبان فارسی صورت پذیرفته است. در این مقاله به ارائه چارچوبی خواهیم پرداخت که میتواند با استفاده از متون نقد کاربران در زبان فارسی قطبیت آن را پیش بینی نموده و ویژگیهای مورد نقد را استخراج نماید. در این راستای، ابتدا در مرحله پیش پردازش دادهها با جداسازی کلمات و جملات، و ریشه یابی کلمات، اطلاعات موردنیاز از نقدها استخراج شده و در گام بعدی با استفاده از مدل SVM نظرات و عقیده کاربران در مورد یک محصول و ویژگیهای آن طبقه بندی نمودیم. در پایان نیز مدل آموزش داده شده توانست با سرعت و دقت بالایی قطبیت نقدهای نوشته شده کاربران را بهدرستی پیشبینی نماید.

نتیجه گیری و كارهای آینده:

 مدل ارائه شده هیچ وابستگی به محصول و یا کاربرد خاص ندارد و به راحتی می توان آن را در هر محیط دادهای که در آن نظرات مشتریان راجع به محصول و یا خدماتی داده میشود، پیاده سازی کرد. به خصوص در سیستمهای مدیریت درخواست مشتری، بسیاری از مدیران به دنبال گزارش جامع و قابل استناد از نظر مشتریان و بازخورد آنان هستند و به طور طبیعی در یک سازمان عظیم که خدمات و یا محصولاتی را به مشتریان ارائه میدهد، حجم تولید اطلاعات متنی بسیار بالا است، با استفاده از این مدل کاربردی میتوان در کسری از ثانیه و با دقت قابل قبول و با استفاده از دادههایی که خود مشتریان در اختیار سازمان قرار میدهند به گزارشهای بسیار کارآمد و دقیق دسترسی یافت.  به دلیل رویکردها و چالشهای خاصی که در تحلیل متون فارسی وجود دارد میتوان بر روی تشخیص قطبیت جملات ذهنی بیشتر تحقیق و بررسی نمود. همچنین با توجه به تولید حجم عظیم اطلاعات متنی و گسترش ابزارهای کلان داده، میتوان اطلاعات متنی را در پایگاه دادههای NoSQL همانند Hadoop ذخیرهسازی کرد و نتایج را مورد بررسی قرار داد.

اگر به پژوهش در حوزه نظرکاوی علاقه مند هستید توصیه می کنیم مجموعه  پنجاه مقاله فارسی مرتبط با نظرکاوی، عقیده کاوی و تحلیل احساسات را تهیه بفرمایید.

اگر در حال پژوهش در حوزه نظرکاوی هستید، سوالات و اشکالات خود را از طریق تلگرام با آکادمی داده در میان بگذارید. با عضو شدن در کانال تلگرام  آکادمی داده از مقالات جدید و دیتاست های منتشر شده مطلع شوید. 

اگر در زمینه نظرکاوی(عقیده کاوی یا تحلیل احساسات) در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام (https://t.me/dataacademyحضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.