سرآغازی بر مبحث نظرکاوی

سرآغازی بر مبحث نظرکاوی

آکادمی داده

۱۳۹۶/۰۷/۲۰


  • 488 بازدید

این چند پاراگراف از ترجمه کتاب بینگ لیو می باشد. این کتاب توسط ایشان که یکی از پیشروترین اساتید نظرکاوی هستند در سال 2015 نوشته شده است. در ادامه مقدمه این کتاب که سرآغازی بر مباحث نظرکاوی است ارائه میشود. برای تهیه ترجمه این کتاب تا اول فصل 11 می توانید با آکادمی داده تماس بگیرید. 

نظر و احساس و مفاهیم مرتبط با آن مانند سنجش[1]، ارزیابی[2]، رفتار[3]، میل[4] ، هیجان[5] و حالت[6] همگی دربارة احساسات و عقاید هستند. آنها اصول روانشناسی انسان و تاثیر گذارهای کلیدی بر روی رفتار ما هستند. عقاید و درک ما از واقعیت به همراه انتخابی که میکنیم، تا حد قابل توجه ای مبتنی بر این است که دیگران چگونه دنیا را میبینندلنگر. به این دلیل دیدگاه ما از جهان بسیار تحت تاثیر دیدگاه دیگران است و هرگاه که نیاز داریم که یک تصمیم بگیریم، اغلب به دنبال نظر دیگران هستیم. این امر نه تنها برای افراد درست است، بلکه برای سازمانها نیز صدق میکند. از دیدگاه کاربردی نقطه نظر، ما به طور ذاتی میخواهیم که عقاید افراد و احساسات افراد را نسبت به هر موضوع مورد عقیده‌ای کاوش کنیم، و این کار وظیفة تحلیل احساس است. به طور دقیق تر، تحلیل احساس که عقیده کاوی نیز نامیده میشود، حوزة مطالعاتی ای است که قصد دارد عقاید و احساسات را با استفاده از روشهای محاسباتی و از طریق پردازش زبان طبیعی استخراج کند.

آغاز و رشد سریع تحلیل احساس همزمان بود با آغاز و رشد رسانه های اجتماعی بر روی وب، مثل نقد ها، بحث های انجمن[7]، بلاگها، میکروبلاگها[8]. زیرا برای اولین بار در تاریخ ما حجم وسیعی از داده ها را به شکل دیجیتال به صورت ذخیره شده داشتیم. این داده ها محتوی تولید شده توسط کاربر[9]  نامیده میشد و پژوهشگران را برانگیخت تا آنها را کاوش کنند تا دانش مفید را در آنها کشف کنند. این امر طبیعتا باعث مسالة تحلیل احساس یا نظرکاوی میشود زیرا تمامی این داده ها پر از عقاید هستند. اینکه این داده ها پر از نظر است تعجب بر انگیز نیست، زیرا دلیل اصلی ای که افراد پیامهایی را بر روی پلتفرم های[10] رسانه های اجتماعی ارسال میکنند این است که دیدگاه و عقاید خودشان را بیان کنند و از اینرو تحلیل احساس هستة اصلی تحلیل رسانه اجتماعی است. قبل از اوایل 2000، تحلیل احساس به یکی از حوزه های پژوهشی فعال در پردازش زبان طبیعی تبدیل شد. این حوزه به صورت گسترده در داده کاوی، وب کاوی و بازیابی اطلاعات مطالعه شد. در واقع این پژوهش از علوم کامپیوتر به علوم مدیریت و علوم اجتماعی به دلیل اهمیتش در کسب و کار و جامعه نیز گسترده شد. در سالهای اخیر، فعالیت های صنعتی حول تحلیل احساس نیز پیشرفت کرده اند. شرکت های نوپای بیشماری به وجود آمدند. شرکت های بسیار بزرگ مانند مایکروسافت، گوگل، هلت پاکارد[11]، و ادوبی[12] سیستم های داخلی خود را ساختند. سیستم های تحلیل احساس کاربردهایی را در تمامی حوزه های کسب و کار، سلامت، حکومتی و اجتماعی پیدا کردند.

در حالی که هیچ الگوریتم معجزه آسایی نمیتواند مسالة تحلیل احساس را حل کند، سیستم های بسیاری قادر به فرآهم سازی اطلاعات مفیدی برای پشتیبانی از کاربردهای زندگی واقعی بودند. من باور دارم که حالا زمان خوبی برای مستند سازی دانشی است که ما در پژوهش بدست آوردیم و این کار را در یک کتاب انجام میدهیم. واضح است که من ادعا نمیکنم که همه چیزی را که در این صنعت میگذرد میدانم، زیرا کسب و کارها الگوریتم هایشان را منتشر یا افشا نمیکنند. از اینرو من خودم سیستم تحلیل احساسی را در یک شرکت نوپا ساخته ام که به کار سرویس گیرنده هایی آمده که بر روی پروژه های مجموعه داده های رسانه های اجتماعی و در حوزه های بسیار مختلفی کار میکردند. در طول این سالها توسعه دهندگان بسیاری از سیستم های تحلیل احساس در این صنعت به طور تقریبی گفتند که از چه الگوریتم هایی استفاده کرده اند. از اینرو من ادعا میکنم که دانش قابل قبولی از سیستم های عملی و ظرفیت هایشان و تجربه ای دست اول در حل مشکلات دنیای واقعی دارم. من تلاش کردم تا آن قطعات اطلاعاتی و دانش غیر محرمانه را در این کتاب بیاوردم.

در نوشتن این کتاب من تلاش داشتم تا رویکردی متوازن داشته باشم و با تحلیل مساله تحلیل احساس از زاویة زبان شناسی به خوانندگان کمک کنم تا ساختار زیربنایی مساله و سازه های زبانی ای که معمولا برای بیان عقاید و احساسات به کار میرود را درک کنند و روشهای محاسباتی ای را برای تحلیل و خلاصه سازی عقاید ارائه نمودم. مانند بسیاری دیگر از اعمال پردازش زبان طبیعی، اکثر تکنیک های محاسباتی منتشر شده از یادگیری ماشین یا الگوریتم های داده کاوی با کمک نشانه های[13] متنی یا خصیصه ها[14] استفاده کردند. با اینحال اگر ما تنها بر این الگوریتم های محاسباتی تمرکز کنیم، بینش عمیق نسبت به مساله را از دست خواهیم داد که باعث عقب ماندگی پیشرفت محاسباتی مان خواهد شد. اکثر الگوریتم های یادگیری ماشینی مانند جعبه های سیاهی هستند که مدل قابل تفسیر برای انسان ندارند. وقتی که اشتباهی پیش میاید، سخت است که دلیل آن را پیدا کنیم و آن را درست کنیم.

در ارائة ساختار و منظرهای زبان شناسی، من سنت زبان شناسی را در نوشتنم رعایت نمیکنم زیرا دانش و روشی که دانش زبان شناسی سنتی ارائه میشود عموما برای افرادی است که آن را درک میکنند، نه برای کامپیوترهایی که این دانش در آنها به کار گرفته شده است تا مسائل دنیای واقعی را حل کنند. در حالی که دانش انسان و دستورالعمل ها برای کامپیوتر ها میتواند بسیار مشترک باشد، تفاوت های عمده ای نیز دارد. مثلا در این مورد وقتی که من بر روی مسالة نظرکاوی در جملات شرطی کار میکنم، من چندین کتاب زبان شناسی دربارة شرطی ها میخوانم. با این حال در کمال نا باوری هیچ دانش زبان شناسی ای را یافت نمیکنم که قابل پیاده سازی کامپیوتری باشد تا به مساله کمک کند. من باور دارم که این امر تا حدی بدین دلیل است که فناوری های محاسباتی امروزی به کافی بالغ نیستند که توانایی و ظرفیت درک به اندازة انسان ها را داشته باشند و اکثر دانش زبان شناسی هم برای استفادة کامپیوتر ها ایجاد نشده است.

خصوصیت دیگر این کتاب این است که همانند مقالات زبان شناسی سنتی نه تنها این کتاب دربارة مطالعات زبان برای درک فی نفسة انسان، بلکه دربارة کاربردهایی عملی از کاوش احساس و نظر بیان شده در زبان طبیعی است که نه تنها قصد شناخت احساس و نظر بیان شده و قطبیت (یا گرایش) آن را دارد، بلکه به استخراج بخش های دیگر اطلاعات مهم همراه با نظر و احساس نیز میپردازد. برای مثال، ما میخواهیم که موجودیت های دنیای واقعی یا موضوعاتی را که یک احساس یا نظر دربارة آن است را مشخص کنیم. این موجودیت ها یا موضوعات اهداف[15] نظر (یا احساس) نامیده میشوند. استخراج اهداف نظر نیز در عمل بسیار مهم است. برای مثال در جمله «من از افزایش مالیات فقرا احساس انزجار میکنم»، اگر ما تنها دریابیم که جمله احساس منفی و/یا یک هیجان انزجار را از سوی نویسنده بیان میکند، در عمل مفید نیست. ولی اگر بتوانیم دریابیم که احساس منفی نسبت به «افزایش مالیات فقرا» است که اهداف احساس یا هیجان منفی میباشد، اطلاعات ارزشمند تر میشود. امیدوارم که این کتاب بتواند زبان شناسان را تشویق کند تا نظریه ای جامع دربارة احساس و نظر و مفاهیم مرتبط با آنها ایجاد کنند.

اگر در حال پژوهش در حوزه نظرکاوی هستید، سوالات و اشکالات خود را از طریق تلگرام با آکادمی داده در میان بگذارید. با عضو شدن در کانال تلگرام آکادمی داده از مقالات جدید و دیتاست های منتشر شده مطلع شوید. 

کپی برداری بدون ذکر منبع، براساس قانون جرایم اینترتی و مادۀ 12 فصل سوم قانون جرایم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 

اگر در زمینه نظر کاوی یا عقیده کاوی در حال تحقیق یا پیاده سازی پروژه تجاری یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است. 

[1] evaluation   [2] appraisal   [3] attitude   [4] affect   [5] emotion   [6] mood   [7] Forum discussions   [8] microblogs    [9] User-generated content   [10] platforms    [11] Hewlett-Packard    [12] Adobe    [13] clues    [14] features   [15] targets