دانش زمینه ای در متخصصین علم داده

دانش زمینه ای در متخصصین علم داده

آکادمی داده

۱۳۹۷/۰۴/۲۸


  • 75 بازدید

راجع به اهمیت دانش زمینه ای برای متخصصین علم داده اختلاف نظر بسیاری وجود دارد. در سال ۲۰۱۲ در کنفرانس استرتا مناظره ای بین دو گروه راجع به اهمیت دانش زمینه ای در متخصصین علم داده انجام شد. سوال این بود که اگر فقط بودجه کافی برای جذب یک نفر به عنوان اولین متخصص علم داده در شرکتتان را داشته باشد متخصص صنعت را انتخاب می کنید یا متخصص یادگیری ماشینی. بعضی افراد از قبیل آقایان درو کانوی، دیجی پاتیل و امی هاینکی اعتقاد داشتند که دانش زمینه ای مهمترین مهارت برای متخصصین علم داده است.
دانش زمینه ای است که زمینه ساز مطرح کردن سوالهای درست، ارزیابی نتایج الگوریتم های یادگیری ماشینی و معنی بخشیدن به فرآیند تحلیل داده ها است. همین طور دانش زمینه ای است که مشخص می کند چه متغیرهایی را می توانید در مدل بگنجانید. این مفهوم اغلب با نام انتخاب متغیرها یا مهندسی متغیرها شناخته می شود. این سه نفر در این مناظره بیان کردند که اگر فقط بودجه کافی برای جذب یک نفر به عنوان متخصص علم داده در شرکتتان را داشته باشید متخصصین صنعت مورد نظر شما بهترین گزینه خواهند بود و این افراد می توانند مهارت های فنی را فرا بگیرند.
در مقابل آقایان پیتر اسکامراک، پیتر واردن و توبی سیگران جذب یک متخصص یادگیری ماشینی را ترجیح می دادند. از نظر این سه نفر دانش زمینه ای با کار کردن روی داده ها به دست می آید و تبحر در یادگیری ماشینی منجر به یادگیری دانش زمینه ای هم خواهد شد. همچنین این گروه مسائلی را بیان کردند که کار کردن روی آنها نیاز به دانش زمینه ای خاصی ندارد. مثلا پیش بینی این که چه کسی در انتخابات پیروز می شود، کاری است که نیاز به پیش زمینه خاصی ندارد. علاوه بر این، افراد در طول مسیر شغلی خود وارد صنایع مختلفی می شوند. پس بهتر است که مهارت یادگیری ماشینی را به عنوان مهارت اصلی خود قرار دهند و در آن عمیق شوند. (2012 ,The Data Science Debate Video)
تیرنی در وب سایت شخصی خود بیان می کند که متخصصین علم داده باید دانش زمینه ای در زمینه کاریشان را داشته باشند. (2012 ,Tierney) گرانویل هم داشتن دانش زمینه ای را برای موفقیت ضروری می داند. وی حوزه تحليل مالی را مثال می زند که اگر در آن دانش زمینه ای نداشته باشید، بدون شک شکست خواهید خورد. یا در حوزه کشف تقلب یک متخصص علم داده باید نکات ریز و ترفندهای کار را پا به پای افراد متقلب بداند تا بتواند از بروز آن جلوگیری کند. (2014 ,Granville) فورنیر هم اعتقاد دارد که این مهارت دانش زمینه ای است که در نهایت به خلق ارزش برای سازمان منجر می شود. و رادینسکی داشتن دانش زمینه ای را به مهارت های متخصص علم داده اضافه می کند. از نظر ایشان این مهارت برای مطرح کردن سوالهای درست و درک مساله ای که قصد دارید، لازم است.
 جفری اسنتتون اهمیت دانش زمینه ای برای متخصصین علم داده را این طور توضیح می دهد :
می دهد: من به عنوان یک استاد دانشگاه می توانم در ۱۰ دقیقه به دانشجویان یاد دهم که چطور می توانند یک آزمون t اجرا کنند و می توانم در نیم ساعت به آنها یاد دهم که چه طور یک برنامه به زبان پایتون بنویسند. چیزی که به سادگی نمی توانم به آنها یاد بدهم دانش زمینه ای است. به عبارت دیگر زمانی که شما در بهداشت و درمان کار می کنید چیزهایی که برای تحلیل موفق داده ها باید بدانید با زمانی که در خرده فروشی فعالیت می کنید، متفاوت است. بنابراین آموزش چنین چیزی به دانشجویان بسیار دشوار است. 
از طرف دیگر افرادی مثل جرمی هاوارد وجود دانش زمینه ای در سازمان را یکی از موانع داده محور بودن می دانند. وی در مصاحبه با فصلنامه مک کینزی چنین بیان می کند که دلیل این امر آن است که آنچه افراد متخصص در صنعت یعنی افراد دارای دانش زمینه ای می دانند، بدیهی و مسلم شمرده می شود و مدیران تمایلی به سنجش آن نظرات با استفاده از داده ها نخواهند داشت. به این ترتیب وجود دانش زمینه ای در افراد آنها را در تحلیل وضعیت جاری دچار سوگیری و تعصب می کند و سازمان از مزایای استفاده از داده ها برای تصمیم گیری محروم می ماند. بنابراین از نظر هاوارد اگرچه دانش زمینه ای مهم است، اما تخصص در کار با داده ها به همان اندازه مهم است و اهمیت آن به صورت نمایی در حال افزایش است.
گلدبلوم این رویه را پیشنهاد می کند: بعد از این که در تعریف مساله و یافتن داده های مورد نیاز برای حل مساله از متخصصین صنعت کمک گرفتیم، باید ذهن خودمان را از دانش زمینه ای رها سازیم و اجازه ندهیم پیش فرض های موجود ما را از پیدا کردن روابط جالب در داده ها باز دارد. در این مرحله باید کار را به افرادی بسپاریم که توانمندی زیادی در تشخیص روابط و الگوهای جدید در داده ها دارند.

منبع : علم داده : مفاهیم و مهارت ها، سهرابی و ایرج

کپی برداری بدون ذکر منبع، بر اساس قانون جرائم اینترنتی و مادۀ 12 فصل سوم قانون جرائم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 
اگر در زمینه علم داده و داده کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 


افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.