آموزش علم داده در ایران

آموزش علم داده در ایران

آکادمی داده

۱۳۹۷/۰۴/۲۸


  • 303 بازدید

یادگیری مجموعه مهارت های علم داده می تواند برای بسیاری از فارغ التحصیلان دانشگاه ها مفید واقع شود. در دنیای امروز که به داده ها و آمار و ارقام متکی است افراد در جایگاه های مختلف در صنعت و دانشگاه برای درک کسب و کارها به درک و تفسیر داده ها نیاز دارند. علم داده مختص فرد یا گروه خاصی نیست و تمامی فعالان صنعت و دانشگاه می توانند به تناسب حرفه خود از چنین دانشی بهره بگیرند و از مزایای آن سازمانها و جامعه را بهره مند سازند.

یادگیری این مهارت ها در دانشگاه می تواند در هر یک از سه مقطع کارشناسی، کارشناسی ارشد و دکترا اتفاق بیفتد. هرچه عادت فکری کار با داده زودتر آموزش شود با سهولت بیشتری می تواند در ذهن افراد نهادینه شود و اثرات مفید بیشتری بر جای بگذارد. بررسی عناوین پایان نامه های دانشجویان دانشگاه های مختلف نشان می دهد که بسیاری از دانشجویان پایان نامه های خود را در رشته های مختلف به روش کمی انجام می دهند و از تحلیل کمی داده ها برای پاسخگویی به مساله تعریف شده استفاده می کنند در حالی که در دروس دانشگاهی هیچ گاه با داده ها کار نکرده اند و پایان نامه برخورد اولیه آنها با موضوع تحلیل داده ها بوده است.

در حال حاضر در زمینه آموزش مهارت های علم داده در دانشگاه ها مسائل زیادی وجود دارد. اولین مساله تدریس مهارت های علم داده در دانشکده های متعدد یک دانشگاه است.

مهندسی کامپیوتر معمولا در دانشکده مهندسی آموزش داده میشود، آمار و ریاضیات در دانشکده علوم پایه، گرافیک به دانشجویان دانشکده هنر آموزش داده میشود و فناوری اطلاعات، بازاریابی و سایر رشته های مدیریت در دانشکده مدیریت. به این ترتیب دانشجویان و استادان این رشته ها کمتر می توانند با هم ارتباط برقرار کنند و از آموزش ها و پژوهش های سایر گروه ها استفاده کنند.

در سیستم آموزشی فعلی برای دانشجویان امکان انتخاب دروس اختیاری از دانشکده های دیگر وجود ندارد و در بعضی دوره ها مانند دوره های کارشناسی ارشد و دکترا دروس اختیاری به وسیله گروه آموزشی انتخاب می شود نه دانشجویان. به این ترتیب انعطاف پذیری زیادی برای اخذ دروس دانشگاهی وجود ندارد. اگر چنین امکانی وجود داشت، یک دانشجوی مهندسی کامپیوتر که قصد دارد در زمینه علم داده به فعالیت بپردازد می توانست چند درس تحلیل آماری را از دانشکده آمار اخذ کند یا یک دانشجوی آمار می توانست دروس ساختمان داده ها و الگوریتم ها را از دانشکده مهندسی کامپیوتر انتخاب کند. امکان انتخاب دروس اختیاری از دانشکده های دیگر راهکاری است که می تواند هم در کوتاه مدت و هم در بلند مدت بکار گرفته شود و راهی را برای یادگیری در اختیار دانشجویان علاقه مند قرار دهد.

به دلیل ذکر شده گذراندن دروس مرتبط با مهارت های علم داده منوط به طراحی چنین دروسی در هریک از این دانشکده ها و دعوت از اساتید دانشکده های دیگر برای تدریس این دروس شده است. این کار می تواند باعث غنی تر شدن دوره های مختلف دانشگاهی شود و متخصصین علم داده بیشتری مخصوصا در رشته های کمی مانند رشته های مهندسی و علوم پایه تربیت کند.

مورد دیگر این است که پذیرش دانشگاه ها در ایران بر اساس آزمون ورودی صورت می گیرد و همین امر کار را برای تغییر رشته از کارشناسی به کارشناسی ارشد و از کارشناسی ارشد به دکترا دشوار می کند. برای مثال اگر یک فارغ التحصیل مهندسی کامپیوتر در گرایش نرم افزار بخواهد در رشته آمار در مقطع کارشناسی ارشد ادامه تحصیل بدهد باید همگام با فارغ التحصیلان کارشناسی رشته آمار دروس این رشته را برای آزمون ورودی دانشگاه ها فرا بگیرد که کاری بسیار دشوار است. این سناریو تقریبا در تمامی تغییر رشته ها وجود دارد. از طرف دیگر این تغییر رشته در مقطع دکترا که مصاحبه هم در پذیرش دانشجو موثر است تقریبا غیر ممکن می شود زیرا دیدگاه بین رشته ای در پذیرش دانشجویان وجود ندارد و یک دانشجوی فرضی که برای مثال در رشته آمار تحصیل کرده است به سختی می تواند اعضای کمیته پذیرش یک دانشگاه را متقاعد کند که صلاحیت لازم برای ورود به دوره دکتری مهندسی نرم افزار را دارد حتی اگر این شخص سابقه کاری و مهارت های لازم برای تحصیل در دوره دکتری مهندسی نرم افزار را داشته باشد.

برای پاسخگویی به نیازهای صنعت در زمینه علم داده دو سناریو وجود دارد : سناریوی اول تربیت متخصصین علم داده در رشته های مرتبط است. متخصصین علم داده می توانند با تحصیل در رشته های کمی و فنی مانند دوره های مهندسی، علوم پایه شامل ریاضی، فیزیک و آمار، مدیریت، اقتصاد و سایر رشته ها را کسب کنند. این سناریو به شرطی اتفاق خواهد افتاد که دانشگاه ها چنین هدفی را در پیش بگیرند و تغییرات لازم را در برنامه دوره های دانشگاهی ایجاد نمایند.

سناریوی اول می تواند به دو شکل اتفاق بیفتد. شکل اول اضافه کردن دروسی است که از قبل در دانشکده های دیگر وجود داشته است مانند اضافه کردن واحدهای درسی آمار به رشته مهندسی کامپیوتر. شایان ذکر است که چنین دروسی در حال حاضر هم در برنامه درسی دانشگاه ها وجود دارد ولی چنین دروسی با نگرش علم داده تدریس نمی شوند یعنی مباحثی که پیوستگی و انسجامی با سایر دروس رشته اصلی داشته باشند، در آنها مطرح نمی شود. برای مثال دانشجویان مهندسی کامپیوتر که درس آمار را می گذرانند متوجه ارتباطی بین آنچه در آمار می آموزند با سایر دروس رشته خود نمی شوند. شکل دوم طراحی دروسی است که از قبل وجود نداشته اند مانند اصول بصری سازی برای دانشجویان آمار و مهندسی کامپیوتر. این شکل از کار مستلزم مطالعه راجع به ضرورت طراحی هر درس و تدوین جزئیات مهارت ها و سرفصل هایی است که قرار است در هر درس آموزش داده شود.

سناریوی دوم ایجاد آشنایی عمومی با علم داده در فارغ التحصیلان دانشگاهی است. به این ترتیب که دانشجویان رشته های مختلف بتوانند بر حسب علاقه خود دروسی که مهارت های علم داده در آن آموزش داده می شود اخذ کنند. این سناریو از طریق انعطاف پذیری بیشتر در اخذ دروس اختیاری در دانشگاه ها امکان پذیر می شود. به این ترتیب که دانشجویان بتوانند دروس مرتبط با علم داده را به عنوان دروس اختیاری اخذ کنند. برای مثال دانشجویان در رشته های مختلف بتوانند دروس تحليل داده ها، آمار یا بصری سازی را اخذ کنند تا بتوانند علاقه خود را در این زمینه ها بیازمایند و در صورت علاقه در آینده آن را به عنوان حرفه خود بپذیرند.

همان طور که در فصل هفتم بیان شد دانش زمینه ای در هر یک از کاربردهای علم داده یکی از مهارت های کلیدی متخصصین علم داده است. بنابراین ارتباط با صنعت و یادگیری دانش زمینه ای باید در دانشگاه ها مورد توجه خاص قرار گیرد. مساله این است که دانشجویان رشته های مهندسی کامپیوتر و آمار که از دید صاحبان صنایع از کاندیداهای اصلی برای فعالیت در زمینه علم داده هستند معمولا در دوران تحصیل دانش زمینه ای به دست نمی آورند و با حل مسائل واقعی در دنیای کسب و کار بیگانه هستند. به این معنا که با یک صنعت در ارتباط باشند، مفاهیم مطرح در آن و سوال ها و چالش های آن صنعت را بشناسند و سعی کنند آموخته های خود را در دانشگاه با حل آن مسائل محک بزنند. این مساله از نتایج ارتباط بسیار ضعیف دانشگاه با صنعت است. به تبع آن فارغ التحصیلان دانشگاه ها مهارت فرموله کردن یک سوال کسب و کار و پاسخ گویی به آن سوال با استفاده از داده ها را پیدا نمی کنند. بنابراین دانشگاه ها باید با فراهم ساختن ارتباط با صنعت به دانشجویان در لمس مسائل واقعی در دنیای کسب و کار کمک کنند.

نارسایی دیگری که در برخی از رشته ها مشاهده می شود وجود دروس کمی در برنامه درسی بدون در نظر گرفتن طیف کاملی از مهارت های تحلیل داده ها است. برای مثال در برنامه درسی دانشجویان رشته های مدیریت، مهندسی صنایع و مهندسی فناوری اطلاعات دروسی با عنوان تحقیق در عملیات گنجانده شده است. همین طور در برنامه درسی دانشجویان رشته های مهندسی صنایع و مدیریت صنعتی درس شبیه سازی وجود دارد. همان طور که در فصل یازدهم تعریف کردیم مدلسازی در علوم تحقیق در عملیات و شبیه سازی از نوع مدلسازی تجویزی است. به این معنا که در این علوم مدل هایی طراحی می شود که روش بهینه انجام هر کار را تجویز می کنند. دانشجویان در حالی به مطالعه این علوم می پردازند که هیچ آموزشی راجع به مراحل پیش از آن یعنی مدل های توصیفی و پیش بینی ندیده اند و آشنایی با تحلیل داده ها ندارند. به این ترتیب دانشجویان بدون این که دید کلی از فرایند تحلیل داده ها به دست بیاورند، یک نوع خاص از مدل ها را مطالعه می کنند. این گسستگی می توان باعث کاهش گستره دید دانشجویان و کاهش کارایی آنها در بکارگیری این مدل ها در پژوهش و دنیای واقعی شود.

یک مشکل اساسی که در زمینه آموزش مهارت های علم داده وجود دارد نگرش موجود به آموزش این مهارت ها است. دانشجویان رشته های مختلف در دوره های دانشگاهی درس آمار مقدماتی را می گذرانند. اما در این درس به جای اینکه کار با داده ها آموزش داده شود کار با مجموعه ای از جدول که داده ها در آنها خلاصه شده اند، تکنیک ها و فرمول ها به دانشجویان داده می شود و سوالهای آزمون صرفا سنجش دانستن فرمولها، جایگذاری اعداد در فرمول ها و رسیدن به پاسخ نهایی است. در کلاسهایی که نرم افزار آماری هم آموزش داده می شود، از همین روش این بار با استفاده از یک نرم افزار خاص استفاده می شود. بنابراین دانشجویان درکی از داده ها و درکی از علم آمار پیدا نمی کنند و از آمار تصور درسی دشوار و سرشار از فرمولها و اعداد بی مفهوم را دارند. اصلاح چنین وضعیتی نیازمند تغییر نگرش نسبت آموزش این دروس و آمادگی اساتید دانشگاه ها برای تغییر روش در آموزش این درس است.

مساله دیگر در آموزش آمار این است که دانشجویان دانشگاه ها در رشته هایی به جز رشته آمار در زمینه مدلسازی آماری آموزشی نمی بینند. دروس آماری که در دانشکده هایی غیر از آمار آموزش داده می شود، عموما تنها به مباحث آمار توصیفی و مبانی آمار استنباطی می پردازند. به این ترتیب بسیاری از دانشجویان ذهنیت درستی از مدلسازی ندارند و زمانی که راجع به اهمیت آمار با آنها صحبت می کنیم چیزی بیش از میانگین و میانه و آزمون فرض در ذهن ندارند. به این ترتیب تلاش هایی لازم است تا پیش از آموزش مهارت های علم داده ذهنیت دانشجویان نسبت به آمار و مدلسازی آماری اصلاح شود.

موردی که در دانشکده مدیریت مشاهده می شود این است که آموزش مهارت های کمی مانند آمار و یادگیری ماشینی و مهارت های فنی مانند برنامه نویسی و پایگاه داده ها جزء اولویت های دانشکده مدیریت قرار ندارد. حتی تصور بر این است که یک فارغ التحصیل رشته مدیریت نیازی به دانستن مهارت های کمی و فنی ندارد و این کار را همواره می توان به افراد دارای این مهارت ها واگذار کرد. حتی در مورد رشته هایی مانند مدیریت فناوری اطلاعات، مدیریت مالی و بازاریابی که نیاز بسیار زیادی برای یادگیری مهارت های کمی و تکنیکی دارند، چنین تفکری وجود دارد و در برابر گنجاندن چنین مباحثی در برنامه درسی مقاومت صورت می گیرد. به دلایل ذکر شده دانشکده های مدیریت در جذب هیئت علمی با مهارت های کمی و فنی موفق نبوده اند و خود دانشکده ها از کمبود نیروهای کمی و تکنیکی رنج می برند. بنابراین تغییر در برنامه درسی رشته های مجموعه مدیریت در وهله اول منوط به تغییر نگرش مدیریت اجرایی دانشکده ها و اعضای هیئت علمی دانشگاه ها نسبت به لزوم آموزش مهارت های علم داده است.

ایجاد رشته های جدید یکی دیگر از راهکارهایی است که می تواند به تربیت متخصصین علم داده بینجامد. این رشته در دانشگاه های مختلف در هر سه مقطع کارشناسی، کارشناسی ارشد  و دکترا تعریف شده است. برای ایجاد رشته هایی جدید می توان از نمونه هایی که در فصل قبل معرفی شده اند استفاده کرد.

منبع : علم داده: مفاهیم و مهارت ها، سهرابی و ایرج

کپی برداری بدون ذکر منبع، بر اساس قانون جرائم اینترنتی و مادۀ 12 فصل سوم قانون جرائم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 
اگر در زمینه علم داده و داده کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 


افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.