چالش های اولیه داده کاوی، طبیعت توزیع شده دادها و طبیعت نا همگن داده ها

چالش های اولیه داده کاوی، طبیعت توزیع شده دادها و طبیعت نا همگن داده ها

آکادمی داده

۱۳۹۷/۰۳/۱۵


  • 139 بازدید

چالش  های اولیه که انگیزه مهم به کارگیری فرآیند داده کاوی به جای روش های سنتی تحلیل داده ها هستند عبارتند از : حجیم بودن داده ها ، ابعاد بالای داده ها ، طبیعت توزیع شده ، و ناهمگن داده ها . در ادامه به بررسی هر کدام از این چالش ها می  پردازیم .

طبیعت توزیع شده دادها

به طور کلی طبیعت توزیع شده داده ها و وجود داده ها در منابع پراکنده باعث می شود نتوانیم از روش های سنتی برای پردازش داده ها استفاده کنیم . در این مواقع به روش های داده کاوی نیاز داریم . این روش ها باید قادر باشند دادهد هایی را که در مکان های مختلف ذخیره شده اند به گونه ای مدیریت کنند که دانش نهفته را از نهان این داده های پراکنده و توزیع شده استخراج کنند .

طبیعت نا همگن داده ها

در انباره داده ای که به عنوان مخزن فرآیند داده کاوی عمل می کند ، انواع مختلفی از ویژگی ها وجود دارند. هر ویژگی محدوده مقادیر مشخص و ویژه ای اختیار می کند . کمینه و بیشینه مقادیر مربوط به بعضی از ویژگی ها با هم تفاوت زیادی دارند . بعضی از ویژگی ها ، حوزه مقداری بسیار وسیع و بعضی دیگر حوزه محدودی دارد . در این مواقع می توان از مباحث نرمال سازی برای برخورد با این مشکل استفاده کرد .  اما مسائل دیگری نیز در ارتباط با ویژگی ها وجود دارند .  به عنوان مثال بعضی از ویژگی های عددی (  صحیح  یا حقیقی )  هستند ،  بعضی دودویی هستند ،  بعضی دیگر از ویژگی ها اسمی هستند ( مثل رنگ چشم ) .  بعضی از ویژگی ها نیز به گونه ای هستند که در مورد آنها تنها می توان گفت آیا با هم مساوی هستند یا خیر ( مثل رنگ چشم ) ،  گونه ای دیگر از ویژگی ها به این شکل اند که در مورد آنهاعلاوه بر مساوی یا نامساوی بودن می توان بزرگتر و کوچکتر بودن رامیز تعیین ( مثل سطح تحصیلات )،  در مورد برخی دیگر از ویژگی ها علاوه بر مساوی یا نا مساوی بودن و تعیین کوچکتر و یا بزرگتری ، می توان از عملگرهای جمع و تفریق نیز استفاده نمود ( مثل تاریخ‌های تقویم) و در نهایت در مورد گروهی دیگر ویژگی ها علاوه بر مساوی یا نا مساوی ، کوچکتر و یا بزرگتر بودن همچنین جمع  و تفریق آنها ،  می توان  عملگرهای  ضرب و تقسیم را نیز به کار برد ( مثل قد و وزن ) .  در نتیجه به دلیل تنوع بالای ماهیت ویژگی‌ها نمی‌توان از  روش های سنتی برای پردازش داده ها استفاده نمود .

داده کاوی کاربردی، صنیعی آباده

کپی برداری بدون ذکر منبع، براساس قانون جرایم اینترتی و مادۀ 12 فصل سوم قانون جرایم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 

اگر در زمینه داده کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله، گپ و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.