درباره تحقیق با عنوان استخراج دانش از داده های بيماران ديابتی با استفاده از درخت تصمیم

درباره تحقیق با عنوان استخراج دانش از داده های بيماران ديابتی با استفاده از درخت تصمیم

آکادمی داده

۱۳۹۶/۱۰/۱۶


  • 474 بازدید

در این سلسله مقالات به کاربرد داده‌کاوی در تحلیل، تشخیص و پیش‌بینی بیماری‌های مختلف پرداخته می‌شود. بدین ترتیب که با استفاده از الگوریتم‌ها و روش‌های داده‌کاوی در کنار اطلاعات بیماران مختلف راهی برای تحلیل، تشخیص و پیش‌بینی بیماری‌های مختلف ارائه می‌شود. درواقع داده خام اطلاعات بیماران و روش‌های نیز روش‌های استفاده‌شده در علوم داده‌کاوی است که منجر به تولید دانشی مفید برای علوم پزشکی می‌گردد. مطالعه این مقالات می‌تواند برای اشخاصی که درزمینهٔ داده‌کاوی پزشکی و سلامت فعالیت می‌کنند راهگشا بوده و مفید واقع شود. بنا بر ادعای برخی علم پزشکی یک علم مبتنی بر آمار است و بسیاری از راه‌حل‌های ارائه شده برای بیماران از طریق روش‌ها و راه‌های تحلیل آماری حاصل می‌شود. این ادعا و واقعیت‌های مرتبط در این رشته مقالات که با عنوان استفاده از داده‌کاوی برای تحلیل بیماری‌ها در موارد مختلف تولید خواهد شد بررسی می‌شود. آکادمی داده امیدوار است در این رشته مقالات، پژوهشگران عزیز را با مفاهیم این حوزه و کارهای انجام‌شده آشنا نماید.  

در مقاله درباره تحقیق با عنوان" استخراج دانش از دادههای بيماران ديابتی با استفاده از روش درخت تصمیم" صحبت خواهد شد. در خلاصه این مقاله می خوانیم:

مقدمه: بروز ديابت در ده سال اخير در سطح جهان دو برابر شده است. حدود 200 ميليون نفر به اين بيماري مبتلا هستند و سالانه شيوع ديابت در جهان حدود شش درصد افزايش مييابد. بيش از دو ميليون نفر در ايران به اين بيماري مبتلا هستند. در اين تحقيق به بررسي ارتباط بين عوارض مشاهده شده در بيماران ديابتي نوع دو و برخي ويژگيهاي آنها از قبيل ميزان قند خون، فشار خون، سن و سابقه خانوادگي بيماران ميپردازيم. هدف اين مطالعه، پيش بيني عوارض بيماران بر اساس علائم مشاهده شده در آنها است.

روش كار: داده هاي مورد نياز براي اين تحقيق از پروندههاي سال 1388 مركز ديابت استان گلستان جمع آوري شده است. تعداد پروندههاي اوليه بيماران 856 ركورد بود. در اين مقاله مدل جديدي بر اساس متدولوژي استاندارد CRISP ارائه شده است. در بخش مدل سازي از دو روش شناخته شده در داده كاوي به نام هاي درخت تصميم C5 و شبكه عصبي استفاده شده است. براي تحليل دادهها از نرم افزار 0.12 Celementine استفاده شده است.

يافته ها: در اين تحقيق براي اولين بار احتمال بروز عوارض ميكروواسكولار، ماكروواسكولار و يا هر دو نوع عارضه در بيماران و ويژگيهاي تأثيرگذار بر آنها مورد بررسي قرار گرفته است. با استفاده از داده كاوي و روشهاي آن تعيين شده است كه متغيرهاي فشار خون بالا، سن و سابقه خانوادگي در عوارض مشاهده شده بيشترين تأثير را داشته اند. به كمك درخت تصميم ايجاد شده، قوانيني استخراج شده اند كه ميتواند به عنوان الگويي براي پيش بيني وضعيت بيماران و احتمال بروز عوارض در آنها استفاده شود. صحت مدل ايجاد شده بر روي داده هاي مورد استفاده در درخت تصميمC5  ،74.89  درصد و در شبكه عصبي مصنوعي 28.51 درصد مي باشد.

نتيجه گيري: با توجه به روشهاي استفاده شده، بالاترين دقت با استفاده از الگوريتم C5 به دست آمده است. بيشترين عوامل تأثيرگذار بر بروز عوارض شناسايي شدند. با توجه به قوانين ايجاد شده براي يك نمونه جديد با ويژگيهاي مشخص، ميتوان پيش بيني كرد بيمار احتمالاً دچار چه نوع عارضه اي خواهد شد.

پیش بینی احتمال وقوع بیماری دیابت یکی از قدیمی ترین تلاش ها برای پیش بینی وقوع یک بیماری توسط الگوریتم داده کاوی است. بیماری دیابت یکی از شایع ترین بیماری های عصر نوین است که روز به روز به گستردگی ان افزوده می شود. در این مقاله نیز تحقیقی بر روی این بیماری انجام شده است. در این تحقیق از داده بومی مربوط به بیماران در استان گلستان برای پیش بینی بیماری دیابت استفاده شده است استفاده محققین ایرانی از داده های بومی برای استخراج دانش می تواند نکته مثبتی برای تحقیق در نظر گرفته شود زیرا ممکن است بیماران ایرانی دارای شرایط و ویژگی های خاص خود باشند و پیش بینی وقوع یک بیماری برای یک ایرانی از یک خارجی متفاوت باشد. لازم به ذکر است معروف ترین مجموعه داده دیابت یک مجموعه داده هندی پریم است که در لینک می توانید با توضیحات فارسی آن را دریافت نمایید. در این مجموعه داده تا کنون دقت 98 درصدی نیز گزارش شده است. با توجه به این می توان دقت 74 درصد در این تحقیق را به چالش کشید. در مقاله دلیل استفاده از الگوریتم درخت تصمیم گیری نیز به صورت شفاف بیان نشده است. در کنار این الگوریتم از الگوریتم شبکه عصبی استفاده شده است که دقت به مراتب پایین تری را گزارش کرده است. در این تحقیق شایسته بود الگوریتم بیشتری مورد بررسی و ارزیابی قرار می گرفت. از دیگر نقاط ضعف این مقاله عدم مقایسه و بررسی روش ارائه شده بر روی مجموعه داده های دیگر بیماری دیابت و مقایسه دانش استخراج شده در هر کدام از آن ها است. استفاده از مجموعه داده بومی می توان این فرصت را ایجاد کند که بین دانش تولید شده از روی مجموعه داده خارجی و داخلی مقایسه ای انجام گردد. 

این مقاله از طریق لینک قابل دسترسی است. محققین و دانشجویان علاقه مند می توانند از آن استفاده نمایند. 

کپی برداری بدون ذکر منبع، براساس قانون جرایم اینترتی و مادۀ 12 فصل سوم قانون جرایم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 

اگر در زمینه داده کاوی برای پیش بینی بیماری در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.