درباره تحقیق با عنوان، مروری بر هفت الگوریتم برتر داده‌کاوی در پیش‌بینی بقا، تشخیص و عود بیماران مبتلا به سرطان پستان

درباره تحقیق با عنوان، مروری بر هفت الگوریتم برتر داده‌کاوی در پیش‌بینی بقا، تشخیص و عود بیماران مبتلا به سرطان پستان

آکادمی داده

۱۳۹۶/۱۰/۱۶


  • 213 بازدید

در این سلسله مقالات به کاربرد داده‌کاوی در تحلیل، تشخیص و پیش‌بینی بیماری‌های مختلف پرداخته می‌شود. بدین ترتیب که با استفاده از الگوریتم‌ها و روش‌های داده‌کاوی در کنار اطلاعات بیماران مختلف راهی برای تحلیل، تشخیص و پیش‌بینی بیماری‌های مختلف ارائه می‌شود. درواقع داده خام اطلاعات بیماران و روش‌های نیز روش‌های استفاده‌شده در علوم داده‌کاوی است که منجر به تولید دانشی مفید برای علوم پزشکی می‌گردد. مطالعه این مقالات می‌تواند برای اشخاصی که درزمینهٔ داده‌کاوی پزشکی و سلامت فعالیت می‌کنند راهگشا بوده و مفید واقع شود. بنا بر ادعای برخی علم پزشکی یک علم مبتنی بر آمار است و بسیاری از راه‌حل‌های ارائه‌شده برای بیماران از طریق روش‌ها و راه‌های تحلیل آماری حاصل می‌شود. این ادعا و واقعیت‌های مرتبط در این رشته مقالات که با عنوان استفاده از داده‌کاوی برای تحلیل بیماری‌ها در موارد مختلف تولید خواهد شد بررسی می‌شود. آکادمی داده امیدوار است در این رشته مقالات، پژوهشگران عزیز را با مفاهیم این حوزه و کارهای انجام‌شده آشنا نماید.  

در این مقاله درباره تحقیق با عنوان" مروری بر هفت الگوریتم برتر داده‌کاوی در پیش‌بینی بقا، تشخیص و عود بیماران مبتلا به سرطان پستان" صحبت خواهد شد. در خلاصه این مقاله می‌خوانیم:

مقدمه: پیش‌بینی تشخیص، بقا و عود بیماران مبتلا به سرطان پستان، همواره از چالش‌های مهم برای محققین و پزشكان بوده است. امروزه به مدد علوم بیوانفورماتیك، امكان رفع این چالش‌ها با بهره‌گیری از اطلاعات قبلی ثبت‌شده از بیماران تا حدود زیادی محقق گردیده است. با تكنولوژیهای کم‌هزینه سخت‌افزاری و نرم‌افزاری، داده‌ها باکیفیت بهتر و در حجم‌های بالاتر به‌صورت خودكار ذخیره می‌گردند و به كمك تجزیه‌وتحلیل بهتر آن‌ها، این حجم عظیم از داده‌ها به‌صورت كارآمد و مؤثرتر پردازش می‌شوند. هدف اصلی این مقاله معرفی تعدادی از الگوریتم‌های پركاربرد و شناخته‌شده داده‌کاوی در سرطان پستان است.

 روش بررسی: الگوریتم‌های داده‌کاوی، مدل‌های بهینه‌ای هستند كه در پیش‌بینی تشخیص، بقا و عود سرطان پستان به‌کاررفته و دقت قابل‌توجهی از خود نشان داده‌اند. نتایج حاصل از این الگوریتم‌ها، نه‌تنها به پزشكان در تصمیم‌گیری بهتر كمك می‌کند بلكه باعث آشكار شدن برخی از الگوهای پنهان و ناشناخته می‌شود كه شاید توجه خاصی به آن‌ها معطوف نبوده است. این الگوریتم‌ها شامل: شبکه‌های عصبی مصنوعی ،درختان تصمیم‌گیری ،شبکه‌های بیزی  ساده ،رگرسیون لجستیك ،بردار پشتیبان ماشین و روش‌های تركیبی درختان تصمیم و شبکه‌های بیزی   هستند. از این الگوریتم‌ها، برای دسته‌بندی، خوشه‌بندی، یادگیری آماری كه مهم‌ترین روش‌های داده‌کاوی هستند، استفاده می‌شود.

یافته‌ها : در این مقاله، هفت الگوریتم برتر داده‌کاوی در پیش‌بینی بقا، تشخیص و عود بیماران مبتلا به سرطان پستان معرفی می‌گردند و با معرفی هر الگوریتم، پیشینه‌ای از تحقیقات صورت گرفته در سرطان پستان به كمك الگوریتم موردنظر، نتایج حاصل از آن و همچنین تحقیقات فعلی در حال انجام در این خصوص ارائه می‌شود. درختان تصمیم و ماشین بردار پشتیبان، در تحقیقات مختلف انجام‌شده، معمولاً نتایج بهتر و دقیق‌تری درزمینهٔ دقت، حساسیت و ویژگی ارائه کرده‌اند.

 نتیجه‌گیری: موفقیت این الگوریتم‌ها، به فاكتورهای متعددی چون وجود متغیرهای مورد نیاز، بزرگتر بودن پایگاه داده، كم بودن تعداد دادههای مفقوده و دسترسی به دادههای صحیح و درست بستگی دارد.

در این تحقیق بر روی یکی از بیماری‌های مشهور در بین زنان یعنی سرطان پستان پژوهش انجام شده است. در این تحقیق مجموعه داده‌ای شامل 176 نفر موردبررسی قرارگرفته است. این مجموعه داده  توسط پرسشنامه تهیه‌شده و از مجموعه داده های بومی در حوزه استفاده از داده‌کاوی برای پیش‌بینی بیماری‌هاست. یکی از نقاط قوت این کار استفاده از هفت الگوریتم برای ایجاد مدل طبقه‌بندی است بر اساس پیاده‌سازی انجام‌شده الگوریتم لجستیک رگرسیون با 85 درصد بهترین عملکرد را داشته است. از ضعف‌های این مقاله این است که به‌جای اینکه به توضیح مسئله اصلی تحقیق و موضوع بپردازد بیش از نود درصد محتوای مقاله را توضیح هفت الگوریتم تشکیل می‌دهد. درواقع به‌جای تعریف مسئله، یک مقاله برای آشنایی با الگوریتم‌های یادگیری ماشین است. کوچک بودن مجموعه داده  نیز از دیگر معایب این تحقیق می‌تواند باشد. در این تحقیق که به وسیله لیلا قاسم احمد انجام شده است اشاره بسیار کوتاهی به ویژگی های مجموعه داده سرطان پستان شده است در حالی که این ویژگی ها بسیار مهم و تعیین کننده هستند.

این مقاله از طریق لینک قابل‌دسترسی است. محققین و دانشجویان علاقه‌مند می‌توانند از آن استفاده نمایند. در کنار آن دیتاستی مناسب برای تحقیقات مربوط به بیماران مبتلا به سرطان سینه توسط دیتاهارت عرضه شده است.