حوزه‌های كاربردى داده‌کاوی پیش‌بینی ورشكستگی

حوزه‌های كاربردى داده‌کاوی  پیش‌بینی ورشكستگی

آکادمی داده

۱۳۹۶/۰۷/۲۱


  • 382 بازدید

به نظر می‌رسد پیش‌بینی ورشكســتگي  مشــهورترين عنوان براي كاربرد روش‌های داده‌کاوی درداده‌هاي مالي اســت ورشكســتگي شرکت‌ها باعث خســارات اقتصادي فراواني براي مديريت، سرمایه‌گذاران، اعتباردهندگان کارمندان شــده و هزینه‌های اجتماعي بسياري نيز در بر خواهد داشت. رويكردهاي آماري مانند تحليل تشخيصي و تحليل لاجيت و پروبيت و همچنین رويكرد فنون هوشــمند محاسباتي شامل سیستم‌های خبره ، شبکه‌های عصبي مصنوعي و در فرآيند پیش‌بینی ورشكستگي شرکت‌ها قابل‌استفاده می‌باشند. اغلب تحقيقات پیش‌بینی ورشكستگى، عملکرد هریک روش‌های فوق را مقايسه می‌کنند، اما به‌طور قطعى نمی‌توان اظهار داشت كه کدام‌یک از اين روش‌ها، از دقت كلى بيشترى در مقايسه با سایر روش‌ها برخوردار است. پیش‌بینی ورشكستگي به‌وسیله داده‌های صورت‌های مالي نخستين بار از آثار آلتمن (1968)  سرچشمه گرفته است آلتمن استدلال می‌کند ورشكستگي فرآيندي بلندمدت است، ازاین‌رو صورت‌های مالي،می‌تواند حاوي هشدارهايي از رخداد يك ورشكستگي قریب‌الوقوع باشد. وي با به‌کارگیری تحليل تشخيصي چندگانه مدلي را براي پیش‌بینی ورشكستگي شرکت‌ها ایجاد کرد. در همین حال بسياري از محققان نیز مدل‌های جايگزين را با استفاده از فنون آماري گسترش می‌دادند .  لين و مك لين(2001)تلاش كردند تا با استفاده از 4 روش متفاوت، ورشكستگي شرکت‌ها را پیش‌بینی نمايند 2 مورد از اين روش‌ها،روش‌های آماري (تحليل تشخيصی ور گرسيون لجستيك و دو مورد ديگر نيز از فنون يادگيري ماشــين (درختان تصمیم‌گیری و شبکه‌های عصبي) بوده‌اند همچنين آن‌ها بر اساس روش‌های پیش‌گفته، الگوریتمى تركيبي را نيز پيشنهاد كردند نمونه مورداستفاده شامل 1133 شركت تجاري انگليسي بوده است 690 شركت موفق و 106 شركت ناموفق به‌عنوان مجموعه آموزشي و 289 شركت ناموفق و 48 شركت موفق به‌عنوان مجموعه آزمايشي استفاده شدند تلاشي براي تطبيق کمپانی‌های موفق و ناموفق صورت نگرفت37 مورد از نسبت‌های مالي، برگرفته از ترازنامه و صورت ســود و زيان به‌عنوان متغيرهاي ورودي انتخاب شد دو روش انتخــاب ويژگى بكار رفته، متغيرهاي ورودي را با اعمال قضاوت انســان به 4 و با اعمال تحليل واريانس به 15 مورد کاهش داده اســت نتايج حاصل از روش‌های شبکه‌های عصبى مصنوعي و درختان تصميم براي هردو انتخاب ويژگى مبتني بر قضاوت انسان و تحليل واريانس، قابل‌قبول‌تر از ديگر روش‌ها  بوده اســت سرانجام نويسندگان مقاله، الگوريتمي تركيبي را پيشنهاد می‌کنند كه رأی‌گیری وزن‌دار طبقه‌بندی کننده‌های مختلف را به كار می‌برد. تانگ و همكاران (2004)يك روش تركيبي را با یکپارچه سازی شبکه‌های عصبي مصنوعي و سیستم های فازي به‌کاربرده‌اند اين مدل كه شبكه عصبي فازي خود سازمانده عمومي ناميده می‌شود، يك سيستم مبتني بر قاعده است كــه مبتنى بر قانون فازى (اگر آنگاه ) بــوده كه نهایتاً منجر به خود تعديلي(اصلاح) پارامترهاي قوانين فازي با استفاده از الگوریتم‌های يادگيري می‌گردد اين الگوریتم‌ها از الگوي شبكه عصبي به دست می‌آیند مزيت اصلي شبکه‌های ِ عصبي فازي، توانايي در مدل‌سازی مسئله‌ای خاص با استفاده از یک مدل زباني سطح بالاي قابل‌فهم، برخلاف عبارات رياضي پيچيده هست اين مدل به‌منظور پیش‌بینی ورشكســتگي بانك به‌کاررفته اســت متغيرهاي ورودي شامل 9 متغيرمالي بوده‌اند كه در بررسی‌های قبلي اهميت آن‌ها محرز شده است. نمونه مورداستفاده شامل داده‌هایی در خصوص  25555 بانك موفق و 548 بانك ناموفق بوده‌اند. 20 درصد از این داده‌ها به‌عنوان مجموعه آموزشي ، و 80 درصد مابقی به‌عنوان مجموعه آزمايش انتخاب شدند. همچنين براي كاهش خطاي نوع اول نمونه نسبت به تعداد بانک‌های موفق و ناموفق، به ميزان مساوي تعديل گرديد. نويسندگان هنگام اســتخراج داده‌ها از آخرين صورت‌های مالي، عملكرد مدل را 93 درصد، هنگامی‌که اين داده‌ها از صورت‌های مالي ســال قبل به دست آمد. ميزان عملکرد را 85 درصد و با دريافت داده‌ها از صورت‌های مالي دو ســال قبل عملكرد را 75 درصد،گزارش نمودند مدل موردنظر،در حدود 50 قاعده فازي اگر آنگاه، توليد كرد كه تعاملات بين 9 متغير ورودي منتخب و اثرشان بر سلامت مالي بانک‌های موردبررسي را، تشريح نموده است . شين و لى (2002)نیز مدلی مبتني بر الگوریتم ژنتيك پيشنهاد دادند آن‌ها براين واقعيت تأکید كردند كه برخلاف شبکه‌های عصبي مصنوعي، الگوریتم‌های ژنتيك می‌توانند قوانيني قابل‌فهم ایجاد کنند در اين مورد، الگوریتم‌های ژنتيك به‌منظور يافتن آستانه های يك يا چند متغير در بالا يا پايين ســطحي به كار رفتند كه موقعيت يك واحد تجاري را بحراني می‌سازد. اين مدل از ساختارى قاعده‌مند بهره می‌برد كه داراى 5 شرط است كه هركدام به يك متغير خارج از 9 نسبت ، تركيب خواهند شد. مجموعه داده‌ها مركب مالي، اشاره دارد اين شرايط با عملکرد عطف منطقي از 264 شركت موفق و 264 شركت ناموفق بوده و 9 نسبت مالي به‌عنوان متغيرهاي ورودي انتخاب گرديدند درصد نمونه به‌عنوان مجموعه آموزشی و 10 درصد نيز به‌منظور اعتبار سنجی به كار رفته‌اند دقت كلى روش مزبور در حدود 80 درصد گزارش شد . ديميتراس وهمكاران (1998)به بررسى پیش‌بینی ورشكستگي با استفاده از نظريه مجموعه اوليه پرداختند. مجموعه آموزشــي مورداستفاده متشكل از 40 شركت ناموفق و 40 شركت موفق از ميان واحدهاي تجاري يوناني در يك دوره 5 ساله و مجموعه آزمايش نيز از 19 شركت ناموفق و 19 شركت موفق تشکیل‌شده بود 12 نسبت مالي بر اساس نظر مدير اعتباري بانكى يوناني به‌منظور ورود به جدول اطلاعات انتخاب گرديد. سرانجام قواعد تصميم تحليل تشخيصي و تحلیل لاجيت مقايسه وبرتري این روش نسبت به ساير روش‌ها مشخص گرديد. پارك وهان نیز در سال 2002 در يك تحقيق بر اساس روش استدلال مبتني بر مورد، مدلي براي پیش‌بینی ورشكستگي بانک‌ها طراحي كردند.

این مقاله از منبع " فناوری داده کاوی رویکردی نوین در حوزه مالی . نگارندگان دستگیر و شفیعی سردشت " استفاده کرده است.         

کپی برداری بدون ذکر منبع، براساس قانون جرایم اینترتی و مادۀ 12 فصل سوم قانون جرایم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 

اگر در زمینه داده کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله، گپ و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.