در این بخش پرسش و پاسخ های که در گروه های تلگرامی در حوزه علم داده رد و بدل می شود ارائه خواهد شد. بد نیست این مقدمه خوانده شود.
جامعهمان به شدت دارد کوتاهمدت میشود. چیزی شبیه مفهوم «جامعه کلنگی» کاتوزیان. کاتوزیان در مقالهای که بعدها بهصورت کتاب در آمد، جامعه ایران را کلنگی مینامد؛ بدین معنا که هر حکومت و هر مسئولی که آمد، هر آنچه حکومت و مسئولین پیش از وی ساخته بودند را از بیخ و بن ویران، و خود از نو شروع به ساختن میکند. قاجارها یادگارهای صفوی را ویران کردند؛ پهلویها دستاوردهای قاجاریان را و جمهوری اسلامی، دستاوردهای پهلوی را. به همین ترتیب، هر رئیسجمهورمان در جمهوری اسلامی نیز، دستاوردهای رؤسای جمهور پیشین را از بیخ و بن ریشهکن کرد تا خود طرحی نو در اندازد؛ بیآنکه بداند رئیسجمهور بعدی، همین بلا را سر خود او خواهد آورد.
به همین شیوه، همین که فیسبوک با استقبال ایرانیان روبرو میشود، فیلتر میگردد؛ تلگرام هم همین طور. در بسیاری از این شبکهها، سرمایهی اجتماعیای شکل میگیرد که این روزها ایران به شدت به آن نیاز دارد. صدها استاد دانشگاه، روزنامهنگار، روحانی، شبکهی خبری داخلی و… در تلگرام توانستهاند اعتماد مردم را جلب کرده و سرمایهی اجتماعی ایرانیان را از دل همین کانالها شکل یا افزایش بدهند. با فیلتر شدن تلگرام، نه تنها دهها هزار کسب و کار تلگرامی از بین خواهد رفت، بلکه این سرمایهی اجتماعی که اهمیتش از آن کسب و کارها به مراتب بیشتر است نیز ویران خواهد شد. تا شبکه اجتماعی دیگری بین مردم جا بیفتد و سرمایهی اجتماعی دوبارهای جان بگیرد، بخش زیادی از این سرمایهها برای همیشه از ایران رخت بر خواهد بست. جامعهشناس فرانسوی، بوردیو، از امکان تبدیل سرمایهها به یکدیگر سخن میگوید. یعنی شما میتوانی از سرمایه اقتصادیات برای توسعه سرمایه اجتماعی سود ببری یا بالعکس. از میان برداشتن سرمایههای اجتماعی در تلگرام، زیانی برابر یا حتی بیشتر از نابودی سرمایههای اقتصادی دارد. مانند این است که مسئولین بگویند همه دارندگان حساب در فلان بانک، حسابشان که طی این چند سال و با تلاش و کوشش پسانداز کردهاند، مسدود و نابود شده و میتوانند از ابتدا در بهمان بانک حساب باز کرده و دوباره از اول شروع به پسانداز کنند.
بیگمان سرمایهی اجتماعیای که در آینده و شبکه اجتماعی دیگری شکل بگیرد نیز، همچون همین فیسبوک و تلگرام، هیچ تضمینی بر ماندگاریاش نیست. بدین شیوه، صدها سال است در چرخهای از ساختن و ویران کردن دچار شدهایم و پیشرفت بر پایه داشتهها و انباشتههای پیشین را، تنها در کشورهای همسایهای میبینیم که روز به روز از ما بیشتر فاصله میگیرند.
منبع : https://t.me/moghaddames
با توجه به فیلتر تلگرام و عدم دسترسی افراد علاقه مند به حوزه علم داده در مدت های آتی، آکادمی داده تصمیم گرفت سوال ها و جواب های مفید که ممکن است مورد سوال دهها تن باشد را در مقالاتی ارائه دهد. البته باید در نظر داشت که تضمینی بر درستی پاسخ ها وجود ندارد ولی قطعا می تواند در راه رسیدن به پاسخ صحیح تر راهگشا باشد. با توجه به ازدیاد این سوالات و پاسخ ها امکان منبع نویسی برای آن ها و اینکه سوال کننده و پاسخ دهنده چه کسانی بودند میسر نیست به همین دلیل به گروههای که این مباحث در آن ها مطرح شده است بسنده خواهد شد. با امید به این که برای علاقه مندان علم داده، داده کاوی، متن کاوی و علوم مرتبط مفید باشد.
افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.
سلام. ببخشید اگر دیتاستمون همه فیچرهاش مقادیر عددی هستند.. حالا من اگه بخام بیام با روش نزدیکترین همسایگی جایگزینی مقادیر گمشده رو انجام بدم.. حتما باید قبلش داده ها رو استاندارد و نرمال کنم و از روشهای نرمال سازی استفاده کنم؟؟
در الگوریتمی هایی که براساس معیارهای فاصله، Similarity و... کار می کنند میبایست ویژگیها را نرمال یا Feature Scaling نمایید که الگوریتم KNN هم جز این الگوریتم ها هست.
افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.
ببخشید موضوعات جالب برای داده کاوی درحوزه سلامت رو جایب میشه پیدا کرد؟؟
حوزههای بسیار کاربردی و جذاب در بخش علم داده در سلامت وجود دارد. تلفیق کاربردهایی مانند پردازش متون نسخههای پزشکی، پردازش تصویر تصاویر پزشکی، تحلیل دادگان ابزارهای هوشمند(iot) مورد استفاده در صنعت سلامت، تحلیل دادگان کلان بخش سلامت و.... تنها بخشی از این کاربردها هست. منتهی دست یابی به دادگان مناسب همواره یکی از چالشهای ورود متخصصین علم داده به حوزه سلامت بوده است.
افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.
افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.
سلام دنبال پایگاه داده ای میگردم که مثلا نظرات پزشک به صورت متن(مثل نامه ها و داده های مشاهده ای بالینی) باشه که بتونم با توجه به محتوای اسناد اونها رو تحلیل کنم
قبلاً به مقاله دیدم کار شده بود روی متن نسخه ها فک کنم برای تامین اجتماعی بود
افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.
1. بعد نرمالسازی متغیر جدید از ترکیب این دو ساخته و به عنوان لیبل در نظر گرفته بشه؟
مثلا به نام FM= Frequency+ Monetary
2. متغیر Frequency رو اصلا وارد مدل نکنیم.
افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.