معرفی کتاب : مقدمه ای بر بازیابی اطلاعات

معرفی کتاب : مقدمه ای بر بازیابی اطلاعات

آکادمی داده

۱۳۹۷/۰۳/۱۸


  • 92 بازدید

کتاب ها همواره یکی از اصلی ترین منابع دانش و اطلاعات بوده اند، دانشجویان و طالبان علم سعی می کردند با مطالعه کتاب ها در مورد یک موضوع، دانش کافی را اخذ کنند. 
در این سلسله مقالات کتاب های چاپ شده در حوزه های مختلف علم داده، مانند داده کاوی، متن کاوی، نظر کاوی و حوزه های مرتبط با آن ها معرفی می گردد. 
علاقه مندان علم داده باید سعی کنند علم داده را از منابع انگلیسی بیاموزند، بدین ترتیب که از کتاب های چاپ شده در حوزه علم داده به زبان انگلیسی استفاده نمایند. زیرا در برخی موارد مطالب سنگین با ترجمه مبهم به فارسی ثقل تر می شود و کار دانشجویان و علاقه مندان علم داده برای فهم مطالب سخت تر می گردد. 

متن کاوی یکی از زیر مجموعه های علوم داده کاوی است که بعضا با نام کشف دانش در متون نیز مطرح می شود .طبق تعریف فرهنگ لغت آکسفورد به فرآیند یا عملی که مجموعه بزرگی از منابع نوشته شده را به اطلاعات جدیدی تبدیل کند متن کاوی گفته می شود.

در این بخش یکی از کتابهای مطرح در مورد علم متن کاوی که یکی از قدیمی ترین کتاب ها در این زمینه است را معرفی می کنیم. 

Introduction to Information Retrieval, Textbook by Christopher D. Manning, Hinrich Schütze, and Prabhakar Raghavan

این کتاب توسط پرفسور منینگ که یکی از برجسته ترین اساتید دانشگاه استنفورد در زمینه پردازش زبان طبیعی است نگاشته شده است. ایشان بیش از 85 هزار ارجاع به مقالات و کتابهایشان دارند و یکی از مطرح ترین اساتید این حوزه در دنیا هستند. پر ارجاع ترین پژوهش ایشان نیز همین کتاب با بیش از 15 هزار ارجاع است. این کتاب به عنوان یکی از کتب کلاسیک برای درک مفاهیم متن کاوی مورد توجه است. این کتاب دارای محتوای زیر است:

01 بازیابی بولین

02 اصطلاح واژگان و نوشته ها 

03 فرهنگ لغت و بازیابی

04 ساخت اسناد 

05 فشرده سازی صفحه 

06 نمره دهی، وزن مدت و مدل فضای بردار 

07 محاسبه نمرات در یک سیستم جستجوی کامل 

08 ارزیابی در بازیابی اطلاعات 

09 بازخورد مربوطه و گسترش پرس و جو 

10 بازیابی XML 

11 بازیابی اطلاعات احتمالی 

12 مدل زبان برای بازیابی اطلاعات 

13 طبقه بندی متن و نایو بیز

  14فضای فضای ارجاع 

15 ماشین بردار پشتیبان و یادگیری ماشین در اسناد 

16 خوشه بندی مسطح

17 خوشه بندی سلسله مراتبی 

18 تقسیمات ماتریسی و نمایه سازی معنی پنهان 

19 جستجوی پایه 

20 وب خزنده و شاخص 

21 تجزیه و تحلیل لینک

این کتاب برای کسانی که به دنبال کار در حوزه متن کاوی و بازیابی اطلاعات هستند به شدت توصیه می گردد. 

کپی برداری بدون ذکر منبع، براساس قانون جرایم اینترتی و مادۀ 12 فصل سوم قانون جرایم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است! 

اگر در زمینه متن کاوی در حال تحقیق یا پیاده سازی پروژه یا پایان نامه هستید برای گرفتن مشاوره یا دادن سفارش انجام با ما تماس بگیرید.  آکادمی داده در تلگرام، واتزآپ و تمامی پیام رسان های ایرانی(سروش، آی گپ، بله، گپ و ویسپی) با شماره 09120637751 حضور دارد برای ارتباط از طریق ایمیل آدرس جیمیل: dataacademyir@gmail.com می باشد. 

افتخار آکادمی داده، همسفر بودن با شما در راه یادگیری علم داده است.