کاربردهای متن‌کاوی در موتورهای جستجو

کاربردهای متن‌کاوی در موتورهای جستجو

آکادمی داده

۱۳۹۶/۱۱/۰۴


  • 264 بازدید

همه ما در طول روز بارها از موتورهای جستجو استفاده میکنیم اما این موتورها چطوری کار میکنند ؟ آیا از روشهای متنکاوی استفاده میکنند یا خیر ؟ در این بخش به مراحل انجام یک جستجو و ارتباط آن با متنکاوی اشاره می شود .

  • جستجوی کاربر پاکسازی میشود .
  • ریشه یابی انجام میگیرد .کلمات جمع به کلمات مفرد تبدیل میشود .مثلاً کلمه جملات به جملهتبدیل میشود .
  • واژهها حذف میشود کلماتی مانند از ، و ، با ، را ،.......از متن جستجو حذف می شود .
  • جستجو نرمالسازی میشود .مثلاً ترتیب کلمات در جملات اصلاح میشود .اگر شما کاوه دادی در بار نوشته باشید این کلمه به دادهکاوی تبدیل میشود .این کار در برخی موارد ممکن است باعث کاهش عملکرد موتور جستجو شود .
  • با استفاده از جداول جستجوی شما شامل شهر یا کشور باشد در این مرحله استخراج می شود.
  • الگوریتم دیگری برای شناسایی کلمات خاص دیگر بررسی میشود مثلاً اسم شهر سانفرانسیسکوشامل دو توکن است ولی درواقع یک توکن است این اقدام در این مرحله اجرا می شود. 
  • مترادف و متضادها در این مرحله شناسایی میشود مثلاً اگر شما کلمه ماشین را جستجو کرده باشید کلمه ماشین یا خودرو نیز توسط الگوریتم به متن جستجو اضافه میشود .این اقدام در افزایش عملکرد موتور جستجو بسیار مؤثر است زیرا استفاده از چند کلمه برای یک مفهوم مشترک در زبانهای مختلف بسیار متداول است .

در مرحله آخر یک الگوریتم سعی میکند نیت کاربر را شناسایی کند . در برخی موارد از پروفایل کاربر نیز برای این کار استفاده میشود .در حقیقت این مرحله پیچیدهترین و سختترین مرحله کار است .

 همانطور که مشاهده میکنید بامطالعه مراحل بالا میتوان بیان کرد که در مراحل مختلف یک موتور جستجو از روشهای مختلف متن کاوی استفاده میکند .

کپی برداری بدون ذکر منبع، براساس قانون جرایم اینترتی و مادۀ 12 فصل سوم قانون جرایم رایانه ای غیر قانونی بوده و مجازات جزای نقدی و حبس دارد و شرعا نیز حرام است!