اجزای موتور جستجو

هر موتور جستجو از پنج بخش تشکیل شده است که عبارتند از: Spider یا عنکبوت، Craweler یا خزنده، Indexer یا بایگانی کننده، DataBase یا پایگاه داده، Ranker یا سیستم رتبه بندی.

۱. Spider یا Robot اولین جزء یک موتور جستجو است، نرم افزاری است که به صفحات مختلف سایتها سر می زند و اطلاعات آنها را می خواند و در اختیار سایر بخشهای موتور جستجو قرار می دهد.

۲. Craweler نرم افزاری است که Spider را راهنمایی می کند چه صفحاتی و چه لینک هایی را بازدید و دنبال کند در واقع به عنوان فرمانده برای Spider عمل می کند.

۳. Indexer اطلاعات جمع آوری شده توسط Spider را تجزیه و تحلیل و طبقه بندی می کند. یعنی اطلاعات جمع آوری شده را به بخشهای مختلف تقسیم می کند مثلا اطلاعات چه حجمی دارند، کلمات چندبار تکرار شده اند، اطلاعات از چه سایتی ارسال شده اند و همچنین اطلاعاتی که ارزشی ندارند را حذف می کند مثل کلمات رایج مانند or، and ، an

۴. اطلاعات طبقه بندی شده در Indexer در DataBase کدبندی می شوند وبه صورت فشرده ذخیره می شوند.

۵. مهمترین بخش یک موتور جستجو است و تفاوت موتورهای جستجو از تفاوت آنها در سیستم رتبه بندیشان است. وقتی کلمه یا عبارتی جستجو می شود موتور جستجو بر اساس الگوریتمی که دارد نتایج را مرتب می کند.