موتور جستجو چیست؟ معرفی انواع موتورهای جستجو پرطرفدار

موتور جستجو

تا چند سال پیش اگر شما به دنبال مطلبی (به عنوان مثال موتورهای جست و جو) بودید، باید به دنبال افراد و کتاب‌هایی می رفتید که در حوزه اطلاعاتی شما دانشی داشتند و اگر مطلب شما هم خیلی تخصصی بود، پیدا کردن منابع  برای دریافت اطلاعات موردنیاز، خیلی سخت بود. بعد از ظهور اینترنت و پیدایش انواع موتور جستجو مختلف، کم‌کم پیدا کردن اطلاعات راحت‌تر شد و هر شرکت و شخصی توانست با ایجاد یک وب‌سایت یا پایگاه داده اطلاعاتی، داده‌های موردنیاز را در این شبکه اینترنتی آپلود نماید تا بقیه افرادی که نیاز به داده‌های آن داشتند، بتوانند استفاده کنند.

موتورهای جستجو به مانند ماشین های پاسخگویی هستند. آنها با این هدف به وجود آمده‌اند که محتوای منتشر شده در اینترنت را کشف، درک و سپس طبقه بندی کنند تا در هنگام پرسش کاربران از طریق جستجو، مرتبط‌ترین آیتم ها را به آن نشان دهند.

برای نمایش بهتر سایت در نتایج جستجو نیاز است که محتوای وب سایت در قدم اول برای موتورهای جستجو قابل دسترسی باشد. این موضوع مسلما مهمترین قطعه پازل سئو است، چرا که یک سایت بدون پیدا شدن، راهی برای نمایش در نتایج جستجو نخواهد داشت.

موتور جستجو چیست؟

موتور جستجو ابزاری است که اطلاعات موردنیاز شما را از پایگاه داده‌ها و سایت‌های مختلف بر اساس الگوریتمی که دارد استخراج می‌کند و نمایش می‌دهد.

امروزه با توجه به رشد سرعت انتشار انواع داده و جستجوی کاربران، استفاده از انواع موتور جستجو افزایش‌یافته است. پس خیلی مهم است که این موتورها دارای الگوریتم درستی باشند تا بتوانند اطلاعات موردنیاز کاربران را دقیق و به‌ درستی نمایش دهند.

انواع موتور جستجو چیست؟

وقتی اسم موتور جستجو می‌آید، اولین اسم (سایتی) که در ذهن همه به وجود می‌آید، گوگل است؛ اما امروزه موتورهای جستجو بیشتر از گذشته شده است و هرکدام نیز کارایی مربوطه و خاص خود را دارد.

در حالت کلی انواع موتور جستجو را می‌توان به دو نوع زیر تقسیم‌بندی کرد:

  • موتور جستجو بر اساس خزیدن در سایت‌ها و پایگاه داده‌ها
  • دایرکتوری‌ها

موتور جستجو بر اساس خزیدن

یکی از دسته کلی انواع موتور جستجو است که برای خزیدن در سایت دارای یک ربات عنکبوتی است و در سایت‌ها، مخصوصاً وب‌سایت‌های جدید خزش می‌کند و بر اساس کلمه کلیدی و دیگر معیارها شاخص گذاری می‌کند و اگر مشکلی نداشته باشد، آن را به پایگاه داده خود برای نمایش به کاربران ذخیره می‌کند. گوگل یکی از نمونه این سایت‌ها است.

دایرکتوری‌ها

دایرکتوری‌ها یکی از انواع موتور جستجو است که اطلاعاتی شامل کسب و کارها، فعالیت‌ها و غیره را بر اساس دسته‌بندی خاصی که دارند، ذخیره می‌کند. یکی از نمونه این سایت‌ها را می‌توان یاهو نام برد.

  • ابتدا مالک کسب‌وکار و غیره، اطلاعات فعالیت خود را بر اساس نوع کار خود در یکی از فهرست‌های دایرکتوری ثبت می‌نماید. همچنین کلمات کلیدی متناسب نیز تعیین می‌شود.
  • بعداز اینکه لینک سایت و اطلاعات خود را ثبت کرد، اطلاعات او بر اساس فهرستی که قرار داده است، توسط مدیران دایرکتوری بررسی و تائید می‌شود.

دیگر انواع موتور جستجو

به ‌غیر از دو نوع بالا، موتورهای جستجو می‌توانند بر اساس کاربرد خود نیز به زیر دسته‌های کوچک‌تری تقسیم شوند:

1. امروزه اکثر موتورهای جستجو، اطلاعات خود را به شکل‌های مختلفی نمایش می‌دهند که هرکدام هم الگوریتم‌های و تکنیک‌های مخصوص به خود را برای نمایش دارند.

برای مثال می‌توان خود گوگل را نام برد. گوگل به غیر از نمایش لینک سایت‌ها، دارای یک صفحه نمایش عکس (google image)، ویدئو، محصولات و نیوز (google news) است که هرکدام برای اینکه سایتی در صفحه اول آن‌ها نمایش داده شود، تکنیک‌های مخصوص به خود را دارد که باید آن‌ها را رعایت کرد.

2. بعضی از موتورهای جستجو مانند Dogpile تعدادی اطلاعات میانی از صفحات از دیگر موتورهای جستجو و دایرکتوری‌ها جمع‌آوری می‌کنند و نمایش می‌دهند.

3. موتورهای جستجو معنایی مانند Swoogle نتایج را در یک محدوده خاص بر اساس معنا و مفهوم کوئری مورد جستجو نمایش می‌دهند.

موتورهای جستجو چگونه کار می کنند؟

موتورهای جستجو دارای سه عملکرد اصلی هستند:

  1. پایش (Crawl): جستجوی محتوا در وب و گشتن محتوا و کدها در هر یو آر ال کشف شده.
  2. ایندکس (index): ذخیره سازی و طبقه بندی محتوای پیدا شده در مرحله پایش. با قرار گرفتن یک صفحه در ایندکس، آن صفحه شانس نمایش در نتایج جستجو را خواهد داشت.
  3. رتبه بندی (Rank): فراهم کردن لیستی از محتواهای مرتبط و مناسب با جستجوی یک عبارت. نتایج جستجو بر اساس معیار بیشترین ارتباط مرتب می شوند.

پایش موتورهای جستجو چیست؟

پایش (Crawling) به فرایندی گفته می شود که در آن تیمی از ربات ها (تحت عنوان پایشگر یا اسپایدر) به اینترنت متصل شده و محتواهای جدید و بروزرسانی شده را کشف می کنند. محتواها می توانند انواع مختلفی مانند صفحه وب، تصویر، ویدئو یا PDF داشته باشند. اما جدا از هر فرمتی محتواها با استفاده از لینک ها شناسایی می شوند.

پایش موتورهای جستجو

ربات گوگل با نام گوگل بات (Googlebot) شروع به مشاهده چند صفحه از وب کرده و سپس لینک های موجود در آن را با هدف کشف صفحات جدید دنبال می کند. با ادامه این کار پایشگر قادر است که محتواهای جدید را یافته و آن را به ایندکس خود تحت نام کافئین (Caffeine) – دیتابیس عظیمی از یو آر ال های کشف شده – اضافه کند. در نتیجه اطلاعات مورد نظر کاربر در زمان درخواست آن، از این طریق فراخوانی می شود.

ایندکس موتورهای جستجو چیست؟

موتورهای جستجو به پردازش و ذخیره سازی اطلاعات کشف شده در قالب یک اینکدس می کنند. ایندکس شامل دیتابیس عظیمی از محتوای یافت شده است که در زمان جستجو کاربر، توسط موتورهای جستجو استفاده می‌شود.

رتبه بندی سایت ها در موتورهای جستجو

درست پس از زمان جستجوی کاربران، موتورهای جستجو شروع به گشتن در بین مطالب مرتبط کرده و آنها را بر اساس عبارت مورد جستجوی کاربر به شکل لیستی مرتب می کنند. به عملیات تهیه این لیست، رتبه بندی گفته می شود. در حالت کلی شما اینطور می توانید تصور کنید که هر چه رتبه یک وب سایت بالاتر باشد، میزان ارتباط محتوای آن با عبارت جستجو شده بیشتر است.

این امکان وجود دارد که از پایش تمام سایت یا برخی از صفحات آن ممانعت به عمل آورد یا اینکه جلوی ایندکس شدن برخی از صفحات در موتورهای جستجو را گرفت. با اینکه ممکن است دلایلی برای انجام این کار وجود داشته باشد، اما شما بایستی در ابتدا اطمینان حاصل کنید که صفحات مورد نظرتان از طرف موتورهای جستجو قابل پایش و ایندکس باشد. در غیر این صورت آن صفحه در نتایج جستجو پدیدار نمی شود.

در انتهای این قسمت شما متوجه خواهید شد که بایستی همگام با موتورهای جستجو کار کرد، نه اینکه بر علیه آنها بود.

همه موتورهای جستجو در سئو یکسان نیستند

بسیاری از مبتدیان از اهمیت نسبی برخی از موتورهای جستجوی خاص تعجب می کنند. بسیاری از افراد می دانند که گوگل بزرگترین سهم بازار جستجو را از آن خود دارد، اما بهینه سازی برای بینگ، یاهو و بقیه چقدر مهم است؟ حقیقت این است که با وجود حداقل بیست موتور جستجوی بزرگ در دنیا، توجه جامعه سئو بر روی گوگل متمرکز است. اما چرا؟ پاسخ کوتاه به این سوال این است که بیشتر جستجوهای دنیا در گوگل انجام می شود. اگر ما علاوه بر بخش وب گوگل، بخش های تصاویر، نقشه و یوتیوب (تحت مالکیت گوگل) را نیز در نظر بگیریم، بیش از 90% جستجوهای دنیا در گوگل رخ می دهد. این عدد 20 برابر بیشتر از جمع سهم بینگ و یاهو است.

پایش: آیا موتورهای جستجو می توانند صفحات سایت را پیدا کنند؟

همانطور که تاکنون آموخته‌اید، پایش و ایندکس شدن صفحات سایت، پیش نیاز دیده شدن در نتایج جستجو است. اگر هم اکنون صاحب وب سایتی هستید، بهتر است که تعداد صفحات ایندکس شده آن را بررسی کنید. این کار موجب می شود که دید اولیه خوبی نسبت به پایش صفحات سایت داشته باشید.

یکی از روش های چک کردن ایندکس سایت، استفاده از اپراتور site: به شکل site:domain.com است. در گوگل عبارت site:domain.com را جستجو کنید و به جای domain.com نام دامنه خود را قرار دهید. با این کار به تعداد صفحات ایندکس شده سایت در گوگل پی خواهید برد.

استفاده از اپراتور site:

تعداد صفحاتی که گوگل در چنین شرایطی نشان می دهد، خیلی عدد دقیقی نیست، اما می توان ایده اولیه ای از صفحات ایندکس شده و نوع نمایش آنها در نتایج جستجو کسب کرد.

برای کسب نتیجه دقیق در این مورد بایستی بخش Coverage در گوگل سرچ کنسول را بررسی کنید. داشتن اکانت در گوگل سرچ کنسول رایگان بوده و با مراجعه به آدرس این ابزار می توانید در آن ثبت نام نمایید. با استفاده از این ابزار می توانید نقشه سایت خود را (لیستی از آدرس های صفحات وب سایت) در آن ثبت کرده و تعداد صفحات قرار گرفته در ایندکس گوگل از این لیست را مشاهده نمایید. البته کارکردهای این ابزار به همین مورد ختم نمی شود.

در صورتی که وب سایت شما در نتایج گوگل نمایش داده نمی شود، دلایل محتملی وجود دارد:

  • سایت شما به تازگی راه اندازی شده و هنوز پایش نشده است.
  • به سایت شما در هیچ وب سایت ایندکس شده دیگری لینک داده نشده است.
  • ساختار سایت شما به گونه ایست که ربات ها قادر به پایش صحیح آن نیستند.
  • وب سایت شما دارای کدهای دستوری است که مانع از پایش ربات های موتورهای جستجو می گردد.
  • سایت شما به دلیل نقض قوانین گوگل جریمه شده است.

به موتورهای جستجو اعلام کنید که چگونه وب سایت شما را پایش کنند

اگر با استفاده از اپراتور site: صفحات مهم سایت خود را مشاهده نمی کنید، یا اینکه صفحاتی می بینید که اصولا نبایست در نتایج جستجو قرار گیرند، بدانید که بهینه سازی‌هایی در این شرایط وجود دارد که می توان با اجرای آن‌ها به موتورهای جستجو اعلام کرد که چگونه به پایش صفحات سایت بپردازند. اعلام صفحات سایت مجاز برای بازدید شدن از طرف موتورهای جستجو می تواند به شما امکان دهد تا ایندکس موتورهای جستجو از وب سایت خود را کنترل نمایید.

بسیاری از افراد تنها به ایندکس شدن صفحات مهم سایت در گوگل بسنده می کنند، اما صفحات زیادی نیز در این بین وجود دارند که شما علاقه مند به ایندکس شدن آنها نیستید و اغلب هم فراموششان می کنید. این صفحات شامل یو آر ال های بدون محتوا، محتوای تکراری (مانند آدرس های دارای پارامتر های مرتبط با فیلتر و مرتب کردن آیتم ها در فروشگاه های اینترنتی)، صفحات تست و از این قبیل می شوند.

برای دور کردن گوگل از پایش صفحاتی خاص می توان از robots.txt استفاده کنید.

معرفی انواع موتور جستجو برتر

1. گوگل

گوگل نیازی به معرفی ندارد. اولین و پراستفاده‌ترین موتور جستجو است.

بر اساس آخرین گزارش‌هایی که در فوریه 2016 منتشر شد، مقدار جستجو در گوگل 65 درصد و در بینگ که رتبه دوم است، 21.4 درصد است.

2. بینگ

تلاش شرکت بینگ در اول این بود که بتواند گوی رقابت را در جستجوی محلی به دست بگیرد ولی نتوانست. البته بعد از یاهو، بیشترین میزان استفاده را بین کاربران دارد.

3. یاهو

یاهو هم یک دایرکتوری معروف است امروزه توسط بینگ مدیریت می‌شود. سرویس ایمیل آن هنوز هم یکی از پراستفاده‌ترین سرویس‌های ارسال نامه است. فقط چند سال پیش، سرویس یاهو چت، خدمات‌رسانی خود را متوقف کرد.

4. Ask.com

اسک توانسته است امروزه 3 درصد جستجوی کل را دربگیرد. پایه و اساس سایت اسک بر اساس پرسش و پاسخ است که توسط کاربران سؤالات پرسیده و جواب داده می‌شود.

5. AOL.com

این سایت توانسته است امروزه سهم جستجوی 0.6 درصدی را نیز به دست بیاورد. شبکه AOL چندین وب‌سایت معروف را برای جستجو اطلاعات تحت پوشش قرار می‌دهد مانند engadget.com،techchrunch.com و the huffingtonpost.com.

6. Baidu

این سایت در سال 2000 تأسیس شد و محبوب‌ترین موتور جستجو در چین است. با توجه به جمعیت بالای چین، یکی از انواع موتور جستجو است که میلیاردی در آن کوئری مورد جستجو قرار می‌گیرد و از این رو رتبه 4 الکسا را دارد.

7. Wolframapha

این موتور جستجو با دیگر نوع‌ها کمی متفاوت است. درواقع یک موتور محاسباتی است و به شما اطلاعات، داده‌ها و فرمول‌ها را برای موضوعات محاسباتی و عددی می‌دهد.

8. DuckDuckGo

این موتور جستجو مزیت‌های بسیاری نسبت به بقیه دارد. داشتن رابط کاربری ساده، اطلاعات و مسیر جستجوی کاربران را ذخیره نمی‌کند و پشتیبانی نکردن از آگهی‌های تبلیغاتی از نمونه مزیت‌های این سایت است. مطمئناً اگر این سایت بین کاربران معروف شود، می‌تواند رقابت تنگاتنگی را نیز با گوگل انجام دهد.

9. Internet Archive

Archive.org آرشیوی از اطلاعات و تاریخچه تمامی سایت‌ها و دامنه‌ها است.

10. Yandex.ru

بر اساس الکسا، این سایت در سی تای اول سایت‌های محبوب و رتبه چهار روسیه است که به نمایش و معرفی محصولات و خدمات می‌پردازد. 65 درصد جستجوی کل کشور روسیه این سایت تشکیل می‌دهد.

انواع موتور جستجو داخلی

موتورهای جستجو داخلی زیادی در چند سال گذشته به وجود آمده است که هرکدام در دسته‌هایی که در بالا معرفی شد، قرار می‌گیرند. البته بیشتر این موتور جستجو در حال حاضر، دایرکتوری هستند و به معرفی کسب و کارها همراه با اطلاعات آن‌ها می‌پردازند. معروف‌ترین این سایت را می‌توان کتاب اول دانست.

منابع:

به این پست امیتاز دهید!
[کل: 3 میانگین: 5]
0 پاسخ

دیدگاه خود را ثبت کنید

تمایل دارید در گفتگوها شرکت کنید؟
در گفتگو ها شرکت کنید.

دیدگاهتان را بنویسید