فهرسة محرك البحث

كيف يعمل محرك البحث على فهرسة صفحات الويب؟

سنقدم لك في هذا الدليل مقدمة حول كيفية عمل محرك البحث على فهرسة صفحات الويب. سيغطي هذا الدليل عمليات الزحف والفهرسة بالإضافة إلى مفاهيم مثل ميزانية الزحف ونظام ترتيب الصفحات.

تعمل محركات البحث عن طريق الزحف إلى مئات المليارات من الصفحات باستخدام برامج زحف الويب الخاصة بها. يشار إلى برامج زحف الويب هذه عادةً باسم روبوتات محركات البحث Bots أو العناكب Spiders. يتنقل محرك بحث في الويب عن طريق تنزيل صفحات الويب واتباع الروابط الموجودة على هذه الصفحات لاكتشاف الصفحات الجديدة التي تمت إضافتها.

 المحتويات:

1. فهرسة محرك البحث.

2. الهدف من خوارزمية محرك البحث.

3. أسباب عدم فهرسة الصفحة.


1. فهرسة محرك البحث.

تتم إضافة صفحات الويب التي تم اكتشافها بواسطة محرك البحث إلى بنية بيانات تسمى الفهرس Index. يتضمن الفهرس جميع عناوين URL المكتشفة جنباً إلى جنب مع عدد من الإشارات الرئيسية ذات الصلة حول محتويات كل عنوان URL مثل:

  • الكلمات الرئيسية التي تم اكتشافها داخل محتوى الصفحة، ما الموضوعات التي تغطيها الصفحة؟
  • نوع المحتوى الذي يتم زحف محرك البحث إليه (باستخدام بيانات جزئية تسمى المخطط)، ما الذي يتم تضمينه في الصفحة؟
  • حداثة الصفحة، متى تم تحديثها آخر مرة؟
  • تفاعل المستخدم السابق للصفحة و/أو المجال الخاص بها، كيف يتفاعل الأشخاص مع الصفحة؟

2. الهدف من خوارزمية محرك البحث.

الهدف من خوارزمية محرك البحث هو تقديم مجموعة ذات صلة من نتائج البحث عالية الجودة التي تلبي استفسارات أو أسئلة المستخدم في أسرع وقت ممكن. ثم يحدد المستخدم خياراً من قائمة نتائج البحث وهذا الإجراء، جنباً إلى جنب مع النشاط اللاحق، ثم يغذي التعلم المستقبلي الذي يمكن أن يؤثر على تصنيفات محرك البحث من الآن فصاعداً. 

ماذا يحدث عند إجراء عملية البحث؟

عندما يتم إدخال استعلام بحث في محرك بحث بواسطة المستخدم، يتم تحديد جميع الصفحات التي تعتبر ذات صلة من الفهرس ويتم استخدام خوارزمية محرك البحث لترتيب الصفحات ذات الصلة بشكل هرمي في مجموعة من النتائج.

تختلف الخوارزميات المستخدمة في ترتيب النتائج الأكثر صلة لكل محرك بحث. على سبيل المثال، قد لا تحتل الصفحة التي تحتل مرتبة عالية لاستعلام البحث في Google ترتيباً عالياً لنفس الاستعلام في Bing.

بالإضافة إلى استعلام البحث، تستخدم محركات البحث البيانات الأخرى ذات الصلة لإرجاع النتائج، بما في ذلك:

  • الموقع، تعتمد بعض طلبات البحث على الموقع ، على سبيل المثال “المقاهي القريبة مني” أو “أوقات الأفلام”.
  • اللغة المستخدمة، ستعرض محركات البحث النتائج بلغة المستخدم، إذا كان من الممكن اكتشافها.
  • سجل البحث السابق، ستعرض محركات البحث نتائج مختلفة لاستعلام يعتمد على ما قام المستخدم بالبحث عنه مسبقاً.
  • الجهاز، قد يتم عرض مجموعة مختلفة من النتائج بناءً على الجهاز الذي تم إجراء الاستعلام منه.

إقرأ أيضاً… ما هي تقنيات القبعة السوداء في سيو Black Hat SEO؟ وكيف يمكن تجنبها؟


3. أسباب عدم فهرسة الصفحة.

هناك عدد من الحالات حيث لن يتم فهرسة عنوان URL بواسطة محرك البحث. قد يكون هذا بسبب:

  • استثناءات ملف Robots.txt، ملف يخبر محركات البحث بالأشياء التي يجب ألا تزورها على موقعك.
  • التوجيهات الموجودة على صفحة الويب، والتي تخبر محركات البحث بعدم فهرسة تلك الصفحة (علامة noindex) أو فهرسة صفحة أخرى مماثلة.
  • خوارزميات محرك البحث التي تحكم على الصفحة على أنها منخفضة الجودة أو ذات محتوى ضعيف أو تحتوي على محتوى مكرر.
  • يعرض عنوان URL صفحة خطأ (على سبيل المثال، رمز استجابة 404 لم يتم العثور على HTTP).

مقالات مرتبطة...

  • معلومات عن القط البريطاني قصير الشعر.

    يعتبر القط البريطاني قصير الشعر من الحيوانات الأليفة الرائعة نظراً لطبيعتها المخلصة، فهم يحبون التكبب وقضاء الوقت مع بشرهم، كما أنهم قد يكونون خجولين بعض الشيء مع أشخاص جدد، إلا أنهم يسارعون إلى إظهار عاطفتهم بمجرد التعرف عليك، سنقدم لك في مقالتنا التالية معلومات عن القط البريطاني قصير الشعر. معلومات عامة عن القط البريطاني قصير…

  • ما هي خدمات معلومات الإنترنت (IIS)؟

    خدمات معلومات الإنترنت (IIS – Internet Information Services) هي عبارة عن حزمة برامج خادم ويب مصممة لنظام التشغيل Windows Server. يتم استخدامه لاستضافة مواقع الويب والمحتويات الأخرى على الويب. ما هي خدمات معلومات الإنترنت (IIS)؟ توفر خدمات معلومات الإنترنت من Microsoft واجهة مستخدم رسومية (GUI) لإدارة مواقع الويب والمستخدمين المرتبطين بها. فهو يوفر وسيلة مرئية…

  • إيجابيات وسلبيات الإنترنت.

    الإنترنت هو تطور تكنولوجي هائل يحمل معه العديد من الإيجابيات والسلبيات، دعنا نلقي نظرة على بعض إيجابيات وسلبيات الإنترنت. إيجابيات الإنترنت. سلبيات الإنترنت. لتحقيق فوائد الإنترنت وتجنب الآثار السلبية، يجب على المستخدمين استخدامه بحكمة ومسؤولية واتباع الإرشادات الأمنية والخصوصية المطلوبة. إقرأ أيضاً… مخاطر الإنترنت على الشباب والمراهقين. تعريف الانترنت. الإنترنت هو شبكة عالمية ضخمة من…

  • ما هو التسويق الهرمي؟

    من مخططات التسويق التي تدور حولها العديد من الشكوك هي مخطط التسويق الهرمي، فما هو مخطط التسويق الهرمي؟ كيف يعمل، وما هي أنواعه؟ ما هو التسويق الهرمي؟ مخطط التسويق الهرمي هو نموذج عمل غير مستدام يستخدمه المحتالون لجذب المشاركين بوعود بعوائد سريعة واستثنائية في فترة زمنية قصيرة. يبدأ بعدد قليل من الأعضاء الأصليين من المستوى…

  • أفضل دورات وشهادات الأمن السيبراني.

    أصبح الأمن السيبراني مهمًا بشكل متزايد للشركات في كل قطاع، وهو حيوي بشكل خاص للمنظمات الصغيرة والمتوسطة الحجم، في حال رغبتك في دخول هذا المجال، سنقدم لك أفضل دورات وشهادات الأمن السيبراني. تستمر الهجمات الإلكترونية في أن تصبح مشكلة رئيسية في العالم، وغالبًا ما تؤدي إلى سرقة معلومات العملاء. بسبب هذه المخاطر المتزايدة، تعد دورات وشهادات…

  • أفضل 10 مساعد شخصي بالذكاء الاصطناعي.

    أصبح المساعد الشخصي الذي يستخدم الذكاء الاصطناعي (AI) لا غنى عنه في مجتمع اليوم. تراه في كل مكان، من الهواتف الذكية إلى المؤسسات الطبية. يتزايد عدد مساعدي الذكاء الاصطناعي في السوق، وسيصبحون أكثر اندماجًا في حياتنا. ما الذي يحدد المساعد الشخصي المبني على الذكاء الاصطناعي؟ ما هو المساعد الشخصي بالذكاء الاصطناعي؟ يمكن تعريف المساعد الشخصي…