ما هي تقنية التعرف على الصور؟ وكيف تعمل؟

تقنية التعرف على الصور هي نوع من برمجة الذكاء الاصطناعي (AI) القادر على تعيين تسمية واحدة عالية المستوى لصورة عن طريق تحليل وتفسير أنماط البكسل في الصورة.

التعرف على الصور هو فئة فرعية من رؤية الكمبيوتر، وهي تسمية شاملة لعملية تدريب أجهزة الكمبيوتر على “الرؤية” مثل البشر واتخاذ الإجراءات.

كما يرتبط أيضًا بمعالجة الصور، وهو مصطلح شامل لاستخدام خوارزميات التعلم الآلي (ML) لتحليل الصور الرقمية.


شرح تقنية التعرف على الصور.

يتم التعرف على الصور بعدة طرق مختلفة، ولكن العديد من التقنيات العليا تتضمن استخدام التعلم الخاضع للإشراف والشبكات العصبية وخوارزميات التعلم العميق.

من خلال مجموعة من التقنيات مثل التجميع الأقصى وتكوين الخطوات والحشو. تساعد المرشحات العصبية التلافيفية برامج التعلم الآلي على تحسين تحديد موضوع الصورة.


حالات الاستخدام.

تشمل الاستخدامات الشائعة للتعرف على الصور ما يلي:

  • التعرف البصري على الأحرف (OCR).
  • تصنيف الصورة.
  • البحث الرقمي عن الصور.

إقرأ أيضاً… كيف تعمل تقنية التعرف على الوجه؟


التعرف على الصور والتعرف على الكائنات.

غالبًا ما يتم الخلط بين مصطلحات التعرف على الصور والتعرف على الأشياء (اكتشاف الكائن).

الفرق هو أن برمجة التعرف على الصور تحلل أنماط البكسل من أجل تصنيف صورة كاملة، بينما تصنف برمجة التعرف على الكائن كل نمط بكسل في الصورة.

توضع الصورة التالية الفرق بين التعرف على الصور والتعرف على الكائنات.

الفرق بين التعرف على الصور والتعرف على الكائنات

التعرف على الصور: معدات رياضة البيسبول.

التعرف على الكائنات: كرة بيسبول، مضرب كرة، قفاز.

قد يعجبك ايضاَ