تصنيف الاستعلام على أساس نتائج الصورة

نشرت: 2022-04-27

حصلت Google مؤخرًا على براءة اختراع بشأن تصنيف الاستعلام استنادًا إلى نتائج الصور.

تخبرنا براءة الاختراع أن: "محركات البحث على الإنترنت توفر معلومات حول الموارد التي يمكن الوصول إليها عبر الإنترنت (مثل صفحات الويب والصور والمستندات النصية ومحتوى الوسائط المتعددة) التي تستجيب لاستعلام بحث المستخدم من خلال إعادة مجموعة من نتائج البحث عن الصور عند البحث عن الصور ردًا على الاستعلام ".

تتضمن نتيجة البحث ، على سبيل المثال ، محدد موقع المعلومات (URL) لصورة أو مستند يحتوي على الصورة ومقتطف من المعلومات.

ترتيب SERPs باستخدام وظيفة التسجيل

يمكن ترتيب نتائج البحث (بالترتيب على سبيل المثال) وفقًا للدرجات التي تم تعيينها بواسطة وظيفة التسجيل.

تقوم وظيفة التسجيل بترتيب نتائج البحث وفقًا لإشارات مختلفة:

  • أين (وكم مرة) يظهر نص الاستعلام في نص المستند المحيط بالصورة
  • تعليق على الصورة أو نص بديل للفكرة
  • ما مدى معايير مصطلحات الاستعلام في نتائج البحث المفهرسة بواسطة محرك البحث.

بشكل عام ، يكون الموضوع الموصوف في هذه البراءة بطريقة تشمل:

  • الحصول على صور من نتائج الصورة الأولى للاستعلام الأول ، حيث يكون عدد الصور المكتسبة المرتبطة بالدرجات وبيانات سلوك المستخدم التي تشير إلى تفاعل المستخدم مع الصور التي تم الحصول عليها عندما تكون الصور التي تم الحصول عليها هي نتائج البحث للاستعلام
  • تحديد عدد من الصور التي تم الحصول عليها لكل منها بيانات سلوكية تلبي حدًا معينًا
  • ربط الصور الأولى المختارة بالعديد من التعليقات التوضيحية بناءً على تحليل محتوى الصور المختارة

يمكن أن تشمل هذه اختياريا الميزات التالية.

يمكن ربط طلب البحث الأول بالفئات بناءً على التعليقات التوضيحية. يمكن تخزين تصنيف الاستعلام وارتباطات التعليقات التوضيحية للاستخدام في المستقبل. يمكن تلقي نتائج الصورة الثانية التي تستجيب لاستعلام ثانٍ مطابق للاستعلام الأول أو يشبهه.

ترتبط كل صورة من الصور الثانية بنتيجة ، ويمكن تعديل الصورة الثانية بناءً على الفئات المتعلقة بالاستعلام الأول.

يمكن أن يوضح أحد تصنيفات الاستعلام أن الاستعلام الأول هو استعلام لشخص واحد ويزيد درجات الصورة الثانية ، التي تشير تعليقاتها التوضيحية إلى أن مجموعة الصور الثانية تحتوي على وجه واحد.

يمكن أن يوضح أحد تصنيفات الاستعلام أن الاستعلام الأول متنوع ويزيد من درجات الصور الثانية ، التي تشير تعليقاتها التوضيحية إلى أن مجموعة الصور الثانية متنوعة.

يمكن أن تشير إحدى الفئات إلى أن الاستعلام الأول هو استعلام نصي وزيادة درجات الصورة الثانية ، التي تشير تعليقاتها التوضيحية إلى أن مجموعة الصور الثانية تحتوي على النص.

يمكن تقديم الاستعلام الأول إلى مصنف مدرب لتحديد تصنيف الاستعلام في الفئات.

يمكن أن يتضمن تحليل محتوى الصور الأولى المحددة تجميع نتائج الصور الأولى لتحديد تعليق توضيحي في التعليقات التوضيحية. يمكن أن تكون بيانات سلوك المستخدم هي عدد المرات التي يختار فيها المستخدمون الصورة في نتائج البحث لطلب البحث الأول.

يمكن تنفيذ الموضوع الموصوف في براءة الاختراع هذه لتحقيق المزايا التالية:

يتم تحليل مجموعة نتائج الصور لاشتقاق التعليقات التوضيحية للصور وتصنيف الاستعلام ، ويمكن استخدام تفاعل المستخدم مع نتائج البحث عن الصور لاشتقاق أنواع للاستعلامات.

تصنيف الاستعلام

يمكن لفئات الاستعلام ، بدورها ، تحسين ملاءمة نتائج البحث عن الصور وجودتها وتنوعها.

يمكن أيضًا استخدام تصنيف الاستعلام كجزء من معالجة الاستعلام أو في عملية خارج الإنترنت.

يمكن استخدام فئات طلبات البحث لتقديم اقتراحات استعلام تلقائية مثل "إظهار الصور ذات الوجوه فقط" أو "إظهار القصاصات الفنية فقط".

تصنيف الاستعلام

تصنيف الاستعلام على أساس نتائج الصور
المخترعون: آنا ماجكوسكا وكريستيان تابوس
الوكيل: GOOGLE LLC
براءات الاختراع الأمريكية: 11308149
تم المنح: 19 أبريل 2022
تاريخ التقديم: 3 نوفمبر 2017

خلاصة

الأساليب والأنظمة والأجهزة ، بما في ذلك برامج الكمبيوتر المشفرة على وسيط تخزين الكمبيوتر ، لتصنيف الاستعلام بناءً على نتائج الصور.

في أحد الجوانب ، تتضمن إحدى الطرق تلقي الصور من نتائج الصور المستجيبة لاستعلام ما ، حيث يتم ربط كل صورة بترتيب في نتائج الصورة وبيانات سلوك المستخدم الخاصة بالصورة كنتيجة بحث للاستعلام الأول وإقرانه الصور الأولى مع عدد من التعليقات التوضيحية بناءً على تحليل محتوى الصور الأولى المختارة.

نظام يستخدم تصنيف الاستعلام لتحسين مجموعة النتائج التي تم إرجاعها لاستعلام

يرسل العميل ، مثل مستعرض الويب أو عملية أخرى يتم تنفيذها على جهاز كمبيوتر ، استعلام إدخال إلى محرك بحث ، ويعيد محرك البحث نتائج بحث الصور إلى العميل. في بعض التطبيقات ، يشتمل الاستعلام على نص مثل الأحرف في مجموعة الأحرف (على سبيل المثال ، "الطماطم الحمراء").

يشتمل الاستعلام على صور أو أصوات أو مقاطع فيديو أو مجموعات منها. أنواع الاستعلام الأخرى ممكنة. سيبحث محرك البحث عن النتائج بناءً على إصدارات بديلة من الاستعلام تساوي أو أوسع من أو أكثر تحديدًا من استعلام الإدخال.

نتائج البحث عن الصور عبارة عن قائمة مرتبة أو مرتبة من المستندات أو روابط لها ، والتي تم تحديدها على أنها تستجيب لاستعلام الإدخال ، مع تحديد المستندات الأكثر صلة بأعلى مرتبة. النسخة هي صفحة ويب أو صورة أو ملف إلكتروني آخر.

في حالة البحث عن الصور ، يحدد محرك البحث ملاءمة الصورة استنادًا ، جزئيًا على الأقل ، إلى ما يلي:

  • محتوى الصورة
  • النص المحيط بالصورة
  • تعليق على الصورة
  • نص بديل للصورة

الفئات المرتبطة باستعلام

عند إنتاج نتائج بحث الصور ، يرسل محرك البحث في بعض التطبيقات طلبًا للفئات المرتبطة بالاستعلام. يمكن لمحرك البحث استخدام الفئات المرتبطة لإعادة ترتيب نتائج بحث الصور عن طريق زيادة ترتيب نتائج الصور المحددة للانتماء إلى الفئات ذات الصلة.

في بعض الحالات ، قد يؤدي ذلك إلى تقليل نتائج الصور التي لا تنتمي إلى الفئات المرتبطة أو كليهما.

يمكن لمحرك البحث أيضًا استخدام فئات النتائج لتحديد كيفية ترتيبها في مجموعة النتائج النهائية جنبًا إلى جنب مع فئة الاستعلام أو فئة منها.

يستخدم محرك المصنف أو عملية أخرى نتائج الصور المستردة للاستعلام ومستودع بيانات سلوك المستخدم لاشتقاق فئات للاستعلام. يحتوي المستودع على بيانات سلوك المستخدم. يشير التخزين إلى عدد المرات التي حدد فيها المستخدمون نتيجة صورة لاستعلام معين.

يمكن تحديد الصورة بعدة طرق ، بما في ذلك استخدام لوحة المفاتيح أو فأرة الكمبيوتر أو إيماءة الإصبع أو الأوامر الصوتية أو طرق أخرى. تتضمن بيانات سلوك المستخدم "بيانات النقر".

يشير النقر فوق البيانات إلى المدة التي يطولها المستخدم أو "يسكن" في نتيجة الصورة

تشير بيانات النقر إلى المدة التي يعرضها المستخدم أو "يسكن" نتيجة الصورة بعد تحديدها في قائمة نتائج الاستعلام. على سبيل المثال ، يمكن أن يشير قضاء وقت طويل على صورة (مثل أكثر من دقيقة واحدة) ، يسمى "نقرة طويلة" ، إلى أن المستخدم وجد الصورة ذات الصلة باستعلام المستخدم.

يمكن تفسير فترة وجيزة من عرض صورة (على سبيل المثال ، أقل من 30 ثانية) ، تسمى "نقرة قصيرة" ، على أنها نقص في ملاءمة الصورة. أنواع أخرى من بيانات سلوك المستخدم ممكنة.

على سبيل التوضيح ، يمكن إنشاء بيانات سلوك المستخدم من خلال عملية تنشئ سجلاً لمستندات النتائج المحددة من قبل المستخدمين استجابةً لاستعلام معين. يمكن تمثيل كل نموذج على هيئة مجموعة: <document، query، data>) التي تتضمن:

  • سؤال مقدم من قبل المستخدمين
  • مرجع استعلام يشير إلى الاستعلام
  • وثيقة تشير إلى ورقة اختارها المستخدمون استجابةً للاستعلام
  • تجميع بيانات النقر (مثل عدد كل نوع نقرة) لجميع المستخدمين أو مجموعة فرعية من جميع المستخدمين الذين حددوا مرجع المستند استجابةً للاستعلام.

من الممكن تمديد هذا النهج المستند إلى المجموعة لبيانات سلوك المستخدم. على سبيل المثال ، يمكن توسيع بيانات سلوك المستخدم لتشمل معرّفات خاصة بالموقع (مثل الدولة أو الولاية) أو المعرّفات الخاصة باللغة.

مع تضمين مثل هذه المعرفات ، ستتألف المجموعة الخاصة بالبلد من البلد الذي نشأ منه استعلام المستخدم ، وستتألف المجموعة الخاصة بلغة معينة من لغة استعلام المستخدم.

لتبسيط العرض التقديمي ، يتم عرض بيانات سلوك المستخدم المرتبطة بمستندات A-CCC للاستعلام في الجدول على أنها إما كمية "عالية" أو "متوسطة" أو "منخفضة" من بيانات سلوك المستخدم المواتية (مثل سلوك المستخدم بيانات تشير إلى الصلة بين المستند والاستعلام).

بيانات سلوك المستخدم لمستند

يمكن أن تشير بيانات سلوك المستخدم المواتية لمستند إلى أن الورق قد تم اختياره من قبل المستخدمين عندما يتم عرضه في نتائج الاستعلام ، أو عندما يعرض المستخدم المستند بعد اختياره من نتائج الاستعلام ، يعرض المستخدمون المستند لـ فترة ممتدة (مثل أن يجد المستخدم أن المستند وثيق الصلة بالسؤال).

يعمل محرك المصنف جنبًا إلى جنب مع محرك البحث باستخدام النتائج التي تم إرجاعها وبيانات سلوك المستخدم لتحديد فئات الاستعلام ثم إعادة ترتيب النتائج قبل إعادتها إلى المستخدم.

بشكل عام ، بالنسبة للاستعلام (مثل استعلام أو نموذج بديل من الاستعلام) المحدد في طلب فئة الاستعلام ، يقوم محرك المصنف بتحليل نتائج الصور للاستعلام لتحديد ما إذا كان الاستعلام ينتمي إلى فئات. تم تحديد نتائج الصور التي تم تحليلها في بعض عمليات التنفيذ من قبل المستخدمين كنتيجة بحث لطلب البحث بإجمالي عدد المرات فوق الحد الأدنى (مثل تعيين عشر مرات على الأقل).

يقوم محرك المصنف بتحليل جميع نتائج الصور التي تم استردادها بواسطة محرك البحث لاستعلام معين. في تطبيقات أخرى

يحلل محرك المصنف نتائج الصور للاستعلام حيث يكون أحد المقاييس (على سبيل المثال ، العدد الإجمالي للتحديدات أو مقياس آخر) لبيانات النقرات أعلى من الحد الأدنى.

يمكن تحليل نتائج الصور عبر الإنترنت باستخدام تقنيات رؤية الكمبيوتر بطرق مختلفة ، سواء في وضع عدم الاتصال أو عبر الإنترنت ، أثناء عملية التسجيل. يتم شرح الصور بالمعلومات المستخرجة من محتواها المرئي.

شروح الصورة

على سبيل المثال ، يمكن تخزين التعليقات التوضيحية للصور في متجر التعليقات التوضيحية. يتم ربط كل صورة تم تحليلها (على سبيل المثال ، الصورة 1 ، الصورة 2 ، إلخ) بالتعليقات التوضيحية (على سبيل المثال ، A1 ، A2 ، وما إلى ذلك) في صورة مقترنة بالتعليقات التوضيحية.

يمكن أن تشمل التعليقات التوضيحية:

  • عدد الوجوه في الصورة
  • حجم كل وجه
  • الألوان السائدة للصورة
  • ما إذا كانت الصورة تحتوي على نص أو رسم بياني
  • ما إذا كانت الصورة لقطة شاشة

بالإضافة إلى ذلك ، يمكن الحصول على تعليق توضيحي لكل صورة ببصمة إصبع يمكنها بعد ذلك تحديد ما إذا كانت الصورتان متطابقتان أم متطابقتان.

بعد ذلك ، يحلل محرك المصنف نتائج الصور لاستعلام معين وشروحه لتحديد فئات الاستعلام. يمكن تحديد اقترانات فئات الاستعلام (على سبيل المثال ، C1 و C2 وما إلى ذلك) لاستعلام معين (مثل الاستعلام 1 والاستعلام 2 وما إلى ذلك) بعدة طرق ، مثل استخدام دليل بسيط أو استخدام مصنف آلي.

مصنف استعلام بسيط يعتمد على الكشف عن مجريات الأمور

كمثال ، يمكن استخدام مصنف استعلام بسيط يعتمد على الكشف عن مجريات الأمور لتحديد اللون السائد المطلوب للاستعلام (وما إذا كان هناك واحد).

يمكن أن يكون الاستدلال ، على سبيل المثال ، أنه إذا كان من بين أفضل 20 صورة تم النقر عليها في أغلب الأحيان لطلب البحث ، فإن 70٪ على الأقل بها لون أحمر سائد ، فيمكن عندئذٍ تصنيف طلب البحث على أنه "استعلام أحمر". بالنسبة لمثل هذه الاستعلامات ، يمكن لمحرك البحث إعادة ترتيب النتائج المستردة لزيادة ترتيب جميع الصور التي تم التعليق عليها باللون الأحمر كلون سائد.

يمكن استخدام نفس التصنيف مع جميع الألوان القياسية الأخرى. تتمثل إحدى ميزات هذا الأسلوب في التحليل الزائد لنص الاستعلام في أنه يعمل مع جميع اللغات دون الحاجة إلى الترجمة (مثل أنه سيعمل على الترويج للصور ذات اللون الأحمر السائد للسؤال "تفاحة حمراء" بأي لغة). إنه أكثر قوة (مثل أنه لن يزيد ترتيب الصور الحمراء للاستعلام "البحر الأحمر").

مثال محرك المصنف

يمكن لمحرك المصنف العمل في وضع متصل بالإنترنت أو وضع غير متصل بالشبكة حيث يتم تخزين اقترانات فئة الاستعلام مسبقًا (على سبيل المثال ، في الجدول) لاستخدامها بواسطة محرك البحث أثناء معالجة الاستعلام.

يستقبل المحرك نتائج استعلام عن صورة لاستعلام معين ويقدم نتائج الصور لمعلقين على الصورة. يقوم كل تعليق توضيحي للصور بتحليل نتائج الصورة واستخراج المعلومات حول المحتوى المرئي للصورة ، والتي يتم تخزينها كتعليق توضيحي للصورة (على سبيل المثال ، التعليقات التوضيحية للصورة) للفكرة.

شرح صورة الوجه

على سبيل التوضيح ، محرر توضيحي لصورة الوجه:

  • يحدد عدد الوجوه في صورة ما وحجم كل وجه
  • يستخرج التعليق التوضيحي لصورة بصمات الأصابع ميزات الصورة المرئية في شكل مكثف (بصمة الإصبع) والتي يمكن مقارنتها بعد ذلك ببصمة إصبع صورة أخرى لتحديد ما إذا كانت الصورتان متشابهتين
  • يحدد التعليق التوضيحي لصورة لقطة الشاشة ما إذا كانت الصورة لقطة شاشة
  • يحدد التعليق التوضيحي للصورة النصية ما إذا كانت الصورة تحتوي على نص
  • يحدد استعلام صورة الرسم البياني / المخطط ما إذا كانت الصورة تشتمل على رسوم بيانية أو مخططات (على سبيل المثال ، الرسوم البيانية الشريطية)
  • يحدد المعلق اللوني السائد ما إذا كانت الصورة تحتوي على لون سائد

يمكن أيضًا استخدام شروح الصور الأخرى. على سبيل المثال ، تم وصف العديد من المعلقين على الصور في ورقة بعنوان "الكشف السريع عن الأشياء باستخدام سلسلة معززة من الميزات البسيطة ،" بقلم Viola، P .؛ Jones، M.، Mitsubishi Electric Research Laboratories، TR2004-043 (مايو 2004).

فئات الاستعلام

بعد ذلك ، يحلل محرك المصنف نتائج الصور لاستعلام معين وتعليقاتها التوضيحية لتحديد فئات الاستعلام (على سبيل المثال ، فئات الاستعلام). يتم تحديد فئات الاستعلام باستخدام مصنف ، ويمكن تحقيق مصنف الاستعلام باستخدام نظام التعلم الآلي.

استخدام التعزيز التكيفي

على سبيل التوضيح ، AdaBoost ، اختصارًا لـ Adaptive Boosting ، هو نظام تعلم آلي يمكن استخدامه مع خوارزميات التعلم الأخرى لتحسين أدائها. يتم استخدام AdaBoost لإنشاء تصنيف استعلام. (المزيد من خوارزميات التعلم ممكنة)

يستدعي AdaBoost مضيفًا توضيحيًا للصورة "ضعيفًا" في سلسلة من الجولات. على سبيل التوضيح ، يمكن لمصنف الاستعلام الفردي الاعتماد على خوارزمية تعلم الآلة المدربة لتحديد ما إذا كان الاستعلام يستدعي صورًا لشخص واحد.

على سبيل التوضيح ، يمكن لمصنف الاستعلام أن يتدرب على مجموعات البيانات التي تشتمل على استعلام ، ومجموعة من متجهات الميزات التي تمثل صور النتيجة للسؤال الذي لا يحتوي على وجوه أو أكثر ، والتصنيف الصحيح للاستعلام (على سبيل المثال ، الوجوه أم لا) . لكل مكالمة ، يقوم مصنف الاستعلام بتحديث توزيع الأوزان التي تشير إلى أهمية الأمثلة في مجموعة بيانات التدريب الخاصة بالتصنيف.

في كل جولة ، تزداد أوزان كل مثال تدريب مصنف (أو تنخفض عواقب كل مثال تدريب مصنف) ، لذلك يركز تصنيف الاستعلام الجديد بشكل أكبر على تلك الأمثلة. يمكن أن يأخذ تصنيف الاستعلام المدرب الناتج استعلامًا كإدخال وإخراج احتمال أن يستدعي الاستعلام صورًا تحتوي على أشخاص فرديين.

يأخذ مصنف الاستعلام المتنوع / المتجانس استعلامًا كمدخلات ويخرج احتمالية أن يكون الاستعلام لصور مختلفة. يستخدم المصنف خوارزمية تجميع لتجميع نتائج الصور وفقًا لبصمات أصابعهم بناءً على قياس المسافة من بعضها البعض. يتم ربط كل صورة بمعرف الكتلة.

يتم استخدام معرف مجموعة الصور لتحديد عدد الكتل ، وحجم المجموعات ، والتشابه بين المجموعات المكونة من الصور في مجموعة النتائج. على سبيل المثال ، يتم استخدام هذه المعلومات لربط احتمالية أن يكون الاستعلام محددًا (أو يدعو إلى التكرارات) أم لا ،

ربط الاستعلامات بالمعاني والتصورات المتعارف عليها

يمكن أيضًا استخدام تصنيف الاستعلام لربط الاستعلامات بالمعاني والتمثيلات المتعارف عليها. على سبيل المثال ، إذا كان هناك مجموعة كبيرة واحدة أو عدة مجموعات كبيرة ، فإن احتمال ارتباط السؤال بنتائج الصور المكررة يكون مرتفعًا. إذا كان هناك العديد من المجموعات الأصغر ، فإن احتمال ارتباط الاستعلام بنتائج الصورة نفسها يكون منخفضًا.

عادةً ما لا تكون الصور المكررة مفيدة جدًا لأنها لا توفر مزيدًا من المعلومات ، لذلك يجب تخفيض رتبتها كنتائج استعلام. لكن هناك استثناءات. على سبيل المثال ، إذا كان هناك العديد من التكرارات في النتائج الأولية (عدد قليل من المجموعات الكبيرة) ، يكون الاستعلام محددًا ، ولا يجب تخفيض ترتيب التكرارات.

يأخذ تصنيف استعلام لقطة شاشة / بدون لقطة شاشة كإدخال استعلامًا ويخرج احتمالية أن يستدعي الاستعلام الصور التي تكون لقطات شاشة. يقبل مصنف الاستعلام النصي / غير النصي كإدخال استعلام ويخرج فرصة أن يستدعي الاستعلام الصور التي تحتوي على نص.

يأخذ تصنيف استعلام الرسم البياني / غير الرسم البياني مدخلات استعلام ويخرج احتمالية أن يستدعي الاستعلام الصور التي تحتوي على رسم بياني أو مخطط. يأخذ مصنف استعلام اللون 133f استعلام معلومات ويخرج فرصة أن يستدعي الاستعلام لقطات يهيمن عليها لون واحد. مصففات الاستعلام الأخرى ممكنة.

تحسين ملاءمة نتائج الصورة بناءً على تصنيف الاستعلام

يمكن للباحث التفاعل مع النظام من خلال عميل أو جهاز آخر. على سبيل المثال ، يمكن أن يكون جهاز العميل محطة كمبيوتر داخل شبكة محلية (LAN) أو شبكة واسعة النطاق (WAN). يمكن أن يكون جهاز العميل جهازًا محمولًا (على سبيل المثال ، هاتف محمول أو كمبيوتر محمول أو مساعد سطح مكتب شخصي ، وما إلى ذلك) قادرًا على الاتصال عبر شبكة LAN أو WAN أو أي شبكة أخرى (مثل شبكة الهاتف الخلوي).

يمكن أن يشتمل جهاز العميل على ذاكرة وصول عشوائي (RAM) (أو ذاكرة أخرى وجهاز تخزين) ومعالج.

يتم تنظيم المعالج لمعالجة التعليمات والبيانات داخل النظام. المعالج عبارة عن معالج دقيق أحادي الخيوط أو متعدد الخيوط له نوى معالجة. يتلقى المعالج منظمًا لتنفيذ التعليمات المخزنة في ذاكرة الوصول العشوائي (أو ذاكرة أخرى وجهاز تخزين مضمن مع جهاز العميل) لتقديم معلومات رسومية لواجهة المستخدم.

يمكن للباحث الاتصال بمحرك البحث داخل نظام الخادم لإرسال استعلام إدخال. محرك البحث هو محرك بحث عن الصور أو محرك بحث عام يمكنه استرداد الصور وأنواع المحتوى الأخرى مثل المستندات (مثل صفحات HTML).

عندما يرسل المستخدم استعلام الإدخال من خلال جهاز إدخال متصل بجهاز عميل ، يتم إرسال سؤال من جانب العميل إلى شبكة وإعادة توجيهه إلى نظام الخادم كاستعلام من جانب الخادم. يمكن أن يكون نظام الخادم أجهزة خادم في المواقع. يشتمل جهاز الخادم على جهاز ذاكرة يتكون من محرك البحث الذي تم تحميله فيه.

يتم تنظيم المعالج لمعالجة التعليمات داخل الجهاز. يمكن لهذه التعليمات تثبيت مكونات محرك البحث. يمكن أن يكون المعالج أحادي الخيوط أو متعدد الخيوط ويتضمن العديد من نوى المعالجة. يمكن للمعالج معالجة التعليمات المخزنة في الذاكرة المتعلقة بمحرك البحث وإرسال المعلومات إلى جهاز العميل من خلال الشبكة لإنشاء عرض تقديمي رسومي في واجهة المستخدم لجهاز العميل (على سبيل المثال ، نتائج البحث على صفحة ويب معروضة على الويب المتصفح).

يتلقى محرك البحث الاستعلام من جانب الخادم. يستخدم محرك البحث المعلومات الموجودة في استعلام الإدخال (مثل مصطلحات الاستعلام) للعثور على المستندات ذات الصلة. يمكن أن يشتمل محرك البحث على محرك فهرسة يبحث في مجموعة (مثل صفحات الويب على الإنترنت) لفهرسة المستندات الموجودة في تلك المجموعة. يمكن تخزين معلومات الفهرس لمستندات المجموعة في قاعدة بيانات الفهرس.

يمكن الوصول إلى قاعدة بيانات الفهرس هذه لتحديد المستندات المتعلقة بالمستخدم. لاحظ أن النسخة الإلكترونية (التي سيشار إليها كمستند) لا تتوافق مع ملف. يمكن تخزين السجل في جزء من الملف يحتوي على مستندات أخرى ، أو في ملف واحد مخصص للمستند المعني ، أو في العديد من الملفات المنسقة. علاوة على ذلك ، يمكن تخزين نسخة في الذاكرة دون تخزينها في ملف.

يمكن أن يشتمل محرك البحث على محرك تصنيف لترتيب المستندات المتعلقة باستعلام الإدخال. يمكن إجراء تصنيف المستندات باستخدام التقنيات التقليدية لتحديد درجة استرداد المعلومات (IR) للسجلات المفهرسة عند تقديم استعلام معين.

قد تحدد أي طريقة مناسبة مدى صلة وثيقة معينة بمصطلح بحث معين أو غيرها من المعلومات المقدمة. على سبيل المثال ، قد يتم استخدام المستوى العام للروابط الخلفية لمستند يحتوي على مطابقات لمصطلح بحث لاستنتاج صلة الوثيقة بالموضوع.

على وجه الخصوص ، إذا تم ربط المستند بـ (على سبيل المثال ، هو هدف الارتباط التشعبي) بواسطة العديد من المستندات الأخرى ذات الصلة (مثل المستندات التي تحتوي على مطابقات لمصطلحات البحث) ، فيمكن الاستدلال على أن المستند الهدف وثيق الصلة بشكل خاص. يمكن الحصول على هذا الاستنتاج لأن مؤلفي أوراق التأشير يشيرون ، في الغالب ، إلى مستندات أخرى ذات صلة بجمهورهم.

تستهدف مستندات التأشير الارتباطات من المستندات الأخرى ذات الصلة ، والتي يمكن اعتبارها أكثر صلة. الوثيقة الأولى مناسبة بشكل خاص لأنها تستهدف الوثائق القابلة للتطبيق (أو حتى وثيقة الصلة بالموضوع).

قد تحدد مثل هذه التقنية أهمية المستند أو أحد المحددات العديدة. يمكن أيضًا اتخاذ طرق مناسبة لتحديد محاولات الإدلاء بأصوات احتيالية وقطعها لزيادة صلة الصفحة بالموضوع.

لزيادة تحسين تقنيات تصنيف المستندات التقليدية ، يمكن لمحرك التصنيف تلقي المزيد من الإشارات من محرك معدل الرتبة للمساعدة في تحديد الترتيب المناسب للمستندات.

بالاقتران مع التعليقات التوضيحية للصور وتصنيف الاستعلام الموصوف أعلاه ، يوفر محرك معدل التصنيف مقاييس ملاءمة للأوراق. يمكن أن يستخدم محرك التصنيف لتحسين ترتيب نتائج البحث المقدم للمستخدم.

يمكن لمحرك معدل الترتيب إجراء عمليات لإنشاء مقاييس الملاءمة.

يعتمد ما إذا كانت درجة نتيجة صورة ما تزيد أو تنقص على ما إذا كان المحتوى المرئي للصورة (كما هو موضح في التعليقات التوضيحية للصور) يطابق تصنيف الاستعلام ، يتم أخذ كل فئة صورة في الاعتبار.

على سبيل المثال ، إذا كان تصنيف طلب البحث هو "شخص واحد" ، فإن نتيجة الصورة التي يتم تصنيفها على أنها "لقطة شاشة" و "وجه واحد" ستنخفض نقاطها أولاً بسبب فئة "لقطة الشاشة". يمكنه بعد ذلك زيادة درجاته بسبب فئة "الوجه الفردي".

يمكن لمحرك البحث إعادة توجيه قائمة النتائج النهائية المرتبة ضمن نتائج البحث من جانب الخادم عبر الشبكة. عند الخروج من الشبكة ، يمكن لجهاز العميل استلام نتائج البحث من جانب العميل ، حيث يمكن تخزين النتائج داخل ذاكرة الوصول العشوائي واستخدامها من قبل المعالج لعرض النتائج على جهاز الإخراج للمستخدم.

نظام استرجاع المعلومات

تشمل هذه المكونات ما يلي:

  • محرك الفهرسة
  • محرك التهديف
  • محرك الترتيب
  • محرك معدل الترتيب

يعمل محرك الفهرسة كما هو موضح أعلاه لمحرك الفهرسة. يقوم محرك تسجيل النقاط بإنشاء درجات لنتائج المستند استنادًا إلى العديد من الميزات ، بما في ذلك الميزات المستندة إلى المحتوى التي تربط استعلام بنتائج المستند والأجزاء المستقلة عن الاستعلام التي توضح بشكل عام جودة نتائج المستندات.

تتضمن الميزات المستندة إلى المحتوى للصور جوانب المستند الذي يحتوي على الصورة ، مثل تطابق الاستعلام مع عنوان المستند أو التسمية التوضيحية للصورة.

محرك سجل الاستعلام

تتضمن الميزات المستقلة عن الاستعلام ، على سبيل المثال ، جوانب الإسناد الترافقي للمستند للورق أو المجال أو أبعاد الصورة.

علاوة على ذلك ، يمكن ضبط الوظائف الخاصة التي يستخدمها محرك التسجيل لتعديل مساهمات الميزات المختلفة لدرجة الأشعة تحت الحمراء النهائية ، باستخدام عمليات تلقائية أو شبه آلية.

يقوم محرك التصنيف بترتيب نتائج المستندات لعرضها للمستخدم بناءً على درجات الأشعة تحت الحمراء المستلمة من آلة التسجيل والإشارات من محرك معدل التصنيف.

يوفر محرك معدل الترتيب مقاييس ملاءمة للمستندات ، والتي يمكن لمحرك التصنيف استخدامها لتحسين ترتيب نتائج البحث المقدم للمستخدم. يسجل مكون التتبع معلومات سلوك المستخدم ، مثل تحديدات المستخدم الفردية للنتائج المعروضة في الطلب.

يحصل مكون التعقب على كود JavaScript مدمج في تصنيف صفحة الويب الذي يحدد اختيارات المستخدم لنتائج المستندات الفردية ويحدد متى يعود المستخدم إلى صفحة النتائج ، مما يشير إلى مقدار الوقت الذي يقضيه المستخدم في عرض نتيجة المستند المحددة.

مكون التتبع هو نظام وكيل يتم من خلاله توجيه تحديدات المستخدم لنتائج المستند. يمكن أن يشتمل مكون التتبع أيضًا على برنامج مثبت مسبقًا للعميل (مثل شريط أدوات إضافي لنظام تشغيل العميل).

من الممكن أيضًا استخدام تطبيقات أخرى ، على سبيل المثال ، أحد التطبيقات التي تستخدم ميزة متصفح الويب التي تسمح بتضمين علامة / توجيه في الصفحة ، والتي تطلب من المتصفح الاتصال مرة أخرى بالخادم برسائل حول الروابط التي نقر عليها المستخدم.

يتم تخزين المعلومات المسجلة في سجلات اختيار النتائج. تتضمن المعلومات المسجلة إدخالات السجل التي تشير إلى تفاعل المستخدم مع كل مستند نتيجة يتم تقديمه لكل استعلام يتم إرساله.

لكل مستخدم يختاره مستند نتيجة مقدم للاستعلام ، تشير إدخالات السجل إلى الاستعلام (Q) ، والورقة (D) ، ووقت بقاء المستخدم (T) على المستند ، واللغة (L) التي يستخدمها المستخدم ، والبلد (C) حيث من المحتمل أن يكون المستخدم موجودًا (على سبيل المثال ، استنادًا إلى الخادم المستخدم للوصول إلى نظام IR) ورمز المنطقة (R) الذي يحدد المنطقة الحضرية للمستخدم.

تسجل إدخالات السجل أيضًا معلومات سلبية ، مثل تقديم نتيجة مستند إلى المستخدم ولكن لم يتم تحديدها.

معلومات أخرى مثل:

  • مواضع النقرات (أي تحديدات المستخدم في واجهة المستخدم
  • معلومات حول الجلسة (مثل وجود ونوع النقرات السابقة (نشاط جلسة ما بعد النقر))
  • عشرات R من النتائج التي تم النقر عليها
  • تظهر نتائج الأشعة تحت الحمراء لجميع النتائج قبل النقر
  • يتم عرض العناوين والمقتطفات للمستخدم قبل النقر
  • ملف تعريف ارتباط المستخدم
  • عمر ملفات تعريف الارتباط
  • عنوان IP (بروتوكول الإنترنت)
  • وكيل المستخدم للمتصفح
  • حالا

يتم أيضًا تسجيل الوقت (T) بين النقر الأولي على نتيجة المستند والمستخدمين الذين يعودون إلى الصفحة الرئيسية والنقر فوق نتيجة مستند أخرى (أو إرسال استعلام بحث جديد).

يتم إجراء تقييم حول الوقت (T) حول ما إذا كانت هذه المرة تشير إلى عرض أطول للمستند أو عرضًا أقصر نظرًا لأن المزيد من الحجج الموسعة تُظهر بشكل عام الجودة أو الملاءمة للنتيجة التي تم النقر عليها. يمكن إجراء هذا التقييم الزمني (T) جنبًا إلى جنب مع تقنيات الترجيح المختلفة.

يمكن دمج المكونات المعروضة بطرق مختلفة وتكوينات نظام متعددة. تندمج محركات الخزان الطرفية للتسجيل في محرك تصنيف واحد ، مثل محرك التصنيف. يمكن أيضًا دمج محرك معدل الترتيب ومحرك التصنيف. بشكل عام ، يتضمن محرك التصنيف أي مكون برمجي يقوم بإنشاء ترتيب لنتائج المستندات بعد الاستعلام. علاوة على ذلك ، يمكن لمحرك التصنيف أن يلائم نظام العميل أيضًا (أو بدلاً من ذلك) في نظام الخادم.

مثال آخر هو نظام استرجاع المعلومات. يشتمل نظام الخادم على محرك فهرسة ومحرك تسجيل / تصنيف.

في هذا النظام ، يشتمل نظام العميل على:

  • واجهة مستخدم لعرض الترتيب
  • مكون تتبع
  • سجلات الاختيار نتيجة
  • محرك معدل التصنيف / الرتبة.

على سبيل المثال ، يمكن أن يشتمل نظام العميل على شبكة مؤسسة للشركة وأجهزة كمبيوتر شخصية ، حيث يشتمل البرنامج الإضافي للمتصفح على محرك معدل التصنيف / التصنيف.

عندما يبدأ موظف في الشركة بحثًا على نظام الخادم ، يمكن لمحرك التسجيل / التصنيف إرجاع نتائج البحث. الترتيب الأولي أو درجات IR الفعلية للنتائج. يقوم المكون الإضافي للمستعرض بإعادة ترتيب النتائج بناءً على تحديدات الصفحات المتعقبة لقاعدة المستخدمين الخاصة بالشركة.

تقنية لتصنيف الاستعلام

يمكن تنفيذ هذه التقنية عبر الإنترنت (كجزء من معالجة الاستعلام) أو بطريقة غير متصلة بالإنترنت.

تلقي نتائج الصور الأولى التي تستجيب للاستعلام الأول. ترتبط كل صورة من الصور الأولى بأمر (مثل درجة الأشعة تحت الحمراء) وبيانات سلوك المستخدم ذات الصلة (مثل بيانات النقر).

يتم تحديد عدد من الصور الأولى حيث يلبي مقياس لبيانات السلوك ذات الصلة لكل صورة محددة حدًا معينًا.

ترتبط الصور الأولى المحددة بالعديد من التعليقات التوضيحية بناءً على تحليل محتوى الصور الأولى المختارة. يمكن أن تستمر التعليقات التوضيحية للصور في التعليقات التوضيحية للصور.

ثم يتم ربط الفئات بطلب البحث الأول بناءً على التعليقات التوضيحية.

يمكن أن تستمر اقترانات تصنيف الاستعلام في فئات الاستعلام.

ثم يتم استلام نتائج الصورة الثانية التي تستجيب لاستعلام ثانٍ مطابق أو الاستعلام الأول.

(إذا لم يتم العثور على الاستعلام الثاني في تصنيف الاستعلام ، فيمكن تحويل الاستعلام الثاني أو "إعادة كتابته" لتحديد ما إذا كان النموذج البديل يطابق استعلامًا في تصنيف الاستعلام.)

في هذا المثال ، يكون الاستعلام الثاني هو نفسه أو يمكن إعادة كتابته على أنه الاستعلام الأول.

يتم إعادة ترتيب نتائج الصورة الثانية بناءً على تصنيف الاستعلام قبل ربطها بالاستعلام الأول.

البحث في الأخبار مباشرة إلى بريدك الوارد

هذا الحقل لأغراض التحقق ويجب تركه بدون تغيير.

*مطلوب