تحديد علاقات سمة الكيان
نشرت: 2022-03-02تتعلق براءة الاختراع هذه ، التي مُنحت في 1 مارس 2022 ، بتحديد العلاقات بين الكيان والسمات في نصوص.
تحاول تطبيقات البحث ، مثل محركات البحث وقواعد المعرفة ، تلبية احتياجات الباحث المعلوماتية وإظهار الموارد الأكثر فائدة للباحث .
قد تساعد البيانات المنظمة في تحديد علاقات السمات بشكل أفضل
يتم تحديد علاقات كيانات السمات في نتائج البحث المنظمة.
تقدم نتائج البحث المنظمة قائمة بالسمات مع إجابات لكيان محدد في طلب المستخدم ، مثل طلب بحث .
لذلك ، قد تتضمن نتائج البحث المنظمة لـ "Kevin Durant" سمات مثل الراتب والفريق وسنة الميلاد والأسرة وما إلى ذلك ، جنبًا إلى جنب مع الإجابات التي توفر معلومات حول هذه السمات .
قد يحتاج إنشاء نتائج البحث المنظمة هذه إلى تحديد علاقات سمات الكيان.
علاقة سمة الكيان هي حالة خاصة لعلاقة نصية بين زوج من المصطلحات.
المصطلح الأول في زوج المصطلحات هو كيان أو شخص أو مكان أو منظمة أو مفهوم.
المصطلح الثاني هو سمة أو سلسلة تصف جانبًا من جوانب الكيان.
الامثله تشمل:
- "تاريخ ميلاد" الشخص
- "سكان" بلد
- "راتب" الرياضي
- "الرئيس التنفيذي" لمنظمة
يوفر توفير المزيد من المعلومات في المحتوى والمخطط (والبيانات المنظمة) حول الكيانات محرك بحث مزيدًا من المعلومات لاستكشاف معلومات أفضل حول الكيانات المحددة ، لاختبار وجمع البيانات ، وإزالة الغموض عما يعرفه ، والحصول على ثقة أكبر وأفضل بشأن الكيانات التي إنها تدرك.
أزواج مرشح سمة الكيان
تحصل براءة الاختراع هذه على زوج مرشح سمة كيان لتعريف كيان وسمة ، حيث تكون السمة سمة مرشح للكيان . بالإضافة إلى التعلم من الحقائق حول الكيانات في البيانات المنظمة ، يمكن لـ Google استخدام المعلومات من خلال النظر في سياق تلك المعلومات والتعلم من المتجهات وتزامن الكلمات والحقائق الأخرى حول هذه الكيانات أيضًا.
ألقِ نظرة على كلمة ناقلات براءة الاختراع للتعرف على كيفية حصول محرك البحث الآن على إحساس أفضل بمعاني وسياق الكلمات والمعلومات حول الكيانات. (هذه فرصة للتعلم من استكشاف براءات الاختراع حول كيفية قيام Google الآن ببعض الأشياء التي تقوم بها.) تجمع Google حقائق وبيانات حول الأشياء التي تقوم بفهرستها وقد تتعرف على الكيانات الموجودة في فهرسها ، و الصفات التي يعرفها عنها.
يتم ذلك في:
- تحديد ، باستخدام الجمل التي تتضمن الكيان والسمة ، ما إذا كانت السمة هي سمة فعلية للكيان في زوج مرشح سمة الكيان
- توليد الزخارف للكلمات في مجموعة الجمل التي تتضمن الكيان والسمة
- إنشاء ، باستخدام أزواج سمات الكيان المعروفة ، دمج سمة التوزيع للكيان ، حيث تحدد سمة التوزيع للكيان التضمين للكيان بناءً على السمات الأخرى المرتبطة بالكيان من أزواج سمة الكيان المعروفة
- استنادًا إلى عمليات التضمين للكلمات في الجمل ، ودمج السمة التوزيعية للكيان ، وبالنسبة للسمة ، ما إذا كان زوج مرشح سمة الكيان سمة أساسية للكيان في زوج مرشح سمة الكيان.
تصنع حفلات الزفاف للكلمات من الجمل مع الكيان والسمة
بناء أول تمثيل متجه يحدد التضمين الأول للكلمات بين الكيان والنقطة في مجموعة الجمل
- عمل تمثيل متجه ثانٍ يحدد التضمين المزدوج للكيان بناءً على مجموعة الجمل
- بناء تمثيل متجه ثالث لدمج ثالث للسمة بناءً على مجموعة الجمل
- يجمع الانتقاء ، باستخدام سمة كيان معروفة ، دمج سمة توزيع للكيان ، ويعني إنشاء تمثيل متجه رابع ، باستخدام أزواج سمة الكيان المتاحة ، وتحديد سمة التوزيع المتضمنة للكيان.
- بناء سمة توزيع متضمنة مع أزواج سمات الكيان المعروفة يعني تطوير تمثيل متجه خامس مع فرق سمة الكيان المتاحة وإدراج سمة التوزيع للسمة .
- تحديد ما إذا كانت السمة في زوج مرشح سمة الكيان سمة أساسية للكيان في زوج مرشح سمة الكيان
- تحديد ، بناءً على التمثيل المتجه الأول ، والتمثيل المتجه الثاني ، والتمثيل المتجه الثالث ، والتمثيل المتجه الرابع ، والتمثيل المتجه الخامس ، ما إذا كانت السمة في زوج مرشح سمة الكيان هي سمة أساسية للكيان في الكيان - السمة زوج مرشح
- الاختيار ، من التمثيل المتجه الأول ، والتمثيل المتجه الثاني ، والتمثيل المتجه الثالث ، والتمثيل المتجه الرابع ، والتمثيل المتجه الخامس ، سواء كانت السمة في زوج مرشح سمة الكيان سمة أساسية للكيان في الكيان- السمة المرشح للزوج ، يتم تنفيذه باستخدام شبكة تغذية.
- الانتقاء ، بناءً على تمثيل المتجه الأول ، والتمثيل المتجه الثاني ، والتمثيل المتجه الثالث ، والتمثيل المتجه الرابع ، والتمثيل المتجه الخامس ، سواء كانت السمة في زوج مرشح سمة الكيان سمة أساسية للكيان في الكيان -زوج مرشح السمة ، ويتألف من:
- إنشاء تمثيل متجه واحد من خلال ربط التمثيل المتجه الأول ، والتمثيل المتجه الثاني ، والتمثيل المتجه الثالث ، والتمثيل المتجه الرابع ، والتمثيل المتجه الخامس ؛ إدخال تمثيل المتجه الفردي في شبكة التغذية
- تحديد ما إذا كانت السمة في زوج مرشح سمة الكيان سمة أساسية للكيان في زوج مرشح سمة الكيان
صنع تمثيل متجه رابع ، مع أزواج سمة-كيان معروفة ، وتحديد سمة التوزيع التي تتضمن تضمين الكيان:
- تحديد مجموعة من السمات المرتبطة بالكيان في فرق سمات الكيان المعروفة ، حيث تغفل مجموعة السمات السمة
- إنشاء تضمين سمة توزيع للكيان عن طريق حساب مجموع مرجح من الخصائص في مجموعة السمات
اختيار تمثيل متجه خامس ، مع أزواج سمة-كيان معروفة ، وتحديد سمة التوزيع التي تتضمن تضمين السمة
- تحديد ، باستخدام السمة ، مجموعة من الكيانات من بين الأزواج المعروفة بخاصية الكيان ؛ لكل كيان في مجموعة الكيانات
- تحديد مجموعة من الميزات المرتبطة بالكيان ، حيث لا يشتمل موقع السمات على السمة
- إنشاء تضمين سمة توزيع للكيان عن طريق حساب مجموع مرجح من الخصائص في مجموعة السمات
ميزة العلاقات بين الكيانات والسمة الأكثر دقة على تعريف الكيان والسمة القائم على نموذج فني سابق
استخدمت تقنيات تحديد سمات الكيانات الفنية السابقة مناهج قائمة على النماذج مثل ميزات معالجة اللغة الطبيعية (NLP) ، والإشراف عن بعد ، ونماذج التعلم الآلي التقليدية ، التي تحدد علاقات سمات الكيان من خلال تمثيل الكيانات والسمات بناءً على جمل البيانات. تظهر هذه الشروط .
على النقيض من ذلك ، تحدد الابتكارات الموضحة في هذه المواصفات علاقات سمات الكيان في مجموعات البيانات باستخدام معلومات حول كيفية التعبير عن الكيانات والسمات في البيانات التي تظهر فيها هذه المصطلحات ومن خلال تمثيل الكيانات والسمات باستخدام ميزات أخرى يُعرف ارتباطها بـ هذه الشروط . يتيح ذلك تمثيل الكيانات والسمات مع التفاصيل التي تشاركها كيانات مماثلة ، وتحسين دقة تحديد علاقات سمات الكيان التي لا يمكن تمييزها بطريقة أخرى من خلال النظر في الجمل التي تظهر فيها هذه المصطلحات .
على سبيل المثال ، ضع في اعتبارك سيناريو تتضمن فيه مجموعة البيانات جملًا لها كيانان ، "رونالدو" و "ميسي" ، يتم وصفها باستخدام سمة "سجل" ، وعقوبة حيث يتم تصنيف الكيان "ميسي" باستخدام "أهداف" السمة . في مثل هذا السيناريو ، قد تحدد تقنيات الفن السابق أزواج سمات الكيان التالية: (رونالدو ، سجل) ، (ميسي ، سجل) ، و (ميسي ، أهداف) . تتجاوز الابتكارات الموضحة في هذه المواصفات مناهج الفن السابق هذه من خلال تحديد علاقات سمات الكيان التي قد لا يتم تمييزها من خلال كيفية استخدام هذه المصطلحات في مجموعة البيانات .
باستخدام المثال أعلاه ، يحدد الابتكار الموصوف في هذه المواصفات أن "رونالدو" و "ميسي" كيانان متشابهان لأنهما يشتركان في سمة "السجل" ثم يمثلان سمة "السجل" باستخدام سمة "الأهداف" . بهذه الطريقة ، يمكن للابتكارات الموصوفة في هذه المواصفات ، على سبيل المثال ، تمكين تحديد العلاقات بين سمات الكيان ، على سبيل المثال (كريستيانو ، الأهداف) ، على الرغم من أن هذه العلاقة قد لا يمكن تمييزها من مجموعة البيانات .
تحديد براءة اختراع علاقات الخواص
تحديد علاقات سمات الكيان
المخترعون: دان إيتر ، وشياو يو ، وفانغتاو لي
الوكيل: Google LLC
براءات الاختراع الأمريكية: 11263.400
تم المنح: 1 مارس 2022
تاريخ التقديم: 5 يوليو 2019
خلاصة
الأساليب والأنظمة والأجهزة ، بما في ذلك برامج الكمبيوتر المشفرة على وسيط تخزين الكمبيوتر ، والتي تسهل تحديد علاقات سمات الكيان في مجموعة نصية .تتضمن الأساليب تحديد ما إذا كانت السمة في زوج سمة الكيان المرشح هي سمة فعلية للكيان في زوج مرشح سمة الكيان .يتضمن ذلك إنشاء عمليات دمج للكلمات في مجموعة الجمل التي تتضمن الكيان والسمة والتوليد ، باستخدام أزواج الكيان-السمة المعروفة .يتضمن ذلك أيضًا إنشاء تضمين توزيع السمة للكيان استنادًا إلى السمات الأخرى المرتبطة بالكيان من أزواج سمة الكيان المعروفة ، وإنشاء دمج توزيع السمة للسمة استنادًا إلى السمات المعروفة المرتبطة بالكيانات المعروفة للسمة في أزواج سمة الكيان .بناءً على عمليات التضمين هذه ، تحدد شبكة التغذية الأمامية ما إذا كانت السمة في زوج مرشح سمة الكيان هي سمة فعلية للكيان في زوج مرشح سمة الكيان .
تحديد علاقات سمة الكيان في النص
زوج سمة الكيان المرشح (حيث السمة هي سمة مرشح للكيان) هو إدخال في نموذج التصنيف . يستخدم نموذج التصنيف محرك تضمين المسار ، ومحرك التمثيل التوزيعي ، ومحرك السمات ، وشبكة التغذية الأمامية. وهي تحدد ما إذا كانت السمة في زوج سمة الكيان المرشح هي كيان أساسي في زوج سمة الكيان المرشح .
يولد محرك تضمين المسار متجهًا يمثل تضمين المسارات أو الكلمات التي تربط الأحداث اليومية للكيان والسمة في مجموعة من الجمل (على سبيل المثال ، 30 جملة أو أكثر) لمجموعة البيانات . يولد محرك التمثيل التوزيعي موجهات تمثل تضمين الكيان ومصطلحات السمات بناءً على السياق الذي تظهر فيه هذه المصطلحات في مجموعة الجمل . يولد محرك سمة التوزيع متجهًا يمثل تضمينًا للكيان ومتجهًا آخر يمثل تضمينًا للسمة .
يعتمد تضمين محرك توزيع السمة للكيان على ميزات أخرى (على سبيل المثال ، سمات أخرى غير سمة المرشح) معروفة بأنها مرتبطة بالكيان في مجموعة البيانات . يعتمد تضمين محرك التوزيع التفصيلي للجودة على ميزات مختلفة مرتبطة بالكيانات المعروفة لسمة المرشح .
يربط نموذج التصنيف تمثيلات المتجه من محرك التضمين p ، ومحرك التمثيل التوزيعي d ، ومحرك السمة التوزيعية d في تمثيل متجه واحد. يقوم نموذج التصنيف بعد ذلك بإدخال تمثيل المتجه الفردي في شبكة التغذية الأمامية التي تحدد ، باستخدام تمثيل المتجه الفردي ، ما إذا كانت السمة في زوج سمة الكيان المرشح هي سمة أساسية للكيان في زوج سمة الكيان المرشح .
افترض أن شبكة التغذية الأمامية تحدد أن النقطة في زوج سمة الكيان المرشح ضرورية للكيان في زوج سمة الكيان المرشح. في هذه الحالة ، يتم تخزين زوج سمة الكيان المرشح في قاعدة المعارف جنبًا إلى جنب مع أزواج سمات الكيان المعروفة / الفعلية الأخرى .
استخراج علاقات سمة الكيان
تتضمن البيئة نموذج تصنيف ، بالنسبة لأزواج سمات الكيان المرشح في قاعدة المعرفة ، يحدد ما إذا كانت السمة في زوج سمة الكيان المرشح هي سمة أساسية للكيان في زوج المرشح . نموذج التصنيف هو نموذج شبكة عصبية ، ويتم وصف المكونات أدناه . يمكن أيضًا استخدام نموذج التصنيف باستخدام نماذج التعلم الآلي الأخرى الخاضعة للإشراف وغير الخاضعة للإشراف .
تحتوي قاعدة المعرفة ، التي يمكن أن تشمل قواعد البيانات (أو غيرها من هياكل تخزين البيانات المناسبة) المخزنة في وسائط تخزين البيانات غير المؤقتة (على سبيل المثال ، محرك (محركات) القرص الصلب ، وذاكرة فلاش ، وما إلى ذلك) ، على مجموعة من أزواج سمات الكيان المرشح . يتم الحصول على أزواج سمات الكيان المرشح باستخدام مجموعة من المحتوى في المستندات النصية ، مثل صفحات الويب والمقالات الإخبارية ، التي تم الحصول عليها من مصدر بيانات. يمكن أن يتضمن مصدر البيانات أي مصدر للمحتوى ، مثل موقع إخباري ، ومنصة لتجميع البيانات ، ومنصة وسائط اجتماعية ، وما إلى ذلك .
يحصل مصدر البيانات على مقالات إخبارية من نظام أساسي لتجميع البيانات. يمكن لمصدر البيانات استخدام نموذج. يُنشئ نموذج التعلم الآلي الخاضع للإشراف أو غير الخاضع للإشراف (نموذج معالجة اللغة الطبيعية) مجموعة من أزواج سمات الكيانات المرشحة عن طريق استخراج الجمل من المقالات وترميز الجمل المستخرجة وتصنيفها ، على سبيل المثال ، ككيانات وسمات ، باستخدام جزء من الكلام وعلامات شجرة تحليل التبعية .
يمكن لمصدر البيانات إدخال الجمل المستخرجة في نموذج التعلم الآلي. على سبيل المثال ، يمكن أن يتم تدريبه باستخدام مجموعة من الجمل التدريبية وأزواج سمات الكيان المرتبطة بها . يمكن لنموذج التعلم الآلي هذا بعد ذلك إخراج فرق سمات الكيان المرشح للجمل المستخرجة من الإدخال .
في قاعدة المعرفة ، يخزن مصدر البيانات أزواج سمات الكيان المرشح والجمل المستخرجة بواسطة مصدر البيانات التي تتضمن كلمات أزواج سمة الكيان المرشح . لا يتم تخزين أزواج سمات الكيان المرشح إلا في قاعدة المعرفة إذا كان عدد الجمل التي يوجد بها الكيان والسمة يفي (على سبيل المثال ، يفي أو يتجاوز) عدد عتبة من الجمل (على سبيل المثال ، 30 جملة) .
يحدد نموذج التصنيف ما إذا كانت السمة في زوج سمة كيان مرشح (مخزنة في قاعدة المعرفة) هي سمة فعلية للكيان في زوج سمة الكيان المرشح . يشتمل نموذج التصنيف على محرك تضمين المسار 106 ، ومصدر التمثيل التوزيعي ، ومحرك السمة ، وشبكة التغذية الأمامية . كما هو مستخدم هنا ، يشير مصطلح المحرك إلى جهاز معالجة البيانات الذي يقوم بمجموعة من المهام. عمليات هذه المحركات لنموذج التصنيف في تحديد ما إذا كانت السمة في زوج سمة الكيان المرشح هي سمة أساسية للكيان .
مثال لعملية تحديد علاقات سمة الكيان
يتم وصف عمليات العملية أدناه على أنها يتم إجراؤها بواسطة مكونات النظام ، ووظائف العملية موضحة أدناه لأغراض التوضيح فقط. يمكن إنجاز عمليات العملية بواسطة أي جهاز أو نظام مناسب ، على سبيل المثال ، أي جهاز معالجة بيانات قابل للتطبيق . يمكن أيضًا تنفيذ وظائف العملية كتعليمات مخزنة على وسيط غير مؤقت يمكن قراءته بواسطة الكمبيوتر . يؤدي تنفيذ التعليمات إلى قيام جهاز معالجة البيانات بتنفيذ عمليات العملية .
تحصل قاعدة المعرفة على زوج مرشح سمة الكيان من مصدر البيانات.
تحصل قاعدة المعارف على مجموعة من الجمل من مصدر البيانات تتضمن كلمات الكيان والسمة في زوج سمة الكيان المرشح .
استنادًا إلى مجموعة الجمل وزوج سمة الكيان المرشح ، يحدد نموذج التصنيف ما إذا كانت سمة المرشح هي سمة فعلية للكيان المرشح . يمكن أن تكون مجموعة العقوبات عددًا كبيرًا من الجمل ، على سبيل المثال ، 30 جملة أو أكثر.
نموذج التصنيف الذي يقوم بالعمليات التالية
- يتم وصف عمليات تضمين الكلمات في مجموعة الجمل التي تتضمن الكيان والسمة بمزيد من التفصيل أدناه فيما يتعلق بالعملية أدناه
- تم إنشاؤه باستخدام أزواج سمات الكيان المعروفة ، وهي سمة توزيع يتم تضمينها للكيان ، والتي يتم وصفها بمزيد من التفصيل أدناه فيما يتعلق بالعملية
- البناء ، باستخدام أزواج سمات الكيان المعروفة ودمج السمة التوزيعية للسمة ، والتي يتم وصفها بمزيد من التفصيل أدناه فيما يتعلق بالعملية
- الاختيار ، بناءً على عمليات التضمين للكلمات في مجموعة الجمل ، ودمج السمة التوزيعية للكيان ، ودمج السمة التوزيعية للسمة ، سواء كانت السمة في زوج مرشح سمة الكيان سمة أساسية للكيان في زوج مرشح سمة الكيان ، والذي يتم وصفه بمزيد من التفصيل أدناه فيما يتعلق بالعملية .
ينشئ محرك تضمين المسار أول تمثيل متجه يحدد الكلمات الأولى التي يتم دمجها بين الكيان والسمة في الجمل . يكتشف محرك تضمين المسار العلاقات بين مصطلحات سمة الكيان المرشح من خلال تضمين المسارات أو الكلمات التي تربط التكرارات اليومية لهذه المصطلحات في مجموعة الجمل .
بالنسبة لعبارة "الثعبان هو زاحف" ، يقوم محرك تضمين المسار بإنشاء تضمين للمسار "هو" ، والذي يمكن استخدامه لاكتشاف ، على سبيل المثال ، العلاقات بين الجنس والأنواع ، والتي يمكن بعد ذلك التعود عليها لتحديد سمة الكيان الأخرى أزواج .
توليد الكلمات بين الكيان والسمة
يقوم محرك تضمين المسار بما يلي لإنشاء كلمات بين الكيان والسمة في الجمل . لكل جملة في مجموعة الجمل ، يستخرج محرك تضمين المسار أولاً مسار التبعية (الذي يحدد مجموعة من الكلمات) بين الكيان والسمة . يقوم محرك تضمين المسار بتحويل الجملة من سلسلة إلى قائمة ، حيث يكون المصطلح الأول هو الكيان ، والمصطلح الأخير هو السمة (أو ، المصطلح الأول هو السمة والمصطلح السابق هو الكيان) .
يتم تمثيل كل مصطلح (يُشار إليه أيضًا باسم حافة) في مسار التبعية باستخدام الميزات التالية: ليمما المصطلح ، وعلامة جزء من الكلام ، وتسمية التبعية ، واتجاه مسار التبعية (يسار ، حق أو جذر) . يتم تضمين كل من هذه الميزات وتسلسلها لإنتاج تمثيل متجه للمصطلح أو الحافة (V.sub.e) ، والذي يشتمل على سلسلة من المتجهات (V.sub.l و V.sub.pos و V.sub.dep ، V.sub.dir) ، كما هو موضح في المعادلة أدناه: {right arrow over (v)}. sub.e = [{right arrow over (v)}. sub.l، {right arrow over (v)} .sub.pos، {right arrow over (v)}. sub.dep، {right arrow over (v)}. sub.dir]
يقوم محرك تضمين المسار بعد ذلك بإدخال تسلسل المتجهات للمصطلحات أو الحواف في كل مسار في شبكة ذاكرة طويلة المدى (LSTM) ، والتي تنتج تمثيل متجه واحد للجملة (V.sub.s) ، كما هو موضح في المعادلة أدناه: {right arrow over (v)}. sub.s = LSTM ({right arrow over (v)}. sub.e.sup. (1) .. {right arrow over (v)}. sub .e.sup. (ك))
أخيرًا ، يُدخل محرك تضمين المسار التمثيل المتجه الفردي لجميع الجمل في مجموعة الجمل في آلية الانتباه ، والتي تحدد المتوسط المرجح لتمثيلات الجملة (V.sub.sents (e ، a)) ، كما هو موضح في المعادلة أدناه: {right arrow over (v)}. sub.sents (e، a) = ATTN ({right arrow over (v)}. sub.s.sup. (1) .. {right arrow over (v )}. sub.s.sup. (n))
يُنشئ النموذج التمثيلي التوزيعي تمثيلًا متجهًا ثانيًا للكيان وتمثيلًا متجهًا ثالثًا للسمة استنادًا إلى الجمل . يكتشف محرك التمثيل التوزيعي العلاقات بين مصطلحات سمة الكيان المرشح بناءً على السياق الذي تحدث فيه النقطة وكيان زوج سمة الكيان المرشح في مجموعة الجمل . على سبيل المثال ، قد يحدد محرك التمثيل التوزيعي أن الكيان "نيويورك" يتم استخدامه في تجميع الجمل بطريقة تشير إلى أن هذا الكيان يشير إلى مدينة أو ولاية في الولايات المتحدة .
كمثال آخر ، قد يحدد محرك التمثيل التوزيعي أن السمة "رأس المال" يتم استخدامها في مجموعة الجمل بطريقة توحي بأن هذه السمة تشير إلى مدينة مهمة داخل دولة أو بلد . وبالتالي ، فإن محرك التمثيل التوزيعي يولد تمثيلًا متجهًا يحدد تضمينًا للكيان (V.sub.e) باستخدام السياق (أي مجموعة الجمل) الذي يظهر فيه الكيان . يقوم محرك التمثيل التوزيعي بإنشاء تمثيل متجه (V.sub.a) يحدد تضمين السمة باستخدام مجموعة الجمل التي تظهر فيها الميزة .
يُنشئ محرك سمة التوزيع تمثيلًا متجهًا رابعًا يحدد سمة توزيع متضمنة للكيان باستخدام أزواج سمة-كيان معروفة . أزواج سمات الكيان المعروفة ، والتي يتم تخزينها في قاعدة المعرفة ، هي أزواج سمات الكيان التي تم تأكيدها (على سبيل المثال ، باستخدام المعالجة المسبقة بواسطة نموذج التصنيف أو بناءً على التقييم البشري) أن كل سمة في الكيان- زوج السمة هو سمة أساسية للكيان في زوج سمة الكيان .
ينفذ محرك سمة التوزيع العمليات التالية لتحديد تضمين سمة التوزيع التي تحدد التضمين للكيان باستخدام بعض (على سبيل المثال ، الأكثر شيوعًا) أو جميع السمات المعروفة الأخرى بين أزواج سمة الكيان المعروفة التي يرتبط بها هذا الكيان .
تحديد السمات الأخرى للكيانات
بالنسبة للكيانات في زوج مرشح سمة الكيان ، يحدد محرك السمة التوزيعية سمات أخرى غير تلك المضمنة في زوج مرشح سمة الكيان المرتبط بالكيان في فرق سمات الكيان المعروفة .
بالنسبة للكيان "مايكل جوردان" في زوج سمة الكيان المرشح (مايكل جوردان ، مشهور) ، يمكن لمحرك توزيع السمة استخدام أزواج سمة الكيان المعروفة لمايكل جوردان ، مثل (مايكل جوردان ، ثري) و (مايكل جوردان ، سجل) ، لتحديد سمات مثل الأثرياء والوصف .
يُنشئ محرك توزيع السمة بعد ذلك تضمينًا للكيان عن طريق حساب مجموع مرجح للسمات المعروفة المحددة (كما هو موضح في الفقرة السابقة) ، حيث يتم تعلم الأوزان باستخدام آلية الانتباه ، كما هو موضح في المعادلة أدناه: {right السهم فوق (v)}. sub.e = ATTN (.epsilon. (. alpha.. sub.1) .. .epsilon. (. alpha..sub.m))
يولد محرك السمة التوزيعية تمثيلًا متجهًا خامسًا يحدد سمة توزيع متضمنة للسمة باستخدام أزواج الكيان-السمة المعروفة . ينفذ محرك السمة التوزيعية العمليات التالية لتحديد نموذج بناءً على بعض (سواء أكان الأكثر شيوعًا) أو كل السمات المعروفة المرتبطة بالكيانات المعروفة لسمة المرشح .
بالنسبة للنقطة الموجودة في زوج مرشح سمة الكيان ، يحدد محرك السمة التوزيعية الكيانات المعروفة بين أزواج سمة الكيان المعروفة التي تتمتع بالجودة .
لكل كيان معروف محدد ، يحدد محرك نعت التوزيع سمات أخرى (أي سمات أخرى غير تلك المدرجة في زوج مرشح سمة الكيان) المرتبطة بالكيان في فرق خواص الكيان المعروفة . يمكن لمحرك السمة التوزيعية تحديد مجموعة فرعية من السمات من بين السمات المحددة من خلال:
(1) تصنيف السمات استنادًا إلى عدد الكيانات المعروفة المرتبطة بكل كيان ، مثل تعيين مرتبة أعلى للسمات المرتبطة بعدد أكبر من الكيانات من تلك المرتبطة بعدد أقل من الكيانات)
البحث في الأخبار مباشرة إلى بريدك الوارد
*مطلوب