تحسين متقدم على الصفحة - ما وراء كثافة الكلمات الرئيسية: TF-IDF لـ SEO
نشرت: 2021-02-26نعلم جميعًا أن تحسين محركات البحث (SEO) ليس جديدًا. إنه الآن مجال راسخ ومتعدد الأوجه خضع للعديد من التغييرات. أدت الطريقة المتغيرة التي تقوم بها محركات البحث بتقييم الصفحات وتصنيفها إلى حدوث العديد من هذه التحولات والانعطافات في تحسين محركات البحث (ألق نظرة على هذه المقالة حول تكلفة تحسين محركات البحث).
بناء الروابط شيء آخر برز إلى مكانة بارزة. حدث ذلك بمجرد أن أصبحت أهمية الروابط الخلفية واضحة. ظهرت مُحسّنات محرّكات البحث التقنية في المقدمة عندما تم التعرف على البنية المعلوماتية لأي موقع معين كعامل حاسم.
ثم أصبحت أهمية المحتوى واضحة. جعلت محركات البحث من المعروف أن المواقع يجب أن تحتوي على محتوى عالي الجودة وملائم. في البداية ، أدى ذلك إلى تشغيل محترفي تحسين محركات البحث (SEO) من أجل كثافة الكلمات الرئيسية وأدوات تخطيط الكلمات الرئيسية الخاصة بهم. باختصار ، أصبح من الواضح أن هذه لم تكن أفضل طريقة للذهاب. أو على الأقل ، استخدام هذه الأدوات لممارسات مشبوهة مثل حشو الكلمات الرئيسية لن ينجح. لن تخدع خوارزميات محرك البحث.
تبحث Google ومحركات البحث الأخرى عن محتوى فعلي عالي الجودة. إنهم يكافئون المحتوى ذي الصلة حقًا بموضوعه المفترض والذي يجيب على نية المستخدم المنشودة. كان إنشاء مثل هذا المحتوى هو النصيحة الرئيسية من Google للتعافي من التحديث الطبي الشهير - أو سيئ السمعة -.
احجز استشارة
نتيجة لذلك ، من الواضح أن Google ومحركات البحث الأخرى يمكنها تقييم وتقييم موضوع ومعنى المحتوى بدقة. إحدى الطرق التي يفعلون بها ذلك هي استخدام tf-idf. Tf-idf هو أحد أقدم عوامل الترتيب التي تستخدمها محركات البحث. في أبسط مستوياته ، يسمح لهم بفهم ماهية الصفحات.
سيعطيك هذا الدليل النهائي لـ tf-idf لـ SEO جميع المعلومات التي قد تحتاجها. سيغطي ما هو tf-idf وكيف يعمل ، وكيف يرتبط tf-idf بـ SEO وكيف ومتى يمكنك استخدام تحليل tf-idf.
ما هو TF-IDF؟
Tf-idf هو إحصاء رقمي يستخدم في استرجاع المعلومات. إنه يمثل مدى أهمية كلمة أو عبارة لوثيقة معينة ، مقارنة بالمستندات الأخرى في مجموعة أو "مجموعة". تزداد قيمة tf-idf بشكل متناسب مع عدد المرات التي تظهر فيها كلمة أو عبارة في المستند.
يتم تعويض ذلك بعدد المرات التي تظهر فيها تلك الكلمة أو العبارة عبر جميع المستندات في المجموعة. هذا مهم لأنه يتكيف مع حقيقة أن بعض الكلمات تظهر في كثير من الأحيان في الاستخدام العام.
خذ مثالاً على مصطلح بحث مثل "أفضل مُحسنات محركات البحث". "The" هي الكلمة التي تظهر عدة مرات في جميع المستندات عبر مجموعة. نتيجة لذلك ، يكون من الأقل أهمية لقيمة td-idf إذا ظهرت "the" في المستند الذي تم البحث عنه مقارنةً بظهور الكلمات الأخرى الأقل شيوعًا.
Tf-idf هو نتاج إحصائيين. بمعنى أنك تضرب واحدًا في الآخر. هذه هي الطريقة التي تمثل بها أهمية كلمة أو عبارة وتعوض التكرار العام لتلك الكلمة أو العبارة. الإحصائيتان هما تردد المدى (tf) وتردد المستند العكسي (idf).
تردد المصطلح
تردد المدى هو النصف الأبسط من tf-idf. يمثل عدد المرات التي يظهر فيها مصطلح في مستند معين. كل ما هو مطلوب لحساب تكرار المصطلح هو طول كلمة المستند وعدد مرات ظهور المصطلح. ثم تقوم بعد ذلك بقسمة عدد مرات ظهور الكلمة على إجمالي عدد الكلمات. هذا يعني أن تكرار المصطلح سيكون دائمًا قيمة بين صفر وواحد.
في أبسط مستوى ممكن ، يتم عمل تردد المدى بالطريقة التالية:
TF (تردد المصطلح) = t (عدد مرات ظهور المصطلح في مستند) / d (إجمالي الكلمات في المستند)
من خلال النظر في طول المستند وعدد مرات ظهور المصطلح ، تحصل على فكرة جيدة عن مدى صلة الوثيقة بالمصطلح المحدد. لا يمكنك أن تعرف على وجه اليقين ، على الرغم من ذلك ، إلا إذا كنت تعرف عدد مرات ظهور المصطلح في المستندات بشكل عام. وهنا يأتي دور التردد العكسي للمستند (idf).
تردد الوثيقة العكسي
الكلمات التي يتم استخدامها كثيرًا عبر العديد من المستندات ليست جيدة لتحديد المستندات ذات الصلة بمصطلح بحث معين. تردد المستند العكسي عبارة عن إحصائية تقلل من الوزن الموضوع على تلك المصطلحات الشائعة.
إنه يضمن أنك إذا كنت تبحث عن "الثعلب البني السريع" ، فإن "الظهور عدة مرات في المستند ، لن يكون مهمًا بقدر ما إذا كانت الكلمات الأخرى موجودة. تردد المستند العكسي هو مقياس لمقدار المعلومات التي توفرها كلمة أو مصطلح.
تبدو صيغة العمل على idf معقدة للغاية:
IDF = سجل (Nd / fi)
إذا قمت بتقسيمها إلى أجزائها ، فهذا ليس معقدًا.
السجل هو ببساطة وظيفة رياضية ليس من المهم جدًا فهمها. يمكنك فقط الضغط على الزر "تسجيل" في الآلة الحاسبة إذا احتجت إلى ذلك. "Nd" هو عدد المستندات في المجموعة أو المجموعة التي يتم البحث عنها. 'fi' هو عدد تلك المستندات التي تحتوي على مصطلح البحث.
تحصل على قيمة IDF الخاصة بك ، بعد ذلك ، من خلال قسمة عدد المستندات على عدد المستندات التي تحتوي على مصطلح البحث ثم تطبيق وظيفة السجل.
مثال محلول TF-IDF
يمكننا الآن أخذ ما تعلمناه واستخدامه كمثال بسيط للغاية. لنفترض أن لديك مستندًا مكونًا من 100 كلمة وأنك تبحث عنه عن كلمة "كلمة رئيسية". إذا ظهرت هذه الكلمة ثلاث مرات ، فيمكنك حساب تكرار المصطلح كما يلي:
3 (عدد المصطلحات في المستند) / 100 (إجمالي الكلمات) = 0.03
تردد مصطلحك هو 0.03. لنفترض الآن أن هناك ما مجموعه عشرة ملايين مستند في مجموعة المستندات التي تبحث عنها وأن "الكلمات الرئيسية" تظهر في 1000 منها. لديك الآن كل ما تحتاجه للعمل على معرفك الشخصي:
السجل (10،000،000 / 1،000) = 4
تردد المستند العكسي هو 4. قيمة tf-idf هي ببساطة مصطلح التردد مضروبًا في idf ، لذلك:
0.03 (tf) x 4 (idf) = 0.12
قيمة tf-idf الخاصة بك هي 0.12. هذا في حد ذاته لا يخبرك كثيرًا ، ولكن يمكن مقارنته بالقيم الأخرى. كلما زادت قيمة tf-idf ، زادت أهمية المصطلح في المستند المحدد. تنتج أعلى قيم tf-idf عندما يكون هناك تكرار طويل الأجل وعدد منخفض من المستندات التي تعرض المصطلح في مجموعة. يجب أن يساعد الجدول التالي في توضيح ذلك:
تردد المدى (TF) | حجم الجسم (Nd) | المستندات ذات المصطلح (fi) | تردد المستند العكسي (IDF) | TF-IDF |
0.03 | 10،000،000 | 1،000 | 4 | 0.12 |
0.04 | 10،000،000 | 900 | 4.05 | 0.162 |
0.05 | 10،000،000 | 800 | 4.10 | 0.205 |
0.06 | 10،000،000 | 700 | 4.15 | 0.249 |
0.07 | 10،000،000 | 600 | 4.22 | 0.295 |
TF-IDF و SEO و LSI
غالبًا ما يتم استخدام Tf-idf كجزء من الفهرسة الدلالية الكامنة (LSI). هذا بالتأكيد هو ما يربط مباشرة بين tf-idf و SEO. LSI مع tf-idf هي تقنية لمعالجة اللغة. يسمح بترتيب المستندات بناءً على مدى صلتها بمصطلح بحث فردي أو مجال موضوع أوسع.
يعمل LSI عن طريق تحديد الأنماط في العلاقات بين العبارات والمفاهيم المختلفة في مجموعات النص غير المهيكلة. يعتمد على فكرة أن الكلمات المستخدمة في نفس السياقات تميل إلى أن يكون لها معاني مرتبطة أو متشابهة.

من خلال تحديد الأنماط بين المصطلحات والعبارات ، يتيح LSI تمييز الموضوع العام أو موضوع النص. عند تطبيق LSI مع tf-idf على مجموعة من المستندات ، سيعرض الاستعلام أو مصطلح البحث نتائج أكثر دقة.
ذلك لأن النتائج ستتضمن وثائق متشابهة من حيث المفهوم في معنى البحث. سيكون هذا هو الحال حتى لو لم تحتوي المستندات على كلمات محددة من مصطلح البحث. الهدف من LSI مع tf-idf هو فهم الموضوعات والتركيز الفعلي لمجموعة من المستندات.
باختصار ، يتيح tf-idf عند استخدامه كجزء من LSI للآلات فهم ماهية صفحات النص. وبالتالي ، فهي الطريقة التي يمكن بها لـ Google ومحركات البحث الأخرى تقييم مدى ملاءمة وفائدة المحتوى.
أصبحت أهمية tf-idf في تحسين محركات البحث أكثر وضوحًا بالتأكيد. إنه أحد العوامل الأولى لتصنيف محركات البحث ويمكن اعتباره لبنة أساسية لمحركات البحث و SERPs. والأهم من ذلك ، أن tf-idf يساعد Google في تقييم مدى الصلة والفائدة الفعليين للصفحات من حيث صلتها بأي مصطلح بحث أو استعلام.
هذا يطرح السؤال عن كيفية استخدام فهمنا الأفضل لـ tf-idf لتحسين محركات البحث. سواء كان ذلك من قبل وكالة SaaS SEO أو صاحب عمل صغير يتطلع إلى زيادة حركة المرور العضوية. قال AJ Ghergich كلامه في مقطع فيديو SEMrush حول هذا الموضوع:
الهدف العام لـ tf-idf هو قياس مدى أهمية الكلمة في مجموعة من المستندات إحصائيًا. إنها مثل أداة مفيدة جدًا لكثافة الكلمات الرئيسية على المنشطات.
SEMrush
هذا تشبيه بسيط ، لكنه قد يكون مضللًا بعض الشيء. لا يتم استخدام تحليل Tf-idf بشكل أفضل لتحديد الكلمات الرئيسية لإدراجها في المحتوى. من الأفضل التفكير في الأمر على أنه نوع من أداة إلهام المحتوى.
يمكن أن يمنحك استخدام tf-idf لمقارنة المحتوى الخاص بك بصفحات مماثلة ذات ترتيب أفضل ، اقتراحات حول كيفية إثراء المحتوى. ستشير إلى الكلمات الرئيسية والعبارات التي يسجل المحتوى الأعلى مرتبة لها قيم tf-idf أفضل من صفحاتك.
سيُظهر ذلك مجالات الموضوعات والموضوعات التي لا يغطيها المحتوى الخاص بك بقدر كبير من التفاصيل أو بالإضافة إلى الصفحات المماثلة. لديك بعد ذلك خارطة طريق لكيفية تحسين المحتوى الخاص بك بطريقة من المؤكد أن Google ستحبها. وذلك من خلال تعزيز أهميتها ومدى إرضائها لنية القراء المحتملين الذين يبحثون عن كلمات رئيسية أو عبارات معينة.
استخدام TF-IDF لتحسين محركات البحث
استخدام TF-IDF لتحسين محركات البحث لا يتعلق بكثافة الكلمات الرئيسية. إنها تتحرك أبعد من ذلك.
يؤدي إجراء تحليل tf-idf إلى الكشف عن المصطلحات والعبارات التي لا يتعامل معها المحتوى الخاص بك بالإضافة إلى الصفحات الأخرى. خطوتك التالية إذن هي عدم البدء في إدخال هذه العبارات في المحتوى الحالي الخاص بك لزيادة كثافة الكلمات الرئيسية. ما تريد القيام به هو تحسين المحتوى الخاص بك بحيث يكون أكثر صلة بالموضوعات والموضوعات المحيطة بهذه العبارات.
قد يكون لديك ، على سبيل المثال ، صفحة يكون موضوعها الرئيسي هو تحسين محركات البحث. قد يكشف تحليل tf-idf أنه يحتوي على قيمة أقل لمصطلح "إنشاء الارتباط" من الصفحات الأخرى التي تحتل مرتبة عالية في عمليات البحث عن تحسين محركات البحث. يخبرك هذا أن المحتوى الخاص بك لا يقدم معلومات كافية ذات صلة ومفيدة حول بناء الروابط. بهذه البساطة ، لديك طريقة محددة لتحسين المحتوى الخاص بك.
قبل أن تتمكن من التفكير في تحسين المحتوى الخاص بك ، تحتاج إلى معرفة كيفية إجراء تحليل tf-idf. دعونا نتعامل مع ذلك الآن.
كيفية إكمال تحليل TF-IDF
من الممكن تقنيًا إجراء تحليل tf-idf يدويًا ، وإجراء الحسابات الخاصة بك. في حين أنه ممكن ، لا ينصح بذلك. كما رأيت بالفعل ، يمكن أن تصبح العمليات الحسابية معقدة بعض الشيء وستستغرق وقتًا دائمًا.
هذه ليست حتى أكبر مشكلة. لا يكون تحليل tf-idf مفيدًا إلا إذا كانت المجموعة التي تقارن المحتوى بها ذات صلة ومفيدة. تريد أن تكون قادرًا على مقارنة قيم tf-idf للمحتوى الخاص بك بالصفحات الأخرى التي يتم تقييمها جيدًا لكلماتك الرئيسية المهمة. وهنا يأتي دور أداة tf-idf ، مثل تلك التي تقدمها Ryte.
يمكن لأداة Ryte مقارنة عنوان URL المباشر من موقعك مع أفضل عشر نتائج بحث على Google لكلمة رئيسية معينة أو استعلام بحث. سيوفر بعد ذلك قائمة بالمصطلحات والعبارات المهمة ذات الصلة التي يكون للمحتوى ذي التصنيف العالي قيمة عالية لـ tf-idf.
علاوة على ذلك ، ستقوم أداة Ryte أيضًا بتقييم عنوان URL الذي اخترته مقابل تلك العبارات والمصطلحات. سيُظهر ما إذا كان المحتوى الخاص بك يحتوي على قيم tf-idf عالية أو أعلى أو أقل لكل منها.
ستوضح لك هذه المعلومات أين وكيف يجب تحسين المحتوى الخاص بك. سيعطيك الموضوعات والموضوعات التي لا تغطيها صفحتك بشكل كافٍ. وبالتالي ، ستكون قادرًا على تصميم الصفحة لتناسب احتياجات قرائها ونواياهم بشكل أفضل.
ربما تتساءل الآن متى يجب عليك استخدام تحليل tf-idf. هناك الكثير من الأشياء الأخرى التي تحتاج أيضًا إلى القيام بها ، بعد كل شيء ، في مجال تحسين محركات البحث وخارجها.
متى تستخدم تحليل TF-IDF
لا يوجد وقت سيء أبدًا للتفكير في تحسين محتوى موقعك. لا يوجد سوى ساعات طويلة في اليوم. هذا يعني أنه من الأفضل تنفيذ تحليل tf-idf في الظروف التي من المرجح أن تحدث فرقًا فيها. هناك عدد قليل من الأمثلة لمثل هذه الظروف بالضبط ؛
- إطلاق العنان لإمكانات المحتوى الحالي
يمكن أن يكون Tf-idf مفيدًا حقًا إذا كان لديك صفحة يتم ترتيبها باستمرار في الصفحة الثانية من عمليات بحث Google. بعد أن وصلت إلى مرتبة عالية جدًا في الترتيب ، من الواضح أن الصفحة لديها إمكانات. يمكن أن يساعدك تحليل tf-idf في تحديد التعديلات والإضافات الدقيقة التي تحتاجها لتحقيق قفزة أخيرة في الصفحة الأولى.
- توجيه خطة محتوى جديدة
يعد تحليل tf-idf رائعًا كمصدر إلهام للمحتوى. سيؤدي إجراء تحليل على صفحات مرتبة جيدًا لموضوعات وموضوعات معينة إلى إظهار ما يحتاج المحتوى الخاص بك إلى تغطيته. يمكن أن يكون هذا أساسًا رائعًا لرسم خطة لمجموعة كاملة من المحتوى الجديد.
- إيقاف الترتيب المتراجع
إذا كانت لديك صفحة اعتادت أن تكون الأفضل أداءً ولكنها تتراجع في تصنيفات الكلمات الرئيسية المهمة ، فيمكن أن يساعدك tf-idf هناك أيضًا. يمكن أن يوضح لك الكلمات الرئيسية والموضوعات التي تتفوق فيها الصفحات التي تتخطى صفحتك على تحقيق قيم tf-idf أفضل. يمكنك بعد ذلك تحسين المحتوى الخاص بك وتحديثه وفقًا لذلك.
TF-IDF for SEO - تجاوز كثافة الكلمات الرئيسية
هناك الكثير مما يجب مراعاته في عالم تحسين محركات البحث الحديث. تظل بنية الموقع والروابط وكثافات الكلمات الرئيسية وجميع العناصر التقليدية الأخرى حاسمة. يمكن القول ، مع ذلك ، أن المحتوى أصبح الآن ملكًا. أو على الأقل أنه يحتاج إلى الاهتمام بنفس القدر الذي يحظى به أي من تلك العوامل الأخرى.
لم يعد بإمكان المواقع التخلص من حشو الكلمات الرئيسية أو ملء الصفحات بمحتوى غير مرغوب فيه مكرر أو مخفي. تحتاج المواقع إلى احتواء محتوى عالي الجودة يكون مفيدًا حقًا للقراء. Tf-idf هي طريقة رئيسية يقوم بها Google ومحركات البحث الأخرى بتقييم المحتوى في هذا الصدد.
لذلك ، من الأهمية بمكان فهم كيفية عمل tf-idf وكيفية ارتباطه بتحسين محركات البحث. يمكن أن يساعدك الفهم الصحيح والتنفيذ لـ tf-idf لـ SEO على إثراء المحتوى الخاص بك ورؤية المكافآت في حركة المرور العضوية الخاصة بك.
احجز استشارة

نيك براون هو المؤسس والرئيس التنفيذي لوكالة تسريع ، وهي وكالة SaaS لتحسين محركات البحث. أطلق نيك العديد من الأعمال التجارية الناجحة عبر الإنترنت ، وكتب لصالح Forbes ، ونشر كتابًا ، ونما بشكل متسارع من وكالة بريطانية إلى شركة تعمل الآن في جميع أنحاء الولايات المتحدة ، وآسيا والمحيط الهادئ وأوروبا والشرق الأوسط وإفريقيا وتوظف 160 شخصًا. كما تم اتهامه مرة من قبل غوريلا الجبل