ما هو ملف XML Sitemap وكيف يمكنك إنشاء واحد لكبار المسئولين الاقتصاديين (مع أمثلة)
نشرت: 2022-01-25 تعد خرائط مواقع XML من أكثر الأجزاء التي يتم فهمها بشكل خاطئ في معادلة تحسين محركات البحث (SEO).
لقد صادفت خبراء تحسين محركات البحث الذين لم يتمكنوا من شرح سبب ضرورتهم ، ناهيك عن إخبارك بكيفية إعداد واحدة "صحيحة".
وهنا تكمن المشكلة:
مثلما تعد الخريطة ضرورية للعثور على وجهتك عن طريق البر ، فإن خريطة موقع XML ضرورية لمحركات البحث لتحديد عناوين URL الخاصة بموقعك على الويب.
بدون الزحف إلى عناوين URL الخاصة بك ، لن تتم فهرستها ، ولن يتم ترتيب صفحاتك (بالطبع) بدون فهرستها.
باختصار ، تلعب خرائط مواقع XML دورًا مهمًا في تحسين محرك البحث.
في منشور اليوم ، سأوضح لك كيفية إنشاء خريطة موقع XML من البداية وتحسينها بشكل مثالي من أجل تحسين محركات البحث خطوة بخطوة. أنا أغطي:
- ما هي خريطة موقع XML
- XML مقابل خرائط مواقع HTML
- علامات خريطة موقع XML (وأي منها يجب عليك استخدامها)
- أمثلة خريطة موقع XML
- لماذا تحتاج إلى خريطة موقع XML
- كيفية إنشاء خريطة موقع XML
- ستة من أفضل الممارسات لإنشاء ملف sitemap.xml
بدون مزيد من اللغط ، دعنا نقفز.
ما هو ملف XML Sitemap؟ (ولماذا يجب أن تهتم هيك)
بعبارات بسيطة:
خريطة موقع XML هي خارطة طريق لمحركات البحث.
يسرد المحتوى المهم لموقع الويب الخاص بك بتنسيق XML ، بحيث يمكن لمحركات البحث بسهولة العثور على المحتوى الخاص بك وفهرسته وعرضه في النهاية في صفحات نتائج محرك البحث.

يجب أن تدرج في خريطة موقع XML الخاصة بك أي صفحة ويب (أو ملف) تريد عرضها في محركات البحث.
لماذا ا؟
لأن خريطة الموقع تضمن إمكانية اكتشاف المحتوى الخاص بك.
لنفترض أن لديك صفحات ويب غير مرتبطة من أي مكان على موقعك - أو الويب ككل. إذا كانت هذه الصفحات لا تحتوي على ارتباطات تشعبية تشير إليها ، فلن تتمكن برامج زحف الويب من العثور عليها.
تضمن خريطة موقع XML (المرسلة إلى محركات البحث) أن محركات البحث يمكنها العثور على أي صفحات تريد تضمينها في SERPs.
لكن هذا ليس كل شيء.
يمكنك استخدام خريطة موقع XML لتوفير معلومات إضافية لمحركات البحث ، مثل وقت آخر تحديث للمحتوى الخاص بك والصفحات التي لها أولوية أعلى. المزيد عن ذلك لاحقًا.
XML مقابل خرائط مواقع HTML - ما الفرق؟
يمكنك إضافة نوعين من خرائط الموقع إلى موقعك ؛ خريطة موقع XML وملف خريطة موقع HTML.
- تستخدم خرائط مواقع XML لغة الترميز الموسعة (XML)
- تستخدم خرائط مواقع HTML لغة ترميز النص التشعبي (HTML)

ولكن بصرف النظر عن الكود الذي يستخدمونه ، فإنهم يخدمون أيضًا وظائف مختلفة:
خريطة موقع XML
لنبدأ بمثال خريطة موقع XML:

كما ترى ، خرائط مواقع XML ليست صديقة للإنسان.
خرائط مواقع XML هي موجزات مصممة بشكل صريح لمحركات البحث.
إنها تساعد محركات البحث مثل Google على فهم عناوين URL التي يجب الزحف إليها وما الذي يحظى بالأولوية.
بالإضافة إلى ذلك ، كم مرة يتم تغيير عناوين URL هذه ، وأي منها يتم إضافته إلى الموقع.

تساعد هذه المعلومات جدولة محرك البحث على تقييم وقت وكم مرة إعادة الزحف إلى عنوان URL معين.
خريطة موقع HTML
فيما يلي مثال على خريطة موقع HTML:

يبدو مختلفًا تمامًا عن خريطة موقع XML.
هذا لأنها صفحة ويب مصممة للبشر - وكذلك الروبوتات.
بالنسبة للبشر ، تساعد خريطة موقع HTML على التنقل بشكل أفضل عبر موقع الويب.
من منظور محرك البحث ، يعد ملف Sitemap بتنسيق HTML أداة مفيدة لاكتشاف عنوان URL (بافتراض أنه يتم الزحف إلى خريطة الموقع وتتبع الروابط الموجودة في خريطة الموقع).
ولكن ، هذه ليست القيمة الوحيدة لتحسين محركات البحث:
توزع خرائط مواقع HTML أيضًا PageRank في جميع أنحاء موقع الويب.
نظرًا لأن خرائط مواقع HTML يتم ربطها بشكل شائع من كل صفحة على الموقع (عبر رابط تنقل في التذييل) ، فإن لديها قدرًا كبيرًا من PageRank يتدفق إليها.

هذا يعني أنه يمكنهم نقل حمولة كبيرة من نظام ترتيب الصفحات الوارد إلى صفحات أخرى على موقع الويب عبر الروابط الداخلية.
حصلت على صفحة مرتبة سيئة؟
أضف تلك الصفحة إلى خريطة موقع HTML الخاصة بك.
يمكن أن تكون طريقة سريعة وسهلة لمنحها دفعة في الترتيب.
كيف تبدو خريطة موقع XML؟
كما أشرت بالفعل ، خرائط مواقع XML مخصصة لمحركات البحث ، وليس البشر.
يمكن أن تبدو مربكة بالتأكيد إذا لم تصادفها من قبل:
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26T19:12:36+09:00</lastmod> <changefreq>Daily</changefreq> <priority>1</priority> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16T13:21:20+09:00</lastmod> <changefreq>Daily</changefreq> <priority>0.8</priority> </url> </urlset>
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26T19:12:36+09:00</lastmod> <changefreq>Daily</changefreq> <priority>1</priority> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16T13:21:20+09:00</lastmod> <changefreq>Daily</changefreq> <priority>0.8</priority> </url> </urlset>
ومع ذلك ، عندما تعرف ما يعنيه كل مكون من هذه المكونات:
- إعلان XML
- مجموعة URL
- URL
- آخر تعديل
- أولوية
- تغيير التردد
تعد خرائط مواقع XML واضحة ومباشرة.
دعنا نقسم كل واحد:
إعلان XML
بعبارات بسيطة ، يخبر إعلان XML محركات البحث أنهم يقرؤون ملف XML.
<?xml version="1.0" encoding="UTF-8"?>
يوضح إعلان XML أيضًا إصدار XML وترميز الأحرف المستخدم.
- يجب أن يكون الإصدار 1.0
- يجب أن يكون الترميز UTF ‑ 8.
ضع إعلان XML أعلى ملف sitemap.xml.
تعيين URL
مجموعة عناوين URL عبارة عن حاوية لجميع عناوين URL في ملف Sitemap.
يبدأ بتحديد البروتوكول القياسي الذي يستخدمه ملف sitemap.xml:
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
ستلاحظ أن البروتوكول المذكور في المثال أعلاه هو 0.9 القياسي.
تدعم Google و Yahoo و Microsoft معيار خريطة الموقع هذا - وهو المعيار الذي أوصي باستخدامه.
من المهم ملاحظة أن مجموعة url يتم إغلاقها أسفل مستند XML:
</urlset>
يخبر هذا المقتطف القصير من الشفرة محركات البحث أن مجموعة عناوين URL قد انتهت.
URL
العلامة <URL> هي العلامة الأصلية لكل عنوان URL في خريطة موقع XML:
<url> <loc>https://seosherpa.com/services/</loc> </url>
<url> <loc>https://seosherpa.com/services/</loc> </url>
بين الفتح <url> والإغلاق </url> ، يجب أن تذكر موقع عنوان URL في علامة <loc> متداخلة.
المهم هنا هو أن تحدد عنوان URL المطلق ، بما في ذلك بروتوكول HTTP: // أو HTTPS: //.
بمعنى آخر ، قم بإدراج عنوان URL تمامًا كما سيظهر في متصفح الويب.

من ناحية أخرى ، لن يتم التعرف على عناوين URL النسبية مثل / services /.
موقع URL هو السمة الوحيدة التي يجب ذكرها بين علامات URL.
ولكن مع ذلك ، هناك ثلاث خصائص إضافية (اختيارية) يمكن تضمينها:
آخر تعديل
تحدد العلامة <lastmod> آخر مرة تم فيها تغيير المحتوى الموجود على عنوان URL هذا.
<lastmod>2022-01-26T19:12:36+09:00</lastmod>
لنفترض أنك قمت بتحديث منشور مدونة في العاشر من كانون الثاني (يناير) 2022 ؛ ستقرأ السمة <lastmod> 2022-01-10.
يخبر محركات البحث عندما تمت مراجعة المحتوى الموجود على عنوان URL هذا مؤخرًا ، وهو ما يؤثر نظريًا عندما يقوم محرك البحث بإعادة الزحف إلى تلك الصفحة.
يمكنك أيضًا تحديد الوقت ، لكنه غير ضروري.
سواء قمت بتضمين التاريخ أو الوقت فقط ، تأكد من استخدام تنسيق "W3C datetime".
إنه التنسيق الوحيد المعترف به لـ علامة <lastmod> في ملف sitemap.xml.
أولوية
تحدد العلامة <priority> أولوية عنوان URL بالنسبة إلى جميع عناوين URL الأخرى على موقع الويب.
<priority>0.8</priority>
بمعنى آخر ، يسمح لك بإخبار محركات البحث بعناوين URL التي يجب أن تحظى بالأولوية عند تخصيص ميزانية الزحف إلى موقعك.
يمكن تعيين قيم الأولوية من 0.0 وهي أدنى أولوية ، إلى 1.0 وهو الحد الأقصى.
المشكلة هي أن Google يتجاهل ملف <priority> في خرائط مواقع XML ، لأنه في كلمات Gary Illyes "إنها كيس من الضوضاء."
لذلك لا جدوى من تحديد الأولوية على الإطلاق.
تغيير التردد
حيث إن علامة <lastmod> تحدد وقت آخر تغيير للمحتوى الموجود على عنوان URL هذا ...
توضح العلامة < changfreq > مدى تكرار تغيير المحتوى.
<changefreq>Daily</changefreq>
والغرض منه هو إعطاء محركات البحث فكرة عن عدد المرات التي قد يرغبون فيها في إعادة الزحف إلى عنوان URL.
يمكن تعيين تكرار التغيير في خريطة موقع XML على أي من القيم التالية:
- دائماً
- ساعيا
- اليومي
- أسبوعي
- شهريا
- سنوي
- أبداً
إذا تم تعيين العلامة على <changefreq> أسبوعيًا </ changefreq> قد يرغب محرك البحث في إعادة الزحف إلى عنوان URL هذا كل سبعة أيام.
إن القيام بذلك بشكل متكرر أكثر من ذلك سيكون إهدارًا لأنه من غير المحتمل أن يختلف المحتوى.
ومع ذلك ، فإن <changefreq> عفا عليه الزمن فيما يتعلق بـ Google:
نظرًا لأن معظم مولدات خرائط الموقع تقوم بعمل رهيب في مطابقة علامة <changefreq> مع التكرار الفعلي للتغيير ، فمن السهل فهم السبب.
يمكنك حذف سمة تكرار التغيير من ملف sitemap.xml الخاص بك.
أمثلة لخريطة موقع XML
الآن بعد أن عرفنا ما الذي يجعل خريطة موقع XML ، دعنا نلقي نظرة على بعض أمثلة ملف sitemap.xml كما تظهر في العالم الحقيقي.
هنا خريطة موقع XML لصفحات Gymshark:

يمكن تحسين خريطة الموقع هذه عن طريق إزالة <changefreq> نظرًا لتجاهلها من قِبل Google ، وعن طريق إضافة إعلان XML في بداية ملف Sitemap XML.
(يعتبر تضمين إعلان XML من أفضل الممارسات لجميع خرائط المواقع).
إليك مثال آخر لخريطة موقع XML ، هذه المرة من yasisland.ae

مثل خريطة موقع Gym Shark ، يمكن تحسين خريطة الموقع هذه عن طريق إضافة إعلان XML في البداية.
بالإضافة إلى ذلك ، يمكن إزالة تغيير التكرار والأولوية لأنها زائدة عن الحاجة هذه الأيام.
بخلاف ذلك ، تم إعداد خرائط مواقع XML هذه بشكل صحيح.
لذا في هذه المرحلة ، ربما تسأل نفسك:
كيف تبدو خريطة موقع XML المثلى؟
شيء من هذا القبيل:
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26</lastmod> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16</lastmod> </url> </urlset>
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26</lastmod> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16</lastmod> </url> </urlset>
يجب أن تحتوي على:
- إعلان XML (الإصدار)
- مجموعة URL
- URL (s)
- آخر تعديل (التاريخ فقط)

وهذا كل شيء حقًا.
لماذا أحتاج إلى خريطة موقع XML؟
كما أوضحت سابقًا ، يكتشف محرك البحث المحتوى على الويب عن طريق الزحف من صفحة ويب إلى أخرى باستخدام برامج الروبوت التي يشار إليها غالبًا باسم "العناكب":

عندما تكتشف هذه العناكب صفحة جديدة عبر ارتباط داخلي أو خارجي ، فإنها تضيف تلك الصفحة إلى فهرسها.
لكن مشكلة الزحف؟
لا يمكن لمحركات البحث العثور على كل المحتوى على الويب بهذه الطريقة.
إذا لم يتم ربط صفحة الويب عبر صفحة أخرى معروفة ، فلن يتمكن محرك البحث من العثور عليها.
هذا هو المكان الذي تأتي فيه خريطة موقع XML.
تعمل خرائط مواقع XML كتأمين للزحف ، من خلال إعلام محركات البحث بمكان العثور على أهم الصفحات على موقع الويب الخاص بك حتى تساعد في اكتشاف المحتوى وفهرسته.
هذا أمر بالغ الأهمية لأن محركات البحث لا يمكنها ترتيب المحتوى الخاص بك دون فهرسته أولاً.
ما نوع مواقع الويب التي تحتاج إلى خريطة موقع XML؟
إذا اتبعت نصيحة Google ، فإن خرائط مواقع XML هي الأفضل لـ:
- مواقع ويب كبيرة تحتوي على آلاف الصفحات
- مواقع الويب التي تحتوي على أرشيفات واسعة النطاق
- مواقع الويب التي تحتوي على الكثير من محتوى الوسائط الغنية
- مواقع الويب التي لا تحتوي على روابط خلفية أو بها عدد قليل جدًا من الروابط
لكن هذا هو الشيء:
تستفيد جميع مواقع الويب من وجود خريطة موقع XML.

عندما تقوم بتضمين خريطة موقع XML ، يمكن لروبوتات محرك البحث فهم بنية موقعك بشكل أفضل ، واكتشاف المحتوى الخاص بك - ومعرفة تاريخ آخر تحديث له.
حتى إذا كان لديك موقع ويب من صفحة واحدة ، فمن المحتمل أن يكون تضمين خريطة موقع XML يستحق ذلك.
ما هي الصفحات التي يجب عليك تضمينها في خريطة موقع XML الخاصة بك؟
الجواب القصير:
قم بتضمين أي صفحات تريد عرضها في نتائج البحث في خريطة موقع XML الخاصة بك واترك كل شيء آخر بالخارج.
بمعنى آخر ، يجب أن يتضمن ملف Sitemap الخاص بك الصفحات التي تحتوي على فائدة فقط. اشياء مثل:
- الصفحة الرئيسية
- حول الصفحة
- صفحات المنتج
- صفحات الخدمة
- صفحة الاتصال
- مشاركات المدونة
بشكل عام ، لن تقوم بتضمين صفحات مثل:
- شكرا لك الصفحات
- صفحات العلامات
- ملفات الوسائط الخاصة
هذه كلها أمثلة على عناوين URL التي لا تريدها أن تظهر في نتائج البحث.

لكن تذكر ، لمجرد حذفك لصفحة من ملف Sitemap الخاص بك لا يعني أنها لن تتم فهرستها.
إذا كانت الصفحة تحتوي على روابط تشير إليها ، فهناك احتمال أن يقوم Google (ومحركات البحث الأخرى) بالزحف إلى تلك الصفحة وفهرستها وعرضها في نتائج محرك البحث.
لضمان إزالة صفحة من نتائج البحث ، احذف الصفحة من خريطة موقع XML وأضف علامة no-index إليها.
وهذا يقودني إلى نقطتي التالية:
يجب أن تكون كل صفحة في خريطة موقع XML الخاصة بك قابلة للفهرسة.
يجب ألا يحتوي ملف Sitemap على صفحات تعرض رموز الحالة التالية:
- 404 - الصفحة غير موجودة
- 301 أو 302 - تم نقل الصفحة إلى مكان آخر
تخبر أكواد الحالة 4XX و 3XX محركات البحث أنه لا توجد صفحة هناك.
وإذا لم تكن هناك صفحة على عنوان URL هذا ، فهي غير قابلة للفهرسة.
بالإضافة إلى:
يجب أن تكون كل صفحة في متناول برامج الزحف بمحركات البحث.
باختصار ، لا يحظر ملف robots.txt الصفحة ، ولا توجد توجيهات (مثل برامج الروبوت الوصفية أو الروابط الأساسية أو علامات x-robots) تخبر محركات البحث بعدم فهرسة الصفحة.
الآن بعد أن عرفت ما يتم تضمينه في خريطة موقع XML ، دعنا نناقش كيفية إنشاء واحد.
كيفية إنشاء خريطة موقع XML (منهجيتان)
إذا كنت قد أنشأت موقع الويب الخاص بك باستخدام نظام إدارة المحتوى مثل Shopify أو Wix ، فلن تحتاج إلى إنشاء خريطة موقع XML ، لأن نظام إدارة المحتوى الخاص بك سينشئ خريطة موقع لك.
يتم تحديث خريطة موقع XML الموجودة على هذه الأنظمة الأساسية (وغيرها مثلها) تلقائيًا عند إضافة الصفحات - أو إزالتها - من الموقع.
إذا لم يقم نظام إدارة المحتوى (CMS) الخاص بك بهذا الأمر ، فعادةً ما يكون هناك مكون إضافي يقوم بذلك نيابةً عنك.
من ناحية أخرى ، إذا كنت لا تستخدم CMS ، فستحتاج إلى إنشاء خريطة موقع XML يدويًا.
دعنا نقسم العملية:
كيفية إنشاء خريطة موقع XML يدويًا
إذا كنت قلقًا من أنه سيتعين عليك ترميز خريطة موقع XML يدويًا ، فلا تقلق!
هذه العملية ليست يدوية حقًا.
سنستخدم Screaming Frog للقيام بمعظم العمل نيابة عنك.
الخطوة الأولى هي تثبيت Screaming Frog SEO Spider.
نصيحة - يمكنك استخدام الإصدار المجاني إذا كان موقع الويب الخاص بك أقل من ثلاثمائة صفحة.
بمجرد التثبيت ، انتقل إلى "الوضع" ثم "العنكبوت".
بعد ذلك ، قم بإسقاط عنوان URL لصفحتك الرئيسية في المربع المكتوب عليه "أدخل عنوان URL إلى العنكبوت".
ثم اضغط على "ابدأ".
سيبدأ Screaming Frog بعد ذلك في الزحف إلى موقع الويب الخاص بك.
بمجرد اكتمال الزحف ، نقوم بعد ذلك بضبط بعض الإعدادات:

نظرًا لأن Google لا تستخدم <changefreq> و <الأولوية> ، فإنني أوصي باستبعاد هذه العلامات من ملف خريطة الموقع.
أقترح أيضًا حذف <lastmod> من خريطة موقع XML إذا كنت تقوم بإنشاء خريطة موقع XML يدويًا.
لماذا ا؟
لأنه يمثل ألمًا حقيقيًا الحاجة إلى إعادة إنشاء خريطة موقع XML في كل مرة تقوم فيها بإجراء تغييرات طفيفة على الصفحة.
يعني استبعاد <lastmod> من خريطة موقع XML أنك لست مضطرًا إلى ذلك.
قبل استخراج ملف Sitemap ، يمكنك إضافة عناوين URL أو تعديلها أو حذفها بناءً على ما تريد أن تزحف إليه محركات البحث وفهرستها.
بمجرد الانتهاء من ضبط ملف Sitemap الخاص بك ، يمكنك بعد ذلك تحميله إلى المجلد الجذر لموقع الويب الخاص بك ، باستخدام "sitemap.xml" كاسم ملفه.
بسيط جدا ، أليس كذلك؟
كيفية إنشاء خريطة موقع XML في WordPress
قد يكون الأمر مفاجئًا ، لكن تثبيت WordPress "خارج الصندوق" لا يأتي مع منشئ خريطة موقع XML.
لإنشاء خريطة موقع XML في WordPress ، ستحتاج إلى مكون إضافي ، مثل Yoast SEO.
فيما يلي كيفية إضافة Yoast إلى موقع الويب الخاص بك ، إذا لم يكن مثبتًا لديك بالفعل:
داخل لوحة تحكم WordPress الخاصة بك ، انتقل إلى "الإضافات" ثم "إضافة جديد".
بعد ذلك ، ابحث عن "Yoast SEO".

ثم انقر فوق "التثبيت الآن" في النتيجة الأولى ، ثم "تنشيط".
بمجرد تثبيت Yoast ، انتقل إلى إعدادات Yoast ، وحدد "SEO" ثم "خرائط مواقع XML" ثم "عام".
في علامة التبويب هذه ، تأكد من "تعيين وظيفة خريطة موقع XML على" ممكّن ".
مع تشغيل خرائط مواقع XML ، يجب أن تشاهد الآن فهرس خريطة الموقع على yourdomain.com/sitemap_index.xml.

لحسن الحظ ، يستبعد Yoast تلقائيًا الصفحات غير القابلة للفهرسة (على سبيل المثال ، تلك التي تحتوي على علامة meta robots "بدون فهرس") من تضمينها في خريطة الموقع. مع ذلك ، يجب أن يكون الإعداد القياسي جيدًا في معظم الحالات.
ومع ذلك ، إذا كنت ترغب في ذلك ، يمكنك اختيار استبعاد أنواع معينة من المنشورات والتصنيفات لتحسين خريطة موقعك بشكل أكبر:

بالنسبة إلى موقع Sherpa لتحسين محركات البحث ، فقد استبعدت الوسائط والعلامات من خريطة موقعي ، لأنه في حالتي على الأقل ، هذه الصفحات لها قيمة قليلة للمستخدمين النهائيين.
كيفية إنشاء خريطة موقع XML في Wix
على عكس WordPress ، فإن Wix لديها وظيفة XML sitemap مضمنة.
المشكلة هي أنها محدودة جدًا.
الخيار الوحيد الذي لديك هو استبعاد صفحات معينة.
إذا كنت ترغب في استبعاد صفحة ما ، فتوجه إلى علامة تبويب إعدادات "SEO (Google)" للصفحة وقم بإيقاف تشغيل "إظهار هذه الصفحة في نتائج البحث".

يؤدي هذا إلى إضافة علامة وصفية noindex إلى الصفحة واستبعادها من خريطة موقع XML.
يتمثل أحد التحديات التي تواجه وظيفة Wix الصارمة لخريطة الموقع في أنها تتضمن عناوين URL تم تحويلها إلى صفحة أخرى.
يشير هذا بشكل أساسي إلى "ترتيب هذه الصفحة" و "عدم ترتيب هذه الصفحة" في نفس الوقت وهو أمر محير للغاية لمحركات البحث.
قد تكون نتيجة ذلك ظهور نسخة خاطئة على صفحات نتائج البحث.
إذا كان لديك موقع ويب Wix ، فيمكنك العثور على خريطة الموقع التي تم إنشاؤها تلقائيًا على yourdomain.com/sitemap.xml.
كيفية إنشاء خريطة موقع XML في Shopify
لا تحتاج إلى إنشاء خريطة موقع XML إذا كان موقعك مصممًا باستخدام Shopify ، فسيتم ذلك من أجلك تلقائيًا.
لسوء الحظ ، لا يوجد أي تخصيص ممكن.
مع Shopify ، لا يمكنك حتى استبعاد صفحة من خريطة موقع XML - كل شيء مضمن.
الطريقة الوحيدة للتحكم في ما يظهر في نتائج البحث هي إضافة علامة noindex إلى الملفات السائلة مباشرة.
لا يزال ، في Shopify سيتم عرض الصفحات غير المفهرسة في خريطة الموقع XML ، والتي كما أشرنا سابقًا ليست مثالية.
ابحث عن خريطة موقعك على yourdomain.com/sitemap.xml.
كيفية إرسال خريطة الموقع إلى Google
الآن ، يجب أن يكون لديك خريطة الموقع الخاصة بك.
الخطوة الأخيرة (وربما الأكثر أهمية) هي إرسال خريطة موقعك إلى Google.
بالطبع ، قبل القيام بذلك ، تحتاج إلى معرفة مكان وجود ملف Sitemap الخاص بك.
إذا كنت قد أنشأت خريطة موقعك يدويًا ، أو كنت تستخدم Wix أو Shopify ، فيمكن العثور على خريطة موقعك على عنوان URL التالي:
yourdomain.com/sitemap.xml
من ناحية أخرى ، إذا كان موقعك موجودًا على WordPress واستخدمت Yoast لملف sitemap.xml الخاص بك ، فستجد فهرس خريطة الموقع على عنوان URL هذا:
yourdomain.com/sitemap_index.xml
إذا كنت تستخدم نظامًا أساسيًا آخر - أو لا يمكنك العثور على خريطة موقعك في أي من تلك المواقع ، فيمكنك التحقق من خريطة موقعك باستخدام أداة ممهدة تحسين محركات البحث (SEO) الخاصة بنا:

بمجرد أن تعرف مكان وجود خريطة موقع XML الخاصة بك ، انتقل إلى Google Search Console ثم "خرائط المواقع" التي ستجدها ضمن قائمة "الفهرس".
بعد ذلك ، الصق عنوان URL لخريطة الموقع في حقل خريطة الموقع واضغط على "إرسال".
"يجب" إرسال ملف Sitemap الخاص بك بنجاح:

وبهذا تكون قد انتهيت!
7 أفضل الممارسات "الأساسية" لخريطة موقع XML
دعنا ننتهي بسلسلة من أفضل الممارسات لخريطة موقع XML.
ستحتاج إلى تنفيذ هذه الأساليب للتأكد من أن خريطة موقع XML الخاصة بك مُحسَّنة من أجل الزحف والفهرسة الفعالين.
دعنا نقفز.
(1). استخدم ملف Sitemap ديناميكي وليس ملف Sitemap ثابت
تخيل أن تضطر إلى تحديث خريطة موقع XML يدويًا كلما أجريت تغييرات على موقع الويب الخاص بك ؟!
حسنًا ، هذا هو بالضبط ما يجب أن تفعله بخريطة الموقع الثابتة.
لحسن الحظ ، تحتوي معظم أنظمة إدارة المحتوى الحديثة على وظائف خريطة موقع XML ديناميكية مدمجة - أو متوفرة عبر مكون إضافي.
مما يعني:
سيتم تحديث ملف Sitemap تلقائيًا عند إضافة أو تغيير أو إزالة صفحات موجودة.
لا حاجة للتدخل اليدوي.
يعد استخدام خريطة موقع ديناميكية أمرًا مهمًا بشكل خاص لمواقع الويب الكبيرة حيث تتم إضافة الصفحات ذات الأولوية بشكل متكرر.
تأكد من استخدام واحد.
(2). استخدم الاسم والموقع القياسي لملف Sitemap
إذا كنت ستستخدم /my_website_sitemap.xml كمسار لخريطة موقع XML ، فهناك احتمال ألا تجده محركات البحث.
لضمان سهولة اكتشاف ملف Sitemap ، التزم بالمواقع القياسية:
https://yourdomain.com/sitemap.xml لملفات Sitemap الفردية
أو
https://yourdomain.com/sitemap_index.xml عندما يكون لديك خرائط مواقع متعددة في فهرس.
بكل بساطة.
(3). قم بالإشارة إلى خريطة موقع XML الخاصة بك في ملف Robots.txt الخاص بك
تتم زيارة ملف robots.txt الخاص بك بواسطة روبوتات محركات البحث عندما تبدأ في الزحف إلى موقع الويب الخاص بك.
يستخدمون ملف robots.txt لفهم كيفية الزحف إلى الموقع.
من خلال الرجوع إلى خريطة موقع XML الخاصة بك داخل ملف robots.txt ، فإنك تتأكد من أن روبوتات البحث يمكنها العثور عليها.
لإضافة خريطة موقع XML إلى ملف robots.txt ، افتح الملف النصي لبرامج الروبوت والصق هذا السطر فيه:
Sitemap: https://www.yourdomain.com/sitemap.xml
يمكنك العثور على ملف robots.txt في الدليل الجذر لخادمك على مسار "/robots.txt".
إذا كان لديك العديد من خرائط مواقع XML ، فقم بإدراجها واحدة تلو الأخرى كما يلي:
Sitemap: https://www.yourdomain.com/page-sitemap.xml Sitemap: https://www.yourdomain.com/post-sitemap.xml Sitemap: https://www.yourdomain.com/product-sitemap.xml
بينما من الناحية النظرية ، يمكنك وضع موقع ملف Sitemap في أي مكان داخل ملف robots.txt ، ومن الأفضل وضعه بشكل عام في النهاية:

(4). استبعد صفحات Noindex من ملف Sitemap الخاص بك
يتمثل دور خريطة موقع XML في إخبار محركات البحث بما يجب الزحف إليه وفهرسته.
هذا يعني أنه يجب تضمين صفحاتك المفضلة التي تستحق الترتيب فقط.
ستؤدي إضافة Noindex أو صفحات غير أساسية أو إعادة توجيه إلى ملف Sitemap الخاص بك إلى إرباك محركات البحث وقد تؤثر سلبًا على ميزانية الزحف الخاصة بك.
(5). احتفظ بخريطة XML الخاصة بك أقل من 50 ميغا بايت
وفقًا لـ Google ، يجب ألا يتجاوز ملف Sitemap بتنسيق XML 50 ميغابايت أو 50000 عنوان URL.

متى تجاوزت حد عنوان URL البالغ 50 ميغابايت أو 50000 ، فيجب عليك تقسيم ملف Sitemap الفردي بتنسيق XML إلى عدة ملفات Sitemap بتنسيق XML.
قد يؤدي تجاوز هذه الحدود إلى توقف Google عن الزحف.
على سبيل المثال ، يمكنك تقسيم خريطة الموقع إلى "مشاركات" و "صفحات".

ثم قم بتجميعها معًا في ملف فهرس خريطة الموقع.
(6). تجاهل سمات الأولوية و Changefreq
كما أشرت سابقًا ، تتجاهل Google هاتين العلامتين:
- <changefreq>
- <الأولوية>
وهذا يعني ، بما في ذلك سمات التكرار والأولوية ، أن يضيف فقط إلى الوزن غير الضروري في خريطة الموقع ، مما قد يؤدي إلى الزحف إلى مشاكل الميزانية والفهرسة.
أوصيك بعدم استخدام علامات <changefreq> أو <الأولوية> في خريطة الموقع على الإطلاق.
(7). راقب Google Search Console بحثًا عن أخطاء خريطة موقع XML
إذا لم تتمكن Google من الزحف إلى خريطة موقع XML الخاصة بك ، فسوف تخبرك عبر Search Console:

يمكن أن تكون الأخطاء مباشرة مثل عدم إمكانية جلب عنوان URL لخريطة موقع XML ، إلى عناوين URL المرسلة التي تعرض رموز الحالة 404 أو بدون فهرس.

تميل المشكلات الأكثر شيوعًا إلى أن تكون:
(أ). لم يتم العثور على عنوان URL الذي تم إرساله (404)
هذا يعني أن عنوان URL الذي أرسلته في خريطة موقع XML الخاص بك غير موجود.
تذكر ، إذا قمت بإزالة صفحة من موقع الويب الخاص بك ، فلا تنس إزالتها من خريطة الموقع. والأفضل من ذلك ، استخدم خريطة موقع XML ديناميكية وستتم إزالة عنوان URL من خريطة الموقع تلقائيًا.
(ب). تم وضع علامة "noindex" على عنوان URL الذي تم إرساله
يحدث هذا عندما تحتوي صفحة في خريطة موقع XML على علامة وصفية "noindex".
إذا كنت تريد فهرسة هذه الصفحة ، يجب عليك إزالة علامة وصفية "noindex". إذا كنت لا تريد فهرسته ، فقم بإزالته من ملف Sitemap الخاص بك.
في كلتا الحالتين ، يجب إصلاحه.
(ج). تم حظر عنوان URL الذي تم إرساله بواسطة ملف robots.txt
يحدث هذا عندما يتم حظر إحدى الصفحات الموجودة في ملف Sitemap بتنسيق XML بواسطة ملف robots.txt.
في الأساس ، هناك توجيه في ملف robots.txt يخبر محركات البحث بعدم الزحف إلى الصفحة ، على الرغم من أنك طلبت من محركات البحث القيام بذلك عن طريق إرسالها للفهرسة.
إذا كنت تريد بالفعل فهرسة عنوان URL ، فابحث عن التوجيه وقم بإزالته من ملف robots.txt الخاص بك.

حاول اختبار صفحتك باستخدام أداة اختبار ملف robots.txt للكشف عن الجاني.
وهناك لديك؛ سبعة من أفضل الممارسات لخريطة موقع XML.
ما رأيك؟
الآن أود أن أسمع منك:
أي تقنية من منشور اليوم ستستخدمها أولاً؟
ما هي التغييرات التي ستقوم بإجرائها على خريطة موقع XML الخاصة بك كنتيجة لقراءة منشور اليوم؟
ربما ستنتقل من دليل إلى خريطة موقع XML آلية؟ أو ربما ستحذف علامة <changefreq>؟
في كلتا الحالتين ، اسمحوا لي أن أعرف من خلال ترك تعليق أدناه.