XML Sitemap คืออะไรและคุณสามารถสร้างแผนผังเว็บไซต์สำหรับ SEO ได้อย่างไร (พร้อมตัวอย่าง)

เผยแพร่แล้ว: 2022-01-25

แผนผังเว็บไซต์ XML ขนาดเล็ก แผนผังเว็บไซต์ XML เป็นหนึ่งในส่วนที่เข้าใจผิดมากที่สุดของสมการ SEO

ฉันเคยเจอ SEO ที่ไม่สามารถอธิบายได้ว่าทำไมจึงจำเป็น นับประสาบอกวิธีตั้งค่าให้ "ถูกต้อง"

นี่คือการถู:

เช่นเดียวกับแผนที่เป็นสิ่งจำเป็นในการค้นหาปลายทางของคุณโดยทางถนน แผนผังเว็บไซต์ XML ก็มีความสำคัญสำหรับเครื่องมือค้นหาเพื่อค้นหา URL เว็บไซต์ของคุณ

หากไม่มีการรวบรวมข้อมูล URL ของคุณจะไม่ได้รับการจัดทำดัชนี และหน้าเว็บของคุณจะไม่จัดอันดับ (แน่นอน) หากไม่มีการทำดัชนี

กล่าวโดยย่อ แผนผังเว็บไซต์ XML มีบทบาทสำคัญในการเพิ่มประสิทธิภาพกลไกค้นหา

ในโพสต์ของวันนี้ ฉันจะแสดงวิธีสร้างแผนผังเว็บไซต์ XML ตั้งแต่เริ่มต้นและปรับให้เหมาะสมที่สุดสำหรับ SEO ทีละขั้นตอน ฉันครอบคลุม:

  • แผนผังเว็บไซต์ XML คืออะไร
  • แผนผังเว็บไซต์ XML กับ HTML
  • แท็กแผนผังเว็บไซต์ XML (และแท็กใดที่คุณควรใช้)
  • ตัวอย่างแผนผังเว็บไซต์ XML
  • ทำไมคุณถึงต้องการแผนผังไซต์ XML
  • วิธีสร้างแผนผังเว็บไซต์ XML
  • แนวทางปฏิบัติที่ดีที่สุดหกประการสำหรับการสร้าง sitemap.xml

เพื่อไม่ให้เป็นการเสียเวลา เรามาโดดกัน

XML Sitemap คืออะไร? (และทำไมคุณควรดูแล Heck)

ในแง่ง่ายๆ:

แผนผังเว็บไซต์ XML เป็นแผนงานสำหรับเครื่องมือค้นหา

มันแสดงรายการเนื้อหาที่สำคัญของเว็บไซต์ของคุณในรูปแบบ XML เพื่อให้เครื่องมือค้นหาสามารถค้นหาและจัดทำดัชนีเนื้อหาของคุณได้อย่างง่ายดายและในที่สุดก็แสดงในหน้าผลลัพธ์ของเครื่องมือค้นหา

แผนผังเว็บไซต์ XML คืออะไร

คุณควรแสดงรายการหน้าเว็บ (หรือไฟล์) ในแผนผังเว็บไซต์ XML ที่คุณต้องการให้แสดงในเครื่องมือค้นหา

ทำไม

เนื่องจากแผนผังเว็บไซต์ทำให้มั่นใจได้ว่าเนื้อหาของคุณจะถูกค้นพบได้

สมมติว่าคุณมีหน้าเว็บที่ไม่ได้เชื่อมโยงจากที่ใดก็ได้ในไซต์ของคุณ – หรือเว็บโดยรวม หากหน้าเหล่านั้นไม่มีไฮเปอร์ลิงก์ที่ชี้ไปยังหน้าเหล่านั้น โปรแกรมรวบรวมข้อมูลเว็บจะไม่พบหน้าเหล่านั้น

แผนผังไซต์ XML (ส่งไปยังเสิร์ชเอ็นจิ้น) ช่วยให้มั่นใจได้ว่าเสิร์ชเอ็นจิ้นสามารถค้นหาหน้าใด ๆ ที่คุณต้องการรวมไว้ใน SERP

แต่นั่นไม่ใช่ทั้งหมด

คุณสามารถใช้แผนผังไซต์ XML เพื่อให้ข้อมูลเพิ่มเติมแก่เครื่องมือค้นหา เช่น เนื้อหาของคุณได้รับการอัปเดตครั้งล่าสุดเมื่อใด และหน้าใดมีลำดับความสำคัญสูงกว่า เพิ่มเติมในภายหลัง

แผนผังเว็บไซต์ XML กับ HTML – ความแตกต่างคืออะไร

คุณสามารถเพิ่มแผนผังเว็บไซต์สองประเภทในเว็บไซต์ของคุณ แผนผังไซต์ XML และแผนผังไซต์ HTML

  • แผนผังเว็บไซต์ XML ใช้ภาษามาร์กอัปที่ขยายได้ (XML)
  • แผนผังเว็บไซต์ HTML ใช้ภาษามาร์กอัปไฮเปอร์เท็กซ์ (HTML)
แผนผังเว็บไซต์ XML กับ HTML

แต่นอกเหนือจากโค้ดที่พวกเขาใช้ พวกเขายังทำหน้าที่ต่างๆ อีกด้วย:

XML Sitemap

เริ่มต้นด้วยตัวอย่างแผนผังเว็บไซต์ XML:

ตัวอย่างแผนผังเว็บไซต์ XML

อย่างที่คุณเห็น แผนผังเว็บไซต์ XML ไม่เป็นมิตรกับมนุษย์

แผนผังเว็บไซต์ XML เป็นฟีดที่ออกแบบมาอย่างชัดเจนสำหรับเครื่องมือค้นหา

ช่วยให้เครื่องมือค้นหาเช่น Google เข้าใจว่า URL ใดที่จะรวบรวมข้อมูลและสิ่งใดที่ได้รับความสำคัญ

นอกจากนี้ URL เหล่านั้นเปลี่ยนแปลงบ่อยเพียงใด และมีการเพิ่ม URL ใหม่ใดในเว็บไซต์

ความถี่ในการรวบรวมข้อมูลแผนผังเว็บไซต์ XML

ข้อมูลนี้ช่วยให้ตัวจัดกำหนดการเครื่องมือค้นหาสามารถประเมินเวลาและความถี่ในการรวบรวมข้อมูล URL หนึ่งๆ ได้ดียิ่งขึ้น

HTML แผนผังเว็บไซต์

นี่คือตัวอย่างของแผนผังเว็บไซต์ HTML:

ตัวอย่างแผนผังเว็บไซต์ HTML

มันดูแตกต่างจากแผนผังเว็บไซต์ XML มาก

นั่นเป็นเพราะมันเป็นหน้าเว็บที่ออกแบบมาสำหรับมนุษย์ – เช่นเดียวกับหุ่นยนต์

สำหรับมนุษย์ แผนผังไซต์ HTML ช่วยในการนำทางผ่านเว็บไซต์ได้ดีขึ้น

จากมุมมองของเครื่องมือค้นหา แผนผังเว็บไซต์ HTML เป็นเครื่องมือที่มีประโยชน์สำหรับการค้นพบ URL (สมมติว่ามีการรวบรวมข้อมูลแผนผังเว็บไซต์และตามลิงก์ที่อยู่ในแผนผังเว็บไซต์)

แต่นั่นไม่ใช่คุณค่าเดียวของพวกเขาสำหรับ SEO:

แผนผังเว็บไซต์ HTML ยังกระจาย PageRank ทั่วทั้งเว็บไซต์

เนื่องจากแผนผังไซต์ HTML มักจะเชื่อมโยงจากทุกหน้าในไซต์ (ผ่านลิงก์การนำทางในส่วนท้าย) จึงมี PageRank จำนวนมากที่ไหลเข้ามา

ส่วนท้ายของเว็บไซต์

ซึ่งหมายความว่าพวกเขาสามารถส่ง PageRank ที่เข้ามาไปยังหน้าอื่น ๆ บนเว็บไซต์ผ่านลิงค์ภายใน

มีเพจที่อันดับไม่ดี?

เพิ่มหน้านั้นลงในแผนผังเว็บไซต์ HTML ของคุณ

อาจเป็นวิธีที่ง่ายและรวดเร็วในการเพิ่มอันดับ

แผนผังไซต์ XML มีลักษณะอย่างไร

ตามที่ฉันได้กล่าวไปแล้ว แผนผังเว็บไซต์ XML มีไว้สำหรับเสิร์ชเอ็นจิ้น ไม่ใช่มนุษย์

พวกเขาอาจดูสับสนอย่างแน่นอนหากคุณไม่เคยพบเจอมาก่อน:

 <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26T19:12:36+09:00</lastmod> <changefreq>Daily</changefreq> <priority>1</priority> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16T13:21:20+09:00</lastmod> <changefreq>Daily</changefreq> <priority>0.8</priority> </url> </urlset> <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26T19:12:36+09:00</lastmod> <changefreq>Daily</changefreq> <priority>1</priority> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16T13:21:20+09:00</lastmod> <changefreq>Daily</changefreq> <priority>0.8</priority> </url> </urlset>

อย่างไรก็ตาม เมื่อคุณรู้ว่าแต่ละองค์ประกอบเหล่านี้หมายถึงอะไร:

  • การประกาศ XML
  • URL set
  • URL
  • แก้ไขล่าสุด
  • ลำดับความสำคัญ
  • เปลี่ยนความถี่

แผนผังเว็บไซต์ XML ค่อนข้างตรงไปตรงมา

มาแยกแต่ละอันกัน:

การประกาศ XML

พูดง่ายๆ ก็คือ การประกาศ XML จะบอกเครื่องมือค้นหาว่าพวกเขากำลังอ่านไฟล์ XML

 <?xml version="1.0" encoding="UTF-8"?>

การประกาศ XML ยังระบุเวอร์ชัน XML และการเข้ารหัสอักขระที่ใช้

  • เวอร์ชันควรเป็น 1.0
  • การเข้ารหัสต้องเป็น UTF‑8

วางการประกาศ XML ที่ด้านบนของไฟล์ sitemap.xml

URL Set

ชุด URL เป็นคอนเทนเนอร์สำหรับ URL ทั้งหมดในแผนผังเว็บไซต์

เริ่มต้นด้วยการระบุโปรโตคอลมาตรฐานที่ sitemap.xml ใช้:

 <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

คุณจะสังเกตเห็นโปรโตคอลที่กล่าวถึงในตัวอย่างข้างต้นเป็นมาตรฐาน 0.9

Google, Yahoo และ Microsoft สนับสนุนมาตรฐานแผนผังไซต์นี้ ซึ่งเป็นมาตรฐานที่ฉันแนะนำให้คุณใช้

สิ่งสำคัญคือต้องสังเกตว่า urlset ถูกปิดที่ด้านล่างของเอกสาร XML:

 </urlset>

โค้ดสั้นๆ นี้จะบอกเครื่องมือค้นหาว่าชุด URL สิ้นสุดแล้ว

URL

แท็ก <URL> เป็นแท็กหลักสำหรับแต่ละ URL ในแผนผังไซต์ XML:

 <url> <loc>https://seosherpa.com/services/</loc> </url> <url> <loc>https://seosherpa.com/services/</loc> </url>

ระหว่าง <url> เปิดและปิด </url> คุณต้องระบุตำแหน่งของ URL ในแท็ก <loc> ที่ซ้อนกัน

สิ่งสำคัญที่นี่คือคุณระบุ URL ที่สมบูรณ์ ซึ่งรวมถึงโปรโตคอล HTTP:// หรือ HTTPS://

กล่าวคือ ระบุ URL ให้ตรงตามที่จะปรากฏในเว็บเบราว์เซอร์

URL ในเบราว์เซอร์

ในทางกลับกัน URL สัมพัทธ์เช่น /services/ จะไม่เป็นที่รู้จัก

ตำแหน่ง URL เป็นแอตทริบิวต์เดียวที่ต้องระบุระหว่างแท็ก URL

แต่จากที่กล่าวมามีคุณสมบัติเพิ่มเติม (ไม่บังคับ) อีกสามรายการที่สามารถรวมได้:

แก้ไขล่าสุด

แท็ก <lastmod> กำหนดว่าเนื้อหาใน URL นั้นมีการเปลี่ยนแปลงครั้งล่าสุดเมื่อใด

 <lastmod>2022-01-26T19:12:36+09:00</lastmod>

สมมติว่าคุณอัปเดตบล็อกโพสต์เมื่อวันที่ 10 มกราคม 2022 แอตทริบิวต์ <lastmod> จะอ่าน 2022-01-10

โดยจะบอกเครื่องมือค้นหาว่าเนื้อหาใน URL นั้นได้รับการแก้ไขครั้งล่าสุดเมื่อใด ซึ่ง ในทางทฤษฎี มีอิทธิพลต่อเมื่อเครื่องมือค้นหารวบรวมข้อมูลหน้านั้นซ้ำ

คุณยังสามารถระบุเวลาได้ แต่ไม่จำเป็น

ไม่ว่าคุณจะใส่เฉพาะวันที่หรือเวลาด้วย อย่าลืมใช้รูปแบบ "วันที่และเวลา W3C"

เป็นรูปแบบเดียวที่รู้จักสำหรับ <lastmod> แท็กใน sitemap.xml

ลำดับความสำคัญ

แท็ก <priority> ระบุลำดับความสำคัญของ URL ที่สัมพันธ์กับ URL อื่นทั้งหมดบนเว็บไซต์

 <priority>0.8</priority>

กล่าวอีกนัยหนึ่ง ช่วยให้คุณสามารถบอกเครื่องมือค้นหาว่า URL ใด ควร มีความสำคัญกว่าเมื่อพวกเขาจัดสรรงบประมาณการรวบรวมข้อมูลไปยังไซต์ของคุณ

สามารถตั้งค่าลำดับความสำคัญได้ตั้งแต่ 0.0 ซึ่งเป็นระดับความสำคัญต่ำสุด ถึง 1.0 ซึ่งเป็นระดับความสำคัญสูงสุด

ปัญหาคือ Google เพิกเฉยต่อ <priority> ในแผนผังเว็บไซต์ XML เพราะในคำพูดของ Gary Illyes "มันเป็นถุงขยะ"

ดังนั้นจึงไม่มีประเด็นในการกำหนดลำดับความสำคัญเลย

เปลี่ยนความถี่

ในขณะที่แท็ก <lastmod> เป็นตัวกำหนดว่าเนื้อหาใน URL นั้นมีการเปลี่ยนแปลงครั้งล่าสุดเมื่อใด...

แท็ก <changfreq> ระบุว่าเนื้อหามี แนวโน้ม ที่จะเปลี่ยนแปลงบ่อยเพียงใด

 <changefreq>Daily</changefreq>

โดยมีวัตถุประสงค์เพื่อให้เครื่องมือค้นหาทราบว่าพวกเขาต้องการรวบรวมข้อมูล URL ซ้ำบ่อยเพียงใด

ความถี่ในการเปลี่ยนแปลงในแผนผังเว็บไซต์ XML สามารถตั้งค่าเป็นค่าใดค่าหนึ่งต่อไปนี้:

  • เสมอ
  • รายชั่วโมง
  • รายวัน
  • รายสัปดาห์
  • รายเดือน
  • รายปี
  • ไม่เคย

หากแท็กถูกตั้งค่าเป็น <changefreq>รายสัปดาห์</changefreq> เครื่องมือค้นหา อาจ ต้องการรวบรวมข้อมูล URL นั้นซ้ำทุกเจ็ดวัน

การทำเช่นนี้บ่อยกว่าที่จะเป็นการสิ้นเปลืองเนื่องจากเนื้อหาไม่น่าจะเปลี่ยนแปลงไป

อย่างไรก็ตาม <changefreq> นั้นล้าสมัยไปแล้วเมื่อเทียบกับ Google:

เนื่องจากโปรแกรมสร้างแผนผังเว็บไซต์ส่วนใหญ่ทำงานที่แย่มากในการจับคู่แท็ก <changefreq> กับความถี่ที่แท้จริงของการเปลี่ยนแปลง คุณจึงเข้าใจได้ง่ายว่าทำไม

คุณสามารถละเว้นแอตทริบิวต์การเปลี่ยนแปลงความถี่จาก sitemap.xml ของคุณ

ตัวอย่างแผนผังเว็บไซต์ XML

ตอนนี้เรารู้แล้วว่าแผนผังเว็บไซต์ XML คืออะไร เรามาดูตัวอย่าง sitemap.xml ที่ปรากฏในโลกแห่งความเป็นจริงกัน

นี่คือแผนผังเว็บไซต์ XML สำหรับหน้าของ Gymshark:

แผนผังไซต์นี้สามารถปรับปรุงได้โดยการลบ <changefreq> เนื่องจาก Google ละเว้นและโดยการเพิ่มการประกาศ XML ที่จุดเริ่มต้นของ XML แผนผังไซต์

(การรวมการประกาศ XML เป็นแนวทางปฏิบัติที่ดีที่สุดสำหรับแผนผังเว็บไซต์ทั้งหมด)

นี่คือตัวอย่างแผนผังเว็บไซต์ XML อีกตัวอย่าง คราวนี้จาก yasisland.ae

ตัวอย่างแผนผังเว็บไซต์ XML

เช่นเดียวกับแผนผังเว็บไซต์ของ Gym Shark แผนผังเว็บไซต์นี้สามารถปรับปรุงได้โดยการเพิ่มการประกาศ XML ที่จุดเริ่มต้น

นอกจากนี้ ความถี่ในการเปลี่ยนแปลงและลำดับความสำคัญสามารถลบออกได้เนื่องจากมีความซ้ำซ้อนในทุกวันนี้

นอกจากนั้น แผนผังเว็บไซต์ XML เหล่านี้ได้รับการตั้งค่าอย่างถูกต้อง

ในขั้นตอนนี้ คุณคงกำลังถามตัวเองว่า

แผนผังเว็บไซต์ XML ที่เหมาะสมที่สุดมีลักษณะอย่างไร

บางอย่างเช่นนี้:

 <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26</lastmod> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16</lastmod> </url> </urlset> <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://seosherpa.com/</loc> <lastmod>2022-01-26</lastmod> </url> <url> <loc>https://seosherpa.com/services/</loc> <lastmod>2021-11-16</lastmod> </url> </urlset>

ควรมี:

  • การประกาศ XML (เวอร์ชัน)
  • URL set
  • URL
  • แก้ไขล่าสุด (วันที่เท่านั้น)
ตัวอย่างแผนผังเว็บไซต์ XML

และนั่นคือทั้งหมด

เหตุใดฉันจึงต้องการแผนผังไซต์ XML

ดังที่ฉันอธิบายไว้ก่อนหน้านี้ เครื่องมือค้นหาค้นพบเนื้อหาบนเว็บโดยการรวบรวมข้อมูลจากหน้าเว็บหนึ่งไปยังอีกหน้าเว็บหนึ่งโดยใช้บอทที่มักเรียกกันว่า "แมงมุม":

แมงมุมค้นหาการรวบรวมข้อมูล

เมื่อสไปเดอร์เหล่านี้ค้นพบหน้าใหม่ผ่านทางลิงก์ภายในหรือภายนอก พวกเขาจะเพิ่มหน้านั้นในดัชนีของตน

แต่ปัญหาเกี่ยวกับการรวบรวมข้อมูล?

เครื่องมือค้นหาไม่พบเนื้อหาทั้งหมดบนเว็บในลักษณะนั้น

หากหน้าเว็บไม่ได้เชื่อมโยงผ่านหน้าอื่นที่รู้จัก เครื่องมือค้นหาจะไม่พบ

นี่คือที่มาของแผนผังเว็บไซต์ XML

แผนผังเว็บไซต์ XML ทำหน้าที่เป็นตัวประกันสำหรับการรวบรวมข้อมูล โดยแจ้งเครื่องมือค้นหาว่าจะหาหน้าที่สำคัญที่สุดในเว็บไซต์ของคุณได้ที่ไหน เพื่อช่วยในการค้นหาเนื้อหาและจัดทำดัชนี

นี่เป็นสิ่งสำคัญเนื่องจากเครื่องมือค้นหาไม่สามารถจัดอันดับเนื้อหาของคุณโดยไม่สร้างดัชนีก่อน

เว็บไซต์ประเภทใดที่ต้องการแผนผังไซต์ XML

หากคุณทำตามคำแนะนำของ Google แผนผังเว็บไซต์ XML จะดีที่สุดสำหรับ:

  • เว็บไซต์ขนาดใหญ่ที่มีหลายพันหน้า
  • เว็บไซต์ที่มีเอกสารสำคัญมากมาย
  • เว็บไซต์ที่มีเนื้อหาสื่อสมบูรณ์มากมาย
  • เว็บไซต์ที่มีลิงก์ย้อนกลับไม่มากหรือน้อย

แต่นี่คือสิ่งที่:

เว็บไซต์ทั้งหมดได้รับประโยชน์จากการมีแผนผังเว็บไซต์ XML

เมื่อคุณรวมแผนผังไซต์ XML บอทของเครื่องมือค้นหาจะสามารถเข้าใจโครงสร้างของไซต์ของคุณได้ดีขึ้น ค้นพบเนื้อหาของคุณ และรู้ว่าเมื่อใดที่มีการอัปเดตครั้งล่าสุด

แม้ว่าคุณจะมีเว็บไซต์แบบหน้าเดียว รวมถึงแผนผังเว็บไซต์ XML ก็ถือว่าคุ้มค่า

หน้าใดที่คุณควรรวมไว้ในแผนผังไซต์ XML ของคุณ

คำตอบสั้น ๆ :

รวมหน้าใด ๆ ที่คุณต้องการแสดงในผลการค้นหาในแผนผังเว็บไซต์ XML ของคุณและทิ้งทุกอย่างที่เหลือ

กล่าวอีกนัยหนึ่ง แผนผังเว็บไซต์ควร มีเฉพาะ หน้าที่มีประโยชน์เท่านั้น สิ่งที่ชอบ:

  • หน้าแรก
  • เกี่ยวกับเพจ
  • หน้าสินค้า
  • หน้าบริการ
  • หน้าติดต่อ
  • โพสต์บล็อก

โดยทั่วไป คุณจะไม่รวมหน้าเช่น:

  • ขอบคุณเพจ
  • แท็กหน้า
  • ไฟล์สื่อส่วนตัว

นี่คือตัวอย่างทั้งหมดของ URL ที่คุณไม่ต้องการให้ปรากฏในผลการค้นหา

การรวมแผนผังเว็บไซต์ XML

แต่อย่าลืมว่า เพียงเพราะคุณละเว้นหน้าจากแผนผังเว็บไซต์ไม่ได้หมายความว่าหน้านั้นจะไม่ได้รับการจัดทำดัชนี

หากหน้านั้นมีลิงก์ที่ชี้ไปยังหน้านั้น มีโอกาสที่ Google (และเครื่องมือค้นหาอื่นๆ) จะรวบรวมข้อมูล จัดทำดัชนี และแสดงหน้านั้นในผลลัพธ์ของเครื่องมือค้นหา

เพื่อให้แน่ใจว่ามีการนำหน้าออกจากผลการค้นหา ให้ละเว้นหน้าจากแผนผังเว็บไซต์ XML และเพิ่มแท็กที่ไม่มีดัชนีลงในหน้านั้น

และสิ่งนี้นำฉันไปสู่จุดต่อไปของฉัน:

ทุกหน้าในแผนผังเว็บไซต์ XML ของคุณจะต้องจัดทำดัชนีได้

แผนผังไซต์ของคุณไม่ควรมีหน้าเว็บที่ส่งคืนรหัสสถานะเหล่านี้:

  • 404 – ไม่พบหน้า
  • 301 หรือ 302 – เพจถูกย้ายไปที่อื่น

รหัสสถานะ 4XX และ 3XX บอกเครื่องมือค้นหาว่าไม่มีหน้าอยู่ที่นั่น

และหากไม่มีหน้าใน URL นั้น จะไม่สามารถจัดทำดัชนีได้

นอกจากนี้:

ทุกหน้าจะต้องเข้าถึงได้สำหรับโปรแกรมรวบรวมข้อมูลของเครื่องมือค้นหา

กล่าวโดยย่อ robots.txt ไม่ได้บล็อกหน้า และไม่มีคำสั่ง (เช่น เมตาโรบ็อต ลิงก์ตามรูปแบบบัญญัติ หรือ x-robots-tags) ที่บอกให้เครื่องมือค้นหาไม่จัดทำดัชนีหน้า

เมื่อคุณทราบแล้วว่ามีอะไรรวมอยู่ในแผนผังไซต์ XML มาพูดคุยถึงวิธีสร้างแผนผังไซต์กัน

วิธีสร้างแผนผังเว็บไซต์ XML (2 วิธี)

หากคุณสร้างเว็บไซต์ของคุณโดยใช้ระบบจัดการเนื้อหา เช่น Shopify หรือ Wix คุณไม่จำเป็นต้องสร้างแผนผังเว็บไซต์ XML เนื่องจาก CMS จะสร้างแผนผังเว็บไซต์ให้กับคุณ

แผนผังเว็บไซต์ XML บนแพลตฟอร์มเหล่านี้ (และอื่น ๆ ที่คล้ายกัน) จะได้รับการอัปเดตโดยอัตโนมัติเมื่อมีการเพิ่มหรือลบหน้าออกจากไซต์

หาก CMS ของคุณไม่ทำเช่นนี้ แสดงว่ามักจะมีปลั๊กอินที่จะทำเพื่อคุณ

ในทางกลับกัน หากคุณไม่ได้ใช้ CMS คุณจะต้องสร้างแผนผังเว็บไซต์ XML ด้วยตนเอง

มาทำลายกระบวนการกัน:

วิธีสร้างแผนผังเว็บไซต์ XML ด้วยตนเอง

หากคุณกังวลว่าคุณจะต้องเขียนโค้ดแผนผังไซต์ XML ด้วยมือ ไม่ต้องกังวล!

กระบวนการนี้ไม่ได้ดำเนินการด้วยตนเองจริงๆ

เราจะใช้ Screaming Frog ทำงานส่วนใหญ่ให้คุณ

ขั้นตอนแรกคือการติดตั้ง Screaming Frog SEO Spider

เคล็ดลับ – คุณสามารถใช้เวอร์ชันฟรีได้หากเว็บไซต์ของคุณมีหน้าไม่ถึงสามร้อยหน้า

เมื่อติดตั้งแล้ว ให้ไปที่ 'Mode' ตามด้วย 'Spider'

ถัดไป วาง URL หน้าแรกของคุณลงในช่องที่ระบุว่า 'ป้อน URL ไปยังแมงมุม'

จากนั้นกด 'เริ่ม'

Screaming Frog จะเริ่มรวบรวมข้อมูลเว็บไซต์ของคุณ

เมื่อการรวบรวมข้อมูลเสร็จสิ้น ต่อไปเราจะปรับการตั้งค่าบางอย่าง:

การตั้งค่าแผนผังเว็บไซต์กบกรีดร้อง

เนื่องจาก Google ไม่ได้ใช้ <changefreq> และ <priority> ฉันขอแนะนำให้ยกเว้นแท็กเหล่านั้นจากไฟล์แผนผังเว็บไซต์

ฉันยังแนะนำให้ละเว้น <lastmod> จากแผนผังไซต์ XML ของคุณ หากคุณกำลังสร้างแผนผังไซต์ XML ด้วยตนเอง

ทำไม

เนื่องจากการสร้างแผนผังไซต์ XML ใหม่ทุกครั้งที่คุณทำการเปลี่ยนแปลงเล็กๆ น้อยๆ ในหน้านั้นเป็นความเจ็บปวดอย่างแท้จริง

การยกเว้น <lastmod> จากแผนผังไซต์ XML หมายความว่าคุณไม่จำเป็นต้องทำ

ก่อนที่คุณจะแยกไฟล์แผนผังเว็บไซต์ คุณสามารถเพิ่ม แก้ไข หรือลบ URL ได้ ขึ้นอยู่กับสิ่งที่คุณต้องการให้เครื่องมือค้นหารวบรวมข้อมูลและจัดทำดัชนี

เมื่อคุณปรับแต่งแผนผังไซต์ของคุณอย่างละเอียดแล้ว คุณสามารถอัปโหลดไปยังโฟลเดอร์รากของเว็บไซต์ของคุณ โดยมี "sitemap.xml" เป็นชื่อไฟล์

ค่อนข้างง่ายใช่มั้ย?

วิธีสร้างแผนผังเว็บไซต์ XML ใน WordPress

อาจเป็นเรื่องแปลกใจ แต่การติดตั้ง WordPress "แบบสำเร็จรูป" ไม่ได้มาพร้อมกับผู้สร้างแผนผังเว็บไซต์ XML

ในการสร้างแผนผังไซต์ XML ใน WordPress คุณจะต้องมีปลั๊กอิน เช่น Yoast SEO

ต่อไปนี้คือวิธีการเพิ่ม Yoast ลงในเว็บไซต์ของคุณ หากคุณยังไม่ได้ติดตั้ง:

ภายในแดชบอร์ด WordPress ของคุณ ให้ไปที่ 'ปลั๊กอิน' จากนั้น 'เพิ่มใหม่'

ถัดไป ค้นหา "Yoast SEO"

ปลั๊กอิน Yoast SEO

จากนั้นคลิก 'ติดตั้งทันที' ในผลลัพธ์แรก จากนั้นคลิก 'เปิดใช้งาน'

เมื่อติดตั้ง Yoast แล้ว ให้ไปที่การตั้งค่า Yoast แล้วเลือก 'SEO' จากนั้นเลือก 'XML Sitemaps' จากนั้นเลือก 'General'

บนแท็บนี้ ตรวจสอบให้แน่ใจว่า 'ฟังก์ชันแผนผังไซต์ XML ถูกตั้งค่าเป็น "เปิดใช้งาน"

เมื่อเปิดแผนผังเว็บไซต์ XML คุณจะเห็นดัชนีแผนผังเว็บไซต์ที่ yourdomain.com/sitemap_index.xml

Yoast ดัชนีแผนผังเว็บไซต์

โชคดีที่ Yoast จะแยกหน้าที่ไม่สามารถจัดทำดัชนีได้โดยอัตโนมัติ (เช่น หน้าที่มีแท็ก meta robots แบบไม่มีดัชนี) ไม่ให้รวมอยู่ในแผนผังเว็บไซต์ ด้วยเหตุนี้ การตั้งค่ามาตรฐานจึงน่าจะใช้ได้ในกรณีส่วนใหญ่

อย่างไรก็ตาม หากคุณต้องการ คุณสามารถเลือกที่จะไม่รวมโพสต์บางประเภทและการจัดหมวดหมู่เพื่อเพิ่มประสิทธิภาพแผนผังไซต์ของคุณต่อไป:

ตั้งค่าแผนผังเว็บไซต์ Yoast XML

สำหรับไซต์ SEO Sherpa ฉันได้ยกเว้นสื่อและแท็กออกจากแผนผังไซต์ของฉัน เนื่องจากในกรณีของฉัน อย่างน้อย หน้าเหล่านี้มีคุณค่าต่อผู้ใช้ปลายทางเพียงเล็กน้อย

วิธีสร้างแผนผังเว็บไซต์ XML ใน Wix

ตรงกันข้ามกับ WordPress Wix มีฟังก์ชันแผนผังไซต์ XML ในตัว

ปัญหาคือมันค่อนข้างจำกัด

ตัวเลือกเดียวที่คุณมีคือการยกเว้นบางหน้า

หากคุณต้องการยกเว้นหน้า ให้ไปที่แท็บการตั้งค่า “SEO (Google)” สำหรับหน้านั้นและปิดสวิตช์ “แสดงหน้านี้ในผลการค้นหา”

การตั้งค่าเครื่องมือค้นหา Wix

การดำเนินการนี้จะเพิ่มเมตาแท็ก noindex ลงในหน้าและยกเว้นจากแผนผังเว็บไซต์ XML

ความท้าทายประการหนึ่งของฟังก์ชันแผนผังเว็บไซต์ที่เข้มงวดของ Wix คือการรวม URL ที่ถูกกำหนดให้เป็นมาตรฐานไปยังหน้าอื่น

นี้เป็นหลักกล่าวว่า "จัดอันดับหน้านี้" และ "ไม่จัดอันดับหน้านี้" ในเวลาเดียวกันซึ่งทำให้สับสนมากสำหรับเครื่องมือค้นหา

ผลลัพธ์อาจเป็นเวอร์ชันที่ไม่ถูกต้องซึ่งแสดงบนหน้าผลการค้นหา

หากคุณมีเว็บไซต์ Wix คุณสามารถค้นหาแผนผังเว็บไซต์ที่สร้างขึ้นโดยอัตโนมัติได้ที่ yourdomain.com/sitemap.xml

วิธีสร้างแผนผังเว็บไซต์ XML ใน Shopify

คุณไม่จำเป็นต้องสร้างแผนผังเว็บไซต์ XML หากเว็บไซต์ของคุณสร้างด้วย Shopify ซึ่งสร้างให้คุณโดยอัตโนมัติ

น่าเสียดายที่มีการปรับแต่งเป็นศูนย์

ด้วย Shopify คุณไม่สามารถยกเว้นหน้าจากแผนผังเว็บไซต์ XML ของคุณได้ – รวมทุกอย่างแล้ว

วิธีเดียวที่จะควบคุมสิ่งที่แสดงในผลการค้นหาคือการเพิ่มแท็ก noindex ลงในไฟล์ .liquid โดยตรง

อย่างไรก็ตาม ใน Shopify หน้าที่ไม่มีการจัดทำดัชนีจะแสดงใน XML แผนผังเว็บไซต์ ซึ่งดังที่เราได้กล่าวไว้ก่อนหน้านี้ไม่เหมาะ

ค้นหาแผนผังเว็บไซต์ได้ที่ yourdomain.com/sitemap.xml

วิธีส่งแผนผังไซต์ของคุณไปยัง Google

ถึงตอนนี้ คุณควรสร้างแผนผังเว็บไซต์แล้ว

ขั้นตอนสุดท้าย (และอาจสำคัญที่สุด) คือการส่งแผนผังเว็บไซต์ไปยัง Google

แน่นอน ก่อนทำอย่างนั้น คุณจำเป็นต้องรู้ว่าแผนผังไซต์ของคุณตั้งอยู่ที่ไหน

หากคุณได้สร้างแผนผังเว็บไซต์ด้วยตนเอง หรือคุณกำลังใช้ Wix หรือ Shopify คุณจะพบแผนผังเว็บไซต์ได้ใน URL ต่อไปนี้:

yourdomain.com/sitemap.xml

ในทางกลับกัน หากไซต์ของคุณอยู่บน WordPress และคุณใช้ Yoast สำหรับ sitemap.xml ของคุณ คุณจะพบดัชนีแผนผังไซต์ที่ URL นี้:

yourdomain.com/sitemap_index.xml

หากคุณกำลังใช้แพลตฟอร์มอื่น – หรือไม่พบแผนผังไซต์ของคุณในตำแหน่งเหล่านั้น คุณสามารถตรวจสอบแผนผังไซต์โดยใช้เครื่องมือจัดเกรด SEO ของเรา:

SEO เกรดเดอร์

เมื่อคุณทราบตำแหน่งแผนผังเว็บไซต์ XML ของคุณแล้ว ให้ไปที่ Google Search Console จากนั้นไปที่ 'แผนผังเว็บไซต์' ซึ่งคุณจะพบได้ในเมนู 'ดัชนี'

ถัดไป วาง URL แผนผังเว็บไซต์ลงในช่องแผนผังเว็บไซต์แล้วกด "ส่ง"

แผนผังไซต์ของคุณ "ควร" ส่งสำเร็จ:

Google Search Console ส่งแผนผังเว็บไซต์สำเร็จ

เท่านี้ก็เสร็จแล้ว!

7 แนวทางปฏิบัติที่ดีที่สุดสำหรับแผนผังเว็บไซต์ XML "จำเป็น"

มาจบด้วยแนวปฏิบัติที่ดีที่สุดสำหรับแผนผังเว็บไซต์ XML

คุณจะต้องใช้เทคนิคเหล่านี้เพื่อให้แน่ใจว่าแผนผังเว็บไซต์ XML ของคุณได้รับการปรับให้เหมาะสมสำหรับการรวบรวมข้อมูลและจัดทำดัชนีอย่างมีประสิทธิภาพ

โดดกันเลย

(1). ใช้แผนผังไซต์แบบไดนามิกไม่ใช่แผนผังไซต์แบบคงที่

ลองนึกภาพว่าต้องอัปเดตแผนผังเว็บไซต์ XML ของคุณด้วยตนเองทุกครั้งที่คุณทำการเปลี่ยนแปลงเว็บไซต์ใช่หรือไม่

นั่นคือสิ่งที่คุณต้องทำกับแผนผังเว็บไซต์แบบคงที่

โชคดีที่ CMS ที่ทันสมัยส่วนใหญ่มีฟังก์ชันแผนผังไซต์ XML แบบไดนามิกในตัว – หรือพร้อมใช้งานผ่านปลั๊กอิน

ซึ่งหมายความว่า:

แผนผังเว็บไซต์จะอัปเดตอัตโนมัติทุกครั้งที่คุณเพิ่ม เปลี่ยนแปลง หรือลบหน้าที่มีอยู่

ไม่จำเป็นต้องมีการแทรกแซงด้วยตนเอง

การใช้แผนผังเว็บไซต์แบบไดนามิกมีความสำคัญเป็นพิเศษสำหรับเว็บไซต์ขนาดใหญ่ที่มีการเพิ่มหน้าที่มีลำดับความสำคัญบ่อยครั้ง

ตรวจสอบให้แน่ใจว่าคุณใช้อย่างใดอย่างหนึ่ง

(2). ใช้ตำแหน่งและชื่อแผนผังเว็บไซต์มาตรฐาน

หากคุณต้องใช้ /my_website_sitemap.xml เป็นเส้นทางสำหรับแผนผังเว็บไซต์ XML มีโอกาสที่เครื่องมือค้นหาจะไม่พบ

เพื่อให้แน่ใจว่าแผนผังไซต์ของคุณจะถูกค้นพบได้ง่าย ให้ยึดตำแหน่งมาตรฐาน:

https://yourdomain.com/sitemap.xml สำหรับแผนผังเว็บไซต์เดียว

หรือ

https://yourdomain.com/sitemap_index.xml เมื่อคุณมีแผนผังเว็บไซต์หลายรายการในดัชนี

มันง่ายมาก

(3). อ้างอิงแผนผังไซต์ XML ของคุณในไฟล์ Robots.txt ของคุณ

โรบ็อตเครื่องมือค้นหาจะเข้าชมไฟล์ robots.txt ของคุณเมื่อพวกเขาเริ่มรวบรวมข้อมูลเว็บไซต์ของคุณ

พวกเขาใช้ robots.txt เพื่อทำความเข้าใจวิธีการรวบรวมข้อมูลเว็บไซต์

การอ้างอิงแผนผังไซต์ XML ของคุณภายในไฟล์ robots.txt คุณมั่นใจได้ว่าบ็อตการค้นหาจะพบได้

หากต้องการเพิ่มแผนผังเว็บไซต์ XML ของคุณลงใน robots.txt ให้เปิดไฟล์ข้อความของโรบ็อตแล้ววางบรรทัดนี้ลงในไฟล์:

 Sitemap: https://www.yourdomain.com/sitemap.xml

คุณค้นหาไฟล์ robots.txt ได้ในไดเรกทอรีรากของเซิร์ฟเวอร์บนเส้นทาง “/robots.txt”

หากคุณมีแผนผังไซต์ XML หลายรายการ ให้แสดงรายการทีละรายการดังนี้:

 Sitemap: https://www.yourdomain.com/page-sitemap.xml Sitemap: https://www.yourdomain.com/post-sitemap.xml Sitemap: https://www.yourdomain.com/product-sitemap.xml

ตามทฤษฎีแล้ว คุณสามารถวางตำแหน่งแผนผังเว็บไซต์ไว้ที่ใดก็ได้ภายใน robots.txt โดยทั่วไปแล้วจะวางไว้ที่ส่วนท้ายได้ดีที่สุด:

การอ้างอิงแผนผังเว็บไซต์ Robots txt

(4). ยกเว้นหน้า Noindex จากแผนผังไซต์ของคุณ

บทบาทของแผนผังเว็บไซต์ XML คือการบอกเครื่องมือค้นหาว่าควรรวบรวมข้อมูลอะไร และจัดทำดัชนี

นั่นหมายความว่า ควรรวมเฉพาะหน้าที่สมควรอันดับที่คุณต้องการเท่านั้น

การเพิ่ม Noindex, non-canonical หรือหน้าเปลี่ยนเส้นทางไปยังแผนผังไซต์ของคุณจะทำให้เครื่องมือค้นหาสับสนและอาจส่งผลเสียต่องบประมาณการรวบรวมข้อมูลของคุณ

(5). ทำให้แผนผังไซต์ XML ของคุณต่ำกว่า 50MB

ตาม Google แผนผังไซต์ XML ไม่ควรเกิน 50MB หรือ 50,000 URL

ขีดจำกัดขนาดไฟล์แผนผังเว็บไซต์

เมื่อใดก็ตามที่คุณเกินขีดจำกัด 50MB หรือ 50,000 URL คุณควรแบ่ง XML Sitemap เดียวของคุณออกเป็นไฟล์ XML Sitemap หลายไฟล์

การเกินขีดจำกัดเหล่านี้อาจทำให้ Google ยุติการรวบรวมข้อมูล

ตัวอย่างเช่น คุณสามารถแบ่งแผนผังเว็บไซต์ออกเป็น "โพสต์" และ "หน้า"

แล้วจัดกลุ่มเข้าด้วยกันในไฟล์ดัชนีแผนผังเว็บไซต์

(6). ละเว้น Priority และ Changefreq Attributes

ดังที่ฉันได้กล่าวไว้ก่อนหน้านี้ Google มองข้ามแท็กทั้งสองนี้:

  • <changefreq>
  • <ลำดับความสำคัญ>

ซึ่งหมายความว่า ซึ่งรวมถึงแอตทริบิวต์การเปลี่ยนแปลงความถี่และลำดับความสำคัญ จะเพิ่มเฉพาะน้ำหนักที่ไม่จำเป็นในแผนผังเว็บไซต์ ซึ่งอาจนำไปสู่ปัญหางบประมาณการรวบรวมข้อมูลและการจัดทำดัชนี

ฉันขอแนะนำว่าอย่าใช้แท็ก <changefreq> หรือ <priority> ในแผนผังไซต์ของคุณเลย

(7). ตรวจสอบ Google Search Console สำหรับข้อผิดพลาดแผนผังเว็บไซต์ XML

หาก Google ไม่สามารถรวบรวมข้อมูลแผนผังเว็บไซต์ XML ของคุณได้ Google จะแจ้งให้คุณทราบผ่าน Search Console:

ข้อผิดพลาด GSC Sitemap

ข้อผิดพลาดอาจตรงไปตรงมาเหมือนกับที่ดึง URL แผนผังเว็บไซต์ XML ไม่ได้ กับ URL ที่ส่งซึ่งส่งคืนรหัสสถานะ 404 หรือไม่มีดัชนี

ปัญหาที่พบบ่อยที่สุดคือ:

(ก). ไม่พบ URL ที่ส่ง (404)

ซึ่งหมายความว่าไม่มี URL ที่คุณส่งในแผนผังเว็บไซต์ XML

จำไว้ว่า หากคุณลบหน้าออกจากเว็บไซต์ของคุณ อย่าลืมลบออกจากแผนผังเว็บไซต์ ยังดีกว่า ใช้แผนผังไซต์ XML แบบไดนามิก แล้ว URL จะถูกลบออกจากแผนผังไซต์ของคุณโดยอัตโนมัติ

(ข). ส่ง URL ที่มีเครื่องหมาย 'noindex'

กรณีนี้เกิดขึ้นเมื่อหน้าในแผนผังเว็บไซต์ XML ของคุณมีเมตาแท็ก 'noindex'

หากคุณต้องการสร้างดัชนีหน้านี้ คุณต้องลบ เมตาแท็ก 'noindex' หากคุณไม่ต้องการให้มีการจัดทำดัชนี ให้ลบออกจากแผนผังเว็บไซต์

ยังไงก็ต้องแก้ไข

(ค). URL ที่ส่งถูกบล็อกโดย robots.txt

สิ่งนี้เกิดขึ้นเมื่อหน้าที่อยู่ในแผนผังเว็บไซต์ XML ของคุณถูกบล็อกโดย robots.txt

โดยพื้นฐานแล้ว มีคำสั่งในไฟล์ robots.txt ของคุณเพื่อบอกให้เครื่องมือค้นหาไม่รวบรวมข้อมูลหน้า แม้ว่าคุณจะขอให้เครื่องมือค้นหาทำอย่างนั้นโดยส่งให้โปรแกรมสร้างดัชนี

หากคุณต้องการสร้างดัชนี URL จริงๆ ให้ค้นหาและลบคำสั่งออกจากไฟล์ robots.txt ของคุณ

เครื่องมือทดสอบ Robots TXT

ลองทดสอบหน้าเว็บของคุณโดยใช้เครื่องมือทดสอบ robots.txt เพื่อค้นหาผู้กระทำความผิด

และที่นั่นคุณมีมัน; แนวทางปฏิบัติที่ดีที่สุดเจ็ดประการของแผนผังเว็บไซต์ XML

คุณคิดอย่างไร?

ตอนนี้ฉันอยากได้ยินจากคุณ:

เทคนิคไหนจากโพสต์วันนี้ที่คุณจะใช้ก่อน?

คุณจะเปลี่ยนแปลงอะไรในแผนผังไซต์ XML ของคุณอันเป็นผลมาจากการอ่านโพสต์ของวันนี้

บางทีคุณอาจจะเปลี่ยนจากคู่มือไปเป็นแผนผังเว็บไซต์ XML แบบอัตโนมัติ หรือบางทีคุณอาจจะละเว้นแท็ก <changefreq>?

ทั้งสองวิธีแจ้งให้เราทราบโดยแสดงความคิดเห็นด้านล่าง