Cara Mengatasi Masalah Dengan Konten Duplikat di Situs Web Anda
Diterbitkan: 2019-06-11Konten duplikat adalah perhatian utama SEO. Itu ada di sana dengan tautan cerdik dan menghindari penalti Google. Memiliki duplikat konten dapat merusak lalu lintas organik situs mana pun. Semua orang yang terlibat dengan SEO memahami hal ini. Itu tidak berarti bahwa duplikat konten mudah dihindari. Terlepas dari upaya terbaik Anda, situs Anda mungkin masih mengalami masalah dengan konten duplikat.
Panduan ini dirancang untuk membantu Anda menyelesaikan masalah tersebut. Kami akan mengarahkan Anda ke cara utama terjadinya duplikat konten. Kami kemudian akan membahas seluk beluk tentang apa yang dapat Anda lakukan untuk menghindari dan menyelesaikan masalah duplikat konten. Namun, pertama-tama, ada baiknya menjelaskan apa itu konten duplikat dan mengapa itu penting.
Pesan Konsultasi
Duplikat Konten & Google
Cara terbaik untuk menjelaskan apa itu konten duplikat, adalah dengan melihat bagaimana Google sendiri mendefinisikannya. Dalam pedoman dukungan mereka mengenai konten duplikat, mereka menawarkan definisi berikut:
'Blok konten yang substansial di dalam atau di seluruh domain yang benar-benar cocok dengan konten lain atau sangat mirip.'
Itu cukup sederhana mengapa duplikat konten itu penting. Itu karena pengaruhnya terhadap tujuan Google untuk menyediakan penggunanya. Mesin pencari berusaha untuk mengindeks dan menampilkan halaman dengan informasi yang berbeda. Itu adalah bagian dari keinginan berkelanjutan mereka untuk memastikan pengalaman pengguna yang lebih baik.
Halaman dengan konten duplikat tidak memenuhi syarat untuk memiliki informasi berbeda. Dengan demikian, Google akan memfilter halaman duplikat tersebut. Artinya, hanya satu halaman yang menampilkan konten duplikat yang akan dicantumkan. Itu dapat memiliki efek negatif yang mendalam pada lalu lintas organik domain. Laman yang akan mendorong lebih banyak lalu lintas ke situs tidak akan dicantumkan sama sekali.
Ini adalah kesalahpahaman umum bahwa Google menjatuhkan hukuman untuk duplikat konten. Bukan itu masalahnya, tetapi jika mereka mencurigai penggunaan konten duplikat yang berbahaya, mereka akan bertindak. Saat itulah konten digunakan untuk memanipulasi peringkat mereka. Dalam hal ini mereka:
'Lakukan penyesuaian yang sesuai dalam pengindeksan dan peringkat situs yang terlibat. Akibatnya, peringkat situs mungkin menurun, atau situs mungkin dihapus seluruhnya dari indeks Google. Dalam hal ini tidak akan muncul lagi di hasil pencarian.'
Sekarang sudah jelas bahwa Anda ingin menghindari duplikat konten di situs Anda. Meski Anda berhati-hati melakukannya, hal itu tetap bisa terjadi. Ada banyak cara hal ini bisa terjadi.
Bagaimana Duplikat Konten Bisa Terjadi
Seperti yang telah kami sebutkan, konten duplikat dapat dengan sengaja ditampilkan di domain. Biasanya sebagai cara untuk mengelabui atau memanipulasi peringkat Google. Setiap profesional SEO sekarang tahu betapa pintarnya algoritma Google. Hanya orang yang paling bodoh atau tidak peduli di antara mereka yang berpikir bahwa mereka dapat lolos dari manipulasi semacam itu.
Jauh lebih sering terjadi bahwa duplikat konten di situs berkembang secara alami. Itu bisa karena masalah teknis tertentu atau kesalahan manusia yang sederhana. Sangat penting untuk memahami cara utama di mana hal ini bisa terjadi. Ini akan membantu Anda mengidentifikasi masalah duplikat konten Anda sendiri. Ini juga akan memudahkan untuk memilih solusi terbaik.
Penyebab terjadinya duplikat konten yang akan kita bahas adalah sebagai berikut:
- Parameter URL untuk pemfilteran & pelacakan
- Saling silang halaman kategori produk
- Deskripsi produk rangkap
- Masalah teknis dengan URL
- Halaman ramah printer
- Masalah pembuatan konten
Parameter URL Untuk Penyaringan & Pelacakan
Parameter URL seperti sufiks yang ditambahkan ke bagian akhir URL laman. Mereka terjadi dalam banyak situasi dan sering tidak banyak mengubah konten halaman atau bahkan sama sekali. Masalahnya adalah bagi mesin pencari, URL dengan parameter berbeda di bagian akhir adalah URL yang berbeda. Jika konten yang ditautkan oleh 'dua' URL itu sama, Google akan mengidentifikasinya sebagai konten duplikat.
Contoh utama dari hal ini berasal dari memfilter produk di situs e-niaga. Hampir semua jenis situs tersebut memungkinkan pelanggan memfilter produk. Mereka mungkin hanya ingin menampilkan produk dalam kisaran harga tertentu atau terbuat dari bahan tertentu. Tindakan memfilter produk menambahkan parameter URL ke URL. Konten yang ditampilkan – produk, dll. – semuanya akan digandakan di tempat lain.
Contoh lain adalah dalam hal tracking. Parameter pelacakan memungkinkan Anda melacak sumber pengunjung situs Anda. Ini sangat penting untuk memantau ROI dari berbagai upaya SEO. Mereka mungkin terlihat seperti ini: '/?source=rss'. Mereka tidak berdampak pada konten halaman tetapi juga terlihat di mesin pencari seperti URL unik.
Crossover Halaman Kategori Produk
Juga masalah khusus untuk situs e-niaga adalah persilangan halaman kategori. Banyak situs akan memiliki halaman kategori berbeda yang terutama menampilkan produk yang sama. Ini sering dilakukan untuk alasan yang bermaksud baik dan dapat dimengerti.
Misalnya, situs hadiah mungkin memiliki kategori bernama 'Hadiah Untuk Dia' dan 'Hadiah Hari Ayah'. Kedua kategori tersebut mungkin menarik pelanggan yang berbeda. Namun, produk yang ditampilkan di halaman kategori akan hampir identik. Hanya itu yang penting bagi Google dan mereka mungkin hanya mengindeks salah satu halaman.
Menduplikasi Deskripsi Produk
Satu tingkat di bawah situs e-niaga dari halaman kategori adalah halaman produk. Ini juga bisa menjadi sumber umum masalah duplikat konten. Pengunjung ke halaman tersebut akan berharap ada deskripsi produk singkat. Ini akan menjadi bagaimana fitur dan karakteristik produk dijual kepada pelanggan.
Situs yang menjual banyak produk seringkali tidak membuat deskripsi yang unik untuk masing-masing produk. Banyak perusahaan hanya menyalin dan menempelkan informasi umum. Seringkali itu telah disediakan oleh pemasok atau pabrikan. Itu mengarah ke banyak konten duplikat di dalam dan di seluruh domain yang berbeda.
Masalah terbesar dalam hal ini adalah jika situs Anda menjual produk yang sama dengan pengecer yang jauh lebih besar seperti Amazon. Deskripsi yang disalin dapat mengarahkan halaman produk Anda ke konten duplikat yang ditemukan di Amazon. Google pasti akan mengindeks halaman Amazon daripada halaman Anda.
Masalah Teknis Dengan URL
Selain parameter URL, ada beberapa masalah URL teknis lainnya yang dapat menyebabkan masalah duplikat konten. Yang pertama datang dalam bentuk 'ID sesi'. Ini digunakan dalam URL ketika pengunjung situs diberi 'sesi'. Itu sering kali agar mereka dapat menambahkan item ke keranjang belanja dan menyimpannya di sana.
ID sesi ditambahkan ke setiap tautan internal saat pengunjung menjelajahi situs Anda. Itu menciptakan banyak URL yang mungkin dilihat oleh mesin pencari sebagai konten duplikat. Dengan nada yang sama, URL yang berantakan sebagai bagian dari CMS dapat memiliki efek yang serupa. URL dengan parameter untuk kategori dan artikel yang urutannya berubah adalah contoh utama.
Halaman Ramah Printer
CMS Anda mungkin membuat halaman ramah printer. Halaman-halaman ini akan ditautkan ke situs Anda dari halaman artikel dan di tempat lain. Google akan dapat menemukan halaman ini kecuali Anda secara khusus menghentikannya (lebih lanjut nanti).

Google hanya akan memfilter dan mengindeks salah satu halaman duplikat. Itu mungkin versi asli atau ramah printer. Anda ingin peringkat halaman asli Anda, bukan yang ramah printer. Yang terakhir tidak akan memiliki semua iklan, tautan, dan konten lainnya.
Masalah Pembuatan Konten
Sebagian besar di atas adalah penyebab teknis dari masalah duplikat konten. Di mana kesalahan manusia terjadi adalah di bidang pembuatan konten. Hampir setiap situs saat ini memiliki blog atau sumber informasi serupa. Ini membantu mereka untuk memberikan informasi yang berguna kepada pengunjung. Blog seringkali menjadi rumah bagi banyak konten duplikat.
Ini mungkin karena memercayai pembuatan konten kepada seseorang yang tidak seharusnya Anda lakukan. Seseorang yang tidak memahami masalah yang dapat ditimbulkan oleh duplikat konten. Mereka mungkin menyalin atau membuat ulang konten tanpa mengetahui masalah SEO yang mereka buat. Kesalahan mereka bisa sekecil selalu menggunakan tag judul yang sama. Mereka bisa sebesar langsung menyalin konten dari situs lain.
Menyelesaikan Masalah Dengan Konten Duplikat
Anda sekarang harus memiliki gagasan dari mana masalah Anda dengan konten duplikat mungkin berasal. Di atas adalah semua penyebab masalah yang umum terjadi di banyak situs. Memahami mereka dan mengetahui mana yang memengaruhi situs Anda sangatlah penting. Itu karena penyebab yang berbeda memberikan solusi yang berbeda.
Kami akan membahas beberapa cara terbaik untuk menyelesaikan masalah dengan konten duplikat. Kami akan menandai masalah dan penyebab mana yang telah kami sebutkan yang paling sesuai dengan setiap solusi seiring berjalannya waktu. Solusi kami sesuai dengan dua kategori:
- Solusi pendidikan & pencegahan
- Solusi praktis & upaya pemulihan
Solusi Pendidikan & Pencegahan
Di dunia yang ideal, Anda ingin menghindari masalah dengan konten duplikat sebelum muncul. Mengetahui tentang penyebab masalah yang telah kita diskusikan adalah titik awal yang bagus. Memiliki pengetahuan itu dapat membantu Anda mengambil langkah-langkah untuk memastikan bahwa tidak ada konten baru yang mengalami masalah yang sama.
Anda dapat, misalnya, menonaktifkan ID sesi di pengaturan sistem Anda. Itu akan mencegah masalah duplikat URL yang dapat menyebabkannya. Anda dapat memilih untuk sama sekali tidak menyertakan halaman ramah printer di situs web Anda. Bukannya banyak orang memiliki alasan untuk mencetak halaman saat ini. Kampanye pelacakan berbasis hashtag juga bisa menjadi alternatif yang baik untuk pelacakan berbasis parameter.
Setelah mempelajari penyebab duplikat konten, Anda berada dalam posisi untuk mengedukasi orang lain. Mereka dapat mencakup pengembang web atau tim produk Anda. Anda dapat menjelaskan kepada mereka masalah yang terkait dengan persilangan dalam kategori produk. Dengan begitu mereka akan tahu untuk mengatur produk yang sesuai. Pembuat konten lepas atau in-house juga dapat diberi pengarahan untuk menjaga hal-hal unik.
Itu di dunia yang ideal. Pada kenyataannya, Anda mungkin tidak dapat mengatasi semua masalah duplikat konten Anda. Dalam keadaan seperti itu Anda memerlukan beberapa solusi praktis. Mereka akan membantu Anda pulih dari masalah yang sudah Anda derita.
Solusi Praktis & Upaya Pemulihan
Panduan kami sejauh ini seharusnya menunjukkan kepada Anda dari mana masalah duplikat konten Anda berasal. Kami sekarang juga menawarkan beberapa tip untuk menghindari lebih banyak masalah yang muncul. Yang tersisa adalah menyarankan beberapa tindakan jika situs Anda memiliki masalah dengan konten duplikat. Ada banyak opsi berbeda yang terbuka untuk Anda.
URL kanonis
URL kanonis dapat membantu jika masalah Anda adalah URL berbeda yang mengarah ke konten yang sama. Seperti dalam kasus pemfilteran parameter atau halaman kategori, seperti yang dijelaskan sebelumnya. URL kanonis adalah URL yang 'benar'. Ini adalah URL halaman yang Anda ingin Google untuk mengindeks dari halaman yang mengarah ke konten yang sama. Anda perlu memutuskan dalam setiap kasus halaman mana itu.
Setelah teridentifikasi, mudah untuk memberi tahu Google halaman mana yang merupakan URL kanonis Anda. Yang perlu Anda lakukan hanyalah menambahkan elemen HTML ke bagian <head> di halaman lain. Disebut 'elemen tautan kanonik', tampilannya seperti ini; 'rel=kanonikal'. Ini akan mengarahkan Google ke halaman pilihan Anda saat diikuti dengan URL-nya.
301 Pengalihan
Mengarahkan Google ke URL kanonis terkadang dijelaskan sebagai menggunakan 'pengalihan lunak'. Itu berlawanan dengan pengalihan 301 sepenuhnya matang. Anda juga dapat menggunakan ini jika Anda tidak dapat atau tidak ingin menghapus konten duplikat.
Menerapkan pengalihan 301 ke URL akan mengarahkan Google ke halaman pilihan Anda. Ini kemudian akan menjadi halaman yang diindeks oleh mesin pencari. Ini bisa menjadi solusi yang berguna untuk masalah halaman kategori produk yang tumpang tindih.
Yang perlu Anda lakukan hanyalah mengidentifikasi kategori mana yang paling berharga bagi Anda dari sudut pandang lalu lintas web. Anda kemudian dapat menggunakan pengalihan 301 ke dari halaman duplikat atau tumpang tindih lainnya ke kategori tersebut.
Tag Noindex
Tag Noindex adalah arahan yang dapat ditambahkan ke kode sumber HTML suatu halaman. Ini secara eksplisit memberi tahu Google bahwa Anda tidak ingin halaman diindeks. Itu dapat mencegah Google memfilter halaman yang ingin Anda indeks demi halaman yang tidak Anda inginkan.
Tag Noindex adalah solusi terbaik untuk masalah yang disebabkan oleh halaman ramah printer. Anda harus menerapkan tag Noindex ke setiap halaman tersebut. Itu akan memastikan bahwa versi asli dari setiap halaman akan menjadi versi yang diindeks oleh Google.
Menulis Ulang Konten
Terkadang masalah duplikat konten tidak dapat diperbaiki dengan cepat. Itulah yang terjadi jika masalah Anda ada pada posting blog atau deskripsi produk. Jika mereka membuat konten duplikat, Anda perlu menemukan salinan yang melanggar dan menulis ulang. Solusi ini memakan waktu dan padat karya. Tidak ada cara lain untuk menangani masalah dengan cakap.
Salah satu cara Anda dapat menghemat sedikit waktu dan tenaga adalah dengan menggunakan alat online gratis seperti Copyscape. Copyscape dirancang untuk membantu Anda menulis konten yang tidak dijiplak. Anda dapat memasukkan URL ke situs dan itu akan mencari konten duplikat di web. Itu memungkinkan Anda menemukan elemen yang tepat dari konten Anda yang perlu dipotong, diganti, atau ditulis ulang.

Nick Brown adalah pendiri & CEO agensi akselerasi, agensi SaaS SEO. Nick telah meluncurkan beberapa bisnis online yang sukses, menulis untuk Forbes, menerbitkan buku, dan telah berkembang pesat dari agensi Inggris menjadi perusahaan yang sekarang beroperasi di seluruh AS, APAC, dan EMEA serta mempekerjakan 160 orang. Dia juga pernah diserbu oleh gorila gunung