Duplikat Konten SEO: Cara Memeriksa Konten Duplikat

Diterbitkan: 2022-06-14

Konten duplikat dapat memengaruhi halaman mana yang muncul di hasil pencarian dan menghabiskan anggaran perayapan Anda. Untungnya, ada cara untuk mengidentifikasi konten duplikat dan menghapusnya dari situs web Anda atau indeks Google untuk mencegahnya memengaruhi kemampuan Anda untuk menentukan peringkat secara negatif.

Apa itu Konten Duplikat?

Konten duplikat terjadi ketika konten yang sama muncul di lebih dari satu lokasi dengan URL unik.

Konten tidak harus sama persis untuk didaftarkan sebagai duplikat — itu juga bisa menjadi apa yang disebut Google "sangat mirip." Konten ini pada dasarnya "cukup dekat" untuk dianggap sebagai konten duplikat meskipun beberapa teks mungkin berbeda.

Sebagian besar pemilik situs bekerja keras untuk memastikan konten mereka segar dan asli, namun masih banyak konten duplikat di web. Terkadang pemilik situs bahkan tidak menyadarinya. Jadi bagaimana ini terjadi?

Mengapa Konten Duplikat Terjadi?

Sebagian besar duplikat konten di web terjadi karena pengindeksan hal-hal seperti versi halaman yang mudah dicetak, produk yang ada di atau ditautkan oleh beberapa URL yang berbeda, dan forum diskusi yang menghasilkan versi desktop dan seluler dari halaman yang sama .

Tapi itu bukan satu-satunya cara Anda bisa berakhir dengan duplikat konten di situs Anda. Berikut adalah beberapa contoh lainnya tentang bagaimana duplikat konten dapat terjadi secara internal di situs Anda dan secara eksternal di situs lain.

Duplikat yang Dihasilkan Secara Internal

Halaman Produk yang Sangat Mirip

Terkadang masuk akal untuk secara sengaja membuat halaman yang cukup mirip, terutama di e-niaga. Misalnya, Anda menjual produk yang sama di dua negara yang berbeda. Dalam hal ini, Anda dapat memilih untuk memiliki dua halaman yang hampir identik, kecuali satu mungkin menampilkan harga dalam dolar AS sementara yang lain menampilkannya dalam dolar Kanada.

Contoh lain adalah halaman produk yang tampak sangat mirip karena menampilkan salinan yang sama, dengan satu-satunya perbedaan nyata adalah gambar produk, nama produk, dan harga produk yang berbeda.

Sistem Manajemen Konten

Terkadang sistem manajemen konten membuat konten duplikat yang mungkin tidak Anda sadari. Beberapa sistem menambahkan tag dan parameter URL untuk pencarian secara otomatis, menghasilkan beberapa jalur ke konten yang sama persis.

Variasi URL

Anda juga dapat berakhir dengan konten duplikat jika Anda memiliki variasi URL berbeda yang menampilkan konten yang sama. Seperti yang disebutkan sebelumnya, sistem manajemen konten dapat melakukannya sendiri, dan Anda mungkin mendapatkan dua variasi URL seperti https://www.website.com/blog1 dan https://www.website.com/blogs/blog1 . Variasi URL lain seperti garis miring atau URL dengan huruf besar dapat menyebabkan masalah yang sama.

Ketika ini terjadi, Google mungkin tidak tahu halaman mana yang harus diberi peringkat dan beberapa sumber luar mungkin menautkan ke salah satu halaman ini sementara yang lain menautkan ke duplikat, memecah ekuitas tautan halaman Anda dalam prosesnya.

HTTP vs HTTPS dan www vs non-www

Sebagian besar situs web dapat diakses dengan atau tanpa www atau di kedua URL HTTP atau HTTPS. Namun, jika Anda belum mengonfigurasi situs dengan benar, Google dapat mengindeks halaman dari lebih dari satu halaman, yang mengakibatkan konten duplikat.

URL Printer-Friendly dan Mobile-Friendly

Halaman ramah-printer atau ramah seluler yang dihosting di URL yang berbeda dari halaman asli akan menghasilkan konten duplikat kecuali jika tidak diindeks dengan benar.

ID sesi

ID sesi dapat menjadi alat yang berharga untuk melacak pengunjung yang mengunjungi situs Anda. Ini biasanya dilakukan dengan menambahkan string ID sesi yang panjang ke URL. Karena setiap ID sesi unik, ini membuat URL baru dan menduplikasi konten Anda.

Parameter UTM

Parameter dapat melacak pengunjung yang masuk dari berbagai sumber. Seperti ID Sesi, mereka menghasilkan URL unik meskipun konten halamannya sama, sehingga membuat konten duplikat jika diindeks.

Duplikat yang Dihasilkan Secara Eksternal

Konten Sindikasi

Sindikasi konten Anda ke situs lain di web dapat menjadi cara yang bagus untuk mengarahkan lebih banyak lalu lintas ke situs web Anda dan membuat nama Anda di luar sana. Namun, konten ini masih dapat ditampilkan sebagai konten duplikat jika tidak diformat dengan tag header kanonik yang tepat. Misalnya, menggunakan tag kanonik pada artikel Medium dapat melindungi konten asli Anda agar tidak terdaftar sebagai duplikat.

Plagiat

Meskipun sebagian besar konten duplikat bersifat tidak berbahaya, beberapa webmaster memang menyalin konten dengan sengaja, mencari keuntungan dari konten yang tidak mereka buat sendiri.

Duplikat Konten SEO: Mengapa Penting?

Jika konten duplikat sering terjadi, mengapa itu penting? Berikut adalah lima cara yang dapat memengaruhi kemampuan Anda untuk mendapatkan peringkat yang baik di hasil pencarian.

1. Penalti Konten Duplikat Google

Google tidak secara langsung menghukum konten duplikat — sebagian besar waktu. Jika Google yakin bahwa konten duplikat di situs Anda "menipu" dan "dimaksudkan untuk memanipulasi hasil mesin pencari", maka Google dapat mengambil tindakan dengan menerapkan hukuman konten duplikat. Jadi, meskipun hal itu tidak sering terjadi, menurut pedoman konten duplikat Google, Anda mungkin masih harus berurusan dengan hukuman langsung jika konten duplikat Anda cukup parah dan diyakini telah dibuat dengan niat jahat.

Penalti Google untuk konten duplikat jarang terjadi, jadi perhatian yang lebih mendesak adalah hubungan antara konten duplikat dan SEO.

2. Indeks Kembung

Indeks mengasapi terjadi ketika perayap mesin pencari mengakses dan mengindeks konten yang tidak penting atau berkualitas rendah — seperti halaman ramah-printer yang saya sebutkan. Ini memengaruhi kemampuan Anda untuk membuat halaman penting Anda diberi peringkat karena mesin pencari tidak akan tahu versi konten mana yang akan Anda sarankan kepada pengguna dan mungkin memberi peringkat pada versi yang berbeda dari yang Anda inginkan. Ini juga berdampak pada anggaran perayapan.

3. Anggaran Perayapan

Google membatasi berapa banyak waktu yang dihabiskan untuk merayapi situs. Jumlah sumber daya yang disediakan Google untuk merayapi dan mengindeks situs Anda adalah anggaran perayapan Anda. Bila Anda memiliki banyak konten duplikat, Anda berisiko membuang anggaran perayapan Anda pada halaman yang tidak begitu penting.

4. Kanibalisasi Kata Kunci

Jika lebih dari satu salinan halaman diberi peringkat, maka halaman Anda akan bersaing satu sama lain untuk kata kunci dan visibilitas yang sama. Cukup sulit bersaing dengan orang lain, mengapa membuatnya lebih sulit dengan bersaing dengan diri sendiri juga?

Pada akhirnya, Anda tidak bisa mengabaikan masalah duplikat konten SEO. Bila memungkinkan, cobalah untuk mengkonsolidasikan atau menghapus konten duplikat.

5. Mengurangi Ekuitas Tautan

Katakanlah Google memutuskan untuk memberi peringkat dua halaman Anda yang cukup mirip. Bagaimana mereka tahu apakah akan mengatribusikan semua nilai konten ke satu halaman atau jika otoritas, ekuitas tautan, dan kepercayaan seharusnya dibagi di antara kedua halaman? Situasi ini dapat mengurangi nilai SEO konten Anda, menyebabkannya berkinerja buruk.

Ekuitas tautan dari tautan balik Anda juga akan dibagi di antara dua halaman tergantung pada apakah situs lain memilih untuk ditautkan.

Cara Memeriksa Konten Duplikat di Situs Anda Sendiri

Menemukan duplikat konten di situs Anda gratis dan mudah. Gunakan versi gratis Screaming Frog dan Siteliner untuk merayapi situs Anda secara metodis dan mengidentifikasi halaman duplikat yang persis atau hampir sama.

Cara Menggunakan Screaming Frog untuk Mengungkap Konten Duplikat

Screaming Frog adalah perayap situs web dan alat audit SEO yang dapat membantu Anda mengidentifikasi masalah duplikat konten di situs web Anda. Berikut cara menggunakan Screaming Frog untuk memindai hingga 500 URL secara gratis.

1. Jelajahi Situs Anda dengan SEO Spider

Pertama, unduh dan buka Screaming Frog. Ketik URL situs web yang ingin Anda jelajahi di bidang 'Masukkan URL ke Spider', dan klik 'Mulai'.

tangkapan layar seo spider

2. Periksa Duplikat di Tab 'Konten'

Klik pada tab 'Konten' untuk memeriksa duplikat yang tepat dan hampir duplikat. Anda akan dapat melihat duplikat yang tepat secara real time, tetapi Anda perlu melakukan 'Analisis Perayapan' untuk melihat daftar duplikat yang hampir sama.

menemukan konten duplikat dengan screamfrog

3. Periksa Duplikat Dekat

Klik tab 'Analisis Perayapan' pada bilah menu dan pilih 'Mulai' dari menu tarik-turun.

Saat analisis perayapan selesai, Anda akan melihat kolom yang terisi di dekat duplikat. Anda akan mengetahui bahwa ini sudah selesai karena bilah kemajuan 'analisis' akan membaca 100% dan filter duplikat yang hampir sama tidak akan lagi menampilkan pesan 'perlu analisis perayapan'.

menemukan konten yang hampir duplikat dengan screamfrog

4. Lihat Duplikat Di Bawah Tab 'Konten'

'Pertandingan Kesamaan Terdekat', 'Tidak. Kolom Near Duplicates,' dan 'Address' akan diisi setelah analisis perayapan selesai.

Filter 'Duplikat Tepat' akan menampilkan halaman yang identik satu sama lain berdasarkan pemindaian kode HTML. Ambang batas kesamaan yang ditetapkan menentukan apa yang memenuhi syarat sebagai 'Mendekati Duplikat'. Untuk mengubah ambang batas, buka 'Config → Spider → Content. Ambang ini disetel ke 90% secara default, tetapi Anda bebas mengubahnya ke apa pun yang Anda inginkan.

Sekarang setelah pemindaian selesai, tinjau halaman apa pun yang muncul sebagai duplikat yang tepat atau hampir sama secara manual.

Cara Menggunakan Siteliner untuk Mengungkap Konten Duplikat

Siteliner adalah alat gratis lain yang dapat Anda gunakan untuk memindai situs web Anda (atau situs web apa pun) untuk menemukan konten duplikat. Namun, versi gratis akan membatasi Anda untuk satu penggunaan setiap 30 hari dan akan membatasi jumlah hasil hingga 250 halaman. Jika Anda perlu melakukan beberapa pencarian atau ingin melihat lebih banyak hasil, daftar untuk versi premium.

menggunakan siteliner untuk menemukan konten duplikat

Untuk memeriksa duplikat konten dengan Siteliner, cukup masukkan URL yang ingin Anda cari ke dalam kotak pencarian di beranda mereka.

Siteliner kemudian akan memeriksa situs dan memberi tahu Anda berapa banyak konten duplikat yang ditemukan dan menyoroti apa yang diyakini sebagai masalah utama Anda. Ini juga akan menampilkan beberapa metrik lagi, termasuk beberapa yang dapat berguna untuk SEO, seperti waktu muat halaman rata-rata, tautan internal dan eksternal, dan tautan masuk.

hasil siteliner untuk konten duplikat internal

Di bawah Menu Utama, klik 'Duplikat Konten' untuk melihat halaman mana yang diidentifikasi Siteline memiliki konten duplikat.

Klik pada setiap baris individu untuk melihat teks apa yang ditandai sebagai duplikat.

Catatan: Siteline akan mengidentifikasi header dan footer yang muncul di beberapa halaman sebagai konten duplikat, sehingga Anda mungkin mendapatkan banyak halaman yang memiliki persentase kecocokan rendah karena masing-masing halaman berbagi konten menu atau footer yang sama.

Cara Memeriksa Apakah Orang Lain Telah Menyalin Konten Anda

Ada juga alat pencarian konten duplikat yang dapat Anda gunakan untuk memeriksa apakah orang lain di web telah menyalin konten Anda. Copyscape adalah alat pemeriksa konten situs web gratis yang efektif dan mudah digunakan.

Cukup masukkan URL ke dalam kotak pencarian dan klik tombol 'Go' tepat di sebelahnya. Copyscape kemudian akan melakukan pencarian di seluruh web untuk melihat apakah konten teks serupa ada di tempat lain.

tangkapan layar copyscape

Jika menemukan sesuatu, Copyscape akan mengembalikan hasilnya dan mengaturnya dalam daftar yang terlihat seperti hasil pencarian Google. Ini memungkinkan Anda dengan mudah menggulirnya dan melihat seberapa banyak konten Anda telah disalin. Anda dapat menganggapnya seperti pemeriksa konten duplikat Google.

hasil copyscape untuk konten duplikat eksternal

Apa yang dapat Anda lakukan jika Anda menemukan orang lain telah menjiplak konten Anda?

Pertama, hubungi pemilik situs web dan minta mereka untuk menghapus konten atau menambahkan tautan kanonik ke konten asli di situs web Anda. Jika tidak berhasil, kirimkan permintaan penghapusan DMCA dengan Google.

Catatan: Jika Anda dengan sengaja mensindikasikan konten Anda dan mengizinkan situs web lain untuk mempublikasikannya, konten tersebut akan tetap muncul sebagai duplikat. Itulah mengapa penting untuk meminta situs penerbitan menyertakan tautan kanonik atau tag noindex pada halaman agar tidak bersaing dengan halaman Anda sendiri di peringkat mesin pencari.

Cara Memperbaiki Konten Duplikat

Untuk memperbaiki masalah duplikat konten, identifikasi salinan mana yang Anda ingin Google kenali sebagai versi asli. Anda juga harus memutuskan apakah Anda ingin menghapus halaman duplikat sekaligus atau hanya ingin memberi tahu Google agar tidak mengindeksnya. Bergantung pada apa yang Anda putuskan, ada beberapa cara berbeda untuk membersihkan konten duplikat Anda.

Noindex dengan Meta Robots Tags & Robots.txt

Salah satu cara untuk meminimalkan dampak duplikat konten pada SEO Anda adalah dengan menghapus indeks halaman duplikat secara manual dengan memodifikasi tag meta robots Anda. Untuk melakukannya, gunakan tag meta robots dan atur nilainya menjadi “noindex, follow.” Terapkan tag ini ke judul HTML setiap halaman yang ingin Anda kecualikan dari hasil pencarian.

Tag meta robot memungkinkan mesin telusur untuk merayapi tautan pada halaman yang menerapkannya, tetapi mencegah perayap penelusuran memasukkannya ke dalam indeks mereka.

Mengapa mengizinkan Google untuk merayapi halaman sama sekali jika Anda tidak ingin diindeks? Karena Google telah secara eksplisit memperingatkan agar tidak membatasi akses perayapan ke konten duplikat apa pun di situs Anda. Mereka ingin tahu itu ada, bahkan jika Anda tidak ingin mereka mengindeksnya.

Tag noindex akan terlihat seperti ini saat diterapkan ke kode HTML Anda:

<head> [code] <meta name=”robots” content=”noindex, follow”> [kode lain jika diperlukan] </head>

Tag meta robots adalah cara sederhana dan efektif untuk menghapus indeks duplikat konten dan menghindari kemungkinan masalah SEO karena memiliki halaman duplikat yang cukup mirip atau sama persis di situs web Anda.

Jika Anda memiliki seluruh direktori yang ingin diblokir oleh Google dan mesin telusur lainnya, edit file robots.txt Anda.

301 Pengalihan

Cara lain untuk menangani masalah duplikat konten adalah dengan pengalihan 301. 301 adalah pengalihan permanen yang meneruskan lalu lintas dari halaman duplikat dan menuju URL lain. Pengalihan 301 ramah SEO dan membantu Anda menggabungkan beberapa halaman menjadi satu URL sehingga mereka mengkonsolidasikan ekuitas tautan mereka.

Saat Anda menggunakan pengalihan 301, halaman duplikat atau halaman yang cukup mirip tidak akan lagi menerima lalu lintas apa pun, jadi gunakan hanya saat Anda setuju dengan halaman duplikat tidak lagi dapat diakses, seperti saat memangkas konten. Jika Anda masih ingin halaman dapat diakses, gunakan tag meta robots untuk mengindeksnya.

Rel Canonical

Cara lain untuk mengelola konten duplikat Anda adalah dengan menggunakan atribut rel=canonical untuk memprioritaskan halaman. Tempatkan atribut rel=canonical di dalam tag HTML <head> untuk memberi tahu mesin telusur bahwa halaman tertentu ada sebagai salinan dari halaman lain dan bahwa semua tautan dan kekuatan peringkat yang dimiliki halaman ini harus benar-benar dikaitkan dengan kanonik halaman.

Tag rel=canonical terlihat seperti ini saat diterapkan ke kode HTML Anda:

<head> [code] <link href="URL OF PRIORITIZED PAGE" rel="canonical" /> </head>

Anda juga dapat menggunakan tag kanonik referensi sendiri untuk menunjukkan bahwa Anda ingin halaman tertentu diperlakukan sebagai versi asli.

Hapus URL dari Peta Situs XML Anda

Peta situs XML Anda hanya boleh menyertakan URL yang ingin Anda indeks. Jika Anda tidak menggunakan URL dinamis yang secara otomatis memperbarui peta situs, Anda harus mengedit peta situs secara manual dan menghapus URL apa pun yang tidak diindeks atau dialihkan.

Hapus URL di Google Search Console

Jika Anda memilih untuk mengalihkan halaman atau membatasi pengindeksan, minta Google menghapus URL tersebut dari indeksnya.

Masuk ke Google Search Console dan pilih 'Penghapusan' dari menu sebelah kiri.

alat penghapusan url di GSC

Sebuah kotak akan muncul memberi tahu Anda bahwa mengirimkan URL akan mencabutnya dari indeks Google hanya dalam enam bulan. Setelah waktu itu, jika Google merayapi situs Anda dan menemukan URL-nya, itu akan diindeks ulang kecuali telah dialihkan atau diblokir oleh tag robots. Jika Anda memiliki beberapa URL yang berbagi awalan, Anda juga dapat mengirimkan awalan untuk menghapus sementara semua URL dari indeks Google.

meminta penghapusan dari indeks Google

Setelah enam bulan, Google akan mencoba merayapi URL Anda lagi. Jika Anda telah mengarahkan ulang atau tidak mengindeksnya dengan benar, mereka tidak akan lagi muncul di halaman hasil mesin pencari (SERP).

Perlu Bantuan Mengidentifikasi Masalah SEO Teknologi?

Ingin meningkatkan kemampuan situs Anda untuk menentukan peringkat? Bermitra dengan agen SEO berbasis data yang akan bekerja dengan Anda untuk mengidentifikasi masalah teknis SEO di situs web Anda dan mengembangkan strategi SEO yang unggul untuk membantu Anda meningkatkan SERP. Pesan konsultasi SEO gratis hari ini dan lihat apa yang bisa kami lakukan untuk Anda!