Optimasi On-Page Tingkat Lanjut – Melampaui Kepadatan Kata Kunci: TF-IDF untuk SEO
Diterbitkan: 2021-02-26Kita semua tahu bahwa Search Engine Optimization (SEO) bukanlah hal baru. Sekarang bidang mapan dan banyak segi yang telah mengalami banyak perubahan. Perubahan cara mesin pencari menilai dan memeringkat halaman telah menyebabkan banyak perubahan dalam SEO (lihat artikel ini tentang biaya SEO).
Pembuatan tautan adalah hal lain yang menjadi terkenal secara signifikan. Itu terjadi begitu pentingnya backlink menjadi jelas. SEO yang lebih teknis muncul ketika arsitektur informasi dari situs mana pun diakui sebagai faktor penting.
Pentingnya konten kemudian menjadi jelas. Mesin pencari memberitahukan bahwa situs harus memiliki konten yang relevan dan berkualitas tinggi. Pada awalnya, hal itu membuat para profesional SEO berlari untuk kepadatan kata kunci dan alat perencanaan kata kunci mereka. Singkatnya, menjadi jelas bahwa itu bukan cara terbaik untuk pergi. Atau setidaknya, menggunakan alat tersebut untuk praktik curang seperti isian kata kunci tidak akan berhasil. Itu tidak akan menipu algoritma mesin pencari.
Google dan mesin pencari lainnya mencari konten berkualitas tinggi yang sebenarnya. Mereka menghargai konten yang benar-benar relevan dengan pokok bahasan yang seharusnya dan yang menjawab maksud yang diinginkan pengguna. Membuat konten semacam itu adalah saran utama dari Google untuk memulihkan dari Pembaruan Medis mereka yang terkenal – atau terkenal buruk.
Pesan Konsultasi
Hasilnya jelas bahwa Google dan mesin pencari lainnya dapat secara akurat menilai dan mengevaluasi subjek dan makna konten. Salah satu cara mereka melakukannya adalah dengan menggunakan tf-idf. Tf-idf adalah salah satu faktor peringkat tertua yang digunakan oleh mesin pencari. Pada tingkat yang paling sederhana, ini memungkinkan mereka untuk memahami tentang halaman apa.
Panduan utama untuk tf-idf untuk SEO ini akan memberi Anda semua informasi yang mungkin Anda perlukan. Ini akan mencakup apa itu tf-idf dan bagaimana cara kerjanya, bagaimana tf-idf berhubungan dengan SEO dan bagaimana dan kapan Anda dapat menggunakan analisis tf-idf.
Apa itu TF-IDF?
Tf-idf adalah statistik numerik yang digunakan dalam pencarian informasi. Ini mewakili betapa pentingnya sebuah kata atau frasa untuk dokumen tertentu, dibandingkan dengan dokumen lain dalam koleksi atau 'korpus'. Nilai tf-idf meningkat secara proporsional dengan berapa kali kata atau frasa muncul dalam dokumen.
Itu kemudian diimbangi dengan berapa kali kata atau frasa itu muncul di semua dokumen dalam korpus. Ini penting karena menyesuaikan fakta bahwa beberapa kata lebih sering muncul dalam penggunaan umum.
Ambil contoh istilah pencarian seperti 'SEO terbaik'. 'The' adalah kata yang akan muncul berkali-kali di semua dokumen di seluruh korpus. Akibatnya, nilai td-idf menjadi kurang penting jika 'the' muncul di dokumen yang dicari daripada jika kata lain yang kurang umum muncul.
Tf-idf adalah produk dari dua statistik. Berarti Anda mengalikan satu dengan yang lain. Begitulah cara mewakili pentingnya sebuah kata atau frase dan mengimbangi frekuensi umum dari kata atau frase tersebut. Kedua statistik tersebut adalah Term Frequency (tf) dan Inverse Document Frequency (idf).
Frekuensi Istilah
Istilah frekuensi adalah bagian sederhana dari tf-idf. Ini mewakili seberapa sering suatu istilah muncul dalam dokumen tertentu. Semua yang diperlukan untuk mengetahui frekuensi istilah adalah panjang kata dari dokumen dan berapa kali istilah itu muncul. Anda kemudian membagi berapa kali kata itu muncul dengan jumlah kata total. Itu berarti frekuensi istilah akan selalu menjadi nilai antara nol dan satu.
Pada tingkat yang paling sederhana, frekuensi istilah dikerjakan dengan cara berikut:
TF (Frekuensi Term) = t (Jumlah kemunculan term dalam dokumen) / d (jumlah kata dalam dokumen)
Dengan mempertimbangkan panjang dokumen dan berapa kali istilah tersebut muncul, Anda mendapatkan gambaran yang wajar tentang seberapa relevan dokumen tersebut dengan istilah yang diberikan. Namun, Anda tidak dapat mengetahui secara pasti, kecuali Anda mengetahui seberapa sering istilah tersebut muncul dalam dokumen secara umum. Di situlah Inverse Document Frequency (idf) masuk.
Frekuensi Dokumen Terbalik
Kata-kata yang sangat sering digunakan di banyak dokumen tidak baik untuk menentukan dokumen mana yang relevan dengan istilah pencarian tertentu. Frekuensi Dokumen Terbalik adalah statistik yang mengurangi bobot yang ditempatkan pada istilah-istilah umum tersebut.
Ini memastikan bahwa jika Anda mencari 'the quick brown fox', 'the' muncul berkali-kali dalam dokumen, tidak akan menjadi masalah seperti jika ada kata lain. Inverse Document Frequency adalah ukuran berapa banyak informasi yang diberikan oleh kata atau istilah.
Rumus untuk mengerjakan idf terlihat cukup rumit:
IDF = log (Nd/fi)
Jika Anda memecahnya menjadi bagian-bagiannya, itu tidak serumit itu.
Log hanyalah fungsi matematika yang tidak terlalu penting untuk dipahami. Anda cukup menekan tombol 'log' pada kalkulator jika perlu. 'Nd' adalah jumlah dokumen dalam koleksi atau korpus yang dicari. 'fi' adalah jumlah dokumen yang mengandung istilah pencarian.
Anda mendapatkan nilai IDF Anda, kemudian, dengan membagi jumlah dokumen dengan jumlah dokumen dengan istilah pencarian dan kemudian menerapkan fungsi log.
Contoh Soal TF-IDF
Kita sekarang dapat mengambil apa yang telah kita pelajari dan menggunakannya untuk contoh yang sangat sederhana. Katakanlah Anda memiliki dokumen 100 kata dan Anda mencarinya untuk kata 'kata kunci'. Jika kata itu muncul tiga kali, Anda dapat menghitung frekuensi istilah sebagai berikut:
3(jumlah istilah dalam dokumen) / 100 (total kata) = 0,03
Frekuensi istilah Anda adalah 0,03. Sekarang katakanlah ada total sepuluh juta dokumen dalam korpus yang Anda cari dan 'kata kunci' muncul di 1.000 dokumen. Anda sekarang memiliki semua yang Anda butuhkan untuk mengerjakan idf Anda:
Log(10.000.000 / 1.000) = 4
Frekuensi dokumen terbalik Anda adalah 4. Nilai tf-idf hanyalah frekuensi istilah dikalikan dengan idf, jadi:
0,03 (tf) x 4 (idf) = 0,12
Nilai tf-idf Anda adalah 0,12. Itu sendiri tidak memberi tahu Anda banyak, tetapi dapat dibandingkan dengan nilai lain. Semakin tinggi nilai tf-idf, semakin signifikan suatu term terhadap dokumen yang diberikan. Nilai tf-idf tertinggi dihasilkan ketika frekuensi istilah tinggi dan jumlah dokumen yang menampilkan istilah dalam korpus rendah. Tabel berikut akan membantu menunjukkan hal ini:
Frekuensi Istilah (TF) | Ukuran Korpus (Nd) | Dokumen dengan Istilah (fi) | Frekuensi Dokumen Terbalik (IDF) | TF-IDF |
0,03 | 10.000.000 | 1.000 | 4 | 0,12 |
0,04 | 10.000.000 | 900 | 4.05 | 0,162 |
0,05 | 10.000.000 | 800 | 4.10 | 0,205 |
0,06 | 10.000.000 | 700 | 4.15 | 0,249 |
0,07 | 10.000.000 | 600 | 4.22 | 0,295 |
TF-IDF, SEO & LSI
Tf-idf paling sering digunakan sebagai bagian dari Latent Semantic Indexing (LSI). Hal inilah yang secara langsung menghubungkan tf-idf dan SEO. LSI dengan tf-idf adalah teknik untuk memproses bahasa. Ini memungkinkan peringkat dokumen berdasarkan relevansi dengan istilah pencarian individual atau area topik yang lebih luas.
LSI bekerja dengan mengidentifikasi pola dalam hubungan antara frasa dan konsep yang berbeda dalam kumpulan teks yang tidak terstruktur. Ini didasarkan pada gagasan bahwa kata-kata yang digunakan dalam konteks yang sama cenderung memiliki makna yang terkait atau mirip.
Dengan menetapkan pola antara istilah dan frasa, LSI memungkinkan untuk membedakan topik atau subjek umum dari sebuah teks. Saat LSI dengan tf-idf diterapkan ke kumpulan dokumen, kueri atau istilah pencarian akan memberikan hasil yang lebih akurat.

Itu karena hasilnya akan menyertakan dokumen yang secara konseptual memiliki arti yang mirip dengan pencarian. Itu akan terjadi bahkan jika dokumen tidak mengandung kata-kata tertentu dari istilah pencarian. Tujuan LSI dengan tf-idf adalah untuk memahami subjek aktual dan fokus kumpulan dokumen.
Singkatnya, tf-idf ketika digunakan sebagai bagian dari LSI memungkinkan mesin memahami tentang halaman teks apa. Oleh karena itu, Google dan mesin pencari lainnya dapat menilai relevansi dan kegunaan konten.
Pentingnya tf-idf untuk SEO tentunya semakin jelas. Ini adalah salah satu faktor peringkat mesin pencari paling awal dan bahkan dapat dilihat sebagai blok bangunan utama mesin pencari dan SERP. Lebih penting lagi, tf-idf membantu Google menilai relevansi aktual dan utilitas halaman terkait dengan istilah atau kueri penelusuran apa pun.
Itu menimbulkan pertanyaan tentang bagaimana pemahaman kita yang lebih baik tentang tf-idf dapat digunakan untuk SEO. Baik itu oleh agen SEO SaaS atau pemilik usaha kecil yang ingin meningkatkan lalu lintas organik. AJ Ghergich mengatakannya dalam video SEMrush tentang topik tersebut:
'Tujuan keseluruhan tf-idf adalah untuk mengukur secara statistik seberapa penting sebuah kata dalam kumpulan dokumen. Ini seperti alat kepadatan kata kunci yang sangat berguna pada steroid.'
SEMrush
Itu analogi kecil yang rapi, tapi mungkin sedikit menyesatkan. Analisis tf-idf paling tidak digunakan untuk mengidentifikasi kata kunci untuk dimasukkan ke dalam konten. Lebih baik menganggapnya sebagai semacam alat inspirasi konten.
Menggunakan tf-idf untuk membandingkan konten Anda sendiri dengan halaman serupa yang berperingkat lebih baik, dapat memberi Anda saran tentang cara memperkaya konten. Ini akan mengarah ke kata kunci dan frasa yang konten peringkatnya lebih tinggi mendapat nilai tf-idf yang lebih baik daripada halaman Anda.
Itu akan menunjukkan bidang subjek dan topik mana yang tidak dicakup oleh konten Anda secara mendetail atau halaman serupa. Anda kemudian memiliki peta jalan untuk meningkatkan konten Anda dengan cara yang pasti disukai Google. Itu dengan meningkatkan relevansinya dan seberapa baik itu memenuhi maksud calon pembaca yang mencari kata kunci atau frase tertentu.
Menggunakan TF-IDF untuk SEO
Menggunakan TF-IDF untuk SEO bukan tentang kepadatan kata kunci. Itu bergerak jauh di luar itu.
Melakukan analisis tf-idf memang mengungkapkan istilah dan frasa yang tidak berhubungan dengan konten Anda serta halaman lain. Langkah Anda selanjutnya adalah tidak mulai memasukkan frasa tersebut ke dalam konten Anda yang ada untuk meningkatkan kepadatan kata kunci. Yang ingin Anda lakukan adalah mengoptimalkan konten Anda sehingga lebih relevan dengan topik dan subjek seputar frasa tersebut.
Anda mungkin, misalnya, memiliki halaman dengan SEO sebagai topik utamanya. Analisis tf-idf mungkin mengungkapkan bahwa istilah 'membangun tautan' memiliki nilai lebih rendah daripada halaman lain yang berperingkat tinggi untuk pencarian SEO. Itu memberi tahu Anda bahwa konten Anda tidak memberikan informasi yang cukup relevan dan berguna tentang pembuatan tautan. Sesederhana itu, Anda memiliki cara yang pasti untuk meningkatkan konten Anda.
Sebelum Anda berpikir untuk meningkatkan konten Anda, Anda perlu mengetahui cara melakukan analisis tf-idf. Mari kita tangani itu sekarang.
Cara Menyelesaikan Analisis TF-IDF
Secara teknis dimungkinkan untuk menjalankan analisis tf-idf dengan tangan, melakukan perhitungan Anda sendiri. Meskipun memungkinkan, itu tidak disarankan. Seperti yang telah Anda lihat, perhitungan bisa menjadi sedikit rumit dan akan selalu memakan waktu.
Itu bahkan bukan masalah terbesar. Analisis tf-idf hanya bermanfaat jika korpus yang Anda bandingkan dengan konten relevan dan bermanfaat. Anda ingin dapat membandingkan nilai tf-idf konten Anda dengan halaman lain yang berperingkat bagus untuk kata kunci penting Anda. Di situlah alat tf-idf, seperti yang ditawarkan oleh Ryte, masuk.
Alat Ryte dapat membandingkan URL langsung dari situs Anda dengan sepuluh hasil pencarian Google teratas untuk kata kunci atau permintaan pencarian tertentu. Ini kemudian akan memberikan daftar istilah dan frasa penting yang terkait dengan konten berperingkat tinggi yang memiliki nilai tf-idf tinggi.
Selain itu, alat Ryte juga akan menilai URL pilihan Anda terhadap frasa dan istilah tersebut. Ini akan menunjukkan apakah konten Anda memiliki nilai tf-idf yang tinggi, lebih tinggi, atau lebih rendah untuk masing-masingnya.
Informasi itu akan menunjukkan kepada Anda di mana dan bagaimana konten Anda perlu ditingkatkan. Ini akan memberi Anda topik dan subjek yang tidak dicakup oleh halaman Anda dengan cukup efisien. Oleh karena itu, Anda akan dapat menyesuaikan halaman agar lebih sesuai dengan kebutuhan dan maksud pembacanya.
Anda mungkin sekarang bertanya-tanya kapan Anda harus menggunakan analisis tf-idf. Ada banyak hal lain yang juga perlu dilakukan, di dalam dan di luar bidang SEO.
Kapan Menggunakan Analisis TF-IDF
Tidak pernah ada waktu yang buruk untuk memikirkan tentang meningkatkan konten situs Anda. Ada juga hanya beberapa jam dalam sehari. Itu berarti yang terbaik untuk menerapkan analisis tf-idf dalam keadaan di mana kemungkinan besar akan membuat perbedaan. Ada beberapa contoh dari keadaan seperti itu;
- Membuka Potensi Konten yang Ada
Tf-idf bisa sangat berguna jika Anda memiliki halaman yang secara konsisten mendapat peringkat di halaman kedua pencarian Google. Setelah mencapai peringkat yang sangat tinggi, halaman tersebut jelas memiliki potensi. Analisis tf-idf dapat membantu Anda menemukan tweak dan penambahan yang tepat yang Anda perlukan untuk membuat lompatan terakhir ke halaman satu.
- Memandu Rencana Konten Baru
Analisis tf-idf sangat bagus sebagai inspirasi untuk konten. Melakukan analisis pada peringkat halaman dengan baik untuk subjek dan topik tertentu akan menunjukkan kepada Anda apa yang perlu dicakup oleh konten Anda sendiri. Itu bisa menjadi dasar yang bagus untuk membuat sketsa rencana untuk seluruh konten baru.
- Menangkap Peringkat yang Menurun
Jika Anda memiliki halaman yang dulunya berkinerja terbaik tetapi peringkatnya turun untuk kata kunci penting, tf-idf dapat membantu di sana juga. Ini dapat menunjukkan kepada Anda kata kunci dan topik mana yang disusul halaman Anda yang mencapai nilai tf-idf yang lebih baik. Anda kemudian dapat meningkatkan dan memperbarui konten Anda sendiri sesuai dengan itu.
TF-IDF untuk SEO – Melampaui Kepadatan Kata Kunci
Ada begitu banyak hal yang perlu dipertimbangkan dalam dunia modern SEO. Arsitektur situs, tautan, kepadatan kata kunci, dan semua elemen tradisional lainnya tetap penting. Namun, dapat dikatakan bahwa konten sekarang adalah raja. Atau paling tidak perlu diberi perhatian sebanyak faktor-faktor lainnya.
Situs tidak lagi dapat lolos dengan isian kata kunci atau mengisi halaman dengan duplikat atau konten spam tersembunyi. Situs harus berisi konten berkualitas tinggi yang benar-benar bermanfaat bagi pembaca. Tf-idf adalah cara utama Google dan mesin pencari lainnya menilai konten dalam hal itu.
Oleh karena itu, sangat penting untuk memahami cara kerja tf-idf dan hubungannya dengan SEO. Pemahaman dan penerapan tf-idf yang tepat untuk SEO dapat membantu Anda memperkaya konten dan melihat hasilnya dalam lalu lintas organik Anda.
Pesan Konsultasi

Nick Brown adalah pendiri & CEO agensi akselerasi, agensi SaaS SEO. Nick telah meluncurkan beberapa bisnis online yang sukses, menulis untuk Forbes, menerbitkan buku, dan telah berkembang pesat dari agensi Inggris menjadi perusahaan yang sekarang beroperasi di seluruh AS, APAC, dan EMEA serta mempekerjakan 160 orang. Dia juga pernah diserbu oleh gorila gunung