Gelişmiş Sayfa İçi Optimizasyon – Anahtar Kelime Yoğunluğunun Ötesinde: SEO için TF-IDF
Yayınlanan: 2021-02-26Hepimiz Arama Motoru Optimizasyonunun (SEO) yeni olmadığını biliyoruz. Artık birçok değişikliğe uğrayan, köklü ve çok yönlü bir alandır. Arama motorlarının sayfaları değerlendirip sıralamasının değişen yolu, SEO'da bu tür bükülmelere ve dönüşlere yol açtı (SEO'nun maliyetiyle ilgili bu makaleye bir göz atın).
Bağlantı kurma, önemli ölçüde öne çıkan başka bir şeydir. Bu, geri bağlantıların önemi netleştiğinde oldu. Herhangi bir sitenin bilgi mimarisi çok önemli bir faktör olarak kabul edildiğinde daha teknik SEO ön plana çıktı.
İçeriğin önemi daha sonra açık hale geldi. Arama motorları, sitelerin yüksek kaliteli ve alakalı içeriğe sahip olması gerektiğini bildirdi. İlk başta bu, SEO uzmanlarının anahtar kelime yoğunluğu ve anahtar kelime planlama araçları için çalışmaya başlamasına neden oldu. Kısa sürede, bunun gidilecek en iyi yol olmadığı ortaya çıktı. Ya da en azından, bu araçları anahtar kelime doldurma gibi gölgeli uygulamalar için kullanmak işe yaramayacaktı. Arama motoru algoritmalarını kandırmaz.
Google ve diğer arama motorları gerçek yüksek kaliteli içerik arıyor. Sözde konusuyla gerçekten alakalı olan ve kullanıcının arzuladığı amaca cevap veren içeriği ödüllendirirler. Bu tür içerik oluşturmak, Google'ın ünlü - veya kötü şöhretli - Medic Güncellemesinden kurtulmak için verdiği ana tavsiyeydi.
Danışmanlık Randevu Alın
Sonuç olarak, Google'ın ve diğer arama motorlarının içeriğin konusunu ve anlamını doğru bir şekilde değerlendirebileceği ve değerlendirebileceği açıktır. Bunu yapmanın bir yolu, tf-idf kullanmaktır. Tf-idf, arama motorları tarafından kullanılan en eski sıralama faktörlerinden biridir. En basit düzeyde, sayfaların ne hakkında olduğunu anlamalarını sağlar.
SEO için tf-idf'ye yönelik bu nihai rehber, size ihtiyaç duyabileceğiniz tüm bilgileri verecektir. tf-idf'in ne olduğu ve nasıl çalıştığı, tf-idf'in SEO ile nasıl bir ilişkisi olduğu ve tf-idf analizinden nasıl ve ne zaman yararlanabileceğiniz ele alınacaktır.
TF-IDF nedir?
Tf-idf, bilgi almada kullanılan sayısal bir istatistiktir. Bir koleksiyon veya 'korpus'taki diğer belgelerle karşılaştırıldığında, belirli bir belge için bir kelimenin veya ifadenin ne kadar önemli olduğunu gösterir. Bir tf-idf değeri, bir kelimenin veya kelime öbeğinin bir belgede görünme sayısıyla orantılı olarak artar.
Bu, daha sonra, söz konusu kelimenin veya tümceciğin külliyattaki tüm belgelerde görünme sayısıyla dengelenir. Bu, bazı kelimelerin genel kullanımda daha sık görünmesi gerçeğini düzelttiği için önemlidir.
'En iyi SEO' gibi bir arama terimi örneğini ele alalım. 'The', bir külliyattaki tüm belgelerde birçok kez geçen bir kelimedir. Sonuç olarak, bir td-idf değeri için aranan belgede 'the'nin görünmesi, daha az yaygın olan diğer kelimelerin görünmesine göre daha az önemlidir.
Tf-idf, iki istatistiğin ürünüdür. Yani birini diğeriyle çarpıyorsunuz. Bir kelimenin veya deyimin önemini bu şekilde temsil eder ve o kelime veya deyimin genel sıklığını dengeler. İki istatistik Terim Sıklığı (tf) ve Ters Belge Sıklığıdır (idf).
Terim Sıklığı
Terim frekansı, tf-idf'nin daha basit yarısıdır. Belirli bir belgede bir terimin ne sıklıkla geçtiğini gösterir. Terim sıklığını hesaplamak için gereken tek şey, belgenin kelime uzunluğu ve terimin kaç kez geçtiğidir. Ardından, kelimenin kaç kez göründüğünü toplam kelime sayısına bölersiniz. Bu, terim frekansının her zaman sıfır ile bir arasında bir değer olacağı anlamına gelir.
Mümkün olan en basit düzeyde, terim sıklığı aşağıdaki şekilde hesaplanır:
TF (Terim Sıklığı) = t (Bir belgede geçen terim sayısı) / d (belgedeki toplam kelime sayısı)
Belgenin uzunluğunu ve terimin kaç kez geçtiğini göz önünde bulundurarak, belgenin verilen terimle ne kadar ilgili olduğu konusunda makul bir fikir edinirsiniz. Terimin genel olarak belgelerde ne sıklıkta geçtiğini bilmiyorsanız kesin olarak bilemezsiniz. Ters Belge Frekansının (idf) devreye girdiği yer burasıdır.
Ters Belge Frekansı
Pek çok belgede çok sık kullanılan sözcükler, hangi belgelerin belirli bir arama terimiyle alakalı olduğunu belirlemede iyi değildir. Ters Belge Sıklığı, bu yaygın terimlere verilen ağırlığı azaltan bir istatistiktir.
Bu, 'hızlı kahverengi tilki'yi arıyorsanız, bir belgede birçok kez geçen 'the'nin, diğer kelimelerin varlığından daha önemli olmamasını sağlar. Ters Belge Frekansı, bir kelimenin veya terimin ne kadar bilgi sağladığının bir ölçüsüdür.
İdf hesaplama formülü oldukça karmaşık görünüyor:
IDF = günlük (Nd / fi)
Parçalarına ayırırsanız, o kadar karmaşık değildir.
Günlük, anlaşılması çok önemli olmayan basit bir matematiksel işlevdir. Gerekirse bir hesap makinesindeki 'log' düğmesine basabilirsiniz. 'Nd', koleksiyondaki veya külliyattaki aranmakta olan belgelerin sayısıdır. 'fi', arama terimini içeren belgelerin sayısıdır.
Ardından, belge sayısını arama terimi ile belge sayısına bölerek ve ardından log işlevini uygulayarak IDF değerinizi elde edersiniz.
TF-IDF Çözülmüş Örnek
Artık öğrendiklerimizi alıp çok basit bir örnek olarak kullanabiliriz. Diyelim ki 100 kelimelik bir belgeniz var ve onu 'anahtar kelime' kelimesini aratıyorsunuz. Bu kelime üç kez geçiyorsa, terim sıklığını şu şekilde hesaplayabilirsiniz:
3(belgedeki terim sayısı) / 100 (toplam kelime) = 0,03
Terim sıklığınız 0.03'tür. Şimdi, aradığınız külliyatta toplam on milyon belge olduğunu ve bunların 1.000'inde 'anahtar kelime' göründüğünü varsayalım. Artık idf'nizi hesaplamak için ihtiyacınız olan her şeye sahipsiniz:
Günlük(10.000.000 / 1.000) = 4
Ters belge sıklığınız 4'tür. Bir tf-idf değeri, terim frekansının idf ile çarpımıdır, yani:
0,03 (tf) x 4 (idf) = 0,12
tf-idf değeriniz 0,12'dir. Bu tek başına size pek bir şey söylemez, ancak diğer değerlerle karşılaştırılabilir. tf-idf değeri ne kadar yüksek olursa, bir terim verilen belge için o kadar önemlidir. En yüksek tf-idf değerleri, bir derlemde terim sıklığı yüksek ve terimi içeren belge sayısı az olduğunda ortaya çıkar. Aşağıdaki tablo bunu göstermeye yardımcı olacaktır:
Terim Frekansı (TF) | Corpus Büyüklüğü (Nd) | Terimli Belgeler (fi) | Ters Belge Frekansı (IDF) | TF-IDF |
0.03 | 10.000.000 | 1.000 | 4 | 0.12 |
0.04 | 10.000.000 | 900 | 4.05 | 0,162 |
0,05 | 10.000.000 | 800 | 4.10 | 0,205 |
0,06 | 10.000.000 | 700 | 4.15 | 0,249 |
0.07 | 10.000.000 | 600 | 4.22 | 0,295 |
TF-IDF, SEO ve LSI
Tf-idf çoğunlukla Gizli Semantik İndekslemenin (LSI) bir parçası olarak kullanılır. Bu kesinlikle tf-idf ve SEO'yu doğrudan birbirine bağlayan şeydir. tf-idf ile LSI, dili işlemek için bir tekniktir. Tek bir arama terimiyle veya daha geniş bir konu alanıyla alaka düzeyine göre belgelerin sıralanmasına olanak tanır.
LSI, yapılandırılmamış metin koleksiyonlarındaki farklı ifadeler ve kavramlar arasındaki ilişkilerdeki kalıpları belirleyerek çalışır. Aynı bağlamlarda kullanılan kelimelerin ilgili veya benzer anlamlara sahip olma eğiliminde olduğu fikrine dayanır.
LSI, terimler ve deyimler arasındaki kalıpları kurarak, bir metin gövdesinin genel konusunu veya konusunu ayırt etmeyi mümkün kılar. Bir belgeler külliyatına tf-idf ile LSI uygulandığında, bir sorgu veya arama terimi daha doğru sonuçlar verir.
Bunun nedeni, sonuçların kavramsal olarak aramaya anlam bakımından benzer belgeleri içermesidir. Belgeler, arama teriminden belirli sözcükler içermese bile durum böyle olacaktır. tf-idf ile LSI'nin amacı, bir belge külliyatının asıl konularını ve odak noktalarını anlamlandırmaktır.

Kısacası, tf-idf, LSI'nin bir parçası olarak kullanıldığında, makinelerin hangi metin sayfalarının ne hakkında olduğunu anlamasını sağlar. Bu nedenle, Google ve diğer arama motorlarının içeriğin alaka düzeyini ve yararlılığını bu şekilde değerlendirebilmesidir.
tf-idf'nin SEO için önemi kesinlikle daha net hale geliyor. En eski arama motoru sıralama faktörlerinden biridir ve hatta arama motorlarının ve SERP'lerin önemli bir yapı taşı olarak görülebilir. Daha da önemlisi, tf-idf, Google'ın herhangi bir arama terimi veya sorguyla ilgili olarak sayfaların gerçek alaka düzeyini ve faydasını değerlendirmesine yardımcı olur.
Bu, tf-idf'yi daha iyi anlamamızın SEO için nasıl kullanılabileceği sorusunu gündeme getiriyor. İster bir SaaS SEO ajansı, isterse organik trafiği artırmak isteyen küçük bir işletme sahibi olsun. AJ Ghergich konuyla ilgili bir SEMrush videosunda şunları söyledi:
'tf-idf'nin genel amacı, bir belge koleksiyonunda bir kelimenin ne kadar önemli olduğunu istatistiksel olarak ölçmektir. Steroidler üzerinde gerçekten kullanışlı bir anahtar kelime yoğunluğu aracı gibi.'
SEMrush
Bu güzel bir benzetme ama biraz yanıltıcı olabilir. Tf-idf analizi, içeriğe eklenecek anahtar kelimeleri belirlemek için en iyi şekilde kullanılmaz. Bunu bir tür içerik ilham aracı olarak düşünmek daha iyi.
Kendi içeriğinizi daha iyi sıralanan benzer sayfalarla karşılaştırmak için tf-idf kullanmak, içeriği nasıl zenginleştireceğiniz konusunda size önerilerde bulunabilir. Daha yüksek dereceli içeriğin sayfalarınızdan daha iyi tf-idf değerleri aldığı anahtar kelimelere ve kelime öbeklerine işaret edecektir.
Bu, içeriğinizin hangi konu alanlarını ve konuları kapsamadığını, benzer sayfalar kadar ayrıntılı olarak gösterecektir. Ardından, içeriğinizi Google'ın beğeneceğinden emin bir şekilde nasıl iyileştireceğinize dair bir yol haritanız var. Bu, alaka düzeyini artırarak ve belirli anahtar kelimeleri veya kelime öbeklerini arayan müstakbel okuyucuların amacını ne kadar tatmin ederek sağlanır.
SEO için TF-IDF Kullanımı
SEO için TF-IDF kullanmak, anahtar kelime yoğunluğu ile ilgili değildir. Bunun çok ötesine geçer.
Bir tf-idf analizi yapmak, içeriğinizin ve diğer sayfaların ilgilenmediği terimleri ve cümleleri ortaya çıkarır. Bir sonraki adımınız, anahtar kelime yoğunluğunu artırmak için bu cümleleri mevcut içeriğinize eklemeye başlamak değildir. Yapmak istediğiniz şey, içeriğinizi konularla ve bu ifadeleri çevreleyen konularla daha alakalı olacak şekilde optimize etmektir.
Örneğin, ana konusu SEO olan bir sayfanız olabilir. Bir tf-idf analizi, 'bağlantı kurma' teriminin SEO aramalarında üst sıralarda yer alan diğer sayfalara göre daha az değere sahip olduğunu ortaya çıkarabilir. Bu, içeriğinizin bağlantı oluşturma hakkında yeterince alakalı, yararlı bilgi vermediğini gösterir. Bu kadar basit, içeriğinizi geliştirmek için kesin bir yolunuz var.
İçeriğinizi geliştirmeyi düşünmeden önce, bir tf-idf analizi yapmayı bilmeniz gerekir. Şimdi bununla ilgilenelim.
TF-IDF Analizi Nasıl Tamamlanır?
Kendi hesaplamalarınızı yaparak elle bir tf-idf analizi yapmak teknik olarak mümkündür. Mümkün olsa da tavsiye edilmez. Daha önce gördüğünüz gibi, hesaplamalar biraz karmaşık olabilir ve her zaman zaman alır.
Bu en büyük sorun bile değil. Bir tf-idf analizi, yalnızca içeriği karşılaştırdığınız külliyat alakalı ve faydalıysa değerlidir. İçeriğinizin tf-idf değerlerini, önemli anahtar kelimeleriniz için iyi derecelendirilen diğer sayfalarla karşılaştırabilmek istiyorsunuz. Ryte tarafından sunulanlar gibi bir tf-idf aracının devreye girdiği yer burasıdır.
Ryte'ın aracı, belirli bir anahtar kelime veya arama sorgusu için sitenizdeki canlı bir URL'yi ilk on Google arama sonucuyla karşılaştırabilir. Daha sonra, yüksek dereceli içeriğin yüksek tf-idf değerine sahip olduğu ilgili önemli terimlerin ve ifadelerin bir listesini sağlayacaktır.
Bunun da ötesinde, Ryte'ın aracı, seçtiğiniz URL'yi bu ifadelere ve terimlere göre de derecelendirecektir. İçeriğinizin her biri için yüksek, yüksek veya düşük tf-idf değerlerine sahip olup olmadığını gösterecektir.
Bu bilgi size içeriğinizin nerede ve nasıl iyileştirilmesi gerektiğini gösterecektir. Sayfanızın yeterince verimli bir şekilde kapsamadığı konuları ve konuları size verecektir. Bu nedenle, sayfayı okuyucularının ihtiyaçlarına ve amaçlarına daha iyi uyacak şekilde uyarlayabileceksiniz.
Muhtemelen şimdi tf-idf analizini ne zaman kullanmanız gerektiğini merak ediyorsunuz. Ne de olsa SEO alanında ve dışında yapılması gereken birçok başka şey var.
TF-IDF Analizi Ne Zaman Kullanılır?
Sitenizin içeriğini iyileştirmeyi düşünmek için asla kötü bir zaman yoktur. Ayrıca günde sadece çok fazla saat var. Bu, tf-idf analizini fark yaratma olasılığının en yüksek olduğu durumlarda uygulamanın en iyisi olduğu anlamına gelir. Bu tür durumların bir avuç dolusu örneği vardır;
- Mevcut İçeriğin Potansiyelini Ortaya Çıkarma
Google aramalarında sürekli olarak ikinci sayfada yer alan bir sayfanız varsa, Tf-idf gerçekten yararlı olabilir. Sıralamalarda bu kadar yükseklere ulaşan sayfanın açıkça potansiyeli var. Bir tf-idf analizi, birinci sayfaya o son sıçramayı yapmak için ihtiyaç duyduğunuz ince ayarları ve eklemeleri tam olarak yapmanıza yardımcı olabilir.
- Yeni Bir İçerik Planına Yön Verme
Bir tf-idf analizi, içerik için ilham kaynağı olarak mükemmeldir. Belli konu ve konularda sıralaması iyi olan sayfalar üzerinde analiz yapmak, kendi içeriğinizin neleri kapsaması gerektiğini size gösterecektir. Bu, bir dizi yeni içerik için bir plan hazırlamak için harika bir temel olabilir.
- Düşen Sıralamaları Durdurmak
Eskiden en iyi performans gösteren ancak önemli anahtar kelimeler için sıralamada aşağı kayan bir sayfanız varsa, tf-idf burada da yardımcı olabilir. Sizinkini geride bırakan sayfaların hangi anahtar kelimeler ve konularda daha iyi tf-idf değerlerine ulaştığını gösterebilir. Daha sonra kendi içeriğinizi buna göre geliştirebilir ve güncelleyebilirsiniz.
SEO için TF-IDF – Anahtar Kelime Yoğunluğunun Ötesine Geçmek
SEO'nun modern dünyasında dikkate alınması gereken çok şey var. Site mimarisi, bağlantılar, anahtar kelime yoğunlukları ve diğer tüm geleneksel unsurlar çok önemli olmaya devam ediyor. Bununla birlikte, içeriğin artık kral olduğu tartışılabilir. Ya da en azından diğer faktörler kadar dikkat edilmesi gerektiğini.
Artık siteler, anahtar kelime doldurma veya yinelenen veya gizli spam içeriği olan sayfaları doldurma ile paçayı sıyıramaz. Sitelerin, okuyucular için gerçekten yararlı olan yüksek kaliteli içeriğe sahip olması gerekir. Tf-idf, Google'ın ve diğer arama motorlarının içeriği bu bağlamda değerlendirdiği önemli bir yoldur.
Bu nedenle, tf-idf'nin nasıl çalıştığını ve SEO ile nasıl bir ilişkisi olduğunu anlamak çok önemlidir. SEO için tf-idf'nin doğru bir şekilde anlaşılması ve uygulanması, içeriğinizi zenginleştirmenize ve organik trafiğinizdeki ödülleri görmenize yardımcı olabilir.
Danışmanlık Randevu Alın

Nick Brown, bir SaaS SEO ajansı olan hızlandırma ajansının kurucusu ve CEO'sudur. Nick birkaç başarılı çevrimiçi işletme kurdu, Forbes için yazdı, bir kitap yayınladı ve Birleşik Krallık'taki bir ajanstan hızla büyüyerek şu anda ABD, APAC ve EMEA'da faaliyet gösteren ve 160 kişiyi istihdam eden bir şirkete dönüştü. Ayrıca bir keresinde bir dağ gorili tarafından suçlandı.