Görüntü Sonuçlarına Dayalı Sorgu Kategorizasyonu

Yayınlanan: 2022-04-27

Google'a kısa süre önce Görsel Sonuçlarına Dayalı Sorgu Kategorizasyonu konusunda bir patent verildi.

Patent bize şunu söylüyor: “İnternet arama motorları, bir kullanıcının arama sorgusuna yanıt veren İnternet erişilebilir kaynaklar (Web sayfaları, resimler, metin belgeleri, multimedya içeriği gibi) hakkında, resim arama sırasında bir dizi resim arama sonucu döndürerek bilgi sağlar. sorusuna yanıt olarak."

Bir arama sonucu, örneğin, bir resmin veya resmi ve bir bilgi parçacığını içeren bir belgenin Tekdüzen Kaynak Konum Belirleyicisini (URL) içerir.

Bir Puanlama İşlevi Kullanarak SERP'leri Sıralama

Arama sonuçları, bir puanlama işlevi tarafından atanan puanlara göre sıralanabilir (sıralama gibi).

Puanlama işlevi, arama sonuçlarını çeşitli sinyallere göre sıralar:

  • Bir görüntüyü çevreleyen belge metninde sorgu metninin nerede (ve ne sıklıkla) göründüğü
  • Fikir için bir resim yazısı veya alternatif metin
  • Arama motoru tarafından indekslenen arama sonuçlarında sorgu terimlerinin ne kadar standart olduğu.

Genel olarak, bu patentte açıklanan konu, aşağıdakileri içeren bir yöntemdedir:

  • İlk sorgu için ilk görüntü sonuçlarından görüntülerin elde edilmesi, burada elde edilen görüntüler sorgu için arama sonuçları olduğunda, elde edilen görüntülerle kullanıcı etkileşimini belirten puanlar ve kullanıcı davranışı verileriyle ilişkili bir dizi elde edilen görüntü
  • Her biri bir eşiği karşılayan ilgili davranış verilerine sahip bir dizi elde edilen görüntünün seçilmesi
  • Seçilen görüntülerin içeriğinin analizine dayalı olarak seçilen ilk görüntüleri çeşitli açıklamalarla ilişkilendirme

Bunlar isteğe bağlı olarak aşağıdaki özellikleri içerebilir.

İlk sorgu, ek açıklamalara dayalı olarak kategorilerle ilişkilendirilebilir. Sorgu kategorizasyonu ve açıklama ilişkilendirmeleri ileride kullanılmak üzere saklanabilir. İkinci bir sorguya yanıt veren ikinci görüntü sonuçları, ilk sorgunun aynısı veya benzeri alınabilir.

İkinci görüntülerin her biri bir puanla ilişkilendirilir ve ikinci görüntü, ilk sorguyla ilgili kategorilere göre değiştirilebilir.

Sorgu kategorizasyonlarından biri, ilk sorgunun tek kişilik bir sorgu olduğunu belirtebilir ve ek açıklamaları ikinci görüntü kümesinin tek bir yüz içerdiğini söyleyen ikinci görüntünün puanlarını artırır.

Bir sorgu sınıflandırması, ilk sorgunun çeşitli olduğunu belirtebilir ve ek açıklamaları ikinci görüntü kümesinin çeşitli olduğunu söyleyen ikinci görüntülerin puanlarını artırabilir.

Kategorilerden biri, ilk sorgunun bir metin sorgusu olduğunu belirtebilir ve ek açıklamaları ikinci görüntü kümesinin metni içerdiğini söyleyen ikinci görüntünün puanlarını artırabilir.

İlk sorgu, kategorilerde bir sorgu kategorizasyonu belirlemek için eğitimli bir sınıflandırıcıya sağlanabilir.

Seçilen ilk görüntülerin içeriğinin analizi, açıklamalardaki bir açıklamayı belirlemek için ilk görüntü sonuçlarının kümelenmesini içerebilir. Kullanıcı davranışı verileri, kullanıcıların ilk sorgu için arama sonuçlarında görseli seçme sayısı olabilir.

Bu patentte açıklanan konu, aşağıdaki avantajları gerçekleştirecek şekilde uygulanabilir:

Görüntü sonuç kümesi, görüntü açıklamaları ve bir sorgu kategorizasyonu türetmek için analiz edilir ve görüntü arama sonuçlarıyla kullanıcı etkileşimi, sorgu türleri türetmek için kullanılabilir.

Sorgu Kategorizasyonu

Sorgu kategorileri, sırayla, görsel arama sonuçlarının alaka düzeyini, kalitesini ve çeşitliliğini iyileştirebilir.

Sorgu sınıflandırması, sorgu işlemenin bir parçası olarak veya çevrimdışı bir süreçte de kullanılabilir.

Sorgu kategorileri, "yalnızca yüzleri olan resimleri göster" veya "yalnızca küçük resimleri göster" gibi otomatik sorgu önerileri sağlamak için kullanılabilir.

sorgu kategorizasyonu

Görüntü sonuçlarına dayalı sorgu kategorizasyonu
Mucitler: Anna Majkowska ve Cristian Tapus
Atanan: GOOGLE LLC
ABD Patenti: 11,308,149
Verildi: 19 Nisan 2022
Dosya: 3 Kasım 2017

Soyut

Görüntü sonuçlarına dayalı sorgu kategorizasyonu için bir bilgisayar depolama ortamında kodlanmış bilgisayar programları da dahil olmak üzere yöntemler, sistemler ve aygıtlar.

Bir açıdan, bir yöntem, bir sorguya yanıt veren görüntü sonuçlarından görüntülerin alınmasını içerir, burada fotoğrafların her biri, ilk sorgu için bir arama sonucu olarak görüntü sonuçlarındaki bir sıra ve görüntü için ilgili kullanıcı davranış verileri ile ilişkilendirilir ve bunların ilişkilendirilmesi seçilen birinci görüntülerin içeriğinin analizine dayalı olarak çok sayıda açıklama içeren birinci görüntüler.

Bir Sorgu İçin Döndürülen Sonuç Kümesini Geliştirmek İçin Sorgu Kategorizasyonunu Kullanan Bir Sistem

Bir web tarayıcısı veya bir bilgi işlem cihazında yürütülen başka bir işlem gibi bir istemci, bir arama motoruna bir girdi sorgusu gönderir ve arama motoru, görüntü arama sonuçlarını istemciye döndürür. Bazı uygulamalarda, bir sorgu, bir karakter kümesindeki karakterler gibi bir metin içerir (örneğin, "kırmızı domates").

Bir sorgu, görüntüleri, sesleri, videoları veya bunların kombinasyonlarını içerir. Diğer sorgu türleri mümkündür. Arama motoru, girdi sorgusuna eşit, daha geniş veya daha spesifik alternatif sorgu sürümlerine dayalı olarak sonuçları arayacaktır.

Görsel arama sonuçları, girdi sorgusuna yanıt verdiği belirlenen ve en alakalı olduğu belirlenen belgeler en yüksek dereceye sahip olan, sıralı veya sıralı bir belge veya bunlara bağlantı listesidir. Kopya, bir web sayfası, resim veya başka bir elektronik dosyadır.

Görsel arama durumunda, arama motoru bir görselin alaka düzeyini en azından kısmen aşağıdakilere dayanarak belirler:

  • Resmin içeriği
  • Resmi çevreleyen metin
  • Resim yazısı
  • Resim için alternatif metin

Bir Sorguyla İlişkili Kategoriler

Görsel arama sonuçlarını üretirken, bazı uygulamalarda arama motoru, sorguyla ilişkili kategoriler için bir istek gönderir. Arama motoru, ilgili kategorilere ait olduğu belirlenen görsel sonuçlarının sıralamasını artırarak görsel arama sonuçlarını yeniden sıralamak için ilişkili kategorileri kullanabilir.

Bazı durumlarda, ilişkili kategorilere veya her ikisine ait olmayan görüntü sonuçlarını azaltabilir.

Arama motoru, sonuçların kategorilerini, sorgu kategorisiyle veya sorgu kategorisiyle birlikte nihai sonuç kümesinde nasıl sıralanmaları gerektiğini belirlemek için de kullanabilir.

Bir kategoriye ayırma motoru veya başka bir süreç, sorgu için alınan görüntü sonuçlarını ve sorgu için kategoriler türetmek için bir kullanıcı davranışı veri havuzunu kullanır. Depo, kullanıcı davranışı verilerini içerir. Depolama, belirli bir sorgu için kullanıcı popülasyonunun bir görüntü sonucunu kaç kez seçtiğini gösterir.

Görüntü seçimi, klavye, bilgisayar faresi veya parmak hareketi, sesli komut veya diğer yöntemler dahil olmak üzere çeşitli şekillerde gerçekleştirilebilir. Kullanıcı davranışı verileri, "tıklama verilerini" içerir.

Tıklama Verileri, Bir Kullanıcının Bir Görüntü Sonucunda Ne Kadar Süre Gördüğünü veya “Oturduğunu” Gösterir

Tıklama verileri, bir kullanıcının sorgu için bir sonuç listesinde seçtikten sonra bir görüntü sonucunu ne kadar süreyle görüntülediğini veya "kaldığını" belirtir. Örneğin, "uzun tıklama" olarak adlandırılan bir resim üzerinde uzun süre kalmak (1 dakikadan uzun gibi) bir kullanıcının resmi kullanıcının sorgusuyla alakalı bulduğunu belirtebilir.

"Kısa tıklama" olarak adlandırılan bir resmin kısa bir süre (örneğin 30 saniyeden az) görüntülenmesi, resim alaka düzeyinin olmadığı şeklinde yorumlanabilir. Kullanıcı davranışı verilerinin başka türleri de mümkündür.

Örnek olarak, kullanıcı davranışı verileri, belirli bir sorguya yanıt olarak kullanıcılar tarafından seçilen sonuç belgeleri için bir kayıt oluşturan bir süreç tarafından oluşturulabilir. Her form, aşağıdakileri içeren bir demet: <belge, sorgu, veri>) olarak temsil edilebilir:

  • Kullanıcılar tarafından gönderilen bir soru
  • Sorguyu belirten bir sorgu referansı
  • Sorguya yanıt olarak kullanıcılar tarafından seçilen bir makaleye atıfta bulunan bir belge
  • Sorguya yanıt olarak belge referansını seçen tüm kullanıcılar veya tüm kullanıcıların bir alt kümesi için tıklama verilerinin (her tıklama türünün sayısı gibi) toplanması.

Kullanıcı davranışı verilerine bu demet tabanlı yaklaşımın uzantıları mümkündür. Örneğin, kullanıcı davranışı verileri, konuma özgü (ülke veya eyalet gibi) veya dile özgü tanımlayıcıları içerecek şekilde genişletilebilir.

Bu tür tanımlayıcılar dahil edildiğinde, ülkeye özgü bir tanımlama grubu, kullanıcı sorgusunun kaynaklandığı ülkeden oluşacak ve dile özgü bir tanımlama grubu, kullanıcı sorgusunun dilinden oluşacaktır.

Sunumun basitliği için, sorgu için A-CCC belgeleriyle ilişkili kullanıcı davranışı verileri, tabloda "yüksek", "orta" veya "düşük" miktarda olumlu kullanıcı davranışı verileri (kullanıcı davranışı gibi) olarak gösterilir. belge ve sorgu arasındaki alaka düzeyini gösteren veriler).

Bir Belge İçin Kullanıcı Davranışı Verileri

Bir belge için olumlu kullanıcı davranışı verileri, kağıdın sorgu sonuçlarında görüntülendiğinde veya kullanıcılar belgeyi sorgu sonuçlarından seçtikten sonra görüntülediğinde, kullanıcılar tarafından belgeyi görüntülediğinde seçildiğini belirtebilir. uzun bir süre (kullanıcının belgeyi soruyla alakalı bulması gibi).

Kategorizatör motoru, sorgu kategorilerini belirlemek için döndürülen sonuçları ve kullanıcı davranışı verilerini kullanarak arama motoruyla birlikte çalışır ve ardından sonuçları kullanıcıya iade edilmeden önce yeniden sıralar.

Genel olarak, sorgu kategorisi isteğinde belirtilen sorgu (bir sorgu veya sorgunun alternatif bir formu gibi) için, kategori oluşturucu motor, sorgunun kategorilere ait olup olmadığını belirlemek için sorgu için görüntü sonuçlarını analiz eder. Bazı uygulamalarda analiz edilen resim sonuçları, sorgu için bir arama sonucu olarak kullanıcılar tarafından toplam bir eşiğin üzerinde (en az on kez ayarlanmış gibi) seçilmiştir.

Kategorizatör motoru, belirli bir sorgu için arama motoru tarafından alınan tüm görüntü sonuçlarını analiz eder. diğer uygulamalarda

Kategori oluşturucu motoru, tıklama verileri için bir metriğin (örneğin, toplam seçim sayısı veya başka bir ölçü) bir eşiğin üzerinde olduğu sorgu için görüntü sonuçlarını analiz eder.

Görüntü sonuçları, puanlama işlemi sırasında çevrimdışı veya çevrimiçi olarak çeşitli şekillerde bilgisayarlı görme teknikleri kullanılarak çevrimiçi olarak analiz edilebilir. Görüntüler, görsel içeriklerinden çıkarılan bilgilerle açıklanır.

Görüntü Açıklamaları

Örneğin, görüntü açıklamaları açıklama deposunda saklanabilir. Analiz edilen her görüntü (örn. görüntü 1, görüntü 2, vb.), bir fotoğraftan açıklamaya ilişkilendirmede açıklamalarla (örn., A1, A2 vb.) ilişkilendirilir.

Ek açıklamalar şunları içerebilir:

  • Resimdeki yüz sayısı
  • Her yüzün boyutu
  • Resmin baskın renkleri
  • Bir resmin metin veya grafik içerip içermediği
  • Bir görüntünün ekran görüntüsü olup olmadığı

Ek olarak, her görüntü, iki görüntünün aynı mı yoksa özdeş mi olduğunu belirleyebilen bir parmak izi ile açıklama alabilir.

Ardından, kategori oluşturucu motoru, sorgu kategorilerini belirlemek için belirli bir sorgu için görüntü sonuçlarını ve ek açıklamalarını analiz eder. Belirli bir sorgu (sorgu 1, sorgu 2 vb. gibi) için sorgu kategorilerinin ilişkileri (örneğin, C1, C2 vb.), basit bir buluşsal yöntem veya otomatik bir sınıflandırıcı kullanmak gibi birçok yolla belirlenebilir.

Bir Sezgiye Dayalı Basit Bir Sorgu Kategorizörü

Örnek olarak, bir buluşsal yönteme dayalı basit bir sorgu kategorizörü, sorgu için istenen baskın rengi (ve olup olmadığını) belirlemek için kullanılabilir.

Örneğin, buluşsal yöntem, sorgu için en sık tıklanan ilk 20 görselden en az %70'inin baskın bir kırmızı renge sahip olması durumunda, sorgunun "kırmızı sorgu" olarak kategorize edilebileceği olabilir. Bu tür sorgular için arama motoru, baskın renk olarak kırmızı ile açıklamalı tüm görüntülerin sıralamasını artırmak için alınan sonuçları yeniden sıralayabilir.

Aynı sınıflandırma, diğer tüm standart renklerle kullanılabilir. Sorgu metnini aşırı analiz etmeye yönelik bu yaklaşımın bir avantajı, çeviriye ihtiyaç duymadan tüm diller için çalışmasıdır (örneğin, herhangi bir dilde “kırmızı elma” sorusu için baskın kırmızı renge sahip görüntüleri teşvik edeceği gibi). Daha sağlamdır ("kızıl deniz" sorgusu için kırmızı resimlerin sıralamasını artırmayacağı gibi).

Örnek Bir Kategorizatör Motoru

Kategori oluşturucu motor, sorgu işleme sırasında arama motoru tarafından kullanılmak üzere sorgu kategorisi ilişkilendirmelerinin önceden depolandığı (örneğin tabloda) bir çevrimiçi modda veya çevrimdışı modda çalışabilir.

Motor, belirli bir sorgu için sorgu görüntüsü sonuçlarını alır ve görüntü sonuçlarını görüntü açıklayıcılarına sağlar. Her görüntü açıklayıcı, görüntü sonuçlarını analiz eder ve fikir için bir görüntü açıklaması (örneğin, görüntü açıklamaları) olarak depolanan görüntünün görsel içeriği hakkında bilgi çıkarır.

Bir Yüz Görüntüsü Anlatıcı

Örnekleme yoluyla, bir yüz görüntüsü açıklayıcısı:

  • Bir görüntüde kaç yüz olduğunu ve her yüzün boyutunu belirler
  • bir parmak izi görüntü açıklayıcı, daha sonra iki görüntünün benzer olup olmadığını belirlemek için başka bir görüntünün parmak iziyle karşılaştırılabilen yoğunlaştırılmış bir biçimde (parmak izi) görsel görüntü özelliklerini çıkarır.
  • Bir ekran görüntüsü açıklama aracı, bir görüntünün ekran görüntüsü olup olmadığını belirler
  • Bir metin resmi açıklayıcısı, bir resmin metin içerip içermediğini belirler
  • Bir grafik/tablo görüntü sorgusu, bir görüntünün grafikler mi yoksa çizelgeler mi (ör. çubuk grafikler) içerip içermediğini belirler.
  • Baskın renk açıklayıcısı, bir resmin baskın bir renk içerip içermediğini belirler.

Diğer görüntü açıklayıcıları da kullanılabilir. Örneğin, birkaç görüntü açıklayıcısı, Viola, P.; Jones, M., Mitsubishi Electric Araştırma Laboratuvarları, TR2004-043 (Mayıs 2004).

sorgu kategorileri

Ardından, kategori oluşturucu motoru, sorgu kategorilerini (örneğin, sorgu kategorileri) belirlemek için belirli bir sorgu için görüntü sonuçlarını ve açıklamalarını analiz eder. Sorgu kategorileri bir sınıflandırıcı kullanılarak belirlenir ve bir sorgu sınıflandırıcısı, bir makine öğrenimi sistemi kullanılarak gerçekleştirilebilir.

Uyarlanabilir Güçlendirme Kullanımı

Adaptive Boosting'in kısaltması olan AdaBoost, performanslarını artırmak için diğer öğrenme algoritmalarıyla birlikte kullanılabilen bir makine öğrenme sistemidir. AdaBoost, bir sorgu kategorizasyonu oluşturmak için kullanılır. (Daha fazla öğrenme algoritması mümkündür)

AdaBoost, bir dizi turda "zayıf" bir görüntü açıklayıcısını çağırır. Örnekleme yoluyla, tek kişilik sorgu sınıflandırıcısı, bir sorgunun tek bir kişinin görüntülerini çağırıp çağırmadığını belirlemek için eğitilmiş bir öğrenme makinesi algoritmasını temel alabilir.

Örnekleme yoluyla, böyle bir sorgu sınıflandırıcı bir sorgu içeren veri kümeleri, sıfır veya daha fazla yüze sahip soru için sonuç görüntülerini temsil eden bir dizi özellik vektörü ve sorgu için doğru kategorizasyon (yani yüzler veya yüzler) ile eğitilebilir. . Her çağrı için, sorgu sınıflandırıcı, sınıflandırma için eğitim veri setindeki örneklerin önemini gösteren bir ağırlık dağılımını günceller.

Her turda, sınıflandırılmış her eğitim örneğinin ağırlıkları artar (veya her sınıflandırılmış eğitim örneğinin sonuçları azalır), bu nedenle yeni sorgu kategorizasyonu bu örneklere daha fazla odaklanır. Ortaya çıkan eğitimli sorgu kategorizasyonu, bir sorguyu girdi olarak alabilir ve sorgunun tek kişileri içeren görüntüler için arama olasılığının çıktısını alabilir.

Farklı/homojen bir sorgu sınıflandırıcı girdi olarak bir sorgu alır ve sorgunun çeşitli görüntüler için olma olasılığını verir. Sınıflandırıcı, birbirlerinden bir uzaklık ölçüsüne dayalı olarak, parmak izlerine göre görüntü sonuçlarını kümelemek için bir kümeleme algoritması kullanır. Her görüntü bir küme tanımlayıcısı ile ilişkilendirilir.

Görüntü kümesi tanımlayıcısı, küme sayısını, grupların boyutunu ve sonuç kümesindeki görüntülerin oluşturduğu kümeler arasındaki benzerliği belirlemek için kullanılır. Örneğin, bu bilgi, sorgunun belirli olma (veya yinelemeleri davet etme) olasılığını ilişkilendirmek için kullanılır,

Sorguları Kanonik Anlamlar ve Temsillerle İlişkilendirme

Sorgu kategorizasyonu, sorguları kurallı anlamlar ve temsillerle ilişkilendirmek için de kullanılabilir. Örneğin, tek bir büyük küme veya birkaç büyük küme varsa, sorunun yinelenen görüntü sonuçlarıyla ilgili olma olasılığı yüksektir. Çok sayıda küçük küme varsa, sorgunun aynı görüntü sonuçlarıyla ilişkilendirilme olasılığı düşüktür.

Görüntülerin kopyaları, daha fazla bilgi sağlamadıkları için genellikle çok kullanışlı değildir, bu nedenle sorgu sonuçları olarak indirgenmeleri gerekir. Ancak istisnalar vardır. Örneğin, ilk sonuçlarda çok sayıda yineleme varsa (birkaç büyük küme), sorgu belirlidir ve yinelemelerin sıralaması düşürülmemelidir.

Bir ekran görüntüsü/ekran görüntüsü olmayan sorgu kategorizasyonu, girdi olarak bir sorgu alır ve sorgunun ekran görüntüsü olan görüntüleri çağırma olasılığını verir. Bir metin/metin olmayan sorgu sınıflandırıcısı, bir sorguyu girdi olarak kabul eder ve sorgunun metin içeren görüntüler için arama şansı verir.

Bir grafik/grafik olmayan sorgu kategorizasyonu, bir sorgunun girdisini alır ve sorgunun bir grafik veya çizelge içeren görüntüler için çağrıda bulunma olasılığını verir. Bir renk sorgusu sınıflandırıcısı 133f bir bilgi sorgusu alır ve sorgunun tek bir rengin baskın olduğu çekimleri çağırması için bir şans verir. Diğer sorgu sınıflandırıcıları mümkündür.

Sorgu Kategorizasyonuna Dayalı Görüntü Sonuçlarının Uygunluğunu Artırma

Bir araştırmacı, bir istemci veya başka bir cihaz aracılığıyla sistemle etkileşime girebilir. Örneğin, istemci cihaz, yerel alan ağı (LAN) veya geniş alan ağı (WAN) içindeki bir bilgisayar terminali olabilir. İstemci cihaz, bir LAN, bir WAN veya başka bir ağ (örneğin, bir cep telefonu ağı) üzerinden iletişim kurabilen bir mobil cihaz (örneğin, bir cep telefonu, bir mobil bilgisayar, bir kişisel masaüstü asistanı, vb.) olabilir.

İstemci aygıtı, bir rastgele erişim belleği (RAM) (veya başka bir bellek ve bir depolama aygıtı) ve bir işlemci içerebilir.

İşlemci, sistem içindeki talimatları ve verileri işlemek için yapılandırılır. İşlemci, işlem çekirdeklerine sahip tek iş parçacıklı veya çok iş parçacıklı bir mikroişlemcidir. İşlemci, bir kullanıcı arayüzü için grafiksel bilgi vermek üzere RAM'de (veya diğer bellekte ve istemci cihaza dahil olan bir depolama cihazında) depolanan talimatları yürütmek üzere yapılandırılmış alır.

Bir araştırmacı, bir giriş sorgusu göndermek için bir sunucu sistemi içindeki arama motoruna bağlanabilir. Arama motoru, bir resim arama motorudur veya resimleri ve belgeler gibi diğer içerik türlerini (ör. HTML sayfaları) alabilen genel bir arama motorudur.

Kullanıcı giriş sorgusunu bir istemci cihazına bağlı bir giriş cihazı aracılığıyla gönderdiğinde, bir istemci tarafı sorusu bir ağa gönderilir ve sunucu sistemine bir sunucu tarafı sorgusu olarak iletilir. Sunucu sistemi, konumlardaki sunucu cihazları olabilir. Bir sunucu cihazı, içine yüklenen arama motorundan oluşan bir bellek cihazı içerir.

Bir işlemci, cihaz içindeki talimatları işlemek için yapılandırılır. Bu talimatlar, arama motorunun bileşenlerini kurabilir. İşlemci tek iş parçacıklı veya çok iş parçacıklı olabilir ve birçok işlem çekirdeği içerir. İşlemci, arama motoruyla ilgili bellekte saklanan talimatları işleyebilir ve istemci cihazın kullanıcı arayüzünde grafik bir sunum oluşturmak için ağ aracılığıyla istemci cihaza bilgi gönderebilir (örneğin, bir web sayfasında görüntülenen bir web sayfasındaki arama sonuçları). tarayıcı).

Sunucu tarafı sorgusu, arama motoru tarafından alınır. Arama motoru, ilgili belgeleri bulmak için giriş sorgusundaki bilgileri (sorgu terimleri gibi) kullanır. Arama motoru, o bütüncede bulunan belgeleri indekslemek için bir bütünü (örneğin, İnternet'teki web sayfaları) arayan bir indeksleme motorunu içerebilir. Derlem belgeleri için dizin bilgileri bir dizin veritabanında saklanabilir.

Bu dizin veritabanına, kullanıcıyla ilgili belgeleri tanımlamak için erişilebilir. Elektronik bir kopyanın (belge olarak anılacaktır) bir dosyaya karşılık gelmediğini unutmayın. Bir kayıt, dosyanın diğer belgeleri içeren bir bölümünde, söz konusu belgeye ayrılmış tek bir dosyada veya birçok koordineli dosyada saklanabilir. Ayrıca, bir kopya bir dosyada saklanmadan bir bellekte saklanabilir.

Arama motoru, giriş sorgusu ile ilgili belgeleri sıralamak için bir sıralama motoru içerebilir. Belgelerin sıralaması, belirli bir sorgu verilen dizinlenmiş kayıtlar için bir Bilgi Alma (IR) puanı belirlemek için geleneksel teknikler kullanılarak gerçekleştirilebilir.

Herhangi bir uygun yöntem, belirli bir arama terimindeki belirli bir belgenin veya sağlanan diğer bilgilerle ilişkisini belirleyebilir. Örneğin, bir arama terimi için eşleşmeler içeren bir belgeye verilen genel geri bağlantı düzeyi, bir belgenin alaka düzeyini anlamak için kullanılabilir.

Özellikle, bir belge diğer birçok ilgili belge (arama terimleri için eşleşmeler içeren belgeler gibi) tarafından bir belgeye bağlanırsa (örneğin, bir köprünün hedefiyse), hedef belgenin özellikle alakalı olduğu sonucuna varılabilir. Bu çıkarım yapılabilir, çünkü işaret eden makalelerin yazarları, muhtemelen, çoğunlukla, hedef kitleleriyle ilgili diğer belgelere işaret eder.

İşaret belgeleri, daha alakalı olarak kabul edilebilecek diğer ilgili belgelerden bağlantıları hedefler. İlk belge özellikle uygundur çünkü uygulanabilir (hatta oldukça alakalı) belgeleri hedef alır.

Böyle bir teknik, bir belgenin uygunluğunu veya birçok belirleyiciden birini belirleyebilir. Bir sayfanın alaka düzeyini artırmak için hileli oy verme girişimlerini belirlemek ve kesmek için uygun yöntemler de alınabilir.

Bu tür geleneksel belge sıralama tekniklerini daha da geliştirmek için, sıralama motoru, belgeler için uygun bir sıralamanın belirlenmesine yardımcı olmak için bir sıralama değiştirici motorundan daha fazla sinyal alabilir.

Yukarıda açıklanan görüntü açıklayıcıları ve sorgu kategorizasyonu ile bağlantılı olarak, sıra değiştirici motoru makaleler için uygunluk ölçüleri sağlar. Sıralama motoru, kullanıcıya sağlanan arama sonuçlarının sıralamasını iyileştirmek için kullanabilir.

Sıra değiştirici motor, alaka ölçütlerini oluşturmak için işlemler gerçekleştirebilir.

Bir görüntü sonucunun puanının artması veya azalması, görüntünün görsel içeriğinin (görüntü açıklamalarında gösterildiği gibi) sorgu kategorisiyle eşleşip eşleşmemesine bağlıdır, her görüntü kategorisi dikkate alınır.

Örneğin, sorgunun kategorizasyonu “tek kişi” ise, hem “ekran görüntüsü” hem de “tek yüz” olarak sınıflandırılan bir görüntü sonucunun puanı önce “ekran görüntüsü” kategorisi nedeniyle düşürülür. Daha sonra “tek yüz” kategorisi nedeniyle puanını artırabilir.

Arama motoru, ağ üzerinden sunucu tarafı arama sonuçları içinde nihai, sıralanmış sonuç listesini iletebilir. Ağdan çıkıldığında, istemci tarafı arama sonuçları istemci cihaz tarafından alınabilir, burada sonuçlar RAM içinde saklanabilir ve işlemci tarafından sonuçları kullanıcı için bir çıkış cihazında görüntülemek için kullanılabilir.

Bir Bilgi Erişim Sistemi

Bu bileşenler şunları içerir:

  • indeksleme motoru
  • puanlama motoru
  • sıralama motoru
  • Sıra değiştirici motor

İndeksleme motoru, indeksleme motoru için yukarıda açıklandığı gibi çalışır. Puanlama motoru, bir sorguyu belge sonuçlarına bağlayan içerik tabanlı özellikler ve genellikle belge sonuçlarının kalitesini belirten sorgudan bağımsız parçalar dahil olmak üzere birçok özelliğe dayalı olarak belge sonuçları için puanlar üretir.

Görüntüler için içerik tabanlı özellikler, belgenin başlığına veya görüntünün başlığına sorgu eşleşmeleri gibi resmi içeren belgenin özelliklerini içerir.

sorgu puanlama motoru

Sorgudan bağımsız özellikler, örneğin, kağıt veya etki alanı veya görüntü boyutlarının belge çapraz referansının özelliklerini içerir.

Ayrıca, puanlama motoru tarafından kullanılan belirli işlevler, otomatik veya yarı otomatik işlemler kullanılarak nihai IR puanına çeşitli özellik katkılarını ayarlamak için ayarlanabilir.

Sıralama motoru, puanlama makinesinden alınan IR puanlarına ve sıralama değiştirici motorundan gelen sinyallere dayalı olarak bir kullanıcıya görüntülenmek üzere belge sonuçlarını sıralar.

Sıralama değiştirici motoru, sıralama motorunun kullanıcıya sağlanan arama sonuçlarının sıralamasını iyileştirmek için kullanabileceği belgeler için alaka ölçüleri sağlar. Bir izleme bileşeni, sırayla sunulan sonuçların bireysel kullanıcı seçimleri gibi kullanıcı davranışı bilgilerini kaydeder.

İzleme bileşeni, tek tek belge sonuçlarının kullanıcı seçimlerini tanımlayan ve kullanıcının sonuçlar sayfasına ne zaman döndüğünü tanımlayan bir web sayfası sıralamasına dahil edilen gömülü JavaScript kodunu alır, böylece kullanıcının seçilen belge sonucunu görüntülemek için harcadığı süreyi belirtir.

İzleme bileşeni, belge sonuçlarının kullanıcı seçimlerinin yönlendirildiği bir proxy sistemidir. İzleme bileşeni, istemci için önceden yüklenmiş yazılımı da içerebilir (örneğin, müşterinin işletim sistemine bir araç çubuğu eklentisi).

Başka uygulamalar da mümkündür, örneğin, bir etiketin/yönergenin bir sayfaya eklenmesine izin veren ve tarayıcının kullanıcı tarafından tıklanan bağlantılar hakkında mesajlarla sunucuya geri bağlanmasını isteyen bir web tarayıcısı özelliğini kullanan bir uygulama.

Kaydedilen bilgiler, sonuç seçim günlüklerinde saklanır. Kaydedilen bilgiler, gönderilen her sorgu için sunulan her sonuç belgesiyle kullanıcı etkileşimini belirten günlük girişlerini içerir.

Bir sorgu için sunulan bir sonuç belgesinin her kullanıcı seçimi için, günlük girişleri sorguyu (Q), kağıdı (D), kullanıcının belgede kalma süresini (T), kullanıcı tarafından kullanılan dili (L), ve kullanıcının büyük olasılıkla bulunduğu ülke (C) (örneğin, IR sistemine erişmek için kullanılan sunucuya göre) ve kullanıcının metropol alanını tanımlayan bir bölge kodu (R).

Günlük girişleri, bir belge sonucunun bir kullanıcıya sunulması ancak seçilmemesi gibi olumsuz bilgileri de kaydeder.

Aşağıdakiler gibi diğer bilgiler:

  • Tıklama konumları (yani, kullanıcı arayüzündeki kullanıcı seçimleri)
  • Oturumla ilgili bilgiler (önceki tıklamaların varlığı ve türü (Tıklama sonrası oturum etkinliği) gibi)
  • Tıklanan sonuçların R puanları
  • Tıklamadan önce gösterilen tüm sonuçların IR puanları
  • Başlıklar ve snippet'ler, tıklamadan önce kullanıcıya gösterilir
  • Kullanıcı çerezi
  • çerez yaşı
  • IP (İnternet Protokolü) adresi
  • Tarayıcının kullanıcı aracısı
  • Yakın zamanda

Belge sonucuna yapılan ilk tıklama ile ana sayfaya dönen ve başka bir belge sonucunu tıklayan (veya yeni bir arama sorgusu gönderen) kullanıcılar arasındaki süre (T) de kaydedilir.

Daha geniş kapsamlı argümanlar genellikle tıklanan sonuç için kalite veya alaka düzeyi gösterdiğinden, bu zamanın belgenin daha uzun bir görünümünü mü yoksa daha kısa bir görünümü mü gösterdiği konusunda zaman (T) hakkında bir değerlendirme yapılır. Bu zaman değerlendirmesi (T) çeşitli ağırlıklandırma teknikleri ile birlikte yapılabilir.

Gösterilen bileşenler, çeşitli şekillerde ve çoklu sistem konfigürasyonlarında birleştirilebilir. Puanlama sonu tanking motorları, sıralama motoru gibi tek bir sıralama motorunda birleşir. Sıralama değiştirici motoru ve sıralama motoru da birleştirilebilir. Genel olarak, bir sıralama motoru, bir sorgudan sonra belge sonuçlarının bir sıralamasını oluşturan herhangi bir yazılım bileşenini içerir. Ayrıca, bir sıralama motoru, bir sunucu sistemine de (veya bunun yerine) bir istemci sistemine sığabilir.

Başka bir örnek bilgi alma sistemidir. Sunucu sistemi, bir indeksleme motoru ve bir puanlama/sıralama motoru içerir.

Bu sistemde, bir istemci sistemi şunları içerir:

  • Bir sıralama sunmak için bir kullanıcı arayüzü
  • Bir izleme bileşeni
  • Sonuç seçim günlükleri
  • Bir sıralama/sıralama değiştirici motor.

Örneğin, istemci sistemi, bir tarayıcı eklentisinin sıralama/sıralama değiştirici motorunu içerdiği bir şirketin kurumsal ağını ve kişisel bilgisayarlarını içerebilir.

Şirketteki bir çalışan sunucu sisteminde bir arama başlattığında, puanlama/sıralama motoru arama sonuçlarını döndürebilir. Sonuçlar için bir ilk sıralama veya gerçek IR puanları. Tarayıcı eklentisi daha sonra şirkete özel kullanıcı tabanı için izlenen sayfa seçimlerine dayalı olarak sonuçları yeniden sıralar.

Sorgu Kategorizasyonu İçin Bir Teknik

Bu teknik çevrimiçi (sorgu işlemenin bir parçası olarak) veya çevrimdışı bir şekilde gerçekleştirilebilir.

İlk sorguya yanıt veren ilk görüntü sonuçları alınır. İlk görüntülerin her biri bir siparişle (IR puanı gibi) ve ilgili kullanıcı davranışı verisiyle (tıklama verileri gibi) ilişkilendirilir.

Seçilen her bir görüntü için ilgili davranış verileri için bir metrik bir eşiği karşılarken, ilk görüntülerin bir kısmı seçilir.

Seçilen ilk görüntüler, seçilen ilk görüntülerin içerik analizine dayalı olarak çeşitli açıklamalarla ilişkilendirilir. Görüntü açıklamaları, görüntü açıklamalarında kalıcı olabilir.

Kategoriler daha sonra açıklamalara dayalı olarak ilk sorguyla ilişkilendirilir.

Sorgu kategorizasyon ilişkileri, sorgu kategorilerinde devam edebilir.

Aynı olan ikinci bir sorguya yanıt veren ikinci görüntü sonuçları veya ilk sorgu daha sonra alınır.

(Sorgu kategorizasyonunda ikinci sorgu bulunamazsa, ikinci sorgu dönüştürülebilir veya alternatif bir formun sorgu kategorizasyonundaki bir sorguyla eşleşip eşleşmediğini belirlemek için "yeniden yazılabilir".)

Bu örnekte, ikinci sorgu, ilk sorgu ile aynıdır veya yeniden yazılabilir.

İkinci görüntü sonuçları, ilk sorguyla ilişkilendirilmeden önce sorgu kategorisine göre yeniden sıralanır.

Haberleri Doğrudan Gelen Kutunuza Arayın

Bu alan doğrulama amaçlıdır ve değiştirilmeden bırakılmalıdır.

*Gerekli