Kategorisasi Kueri Berdasarkan Hasil Gambar
Diterbitkan: 2022-04-27Google baru-baru ini diberikan paten pada Kategorisasi Kueri Berdasarkan Hasil Gambar.
Paten memberi tahu kita bahwa: “mesin pencari internet memberikan informasi tentang sumber daya yang dapat diakses melalui Internet (seperti halaman Web, gambar, dokumen teks, konten multimedia) responsif terhadap permintaan pencarian pengguna dengan mengembalikan, saat pencarian gambar, serangkaian hasil pencarian gambar sebagai tanggapan atas pertanyaan itu.”
Hasil pencarian mencakup, misalnya, Uniform Resource Locator (URL) dari gambar atau dokumen yang berisi gambar dan potongan informasi.
Peringkat SERP Menggunakan Fungsi Skor
Hasil pencarian dapat diberi peringkat (seperti berurutan) menurut skor yang diberikan oleh fungsi penilaian.
Fungsi penilaian memberi peringkat pada hasil pencarian menurut berbagai sinyal:
- Di mana (dan seberapa sering) teks kueri muncul dalam teks dokumen yang mengelilingi gambar
- Keterangan gambar atau teks alternatif untuk ide tersebut
- Seberapa standar istilah kueri dalam hasil penelusuran yang diindeks oleh mesin telusur.
Secara umum, subjek yang dijelaskan dalam paten ini adalah metode yang meliputi:
- Memperoleh gambar dari hasil gambar pertama untuk query pertama, dimana sejumlah gambar yang diperoleh dikaitkan dengan skor dan data perilaku pengguna yang menyatakan interaksi pengguna dengan gambar yang diperoleh ketika gambar yang diperoleh merupakan hasil pencarian untuk kueri
- Memilih sejumlah gambar yang diperoleh masing-masing memiliki data perilaku masing-masing yang memenuhi ambang batas
- Mengaitkan gambar pertama yang dipilih dengan beberapa anotasi berdasarkan analisis konten gambar yang dipilih
Ini secara opsional dapat mencakup fitur-fitur berikut.
Kueri pertama dapat dikaitkan dengan kategori berdasarkan anotasi. Kategorisasi kueri dan asosiasi anotasi dapat disimpan untuk digunakan di masa mendatang. Hasil gambar kedua responsif terhadap permintaan kedua yang sama atau seperti permintaan pertama dapat diterima.
Setiap gambar kedua dikaitkan dengan skor, dan gambar kedua dapat dimodifikasi berdasarkan kategori yang terkait dengan kueri pertama.
Salah satu kategorisasi kueri dapat menyatakan bahwa kueri pertama adalah kueri satu orang dan meningkatkan skor gambar kedua, yang anotasinya mengatakan bahwa kumpulan gambar kedua berisi satu wajah.
Satu kategorisasi kueri dapat menyatakan bahwa kueri pertama beragam dan meningkatkan skor gambar kedua, yang anotasinya mengatakan bahwa kumpulan gambar kedua beragam.
Salah satu kategori dapat menyatakan bahwa kueri pertama adalah kueri teks dan meningkatkan skor gambar kedua, yang anotasinya mengatakan bahwa kumpulan gambar kedua berisi teks.
Kueri pertama dapat diberikan kepada pengklasifikasi terlatih untuk menentukan kategorisasi kueri dalam kategori.
Analisis konten gambar pertama yang dipilih dapat mencakup pengelompokan hasil gambar pertama untuk menentukan anotasi dalam anotasi. Data perilaku pengguna dapat berupa frekuensi pengguna memilih gambar dalam hasil penelusuran untuk kueri pertama.
Pokok bahasan yang diuraikan dalam paten ini dapat diimplementasikan sehingga mewujudkan keuntungan-keuntungan berikut:
Kumpulan hasil gambar dianalisis untuk memperoleh anotasi gambar dan kategorisasi kueri, dan interaksi pengguna dengan hasil penelusuran gambar dapat digunakan untuk memperoleh jenis kueri.
Kategorisasi Kueri
Kategori kueri pada gilirannya dapat meningkatkan relevansi, kualitas, dan keragaman hasil penelusuran gambar.
Kategorisasi kueri juga dapat digunakan sebagai bagian dari pemrosesan kueri atau dalam proses offline.
Kategori kueri dapat digunakan untuk memberikan saran kueri otomatis seperti "hanya tampilkan gambar dengan wajah" atau "hanya tampilkan clip art".
Kategorisasi kueri berdasarkan hasil gambar
Penemu: Anna Majkowska dan Cristian Tapus
Penerima Tugas: GOOGLE LLC
Paten AS: 11.308.149
Diberikan: 19 April 2022
Diarsipkan: 3 November 2017
Abstrak
Metode, sistem, dan peralatan, termasuk program komputer yang dikodekan pada media penyimpanan komputer, untuk kategorisasi kueri berdasarkan hasil gambar.
Dalam satu aspek, metode termasuk menerima gambar dari hasil gambar yang responsif terhadap kueri, di mana setiap foto dikaitkan dengan urutan dalam hasil gambar dan data perilaku pengguna masing-masing untuk gambar sebagai hasil pencarian untuk kueri pertama dan mengaitkan gambar pertama dengan pluralitas anotasi berdasarkan analisis konten gambar pertama yang dipilih.
Sebuah Sistem Yang Menggunakan Kategorisasi Kueri Untuk Meningkatkan Kumpulan Hasil Yang Dikembalikan Untuk Kueri
Seorang klien, seperti browser web atau proses lain yang dijalankan pada perangkat komputasi mengirimkan permintaan input ke mesin pencari, dan mesin pencari mengembalikan hasil pencarian gambar ke klien. Dalam beberapa implementasi, kueri terdiri dari teks seperti karakter dalam kumpulan karakter (misalnya, "tomat merah").
Kueri terdiri dari gambar, suara, video, atau kombinasi dari semuanya. Jenis kueri lainnya dimungkinkan. Mesin pencari akan mencari hasil berdasarkan versi kueri alternatif yang sama dengan, lebih luas dari, atau lebih spesifik daripada kueri masukan.
Hasil pencarian gambar adalah daftar dokumen atau tautan yang diurutkan atau diberi peringkat, yang ditentukan untuk responsif terhadap permintaan input, dengan dokumen yang ditentukan paling relevan memiliki peringkat tertinggi. Salinan adalah halaman web, gambar, atau file elektronik lainnya.
Dalam hal penelusuran gambar, mesin telusur menentukan relevansi gambar berdasarkan, setidaknya sebagian, pada hal berikut:
- konten gambar
- Teks di sekitar gambar
- Keterangan gambar
- Teks alternatif untuk gambar
Kategori Terkait Dengan Kueri
Dalam menghasilkan hasil pencarian gambar, mesin pencari dalam beberapa implementasi mengajukan permintaan untuk kategori yang terkait dengan kueri. Mesin pencari dapat menggunakan kategori terkait untuk mengurutkan ulang hasil pencarian gambar dengan meningkatkan peringkat hasil gambar yang ditentukan untuk termasuk dalam kategori terkait.
Dalam beberapa kasus, ini dapat menurunkan hasil gambar yang tidak termasuk dalam kategori terkait atau keduanya.
Mesin pencari juga dapat menggunakan kategori hasil untuk menentukan bagaimana mereka harus mendapatkan peringkat dalam kumpulan hasil akhir dalam kombinasi dengan atau dari kategori kueri.
Mesin pengkategorisasi atau proses lain menggunakan hasil gambar yang diambil untuk kueri dan repositori data perilaku pengguna untuk memperoleh kategori kueri. Repositori berisi data perilaku pengguna. Penyimpanan menunjukkan berapa kali populasi pengguna memilih hasil gambar untuk kueri tertentu.
Pemilihan gambar dapat dilakukan dengan berbagai cara, termasuk menggunakan keyboard, mouse komputer atau gerakan jari, perintah suara, atau metode lainnya. Data perilaku pengguna mencakup “data klik”.
Data Klik Menunjukkan Berapa Lama Tampilan Pengguna Atau "Berdiam" Pada Hasil Gambar
Data klik menunjukkan berapa lama pengguna melihat atau "berdiam" pada hasil gambar setelah memilihnya dalam daftar hasil untuk kueri. Misalnya, waktu yang lama memikirkan gambar (seperti lebih dari 1 menit), yang disebut "klik lama", dapat menyatakan bahwa pengguna menemukan gambar yang relevan dengan kueri pengguna.
Waktu singkat untuk melihat gambar (misalnya, kurang dari 30 detik), yang disebut "klik singkat", dapat diartikan sebagai kurangnya relevansi gambar. Jenis data perilaku pengguna lainnya dimungkinkan.
Sebagai ilustrasi, data perilaku pengguna dapat dihasilkan oleh proses yang membuat catatan untuk dokumen hasil yang dipilih oleh pengguna sebagai respons terhadap kueri tertentu. Setiap formulir dapat direpresentasikan sebagai Tuple: <document, query, data>) yang mencakup:
- Sebuah pertanyaan yang diajukan oleh pengguna
- Referensi kueri yang menunjukkan kueri
- Dokumen mereferensikan makalah yang dipilih oleh pengguna sebagai tanggapan atas kueri
- Agregasi data klik (seperti jumlah setiap jenis klik) untuk semua pengguna atau subkumpulan semua pengguna yang memilih referensi dokumen sebagai tanggapan atas kueri.
Perluasan pendekatan berbasis tuple ini untuk data perilaku pengguna dimungkinkan. Misalnya, data perilaku pengguna dapat diperluas untuk menyertakan pengenal khusus lokasi (seperti negara atau negara bagian) atau khusus bahasa.
Dengan pengidentifikasi tersebut disertakan, tupel khusus negara akan terdiri dari negara asal kueri pengguna, dan tupel khusus bahasa akan terdiri dari bahasa kueri pengguna.
Untuk kesederhanaan presentasi, data perilaku pengguna yang terkait dengan dokumen A-CCC untuk kueri digambarkan dalam tabel sebagai data perilaku pengguna yang disukai "tinggi", "sedang", atau "rendah" (seperti perilaku pengguna data yang menunjukkan relevansi antara dokumen dan kueri).
Data Perilaku Pengguna Untuk Dokumen
Data perilaku pengguna yang menguntungkan untuk dokumen dapat menyatakan bahwa kertas dipilih oleh pengguna saat dilihat dalam hasil kueri, atau saat pengguna melihat dokumen setelah memilihnya dari hasil kueri, pengguna melihat dokumen untuk periode yang diperpanjang (seperti pengguna menemukan dokumen yang relevan dengan pertanyaan).
Mesin pengkategori bekerja bersama dengan mesin telusur menggunakan hasil yang dikembalikan dan data perilaku pengguna untuk menentukan kategori kueri dan kemudian memeringkat ulang hasil sebelum dikembalikan ke pengguna.
Secara umum, untuk kueri (seperti kueri atau bentuk kueri alternatif) yang ditentukan dalam permintaan kategori kueri, mesin pengkategoris menganalisis hasil gambar untuk kueri untuk menentukan apakah kueri tersebut termasuk dalam kategori. Hasil gambar yang dianalisis dalam beberapa implementasi telah dipilih oleh pengguna sebagai hasil pencarian untuk kueri beberapa kali di atas ambang batas (seperti ditetapkan setidaknya sepuluh kali).
Mesin kategorizer menganalisis semua hasil gambar yang diambil oleh mesin pencari untuk kueri tertentu. dalam implementasi lainnya
Mesin pengkategoris menganalisis hasil gambar untuk kueri di mana metrik (misalnya, jumlah total pilihan atau ukuran lain) untuk data klik berada di atas ambang batas.
Hasil citra dapat dianalisis secara online menggunakan teknik computer vision dengan berbagai cara, baik offline maupun online, selama proses penilaian. Gambar dianotasi dengan informasi yang diambil dari konten visualnya.
Anotasi Gambar
Misalnya, anotasi gambar dapat disimpan di penyimpanan anotasi. Setiap gambar yang dianalisis (misalnya, gambar 1, gambar 2, dll.) dikaitkan dengan anotasi (misalnya, A1, A2, dan seterusnya) dalam sebuah foto ke asosiasi anotasi.
Anotasi dapat mencakup:
- Jumlah wajah dalam gambar
- Ukuran setiap wajah
- Warna dominan gambar
- Apakah gambar berisi teks atau grafik
- Apakah suatu gambar adalah tangkapan layar
Selain itu, setiap gambar dapat dianotasi dengan sidik jari yang kemudian dapat menentukan apakah dua gambar identik atau identik.
Selanjutnya, mesin pengkategoris menganalisis hasil gambar untuk kueri tertentu dan anotasinya untuk menentukan kategori kueri. Asosiasi kategori kueri (misalnya, C1, C2, dan seterusnya) untuk kueri tertentu (seperti kueri 1, kueri 2, dll.) dapat ditentukan dengan banyak cara, seperti menggunakan heuristik sederhana atau menggunakan pengklasifikasi otomatis.
Kategorisator Kueri Sederhana Berdasarkan Heuristik
Sebagai contoh, pengkategori kueri sederhana berdasarkan heuristik dapat digunakan untuk menentukan warna dominan yang diinginkan untuk kueri (dan apakah ada).
Heuristiknya dapat berupa, misalnya, jika dari 20 gambar teratas yang paling sering diklik untuk kueri, setidaknya 70% memiliki warna dominan merah, maka kueri tersebut dapat dikategorikan sebagai "kueri merah". Untuk kueri seperti itu, mesin pencari dapat mengurutkan ulang hasil yang diambil untuk meningkatkan peringkat semua gambar yang dianotasi dengan warna merah sebagai warna dominan.
Kategorisasi yang sama dapat digunakan dengan semua warna standar lainnya. Keuntungan dari pendekatan ini untuk menganalisis teks kueri secara berlebihan adalah bahwa ia bekerja untuk semua bahasa tanpa perlu terjemahan (seperti itu akan mempromosikan gambar dengan warna merah dominan untuk pertanyaan "apel merah" dalam bahasa apa pun). Ini lebih kuat (seperti tidak akan meningkatkan peringkat gambar merah untuk kueri "laut merah").
Contoh Mesin Pengategori
Mesin pengkategorisasi dapat bekerja dalam mode online atau mode offline di mana asosiasi kategori kueri disimpan sebelumnya (misalnya, dalam tabel) untuk digunakan oleh mesin pencari selama pemrosesan kueri.
Mesin menerima hasil gambar kueri untuk kueri tertentu dan memberikan hasil gambar ke annotator gambar. Setiap anotasi gambar menganalisis hasil gambar dan mengekstrak informasi tentang konten visual gambar, yang disimpan sebagai anotasi gambar (misalnya, anotasi gambar) untuk ide tersebut.
Seorang Annotator Gambar Wajah
Sebagai ilustrasi, annotator gambar wajah:
- Menentukan berapa banyak wajah dalam sebuah gambar dan ukuran setiap wajah
- annotator citra sidik jari mengekstrak fitur citra visual dalam bentuk padat (sidik jari) yang kemudian dapat dibandingkan dengan sidik jari citra lain untuk menentukan apakah kedua citra tersebut serupa
- Annotator gambar tangkapan layar menentukan apakah suatu gambar adalah tangkapan layar
- Annotator gambar teks menentukan apakah gambar berisi teks
- Kueri gambar grafik/bagan menentukan apakah suatu gambar menyertakan grafik atau bagan (misalnya, grafik batang)
- Annotator warna dominan menentukan apakah sebuah gambar mengandung warna dominan
Annotator gambar lain juga bisa digunakan. Misalnya, beberapa anotator gambar dijelaskan dalam makalah berjudul "Deteksi Objek Cepat Menggunakan Cascade yang Ditingkatkan dari Fitur Sederhana," oleh Viola, P.; Jones, M., Laboratorium Penelitian Mitsubishi Electric, TR2004-043 (Mei 2004).
Selanjutnya, mesin pengkategoris menganalisis hasil gambar untuk kueri tertentu dan anotasinya untuk menentukan kategori kueri (misalnya, kategori kueri). Kategori kueri ditentukan menggunakan pengklasifikasi, dan pengklasifikasi kueri dapat direalisasikan menggunakan sistem pembelajaran mesin.
Penggunaan Peningkatan Adaptif
Sebagai ilustrasi, AdaBoost, kependekan dari Adaptive Boosting, adalah sistem pembelajaran mesin yang dapat digunakan dengan algoritme pembelajaran lain untuk meningkatkan kinerjanya. AdaBoost digunakan untuk menghasilkan kategorisasi kueri. (Lebih banyak algoritma pembelajaran dimungkinkan)
AdaBoost memanggil anotator gambar "lemah" dalam serangkaian putaran. Sebagai ilustrasi, pengklasifikasi kueri satu orang dapat didasarkan pada algoritme mesin pembelajaran yang dilatih untuk menentukan apakah kueri memanggil gambar satu orang.
Sebagai ilustrasi, pengklasifikasi kueri seperti itu dapat dilatih dengan kumpulan data yang terdiri dari kueri, satu set vektor fitur yang mewakili gambar hasil untuk pertanyaan dengan nol atau lebih wajah, dan kategorisasi yang benar untuk kueri (yaitu, wajah atau tidak) . Untuk setiap panggilan, pengklasifikasi kueri memperbarui distribusi bobot yang menunjukkan pentingnya contoh dalam kumpulan data pelatihan untuk klasifikasi.
Pada setiap putaran, bobot masing-masing contoh pelatihan yang diklasifikasikan meningkat (atau konsekuensi dari setiap contoh pelatihan yang diklasifikasikan menurun), sehingga kategorisasi kueri baru lebih berfokus pada contoh-contoh tersebut. Kategorisasi kueri terlatih yang dihasilkan dapat mengambil sebagai masukan kueri dan mengeluarkan probabilitas bahwa kueri tersebut memanggil gambar yang berisi satu orang.
Pengklasifikasi kueri yang beragam/homogen mengambil sebagai input kueri dan mengeluarkan probabilitas bahwa kueri tersebut untuk berbagai gambar. Pengklasifikasi menggunakan algoritma pengelompokan untuk mengelompokkan hasil gambar sesuai dengan sidik jarinya berdasarkan ukuran jarak satu sama lain. Setiap gambar akan dikaitkan dengan pengidentifikasi cluster.
Pengidentifikasi klaster gambar digunakan untuk menentukan jumlah klaster, ukuran kelompok, dan kesamaan antar klaster yang dibentuk oleh gambar dalam kumpulan hasil. Misalnya, informasi ini digunakan untuk mengaitkan kemungkinan bahwa kueri itu spesifik (atau mengundang duplikat) atau tidak,
Mengaitkan Pertanyaan Dengan Makna dan Representasi Kanonik
Kategorisasi kueri juga dapat digunakan untuk mengaitkan kueri dengan makna dan representasi kanonik. Misalnya, jika ada satu cluster besar atau beberapa cluster besar, kemungkinan pertanyaan terkait dengan hasil gambar duplikat tinggi. Jika ada banyak cluster yang lebih kecil, maka kemungkinan kueri terkait dengan hasil gambar yang sama adalah rendah.

Duplikat gambar biasanya tidak terlalu berguna karena tidak memberikan informasi lebih lanjut, sehingga harus diturunkan sebagai hasil kueri. Tapi, ada pengecualian. Misalnya, jika ada banyak duplikat dalam hasil awal (beberapa, cluster besar), kueri bersifat khusus, dan duplikat tidak boleh diturunkan.
Kategorisasi kueri tangkapan layar/non-tangkapan layar mengambil sebagai masukan kueri dan mengeluarkan probabilitas bahwa kueri tersebut memanggil gambar yang merupakan tangkapan layar. Pengklasifikasi kueri teks/non-teks menerima sebagai masukan kueri dan mengeluarkan peluang bahwa kueri memanggil gambar yang berisi teks.
Kategorisasi kueri grafik/non-grafik mengambil input kueri dan mengeluarkan probabilitas bahwa kueri memanggil gambar yang berisi grafik atau bagan. Pengklasifikasi kueri warna 133f mengambil kueri informasi dan mengeluarkan peluang bahwa kueri memanggil bidikan yang didominasi oleh satu warna. Pengklasifikasi kueri lainnya dimungkinkan.
Meningkatkan Relevansi Hasil Gambar Berdasarkan Kategorisasi Kueri
Seorang pencari dapat berinteraksi dengan sistem melalui klien atau perangkat lain. Misalnya, perangkat klien dapat berupa terminal komputer dalam jaringan area lokal (LAN) atau jaringan area luas (WAN). Perangkat klien dapat berupa perangkat seluler (misalnya, ponsel, komputer seluler, asisten desktop pribadi, dll.) yang mampu berkomunikasi melalui LAN, WAN, atau jaringan lain (misalnya, jaringan telepon seluler).
Perangkat klien dapat mencakup memori akses acak (RAM) (atau memori lain dan perangkat penyimpanan) dan prosesor.
Prosesor akan terstruktur untuk memproses instruksi dan data di dalam sistem. Prosesor adalah mikroprosesor single-threaded atau multi-threaded yang memiliki inti pemrosesan. Prosesor menerima terstruktur untuk mengeksekusi instruksi yang disimpan dalam RAM (atau memori lain dan perangkat penyimpanan yang disertakan dengan perangkat klien) untuk membuat informasi grafis untuk antarmuka pengguna.
Seorang pencari dapat terhubung ke mesin pencari dalam sistem server untuk mengirimkan permintaan input. Mesin pencari adalah mesin pencari gambar atau mesin pencari generik yang dapat mengambil gambar dan jenis konten lainnya seperti dokumen (misalnya, halaman HTML).
Ketika pengguna mengirimkan kueri input melalui perangkat input yang terpasang ke perangkat klien, pertanyaan sisi klien dikirim ke jaringan dan diteruskan ke sistem server sebagai kueri sisi server. Sistem server dapat berupa perangkat server di lokasi. Perangkat server mencakup perangkat memori yang terdiri dari mesin pencari yang dimuat di dalamnya.
Prosesor terstruktur untuk memproses instruksi di dalam perangkat. Petunjuk ini dapat menginstal komponen mesin pencari. Prosesor dapat berupa single-threaded atau multi-threaded dan mencakup banyak inti pemrosesan. Prosesor dapat memproses instruksi yang disimpan dalam memori yang terkait dengan mesin pencari dan mengirim informasi ke perangkat klien melalui jaringan untuk membuat presentasi grafis di antarmuka pengguna perangkat klien (misalnya, hasil pencarian pada halaman web yang ditampilkan di web peramban).
Kueri sisi server diterima oleh mesin pencari. Mesin pencari menggunakan informasi dalam kueri masukan (seperti istilah kueri) untuk menemukan dokumen yang relevan. Mesin pencari dapat menyertakan mesin pengindeks yang mencari korpus (misalnya, halaman web di Internet) untuk mengindeks dokumen yang ditemukan di korpus itu. Informasi indeks untuk dokumen korpus dapat disimpan dalam database indeks.
Basis data indeks ini dapat diakses untuk mengidentifikasi dokumen yang terkait dengan pengguna. Perhatikan bahwa salinan elektronik (yang akan disebut sebagai dokumen) tidak sesuai dengan file. Catatan dapat disimpan di bagian file yang menyimpan dokumen lain, dalam satu file yang didedikasikan untuk dokumen yang bersangkutan, atau dalam banyak file terkoordinasi. Selain itu, salinan dapat disimpan dalam memori tanpa disimpan dalam file.
Mesin pencari dapat menyertakan mesin peringkat untuk memberi peringkat pada dokumen yang terkait dengan permintaan input. Pemeringkatan dokumen dapat dilakukan dengan menggunakan teknik tradisional untuk menentukan skor Information Retrieval (IR) untuk catatan yang diindeks berdasarkan kueri tertentu.
Metode apa pun yang sesuai dapat menentukan relevansi dokumen tertentu dalam istilah pencarian tertentu atau dengan informasi lain yang disediakan. Misalnya, tingkat umum tautan balik ke dokumen yang berisi kecocokan untuk istilah pencarian dapat digunakan untuk menyimpulkan relevansi dokumen.
Secara khusus, jika sebuah dokumen ditautkan ke (misalnya, adalah target hyperlink) oleh banyak dokumen relevan lainnya (seperti dokumen yang berisi kecocokan untuk istilah pencarian), dapat disimpulkan bahwa dokumen target sangat relevan. Kesimpulan ini dapat dibuat karena penulis makalah penunjuk mungkin sebagian besar menunjuk ke dokumen lain yang relevan dengan audiens mereka.
Dokumen penunjuk menargetkan tautan dari dokumen lain yang relevan, yang dapat dianggap lebih relevan. Dokumen pertama sangat tepat karena menargetkan dokumen yang berlaku (atau bahkan sangat relevan).
Teknik seperti itu dapat menentukan relevansi dokumen atau salah satu dari banyak faktor penentu. Metode yang tepat juga dapat digunakan untuk mengidentifikasi dan memotong upaya untuk memberikan suara palsu untuk meningkatkan relevansi halaman.
Untuk lebih meningkatkan teknik peringkat dokumen tradisional seperti itu, mesin peringkat dapat menerima lebih banyak sinyal dari mesin pengubah peringkat untuk membantu menentukan peringkat yang sesuai untuk dokumen.
Dalam hubungannya dengan anotasi gambar dan kategorisasi kueri yang dijelaskan di atas, mesin pengubah peringkat memberikan ukuran relevansi untuk makalah. Mesin peringkat dapat digunakan untuk meningkatkan peringkat hasil pencarian yang diberikan kepada pengguna.
Mesin pengubah peringkat dapat melakukan operasi untuk menghasilkan ukuran relevansi.
Apakah skor hasil gambar meningkat atau menurun tergantung pada apakah konten visual gambar (seperti yang ditunjukkan dalam anotasi gambar) cocok dengan kategorisasi kueri, setiap kategori gambar akan dipertimbangkan.
Misalnya, jika kategorisasi kueri adalah "orang lajang", maka hasil gambar yang diklasifikasikan sebagai "tangkapan layar" dan "satu wajah" pertama-tama akan mengalami penurunan skor karena kategori "tangkapan layar". Itu kemudian dapat meningkatkan skornya karena kategori "satu wajah".
Mesin pencari dapat meneruskan daftar hasil akhir yang diberi peringkat dalam hasil pencarian sisi server melalui jaringan. Keluar dari jaringan, hasil pencarian sisi klien dapat diterima oleh perangkat klien, di mana hasilnya dapat disimpan di dalam RAM dan digunakan oleh prosesor untuk menampilkan hasil pada perangkat keluaran bagi pengguna.
Sistem Pencarian Informasi
Komponen ini meliputi:
- Mesin pengindeksan
- Mesin pencetak gol
- Mesin peringkat
- Mesin pengubah peringkat
Mesin pengindeksan berfungsi seperti yang dijelaskan di atas untuk mesin pengindeksan. Mesin penilaian menghasilkan skor untuk hasil dokumen berdasarkan banyak fitur, termasuk fitur berbasis konten yang menautkan kueri ke hasil dokumen dan bagian independen kueri yang umumnya menyatakan kualitas hasil dokumen.
Fitur berbasis konten untuk gambar mencakup aspek dokumen yang berisi gambar, seperti kecocokan kueri dengan judul dokumen atau keterangan gambar.
Fitur kueri-independen mencakup, misalnya, aspek dokumen referensi silang kertas atau domain atau dimensi gambar.
Selain itu, fungsi tertentu yang digunakan oleh mesin penilaian dapat disetel untuk menyesuaikan berbagai kontribusi fitur pada skor IR akhir, menggunakan proses otomatis atau semi-otomatis.
Mesin peringkat memberi peringkat hasil dokumen untuk ditampilkan kepada pengguna berdasarkan skor IR yang diterima dari mesin penilaian dan sinyal dari mesin pengubah peringkat.
Mesin pengubah peringkat memberikan ukuran relevansi untuk dokumen, yang dapat digunakan mesin peringkat untuk meningkatkan peringkat hasil pencarian yang diberikan kepada pengguna. Komponen pelacakan merekam informasi perilaku pengguna, seperti pilihan pengguna individu dari hasil yang disajikan dalam urutan.
Komponen pelacakan mendapatkan kode JavaScript tersemat yang disertakan dalam peringkat halaman web yang mengidentifikasi pilihan pengguna dari masing-masing hasil dokumen dan mengidentifikasi kapan pengguna kembali ke halaman hasil, sehingga menunjukkan jumlah waktu yang dihabiskan pengguna untuk melihat hasil dokumen yang dipilih.
Komponen pelacakan adalah sistem proxy yang melaluinya pilihan pengguna dari hasil dokumen dirutekan. Komponen pelacakan juga dapat menyertakan perangkat lunak pra-instal untuk klien (seperti plug-in toolbar ke sistem operasi klien).
Implementasi lain juga dimungkinkan, misalnya, yang menggunakan fitur browser web yang memungkinkan tag/direktif untuk disertakan dalam halaman, yang meminta browser untuk terhubung kembali ke server dengan pesan tentang tautan yang diklik oleh pengguna.
Informasi yang direkam disimpan dalam log pemilihan hasil. Informasi yang direkam mencakup entri log yang menyatakan interaksi pengguna dengan setiap dokumen hasil yang disajikan untuk setiap kueri yang dikirimkan.
Untuk setiap pilihan pengguna dari dokumen hasil yang disajikan untuk kueri, entri log menyatakan kueri (Q), makalah (D), waktu tunggu pengguna (T) pada dokumen, bahasa (L) yang digunakan oleh pengguna, dan negara (C) tempat pengguna kemungkinan berada (misalnya, berdasarkan server yang digunakan untuk mengakses sistem IR) dan kode wilayah (R) yang mengidentifikasi area metropolitan pengguna.
Entri log juga merekam informasi negatif, seperti hasil dokumen yang disajikan kepada pengguna tetapi tidak dipilih.
Informasi lain seperti:
- Posisi klik (yaitu, pilihan pengguna di antarmuka pengguna
- Informasi tentang sesi (seperti keberadaan dan jenis klik sebelumnya (Aktivitas sesi pasca-klik))
- Skor R dari hasil yang diklik
- Skor IR dari semua hasil ditampilkan sebelum klik
- Judul dan cuplikan ditampilkan kepada pengguna sebelum mengklik
- kuki pengguna
- usia kue
- Alamat IP (Protokol Internet)
- Agen pengguna browser
- Segera
Waktu (T) antara klik-tayang awal ke hasil dokumen dan pengguna kembali ke halaman utama dan mengklik hasil dokumen lain (atau mengirimkan permintaan pencarian baru) juga akan dicatat.
Penilaian dilakukan tentang waktu (T) tentang apakah waktu ini menunjukkan tampilan dokumen yang lebih panjang atau lebih pendek karena argumen yang lebih panjang umumnya menunjukkan kualitas atau relevansi untuk hasil yang diklik. Penilaian waktu (T) ini dapat dilakukan bersamaan dengan berbagai teknik pembobotan.
Komponen yang ditampilkan dapat digabungkan dalam berbagai cara dan beberapa konfigurasi sistem. Mesin tanking akhir penilaian bergabung menjadi mesin peringkat tunggal, seperti mesin peringkat. Mesin pengubah peringkat dan mesin peringkat juga bisa digabungkan. Secara umum, mesin peringkat mencakup komponen perangkat lunak apa pun yang menghasilkan peringkat hasil dokumen setelah kueri. Selain itu, mesin peringkat juga dapat memuat sistem klien (atau lebih dari itu) dalam sistem server.
Contoh lainnya adalah sistem temu kembali informasi. Sistem server mencakup mesin pengindeksan dan mesin penilaian/peringkat.
Dalam sistem ini, sistem klien meliputi:
- Antarmuka pengguna untuk menampilkan peringkat
- Komponen pelacakan
- Hasil seleksi log
- Mesin pengubah peringkat/peringkat.
Misalnya, sistem klien dapat mencakup jaringan perusahaan perusahaan dan komputer pribadi, di mana plug-in browser menggabungkan mesin pengubah peringkat/peringkat.
Ketika seorang karyawan di perusahaan memulai pencarian di sistem server, mesin penilaian/peringkat dapat mengembalikan hasil pencarian. Peringkat awal atau skor IR aktual untuk hasil. Plug-in browser kemudian memeringkat ulang hasil berdasarkan pilihan halaman yang dilacak untuk basis pengguna khusus perusahaan.
Teknik Untuk Kategorisasi Kueri
Teknik ini dapat dilakukan secara online (sebagai bagian dari pemrosesan query) atau secara offline.
Hasil gambar pertama yang responsif terhadap kueri pertama diterima. Setiap gambar pertama dikaitkan dengan pesanan (seperti skor IR) dan data perilaku pengguna masing-masing (seperti data klik).
Sejumlah gambar pertama dipilih di mana metrik untuk data perilaku masing-masing untuk setiap gambar yang dipilih memenuhi ambang batas.
Gambar pertama yang dipilih akan dikaitkan dengan beberapa anotasi berdasarkan analisis konten gambar pertama yang dipilih. Anotasi gambar dapat bertahan dalam anotasi gambar.
Kategori kemudian dikaitkan dengan kueri pertama berdasarkan anotasi.
Asosiasi kategorisasi kueri dapat bertahan dalam kategori kueri.
Hasil gambar kedua responsif terhadap query kedua yang sama atau query pertama kemudian diterima.
(Jika kueri kedua tidak ditemukan dalam kategorisasi kueri, kueri kedua bisa diubah atau "ditulis ulang" untuk menentukan apakah formulir alternatif cocok dengan kueri dalam kategorisasi kueri.)
Dalam contoh ini, kueri kedua sama atau dapat ditulis ulang sebagai kueri pertama.
Hasil gambar kedua diurutkan ulang berdasarkan kategorisasi kueri sebelum dikaitkan dengan kueri pertama.
Cari Berita Langsung Ke Kotak Masuk Anda
*Diperlukan