Pengelompokan Entitas di Google SERPs Diperbarui
Diterbitkan: 2022-01-13Paten Entitas Pengelompokan Diperbarui
Salah satu posting blog terbaru saya adalah tentang Google mengelompokkan hasil berita berdasarkan topik dalam hasil pencarian organik. Google telah mengelompokkan informasi tentang entitas dalam hasil pencarian juga. Jika Anda sekarang mencari orang yang berakting dengan Humprey Bogart di Casablanca. Anda dapat melihat aktor lain dalam film tersebut di hasil penelusuran tersebut. Anda juga dapat melihat pertanyaan terkait yang menyertakan aktor dan film tersebut (dan ontologi tentang kategori terkait untuk film tersebut). Postingan baru ini adalah tentang pengelompokan entitas dan perubahan cara Google memberikan hasil penelusuran terkait pengelompokan entitas.
Berikut adalah contoh hasil pencarian yang menunjukkan hubungan antara aktor dan film Casablanca:
Google memiliki paten lanjutan mulai 3 Januari 2022. Saya telah menulis tentang versi sebelumnya dari paten tersebut pada tahun 2019 di pos Pengelompokan Entitas di Hasil Penelusuran Google
Klaim Dari Paten Pertama
Karena paten baru ini merupakan paten lanjutan, sebagian besar paten identik. Paten berisi klaim yang diperbarui. Klaim pertama dari paten Clustering Search Results versi 2019 berbunyi sebagai berikut:
1. Metode yang terdiri dari: menentukan item yang responsif terhadap kueri; menghasilkan cluster item tingkat pertama, setiap cluster mewakili entitas dalam basis pengetahuan dan termasuk item yang dipetakan ke entitas; menghitung skor klaster masing-masing untuk setiap klaster tingkat pertama, di mana skor klaster masing-masing untuk klaster tingkat pertama didasarkan pada skor siluet masing-masing yang mengukur koherensi dan pemisahan klaster tingkat pertama dan pada rasio siluet yang mewakili persentase semua cluster tingkat pertama yang memiliki skor siluet masing-masing di atas ambang batas; menggabungkan klaster tingkat pertama berdasarkan hubungan ontologi entitas dan pada masing-masing skor klaster yang dihitung untuk klaster yang digabungkan, di mana skor klaster masing-masing dari klaster gabungan mewakili skor yang lebih baik daripada skor klaster masing-masing untuk klaster tingkat pertama yang termasuk dalam klaster gabungan ; menerapkan pengelompokan hierarkis ke cluster yang digabungkan, menghasilkan cluster akhir yang memaksimalkan skor cluster masing-masing untuk pengelompokan hierarkis; dan menyediakan item yang responsif terhadap kueri untuk ditampilkan sesuai dengan kluster akhir.
Klaim Dari Paten yang Diperbarui
Secara rinci, posting yang saya tulis pada tahun 2019 menjelaskan proses di balik paten entitas pengelompokan. Sekarang, versi paten baru dari hari pertama tahun 2022 memiliki bahasa baru yang memberi tahu kita apa yang dilakukan paten tersebut. Kumpulan klaim pertama pada tahun 1999 memberi tahu kami tentang "skor siluet", yang tidak ada dalam klaim baru. Klaim 2022 mencakup beberapa istilah yang tidak ada dalam versi 2019:
1. Metode yang dilakukan oleh mesin pencari yang terdiri dari: menentukan sekumpulan item yang responsif terhadap kueri; untuk setiap item dari kumpulan item yang ditentukan untuk responsif terhadap kueri: mengidentifikasi satu atau lebih entitas yang terkait dengan item tersebut, dan memperoleh penyematan untuk item tersebut; menghasilkan cluster tingkat pertama dari set item, setiap cluster mewakili entitas dari satu atau lebih entitas; menghasilkan cluster akhir dengan menggabungkan cluster tingkat pertama berdasarkan hubungan ontologis entitas dan kesamaan embedding ditentukan menggunakan embeddings item, dimana hubungan ontologis entitas termasuk hypernym, sinonim, dan co-hypernym; dan menyediakan item dari kumpulan item yang responsif terhadap permintaan untuk ditampilkan sesuai dengan cluster akhir.
2. Metode klaim 1, dimana cluster tingkat pertama yang lebih kecil digabung terlebih dahulu.
3. Metode klaim 2, dimana penggabungan klaster tingkat pertama yang lebih kecil meliputi, untuk klaster tingkat pertama pertama: menentukan klaster tingkat pertama kedua dan klaster tingkat pertama ketiga yang terkait dengan klaster tingkat pertama pertama berdasarkan hubungan ontologis entitas ; menentukan bahwa klaster tingkat pertama ketiga dan klaster tingkat pertama lebih kecil dari klaster tingkat pertama kedua; dan menggabungkan klaster tingkat pertama pertama dengan klaster tingkat pertama ketiga.
4. Metode klaim 1, dimana cluster tingkat pertama yang paling mirip digabung terlebih dahulu.
5. Metode klaim 4, dimana penggabungan klaster pertama yang paling mirip pertama meliputi, untuk klaster tingkat pertama pertama: menentukan klaster tingkat pertama kedua dan klaster tingkat pertama ketiga yang terkait dengan klaster tingkat pertama pertama di hubungan ontologis entitas; menentukan bahwa klaster tingkat pertama pertama lebih mirip dengan klaster tingkat pertama kedua daripada klaster tingkat pertama ketiga; dan menggabungkan klaster tingkat pertama pertama dengan klaster tingkat pertama kedua.
Versi yang lebih baru memberi tahu kita bahwa itu mencakup "hubungan ontologis", yang tidak dimiliki oleh rangkaian klaim pertama. Jadi, kita tahu dari SERP bahwa Bogart ada di Film "Casablanca", seperti banyak aktor lain yang fokus pada hasil pencarian itu.

Mengelompokkan hasil pencarian
Penemu: Jilin Chen, Dai; Lichan Hong, Tianjiao Zhang, Huazhong Ning, dan Ed Huai-Hsin Chi
Penerima tugas: Google LLC
Paten AS: 11.216.503
Diberikan: 4 Januari 2022
Diarsipkan: 26 November 2019
Abstrak
Implementasi menyediakan sistem yang ditingkatkan untuk menyajikan hasil pencarian berdasarkan asosiasi entitas dari item pencarian. Contoh metode termasuk menghasilkan klaster tingkat pertama dari item yang responsif terhadap kueri, setiap klaster mewakili entitas dalam basis pengetahuan dan termasuk item yang dipetakan ke entitas, menggabungkan klaster tingkat pertama berdasarkan hubungan ontologi entitas, menerapkan pengelompokan hierarkis ke menggabungkan cluster, menghasilkan cluster akhir, dan memulai tampilan item sesuai dengan cluster akhir. Metode contoh lain termasuk menghasilkan cluster tingkat pertama dari item yang responsif terhadap kueri, setiap cluster mewakili entitas dalam basis pengetahuan dan termasuk item yang dipetakan ke entitas, menghasilkan cluster akhir dengan menggabungkan cluster tingkat pertama berdasarkan ontologi entitas dan ruang penyematan yang dihasilkan dari model penyematan yang menggunakan pemetaan, dan memulai tampilan item yang responsif terhadap kueri menurut kluster akhir.
Jika Anda kembali ke tulisan asli saya tentang paten entitas pengelompokan ini dari 2019, Anda akan melihat bahwa saya menyebutkan "ontologi" berkali-kali ketika menulis tentang entitas. Versi 2022 dari paten entitas pengelompokan menambahkan bahasa itu langsung ke klaim. Mereka berada di SERPs tanpa membahas hubungan antara film dan aktornya.
Pengelompokan Entitas dan Berita
Setelah perubahan ini, saat kami mencari entitas dan berita tertentu, kami juga melihat hasil pencarian yang dikelompokkan di sana:
Jadi Google tidak lagi menyortir SERP berdasarkan seberapa bagus dokumen yang cocok untuk istilah kueri – Google mengelompokkan topik dan hubungan antar entitas sebagai bagian dari keputusannya tentang apa yang harus disertakan dalam hasil pencarian.
Cari Berita Langsung Ke Kotak Masuk Anda
*Diperlukan