Google SERP의 클러스터링 엔터티 업데이트됨

게시 됨: 2022-01-13

클러스터링 엔터티 특허가 업데이트되었습니다.

클러스터링 엔터티

내 최근 블로그 게시물 중 하나는 자연 검색 결과에서 주제별로 뉴스 결과를 클러스터링하는 Google에 관한 것입니다. Google은 검색 결과의 엔터티에 대한 정보도 클러스터링했습니다. 지금 카사블랑카에서 험프리 보가트와 함께 연기한 사람들을 찾는다면. 해당 검색 결과에서 해당 영화의 다른 배우를 볼 수 있습니다. 또한 해당 배우와 영화를 포함하는 관련 질문(영화의 관련 카테고리에 대한 해당 온톨로지)도 볼 수 있습니다. 이 새 게시물은 항목 클러스터링 및 Google이 항목 클러스터링과 관련된 검색 결과를 제공하는 방식의 변경사항에 관한 것입니다.

다음은 배우와 영화 카사블랑카 간의 연결을 보여주는 검색 결과의 예입니다.

엔터티 클러스터링 - 카사블랑카

Google은 2022년 1월 3일부터 계속 특허를 보유하고 있습니다. 저는 Google 검색 결과의 엔티티 클러스터링 게시물에서 2019년 해당 특허의 이전 버전에 대해 썼습니다.

첫 번째 특허의 주장

이번 신규특허는 계속특허이기 때문에 대부분의 특허가 동일합니다. 특허에는 업데이트된 주장이 포함되어 있습니다. 2019년 버전의 클러스터링 검색 결과 특허의 첫 번째 주장은 다음과 같습니다.

질의에 응답하여 항목을 결정하는 단계; 항목의 첫 번째 수준 클러스터를 생성하는 단계 - 각 클러스터는 지식 기반의 엔터티를 나타내고 엔터티에 매핑된 항목을 포함합니다. 각각의 제1 레벨 클러스터에 대한 각각의 클러스터 점수를 계산하고, 여기서 제1 레벨 클러스터에 대한 각각의 클러스터 스코어는 제1 레벨 클러스터 의 일관성 및 분리를 측정하는 각각의 실루엣 스코어 및 임계값 이상의 각각의 실루엣 점수를 갖는 모든 첫 번째 수준 클러스터; 엔티티 온톨로지 관계 및 병합된 클러스터에 대해 계산된 각각의 클러스터 점수에 기초하여 제1 수준 클러스터를 병합하는 단계로서, 병합된 클러스터 의 개별 클러스터 점수는 병합된 클러스터에 포함된 제1 수준 클러스터에 대한 각각의 클러스터 점수보다 더 나은 점수를 나타냅니다. ; 병합된 클러스터에 계층적 클러스터링을 적용하여 계층적 클러스터링에 대한 각각의 클러스터 점수를 최대화하는 최종 클러스터를 생성하는 단계; 및 최종 클러스터에 따라 디스플레이를 위해 질의에 응답하는 항목을 제공하는 단계를 포함한다.

업데이트된 특허의 청구

구체적으로 2019년에 작성한 게시물은 클러스터링 엔터티 특허의 이면에 있는 프로세스를 설명합니다. 이제 2022년 첫날부터 특허의 새 버전에는 특허가 무엇을 하는지 알려주는 새로운 언어가 있습니다. 1999년의 첫 번째 청구 세트는 새로운 청구에 없는 "실루엣 점수"에 대해 알려줍니다. 2022년 클레임에는 2019년 버전에 없는 일부 용어가 포함되어 있습니다.

검색 엔진에 의해 수행되는 방법으로서, 질의에 응답하여 항목 세트를 결정하는 단계; 질의에 응답하도록 결정된 항목 세트의 각 항목에 대해: 항목과 연관된 하나 이상의 엔티티를 식별하고 항목에 대한 임베딩을 획득하는 단계; 항목 세트로부터 제1 레벨 클러스터를 생성하는 단계 - 각 클러스터는 하나 이상의 엔티티의 엔티티를 나타냄 -; 항목 임베딩을 이용하여 결정된 개체 온톨로지 관계 및 임베딩 유사도에 기초하여 제1 수준 클러스터를 병합하여 최종 클러스터를 생성하는 단계(여기서, 개체 존재론적 관계는 상위어, 동의어 및 공동 상위어를 포함함); 및 최종 클러스터에 따른 디스플레이를 위해 질의에 응답하여 아이템 세트로부터 아이템을 제공하는 단계를 포함한다.

제1항에 있어서, 더 작은 제1 레벨 클러스터가 먼저 병합되는 방법.

제2항에 있어서, 더 작은 제1 레벨 클러스터를 병합하는 단계는 제1 제1 레벨 클러스터에 대해 , 제2 제1 레벨 클러스터 및 제1 제1 레벨 클러스터와 관련된 제3 제1 레벨 클러스터를 결정하는 단계를 포함하는 방법. 개체 존재론적 관계를 기반으로 ; 제3 제1 레벨 클러스터 및 제1 제1 레벨 클러스터가 제2 제1 레벨 클러스터보다 작다고 결정하는 단계; 및 제1 제1 레벨 클러스터를 제3 제1 레벨 클러스터와 병합하는 단계를 포함한다.

제1항에 있어서, 가장 유사한 제1 레벨 클러스터가 먼저 병합되는 방법.

제4항에 있어서, 가장 유사한 제1 클러스터를 먼저 병합하는 단계는 제1 제1 레벨 클러스터에 대해, 개체 존재론적 관계; 제1 제1 레벨 클러스터가 제3 제1 레벨 클러스터보다 제2 제1 레벨 클러스터와 더 유사하다고 결정하는 단계; 및 제1 제1 레벨 클러스터를 제2 제1 레벨 클러스터와 병합하는 단계를 포함한다.

최신 버전은 첫 번째 주장 세트에는 없는 "존재론적 관계"가 포함되어 있다고 알려줍니다. 그래서 우리는 SERP를 통해 Bogart가 영화 "Casablanca"에 있었고 그 검색 결과에 초점을 맞춘 다른 많은 배우들도 있었다는 것을 압니다.

클러스터링 검색 결과
발명가: Jilin Chen, Dai; Lichan Hong, Tianjiao Zhang, Huazhong Ning, Ed Huai-Hsin Chi
양수인: Google LLC
미국 특허: 11,216,503
부여: 2022년 1월 4일
출원일: 2019년 11월 26일

추상적인

구현은 검색 항목의 엔터티 연관을 기반으로 검색 결과를 표시하기 위한 개선된 시스템을 제공합니다. 예시적인 방법은 쿼리에 응답하여 항목의 1차 수준 클러스터를 생성하고, 각 클러스터는 지식 기반의 엔터티를 나타내고 엔터티에 매핑된 항목을 포함하고, 엔터티 온톨로지 관계에 기반하여 1차 수준 클러스터를 병합하고, 계층적 클러스터링을 계층적 클러스터링에 적용하는 것을 포함합니다. 병합된 클러스터, 최종 클러스터 생성, 최종 클러스터에 따라 항목 표시 시작. 다른 예시적인 방법은 쿼리에 응답하는 항목으로부터 1차 수준 클러스터를 생성하는 단계를 포함하며, 각 클러스터는 지식 기반의 엔터티를 나타내고 엔터티에 매핑된 항목을 포함하고, 엔터티 온톨로지 및 매핑을 사용하는 임베딩 모델에서 생성된 임베딩 공간 및 최종 클러스터에 따라 쿼리에 응답하여 항목 표시를 시작합니다.

2019년 이 클러스터링 엔터티 특허에 대한 저의 원래 작성으로 돌아가면 엔터티에 대해 쓸 때 "온톨로지"를 여러 번 언급한다는 것을 알 수 있습니다. 클러스터링 엔티티 특허의 2022 버전은 해당 언어를 청구에 직접 추가합니다. 그들은 영화와 배우 사이의 관계에 대해 논의하지 않고 SERP에 있습니다.

클러스터링 엔터티 및 뉴스

이 변경 후 특정 엔터티 및 뉴스를 검색할 때 클러스터된 검색 결과도 표시됩니다.

클러스터링 엔터티 뉴스

따라서 Google은 더 이상 검색어에 대해 일치 문서가 얼마나 좋은지에 따라 SERP를 정렬하지 않습니다. Google은 검색 결과에 포함할 항목에 대한 결정의 일부로 항목 간의 주제와 관계를 클러스터링하고 있습니다.

받은 편지함으로 바로 뉴스 검색

이 필드는 유효성 검사를 위한 것이며 변경되지 않은 상태로 두어야 합니다.

*필수의