Qu'est-ce que le référencement BERT et le traitement du langage naturel ?
Publié: 2020-02-12Grâce au BERT, le traitement du langage naturel (NLP) est le nouvel ingrédient incontournable de toute campagne de référencement mobile .
Vous avez peut-être entendu le proverbe « vos paroles déterminent votre destin ». De même, dans Search Marketing, la façon dont nous utilisons les mots sur une page est importante. Le BERT de Google offre des informations sur son organisation des résultats de recherche. Il illustre comment la relation entre les entités verbales et l'utilisation du langage façonne l'avenir du référencement.
L'indexation Mobile-First influence la dépendance accrue de Google à l'emplacement physique (GPS / Google Maps) du chercheur. Il connaît également les paramètres de langue du chercheur sur son téléphone et dans son compte Google. Cela aide à informer les résultats de recherche qui sont renvoyés et offre des résultats de recherche plus personnalisés.
Dès que Google a publié sa déclaration annonçant le format de recherche influencé par l'algorithme BERT, nous savions que cela méritait du temps et de l'attention. Puisqu'il vise à améliorer l'interprétation des requêtes de recherche complexes à longue traîne et à afficher des résultats de recherche plus pertinents, il s'agit de la plus grande mise à jour de recherche en 5 ans. Ce n'est qu'après avoir intériorisé ce que signifient réellement les mots que BERT englobe que nous pouvons améliorer le marketing de recherche.
Voici ce à quoi nous sommes arrivés à ce jour.
Qu'est-ce que le BERT ?
BERT, est un acronyme pour Représentations d'encodeurs bidirectionnels de transformateurs. Il s'agit d'une technique basée sur un réseau de neurones pour la pré-formation en traitement du langage naturel. En termes plus simples, il peut être utilisé pour aider les moteurs de recherche à mieux déchiffrer le contexte des mots dans les requêtes de recherche.
Les modèles BERT dépassent les capacités précédentes. Ils évaluent le contexte complet d'un mot en regardant à la fois les mots qui viennent AVANT et APRÈS. Cela l'aide à rassembler un contexte particulièrement utile pour comprendre l'intention qui a déclenché la requête de recherche.
Qu'est-ce qu'une entité Google ?
Google a obtenu le brevet n° US 9 477 759 B2 le 25 octobre 2016. Il définit une entité Google comme : "Une chose ou un concept singulier, unique, bien défini et distinctif". Il aborde également ses capacités de réponse aux questions qui reposent sur des références d'entité dans des données non structurées. Le brevet explique comment Google trouve des informations pertinentes dans les pages Web.
Il est important de comprendre qu'une entité n'a pas besoin d'être un objet physique, il peut également s'agir d'une teinte de couleur, d'une date, d'un parfum, etc. Une entité est tout ce qui est : Singulier. Par exemple, une entité peut être un individu, un bâtiment physique, un emplacement géographique, un produit, un son, une idée cognitive, un concept abstrait, un élément factuel ou d'autres choses existantes. Il peut également s'agir de n'importe quelle combinaison de ces éléments pour faciliter la façon dont Google explore et indexe un site.
Une entité n'appartient pas à un nœud parent ; ses descendants sont plutôt en lecture seule. Le nom d'une entité est contenu dans la propriété nodeName
. De plus, une Entity est un objet Node, et en hérite donc certaines propriétés et méthodes.
Qu'est-ce que la reconnaissance d'entité ?
La reconnaissance d'entité est ce qui élève la recherche des chaînes aux choses. Il aide Google Search Appliance à identifier et à classer les entités intéressantes dans les documents, puis à stocker ces entités dans sa bibliothèque ou son index de recherche. Les SEO peuvent enrichir le contenu pauvre en métadonnées pour augmenter les chances de gagner des résultats riches avec du texte en utilisant la PNL. Un terme peut être le nom d'une entité, qui est ensuite appelée « entité nommée ».
Qu'est-ce que la correspondance entité-requête ?
La correspondance entité-requête étend les capacités avancées de perception du contenu de Google. Comment utiliser le NLP dans l'optimisation sur site est devenu une question majeure en 2020. Commencez chaque campagne de marketing de contenu par une étude de marché approfondie. Cela vous aidera à comprendre le contexte que les moteurs de recherche peuvent associer aux requêtes des utilisateurs sur chaque sujet.
Comment savoir quelles pages sont suffisamment crédibles pour voir des résultats avec l'optimisation NLP ?
Si vous avez déjà un contenu de qualité sur un sujet et que vous vous classez pour celui-ci, vous avez de meilleures chances. Trouvez une page dont le contenu est faible mais qui peut être classée en raison de liens entrants et commencez par améliorer ces pages. Votre contenu répondra mieux aux besoins réels des téléspectateurs s'il est écrit en langage naturel.
Qu'est-ce que le traitement automatique du langage naturel basé sur le contexte ?
Le traitement du langage naturel basé sur le contexte commence par la façon dont les moteurs de recherche tentent d'identifier les contextes qui peuvent être utilisés pour répondre à des demandes d'utilisateurs particulières. Cela implique le traitement de ces demandes d'utilisateurs en tirant parti d'un moteur de système de dialogue qui s'appuie sur les contextes. Ceux-ci font généralement référence à des contextes vocaux qui génèrent une séquence de demandes d'utilisateurs ou de réponses de système de dialogue qui sont stockées et catégorisées
Comment les spécialistes du marketing de recherche peuvent-ils utiliser le NLP pour générer des revenus ?
Les données structurées reflètent le contenu de votre contenu. S'il est mis en œuvre correctement et tenu à jour, il devrait le faire. Pour les sites de commerce électronique, incluez du contenu contextuel qui peut répondre aux requêtes de recherche avec intention d'achat. Évitez les entités PNL qui peuvent avoir une implication négative, comme « déprimé » ou « fou ». Il faut avoir une vue d'ensemble par rapport aux valeurs elles-mêmes. Cela aidera à déchiffrer les différences granulaires dans les entités.
La page de résultats de recherche, connue sous le nom de SERP, est extrêmement populaire. Le bon contenu peut aider votre entreprise à apparaître dans des fonctionnalités telles que les packs locaux de Google et les extraits en vedette. En adoptant un état d'esprit axé sur le BERT, votre entreprise peut gagner des appels clients même à partir de recherches sans clic. L'ajout d'un traitement sémantique dans votre flux de travail de publication de contenu implique l'utilisation du traitement du langage naturel pour ajouter des informations sémantiquement structurées utiles qui décrivent votre contenu. De nombreuses stratégies de recherche peuvent inclure la PNL pour améliorer le référencement et l'engagement des utilisateurs.
Le domaine du traitement du langage naturel se développe à pas de géant. Combiné à l'apprentissage automatique et piloté par des techniques d'apprentissage en profondeur, des modèles d'utilisation des mots émergent. Les entités et les nœuds produisent une structure de contenu à partir de vastes trésors de texte. Google choisit ensuite comment il veut les utiliser.
Google Knowledge Graphs affiche les entités associées. Un panneau de connaissances d'une personne largement connue peut afficher un lien entre cette personne correspondant à votre requête de recherche et une autre personne. En cliquant sur "Voir la connexion", plus d'informations incluant les deux individus s'afficheront. Pour expérimenter vous-même, recherchez votre célébrité préférée, puis sélectionnez une célébrité suggérée dans les résultats SERP "Les gens recherchent également". C'est une façon de déclencher ces nœuds d'entité associés.
Les chatbots d'IA conversationnelle et les assistants vocaux s'appuient sur des modèles de langage naturel de pointe pour répondre à la question des gens lorsqu'une entreprise n'est pas disponible. Ces modèles peuvent être formés pour faciliter une approche centrée sur le consommateur pour répondre aux questions fréquemment posées.
Toutes les entreprises doivent-elles se soucier des entités de recherche Google ?
Oui, ceux qui veulent être trouvés dans la recherche organique. L'objectif de la façon dont vous utilisez les entités dans votre contenu doit inclure la motivation des personnes à prendre des mesures directement liées à vos objectifs commerciaux.
La représentation précise du nom et des entités de votre entreprise aide les clients à trouver votre entreprise en ligne. Cela commence par une liste Google My Business entièrement optimisée avec toutes les entités renseignées.
Ils n'y penseraient probablement jamais de cette façon. Le microphone de votre téléphone est toujours à l'écoute. En arrière-plan, l'apprentissage automatique évalue ce qu'il entend des entités qu'il capte. Les versions récentes de l'iPhone et d'Android vous montrent la distance jusqu'au dernier endroit où il vous a entendu parler. Ou où voir le film qu'il a entendu pour la dernière fois annoncé dans une publicité radio/TV que vous écoutez. Qu'est-ce qu'il écoute d'autre ?
Cortana installé sur mon ordinateur m'a récemment dit à plusieurs reprises : "Je peux apprendre à mieux te comprendre si je peux me familiariser avec ta façon de parler." Cependant, je ne lui parlais pas et je ne pensais pas qu'il « écoutait ».
Au cours des derniers mois, nous avons de plus en plus de preuves que l'indexation Mobile-First de Google n'est pas seulement un changement du crawler principal, mais un changement majeur dans la stratégie de Google pour organiser les informations et traiter les requêtes. La relation entre les langues et les entités dans Mobile-First Indexing, « Entity-First Indexing », ne peut pas être surestimée. » – Cindy Krum de Mobile Moxie
Quelles sont les meilleures façons d'utiliser des mots et des phrases dans le contenu ?
Les mots de votre contenu deviennent des paires d'entités.
Les mots dans le contenu Web doivent circuler de la même manière que les gens parlent, mais ils doivent être sémantiquement corrects dans les termes recherchés par BERT. Cela vous aidera à obtenir les résultats les plus complets dans les SERP.
Recherchez les entités uniques qui correspondent le mieux à votre phrase de recherche principale. Vérifiez comment utiliser correctement les entités pour ajouter une valeur de contexte aux lecteurs. Actuellement, Google dispose des meilleurs ensembles de données pour aider les algorithmes à apprendre.
Les référenceurs qui manquaient autrefois de sens des affaires sont aujourd'hui obligés de comprendre les stratégies commerciales et d'avoir des compétences globales en marketing numérique. Les mots ou expressions de recherche utilisés dans votre contenu et vos communications sont importants. Chaque phrase doit être utile et importante.
L'importance d'un modèle de traitement du langage naturel
Pourquoi utiliseriez-vous le processeur d'API NLP pour améliorer la correspondance entité-requête ?
Les avantages d'une évolution vers une approche plus naturelle du langage sont fondamentalement doubles.
- Cela rend votre contenu plus facile à lire et à utiliser.
- Cela rend votre contenu plus facile à comprendre et à cataloguer pour les moteurs de recherche.
Retour à la QUESTION REPONSE EN UTILISANT DES REFERENCES D'ENTITES DANS DES DONNEES NON STRUCTUREES. Cela nous dit qu'une entité est essentiellement ce que les gens recherchent sur Google. Adopter la PNL peut être énorme pour les sites de commerce électronique. Implémentez et testez le balisage de votre produit pour vous aider à organiser vos pages de destination de manière prédéfinie.
Considérez ce que dit le brevet ci-dessus :
Considérez ce que dit le brevet ci-dessus :
« Classement de la ou des références d'entité sur la base des sommes pondérées respectives : sélection d'un résultat d'entité parmi la ou les références d'entité sur la base au moins en partie du classement de la ou des références d'entité ; et fournir une réponse à la requête basée au moins en partie sur le résultat de l'entité. »
Comment l'Assistant Google utilise le traitement du langage naturel
Un autre brevet de Google est davantage axé sur le traitement des requêtes de recherche conversationnelles mobiles.
Google Assistant est un assistant virtuel basé sur l'intelligence artificielle qui peut engager une conversation personnalisée avec un chercheur. Il surpasse tous les autres en répondant correctement aux requêtes de recherche conversationnelle. Il s'appuie en partie sur le contexte des sessions de recherche précédentes.
Un brevet Google plus récent a été accordé le 19 novembre 2019, concerne plus directement l'assistant Google. Il s'intitule Traitement du langage naturel basé sur le contexte et nous informe sur les méthodes de traitement du langage naturel (TAL) qui impliquent le traitement multimodal des requêtes des utilisateurs. Cela a été chronométré avec l'annonce qu'ils utilisent BERT pour comprendre plus efficacement le langage naturel.
Le géant de la technologie cherche à surmonter ses défis lorsqu'il est confronté à des requêtes qui "ne sont pas raisonnablement compréhensibles si elles sont prises seules ou isolément". Pandu Nayak Google Fellow et vice-président de la recherche a publié un article le 25 octobre 2019 intitulé Comprendre les recherches mieux que jamais. Il a déclaré : « Nous voyons des milliards de recherches chaque jour, et 15 % de ces requêtes sont celles que nous n'avons jamais vues auparavant. Nous avons donc conçu des moyens de renvoyer des résultats pour des requêtes que nous ne pouvons pas anticiper ».
Avec l'algorithme BERT, même de petits mots peuvent désormais aider à mieux comprendre l'intention de recherche.
« Le mot « à » et sa relation avec les autres mots de la requête sont particulièrement importants pour en comprendre le sens. Il s'agit d'un Brésilien voyageant aux États-Unis, et non l'inverse. Auparavant, nos algorithmes ne comprenaient pas l'importance de cette connexion, et nous avons renvoyé des résultats sur les citoyens américains voyageant au Brésil. Avec BERT, Search est capable de saisir cette nuance et de savoir que le mot très courant "à" compte beaucoup ici, et nous pouvons fournir un résultat beaucoup plus pertinent pour cette requête. - Google
BERT fournit une meilleure compréhension des mots et du langage
"La compréhension de la langue est la clé de tout ce que nous faisons sur la recherche", a déclaré Pandu Nayak. "C'est le changement unique, le plus important et le plus positif que nous ayons eu au cours des cinq dernières années."
Google peut mieux déchiffrer les demandes des utilisateurs en identifiant un type de discours, des nœuds d'entité ou un contexte environnemental qui accompagne la recherche de l'utilisateur. Vous pouvez utiliser ces informations sur les entités pour démontrer votre expertise de niche industrielle. Le brevet fait référence à des "systèmes de dialogue" et à des applications mobiles.
« Les systèmes de dialogue conventionnels sont largement utilisés dans l'industrie des technologies de l'information, notamment sous la forme d'applications mobiles pour les téléphones sans fil et les tablettes. Généralement, un système de dialogue fait référence à un agent informatique doté d'une interface centrée sur l'homme pour accéder, traiter, gérer et fournir des informations. Les systèmes de dialogue sont également connus sous le nom de systèmes d'information de chat, de systèmes de dialogue parlé, d'agents conversationnels, de robots bavards, de chatterbots, de chatbots, d'agents de chat, d'assistants personnels numériques, d'assistants en ligne automatisés, etc. – Brevet US20160259775A1
Voilà une liste complète des entités de communication qui relèvent du « système de dialogue » ! Le brevet explique comment Google Assistant est conçu pour se connecter avec les chercheurs via NLP.
« Un système de dialogue interagit avec ses utilisateurs en langage naturel pour simuler une conversation intelligente et fournir une assistance personnalisée aux utilisateurs. Par exemple, un utilisateur peut générer des requêtes vers le système de dialogue sous la forme de questions conversationnelles, telles que "Où est l'hôtel le plus proche ?" ou "Quel temps fait-il à Alexandrie ?" et recevez les réponses correspondantes du système de dialogue sous forme de messages audio et/ou affichables. Les utilisateurs peuvent également fournir des commandes vocales au système de dialogue… – Brevet US20160259775A1
Maintenant que nous avons une compréhension fondamentale de la façon dont Google Search utilise le NLP, il est fascinant de voir comment cela peut influencer notre approche de la création de contenu et du référencement.
7 STRATÉGIES DE SEO POUR AMÉLIORER LES CAPACITÉS DE TRAITEMENT DU LANGAGE NATUREL D'UN SITE
Il existe plusieurs façons d'utiliser la PNL pour améliorer le référencement et l'engagement des utilisateurs.
1. Assurez-vous que votre site Web et votre contenu sont pertinents
2. Concentrez-vous sur le contenu sémantique
3. Utiliser la catégorisation d'ontologie et la relation dans les connexions de contenu
4. Utiliser Google AutoML permet aux entreprises de trouver des entités
5. Mettez à jour les messages plus anciens qui sont en retard ou obsolètes
6. Planifiez pour le chercheur qui s'appuie sur la recherche vocale
7. Soyez prêt à expérimenter avec des données structurées
Maintenant, pour un examen plus approfondi des façons dont Hill Web Marketing utilise le traitement du langage naturel en tandem avec les technologies du Web sémantique et l'apprentissage automatique. De cette façon, nous obtenons un véritable avantage SEO pour les ventes de commerce électronique.
1. Assurez-vous que votre site Web et votre contenu sont pertinents
Curieusement, de nombreux sites Web se promènent sans se concentrer clairement sur un sujet particulier. Si vous souhaitez vendre des « innovations en matière d'instruments de santé », assurez-vous que votre site Web est pertinent pour le sujet « dispositifs médicaux » et tout ce qui est lié et utile.
Les pages Web les mieux notées font plus que simplement fournir une copie des ventes ou des réponses directes aux questions. Ils contiennent également des informations complémentaires. Plusieurs fois, une réponse fait surface à une autre question du lecteur. Apporter des réponses pertinentes et anticiper leurs besoins. Incluez les informations dont vous savez qu'ils auront besoin – et auxquelles ils n'ont pas pensé auparavant.
Google veut proposer des solutions sur le web ; c'est-à-dire des « solutions correctes et pertinentes » faciles à comprendre pour les lecteurs. Une approche structurée de la création de votre contenu combinée à un balisage de données structuré vous aidera beaucoup.
Si vous fournissez ces réponses et ces solutions dans votre contenu, vous pouvez vous attendre à ce que l'autorité de votre domaine se développe. Cela augmente également vos chances d'obtenir une Google Rich Card.
2. Concentrez-vous sur le contenu sémantique
La cartographie sémantique des connaissances affiche dans les catégories des mots liés les uns aux autres.
Les algorithmes Google actuels reposent davantage sur un langage contextuel que sur des mots-clés textuels. Il se concentre sur l'ensemble du contexte des requêtes du chercheur depuis la récente mise à jour de l'algorithme. En étant la meilleure réponse aux bonnes questions, votre entreprise apportera le plus de valeur. C'est ici que vous pouvez ajouter le schéma FAQ, un type essentiel de balisage de schéma.
Vérifiez la longueur de votre contenu pour correspondre à l'intention de votre chercheur. Un contenu informatif approfondi répond à un besoin et une réponse rapide à un autre.
En effectuant une analyse sémantique de votre contenu en langage naturel et de la structure de votre contenu, vous pouvez localiser tous les mots de votre contenu qui capturent le sens réel de votre texte. Vous pouvez maintenant identifier davantage les éléments de texte à attribuer à leur rôle logique et grammatical. De cette façon, vous pouvez établir des relations entre différents concepts de votre texte qui s'alignent sur BERT.
L'article du 8 août 2019 sur l'appariement des connaissances sémantiques basé sur le BERT pour la répartition des informations sur l'élimination des pannes révèle à quel point le modèle BERT est vaste. Jixiang Lu et Tao Zhang disent que "Bert est un modèle pré-formé basé sur des données massives de Wikipedia (2500 M mots} et des données BookCorpus (800 M mots)".
Il est capable de recueillir des représentations contextuelles de mots. Pour un exemple, considérez tout ce qui se trouve sur Google Maps. Il utilise des entités du monde réel auxquelles plusieurs propriétés peuvent être associées.
3. Utiliser la catégorisation d'ontologie et la relation dans les connexions de contenu
Le contenu gagnant est également très succinct, avec un contenu plus factuel rédigé par des sources faisant autorité. C'est aussi engageant. Lorsque les gens peuvent rapidement s'identifier émotionnellement à vos messages, ils sont plus attachants. Concentrez-vous sur la résolution de problèmes humains plus profonds. Les SEO peuvent adopter l'intelligence artificielle pour améliorer l'expérience utilisateur et fournir des solutions clairement formulées. Le contenu B2B a également besoin de déclencheurs de conversion convaincants et d'une conception UX intelligente.
Google investit dans la construction d'une bibliothèque de concepts basée sur la connaissance. Cela aide le géant de la technologie à mieux comprendre des choses telles que ce pour quoi différentes entreprises ou entités sont « connues » ou à définir des relations mieux connectées entre entités. Les pages Web d'entités spécifiques peuvent obtenir le meilleur positionnement dans les résultats de recherche lorsque l'historique d'engagement des utilisateurs indique que l'intention de recherche peut inclure cette entité dans une requête.
Votre stratégie de recherche peut devoir inclure à la fois la recherche organique et la publicité payante pour atteindre les acheteurs numériques.
4. Utiliser Google AutoML permet aux entreprises de trouver des entités
Vérifiez-le par vous-même. Google nous explique comment fonctionne AutoML Natural Language.
1. Téléchargez vos documents. Étiquetez le texte en fonction des mots-clés et expressions spécifiques à votre domaine.
2. Entraînez votre modèle personnalisé. Classifiez, extrayez et détectez les sentiments.
3. Évaluez. Obtenez des informations pertinentes pour vos besoins spécifiques.
L'API Natural Language de Google discerne la syntaxe, les entités et les sentiments dans le texte, et organise le texte dans un ensemble prédéfini de catégories. Le contenu destiné aux articles de presse, au contenu scientifique ou à découvrir le sentiment de vos exemples peut trouver l'API Natural Language utile d'essayer. De plus, nous aimons avoir la possibilité d'utiliser nos propres étiquettes en utilisant un classificateur personnalisé.
5. Mettez à jour les messages plus anciens qui sont en retard ou obsolètes
Les murs existants de la "rédaction SEO traditionnelle" que peu de lecteurs consomment doivent s'effondrer. Les graphes de connaissances, les entités et le langage naturel sont tous essentiels. Ils occupent une place clé dans le contenu à feuilles persistantes tout en reconnaissant comment les gens passent du texte écrit à la gratification rapide des médias visuels et du contenu vidéo.
Un écrivain purement technique peut manquer de connaissances sur le sujet ou être passionné par ce qu'il écrit. Cela rend plus difficile d'écrire dans le meilleur ton et le meilleur choix de phrases auxquelles les gens s'identifient facilement. Sachez quelle recherche peut vous informer pour rédiger un meilleur contenu.
Ensuite, vous aurez besoin d'un audit SEO technique approfondi pour vous assurer qu'il n'y a pas de problèmes qui retiennent votre contenu.
Les meilleures stratégies de contenu SEO commencent simplement :
- Connaissez vos compétences et vos passions.
- Sachez ce que votre public veut.
- Les entités que vous utilisez doivent renforcer votre facteur de confiance envers la marque.
Voici un script pour extraire des entités de votre sortie.
6. Planifiez pour le chercheur qui s'appuie sur la recherche vocale
De nombreuses technologies peuvent renforcer l'Assistant Google. Nous pouvons tirer des indices de Google sur son utilisation du BERT pour faire correspondre les réponses aux questions. L'utilisation de la PNL prend en charge une meilleure recherche contextuelle basée sur les modèles de parole et les contextes environnementaux.
Les recherches vocales sont un moyen naturel pour les gens de découvrir et d'acheter des biens. Cela signifie que les spécialistes du marketing doivent ajuster leur stratégie de contenu et leurs efforts de référencement pour s'aligner au mieux sur l'évolution de la recherche Google. Si l'état d'esprit et les préférences de recherche du chercheur doivent s'appuyer sur une application d'assistant vocal, cela modifie son comportement de recherche de la saisie de texte à la saisie vocale.
Lors du réglage fin, BERT a une "longueur de séquence maximale pour chaque phrase est fixée à 128 et une prédiction maximale par séquence à 20", selon Tao Zhang. Nous pouvons donc voir où il gère mieux les expressions de recherche plus longues. Cela convient aux requêtes de recherche activées par la voix car elles ont tendance à être plus longues, comme une phrase naturelle.
La recherche vocale va se développer, en particulier pour les masses d'utilisateurs mobiles qui veulent une commodité mains libres et en déplacement. Ils réfléchissent vite et s'attendent à une expérience utilisateur efficace. En prévision de cette tendance explosive de la recherche mobile, BERT gère les requêtes complexes en langage naturel mieux que tout à ce jour.
7. Soyez prêt à expérimenter avec des données structurées
Bien que le balisage Speakable
soit encore en version bêta, c'est quelque chose que vous pouvez essayer. Si vous identifiez des questions importantes qui semblent être couramment activées par la voix, le balisage Speakable
Schema pourrait répondre de manière audible. Comme pour les autres stratégies de référencement, il n'y a aucune garantie. Un spécialiste du marketing de recherche expérimenté aura sa propre expérience en essayant, testant et peaufinant ses efforts. Ils peuvent effectuer un audit complet du site pour trouver des moyens d'améliorer vos stratégies de recherche.
Les mises à jour de l'algorithme de Google ont un impact sur les meilleures pratiques de référencement, il est donc préférable d'être flexible et d'apprendre rapidement.
Utilisez autant de balises de données structurées qui correspondent à votre contexte que possible. Il existe plusieurs outils de référencement conçus pour extraire des entités. Ces entités ainsi que leurs identifiants uniques peuvent être utilisés pour aider à décrire votre contenu aux moteurs de recherche.
Les moteurs de recherche cherchent à comprendre les entités qui apparaissent sur vos pages, leurs relations avec d'autres entités, leurs relations connectées avec les attributs (propriétés) de ces entités et les relations avec les classifications de ces entités. L'architecture, les ontologies et les données structurées de votre site sont utiles.
Reconnaissance d'entité nommée dans la requête Brevet Google n° US9009134B2
Son statut d'application est actif à compter d'aujourd'hui, le 11 février 2020. Il explique en outre une partie du marquage de la parole en informatique et en analyse des sentiments.
Qu'est-ce que la segmentation des requêtes ?
Ce brevet répond et définit ce qu'est la segmentation des requêtes. Sachant qu'il s'agit généralement de segmenter une requête spécifique en unités de plus petite taille. Il nous dit que «souvent, il peut y avoir des limitations sur les types d'unités segmentées possibles, ce qui entraîne une fonctionnalité limitée de la méthode. L'analyse syntaxique se concentre généralement sur l'identification de la structure linguistique d'une requête. La classification des requêtes se divise généralement en deux groupes : classification selon l'intention de recherche, telle qu'informationnelle, de navigation ou transactionnelle ; et classification selon la sémantique d'une requête.
Cela pourrait s'appliquer aux « achats » ou aux « acheteurs ». Les deux formes de classification des requêtes considèrent la requête entière. Une fois classés et il n'y a généralement pas d'autres diagnostics sur la structure interne de la requête.
Nous en apprenons également plus sur la façon dont il cherche à surmonter les entités thématiques ambiguës et les défis lors de l'utilisation d'une méthode d'apprentissage non supervisée.
«Étant donné que les sujets d'un modèle peuvent être prédéfinis et que les sujets possibles d'un document peuvent être donnés, une nouvelle méthode d'apprentissage d'un modèle de sujet, appelée allocation Dirichlet latente faiblement supervisée (WS-LDA) peut être utilisée.
Pour chaque mot
une. Dessiner l'affectation de sujet zn˜Multinomial(θ)
b. Dessinez le mot wn˜Multinomial(βZn), une distribution multinomiale conditionnée sur le sujet zn.””
Nous apprenons qu'une source de données pour les entités correspondantes peut être "des données de journal de requête telles qu'un journal de requête d'un moteur de recherche Web commercial", ou quelque chose de similaire. Le brevet propose des exemples de mise en œuvre de divers modes de réalisation pour trier des entités à partir de supports lisibles par ordinateur. Il fournit une partie qui comprend : "RAM, ROM, EEPROM, mémoire flash ou autre technologie de mémoire, CD-ROM, disques numériques polyvalents (DVD) ou autre stockage optique, cassettes magnétiques, bande magnétique, stockage sur disque magnétique ou autres périphériques de stockage magnétiques , ou tout autre support permettant de stocker les informations souhaitées ».
Une aide à la traduction automatique pour l'extraction d'entités peut être trouvée dans des sources ouvertes sur le Web. Il est passionnant de se lancer dans la modélisation d'entités personnalisées, en particulier parce que la compréhension des entités nous aide à mieux communiquer avec de vrais consommateurs. Le schéma d'entreprise locale est fondamental pour construire votre Knowledge Graph et se connecter avec les consommateurs locaux. Cindy Krum le dit le mieux, alors je vais la citer à nouveau.
"Dans l'ensemble, les entités fournissent à Google une compréhension meilleure et plus approfondie des sujets, car elles permettent à Google de développer facilement des connexions et des relations entre différents sujets (entités). Une compréhension plus approfondie d'une entité et de ses relations, à son tour, donne à Google la possibilité de fournir potentiellement des informations sur l'entité dans n'importe quelle langue (avec une traduction en direct à partir des API de langue de Google si nécessaire), car la langue n'a désormais qu'un rôle de soutien pour la requête - comme un modificateur. Quelle que soit la compréhension de l'entité et les relations entre les entités que Google apprend dans une langue, elle peut être automatiquement traduite dans d'autres langues, en particulier dans les résultats de position zéro hébergés par Google comme le Knowledge Graph.
Les algorithmes Google BERT essaient de trouver les bonnes connexions entre vos pages publiées et les sujets qu'ils identifient. Vous pouvez aider Google à trouver les bonnes "entités" sur votre site.
Conclusion:
Les données peuvent servir de nouvelle référence. La véritable technologie PNL de bon sens intègre de nouvelles techniques, comme des modèles de connaissances structurés.
Les conversations interhumaines peuvent facilement comprendre les questions posées afin de sélectionner la bonne réponse avec laquelle répondre. La posture du corps, les gestes, le ton de la voix indiquent clairement de quoi parle vraiment la conversation. La PNL aide les machines à mieux faire de même. Au fur et à mesure que j'apprends et expérimente davantage, je mettrai à jour cet article pour le rendre plus utile. Votre voyage à l'aide de la PNL et vos commentaires sont les bienvenus.
Trouvez de nouvelles façons d'enrichir votre contenu.