Comment utiliser Google Dataset Search pour Dataset Schema
Publié: 2019-10-01Recherche d'ensemble de données Google : comment utiliser le schéma d'ensemble de données pour les requêtes
Mis à jour le 12.6.2021
Avec les quantités croissantes de données numériques, les stratèges du marketing de recherche sont confrontés à un besoin croissant de donner un sens aux données.
De nombreuses applications de base de données avancées commencent à prendre en charge Google Database Search. De plus, les SEO ont de nouveaux rapports ajoutés à la Google Search Console en septembre 2019 pour mieux comprendre leurs données. On gagne beaucoup en incorporant des connaissances au niveau du domaine codées sous forme d'ontologies dans des requêtes sur des données relationnelles. Avec tant de choses sur le référencement, les spécialistes du marketing de recherche ont plus de mal à distinguer les faits de la fiction, les tactiques de référencement utiles et les tests de vérité par rapport aux simples paroles.
S'appuyer en grande partie sur les expériences passées de marketing de recherche et les intuitions sont agréables, mais trop souvent incorrectes. Les décisions influencées par les données s'avèrent toujours meilleures que "mon instinct me l'a dit". De nombreux outils d'analyse de données tels que Google Analytics fournissent des preuves à l'appui, mais il est désormais plus facile que jamais de localiser les ensembles de données publics Google Cloud.
Qu'est-ce que la recherche d'ensembles de données Google ?
Une vue d'ensemble rapide est que Google Data Search dépend des fournisseurs d'ensembles de données, grands ou petits, qui ajoutent des métadonnées structurées dans leurs sites Web à l'aide de la norme ouverte schema.org/Dataset. Google Dataset Search permet aux chercheurs de localiser des ensembles de données stockés sur le Web grâce à des recherches avec des expressions de recherche spécifiques. Selon Google, l'outil affiche des informations sur les ensembles de données hébergés dans des milliers de référentiels sur le Web, ce qui rend ces ensembles de données universellement accessibles et utiles.
En accédant à des ensembles de données publics à forte demande liés à votre créneau commercial, vous pouvez découvrir de nouvelles informations sur les consommateurs à partir des données cloud. En analysant des ensembles de données supplémentaires hébergés dans BigQuery et Cloud Storage, il est plus facile de tirer pleinement parti de Google Cloud .
Les journalistes de données sont déjà familiarisés avec l'obtention de données gouvernementales et d'ensembles de données pour les sciences sociales. Cet article vous aidera à établir une base de référence et à mettre en place un cadre basé sur les données pour mesurer vos progrès numériques et tirer parti des dernières opportunités de balisage de schéma Google.
La recherche d'ensembles de données de Google est reconnue comme un type de moteur de recherche lancé par Google dans le but d'aider les universitaires à trouver les données dont ils pourraient avoir besoin. Les spécialistes du marketing de recherche commencent à exploiter davantage les ensembles de données.
Les ensembles de données simplifient-ils l'intelligence des données et l'ontologie compliquée ?
Oui. Les ensembles de données sont plus simples à localiser lorsque les informations de prise en charge telles que le nom du fournisseur, la description, le créateur et les formats de distribution sont balisées avec des données structurées. Google facilite la découverte d'ensembles de données via schema.org et d'autres normes de métadonnées qui peuvent être ajoutées au contenu Web qui représente des ensembles de données.
Une fois que Google a construit son index de bibliothèque, il commence à répondre aux requêtes des utilisateurs et à déterminer quels résultats correspondent le mieux à la requête de chaque personne, parlée ou tapée.
« Il est extrêmement difficile d'exprimer des requêtes contre une ontologie structurée en graphes dans le langage de requête SQL relationnel ou ses extensions. De plus, les requêtes sémantiques ne sont généralement pas précises, en particulier lorsque les données et leur ontologie associée sont compliquées. »
Les utilisateurs n'ont même pas besoin de connaître la représentation ontologique. Il suffit que l'utilisateur donne quelques exemples qui répondent à la requête qu'il a en tête. Ensuite, le système de Google trouve automatiquement la réponse à la requête . Dans ce processus, la sémantique, qui est un concept généralement difficile à exprimer, reste en tant que concept dans l'esprit de l'utilisateur, sans avoir à être exprimée explicitement dans un langage de requête. – Livre blanc Google : Requêtes sémantiques par exemple *****
Cela présente une opportunité. Des modèles pré-entraînés sur des ensembles de données volumineux sont disponibles pour tous ceux qui développent le traitement du langage naturel. De la compréhension en lecture à l'analyse des sentiments en passant par le BERT ; une tendance clé de la recherche est l'essor de l'apprentissage par transfert en PNL.
L'évolution du rôle d'un spécialiste du marketing de recherche est devenue plus complexe avec un besoin croissant de digérer les données. La création de votre propre ensemble de données est une forme de référencement positif qui peut s'appuyer sur la littérature académique. Repenser à la manière dont vous pouvez appliquer vos données d'image à un niveau plus large peut être un point de départ. Cela aidera les systèmes évolutifs à déterminer les chemins courts dans votre graphe de liens et votre réseau de liens Web. Il est susceptible d'aider Google lors de la nouvelle exploration et du recalcul de la carte des liens de votre site.
"Lors de la description de collections de données packagées, par exemple telles que publiées dans des référentiels de" données ouvertes "scientifiques, universitaires ou gouvernementaux, le type Dataset peut être utilisé, aux côtés de DataCatalog pour indiquer la collection globale, et DataDownload pour des représentations spécifiques d'un ensemble de données." – Données et ensembles de données – schema.org
Étapes pour ajouter un schéma de jeu de données
- Tout d'abord, lisez le balisage de la documentation de l'ensemble de données pour savoir comment l'ajouter à votre domaine par rapport à un seul fichier DCAT.
- Ensuite, ajoutez à votre collection d'extraits de données structurées dans le format de balisage JSON-LD préféré de Google ; utilisez le schéma de type Dataset.
- Testez la mise en œuvre de votre ensemble de données avec l'outil de test des données structurées de Google.
- Enfin, soumettez vos URL dans un sitemap qui indique à Googlebot de commencer à explorer les pages de l'ensemble de données.
REMARQUE : Google accepte le balisage avec le formatage DCAT. Le schéma de l'ensemble de données de Google est destiné à afficher un ensemble d'informations structurées décrivant certaines informations organisées. Cela fonctionne soit pour insérer des données structurées JSON soit dans le corps, soit dans la tête.
Ensembles de données Google utilisant le code JSON-LD et le vocabulaire de schéma
Qu'est-ce que le moteur de recherche d'ensembles de données Google ?
Un moteur de recherche d'ensemble de données Google se produit lorsqu'un utilisateur engage Google pour essayer de localiser des données en ligne accessibles au public. Google Dataset Search est destiné à fonctionner avec Google Scholar, le moteur de recherche des entreprises pour les études universitaires, la recherche et les rapports.
Les modifications récentes apportées à la page de documentation des ensembles de données de Google mettent à jour le chemin vers le déploiement des données structurées des ensembles de données pour les webmasters, les SEO et les éditeurs dans les résultats riches de la recherche Google. C'est différent de la façon habituelle dont nous utilisons Schema.org, le schéma de l'ensemble de données peut être dans des formats arbitraires ou représenter des statistiques agrégées.
Aaron explique que Google a laissé tomber l'icône de la patte dans l'avis avec une étoile, ce qui, selon lui, "suggère que le déploiement de résultats riches en ensembles de données est imminent".
Pourquoi devriez-vous baliser vos ensembles de données avec Schema ?
L'expérience client idéale peut souvent sembler insaisissable. Il n'est pas facile de cartographier le parcours client et de trier des monceaux de chaînes de données numériques. Il ne suffit pas d'avoir la bonne offre pour le bon client. Cela commence par les heures d'achat, quel canal numérique, la collecte de données des offres passées, et parfois même plus. La gestion des données est passée d'une réflexion tactique d'achat de médias à la manière de mettre en œuvre les bonnes informations stratégiques qui sont au cœur des expériences client d'entreprise qui renforcent la confiance dans la marque.
Votre contenu peut être mieux compris, mis en correspondance et utilisé pour des réponses et des solutions. Le schéma d'ensemble de données exploite une approche d'apprentissage automatique pour traiter les requêtes sémantiques dans les bases de données relationnelles. Dans le traitement des requêtes sémantiques, le plus grand obstacle est de fournir des données ontologiques précises sous forme relationnelle afin que le moteur de base de données relationnelle puisse manipuler l'ontologie d'une manière qui s'aligne sur la manipulation des données.
Les ensembles de données balisés avec un schéma sont plus faciles à interpréter pour les autres, ainsi que pour les moteurs de recherche pour mieux comprendre les données. Cela les aide à traduire cette compréhension en illustrations visuelles de vos données.
Google indique que les ensembles de données peuvent être utilisés dans ces cas :
- Un tableau ou un fichier CSV avec des données
- Une collection organisée de tableaux
- Un fichier dans un format propriétaire qui contient des données
- Une collection de fichiers qui, ensemble, constituent un ensemble de données significatif
- Un objet structuré avec des données dans un autre format que vous voudrez peut-être charger dans un outil spécial pour le traitement
- Images capturant des données
- Fichiers liés à l'apprentissage automatique, tels que des paramètres entraînés ou des définitions de structure de réseau neuronal
- Tout ce qui ressemble à un ensemble de données pour vous
Nous avons trouvé d'énormes ensembles de données. Il est préférable de rester simple. Google recommande de "limiter toutes les propriétés textuelles à 5000 caractères ou moins. Google Dataset Search n'utilise que les 5 000 premiers caractères d'une propriété textuelle. Les noms et les titres sont généralement composés de quelques mots ou d'une courte phrase ».
Comment moderniser vos données avec des bases de données relationnelles sécurisées et fiables
Une base de données relationnelle rassemble et héberge des données dans des tables et des colonnes qui organisent et mettent l'accent sur les relations entre les données. Les bases de données relationnelles sont destinées à des données structurées et connectées. Webopedia définit les bases de données relationnelles comme étant capables de "mettre à jour automatiquement les données si une instance de celles-ci est modifiée ou modifiée ; les autres données connexes recevront des mises à jour en temps réel. Les gens utilisent souvent les bases de données relationnelles et les systèmes de gestion de bases de données relationnelles (RDBMS) de manière interchangeable ».
Cela aide les entreprises à créer des solutions de données avec des architectures modernes et à obtenir des informations intelligentes en temps réel pour mieux répondre aux intentions des utilisateurs.
Les modèles table-texte extraient des informations textuelles à partir de données structurées 
Soyez axé sur les données et les personnes
L'obtention d'un mécanisme séquentiel pour l'extraction de données au niveau du champ permet d'effectuer la tâche de classification ou de régression ultime en évaluant vos fonctionnalités d'entrée globales, en les mappant à un autre type de données.
Les rapports sur les ensembles de données Google peuvent aider vos apprentissages à mieux alimenter votre réflexion sur la correspondance des intentions de recherche. Effectuez une recherche dans la bibliothèque de données en ligne pour trouver ce dont vous avez besoin ou embauchez un spécialiste des données. Les résultats riches en jeux de données sont utiles pour les workflows de recherche et de développement rapides qui aident à rationaliser l'encodage des données brutes en informations significatives. Ils aident à créer une approche structurée de vos données. Les entreprises en bénéficient en rationalisant leurs processus de prise de décision et en obtenant plus rapidement des résultats plus performants.
"L'un des principaux catalyseurs des progrès rapides de la recherche et du développement est la disponibilité d'architectures de réseaux de neurones canoniques pour coder efficacement les données brutes en représentations significatives. Intégrées à des couches de prise de décision simples, ces architectures canoniques offrent généralement des performances élevées sur les nouveaux ensembles de données et les tâches associées avec un petit effort de réglage supplémentaire. » - Apprentissage tabulaire interprétable attentif sur Google Cloud AI
Qu'est-ce qui a changé dans la version bêta de Google Dataset Search ? 
Auparavant, les documents Google indiquaient que : "Le balisage de l'ensemble de données est disponible pour que vous puissiez l'expérimenter avant sa mise à disposition générale" et avertissait que, même si vous pouviez utiliser l'outil de test de données structurées pour la validation, vous "ne , cependant, voyez vos ensembles de données apparaître dans la recherche. » Pour ceux qui attendaient que cela soit déployé, l'ajout de données structurées d'ensemble de données à votre site peut aider à mesurer les défis mobiles et les spécifications de propriété. Google Dataset Search prend en charge Google Scholar, le moteur de recherche de l'entreprise technologique pour les études universitaires et les rapports factuels.
Le 23 janvier 2020, Natasha Noy de Google a déclaré que "Dataset Search a indexé près de 25 millions de ces ensembles de données, vous offrant un emplacement unique pour rechercher des ensembles de données et trouver des liens vers l'endroit où se trouvent les données. Au cours de la dernière année, les gens l'ont essayé et ont fourni des commentaires, et maintenant Dataset Search est officiellement sorti de la version bêta.
L'article Découvrir des millions d'ensembles de données sur le Web nous informe que la plupart des gouvernements dans le monde publient leurs données et les annotent avec schema.org. "Les États-Unis sont en tête du nombre d'ensembles de données gouvernementales ouvertes disponibles, avec plus de 2 millions."
Cela signifie que les chercheurs de marché ont un meilleur accès aux données que jamais dans notre histoire numérique.
Les ensembles de données peuvent gérer tout le contenu de votre site
Une fois que la collecte de données propres et utiles a eu lieu, même si cela prend beaucoup de temps, cela peut prendre en charge et aider à gérer tout ce contenu sur votre site.
Vous pouvez apprendre à être plus informé sur les faits en utilisant différentes tâches d'apprentissage automatique avec des ensembles de données plus réalistes. Pour chacun des KPI de votre entreprise, Hill Web Marketing peut vous aider à comprendre quelles mesures sont importantes, comment utiliser le schéma pour les aligner sur les objectifs de votre secteur et déterminer comment obtenir de meilleures performances.

Natasha Noy, chercheuse scientifique pour Google AI, a publié Faciliter la découverte d'ensembles de données le 5 septembre 2018 et déclare : "La recherche d'ensembles de données fonctionne dans plusieurs langues avec la prise en charge de langues supplémentaires à venir".**** De toute évidence, c'est la direction que prend le Web ; la mise en œuvre des types essentiels de balisage Schema aidera votre entreprise à être trouvée.
L'utilisation d'ensembles de données permet d'assurer les flux de revenus des produits
Comment fonctionne la recherche d'ensembles de données Google ?
Les ensembles de données peuvent être découverts facilement lorsque vous fournissez des informations qui incluent quelque chose comme leur nom, leur description, leur créateur et leurs formats de distribution sous forme de données structurées. Google permet la découverte d'ensembles de données et utilise schema.org et d'autres formats de données pouvant être intégrés dans des pages Web décrivant des ensembles de données. Ce schéma peut augmenter vos chances de figurer dans les résultats de recherche du carrousel de produits.
Le succès futur de votre entreprise dépend des informations nécessaires pour conduire votre organisation vers des flux de revenus durables. Les messages sur vos produits doivent inspirer suffisamment la confiance d'un acheteur potentiel pour prendre les mesures nécessaires pour conclure l'affaire. Vous avez un certain niveau de contrôle sur ce qui apparaît dans le graphe des connaissances de votre entreprise. "Les enjeux sont élevés, avec International Data Corporation qui estime que les investissements mondiaux des entreprises dans le D&A dépasseront 200 milliards de dollars par an d'ici 2020", selon Harvard Business Review.
"Une fonction D&A (données et analyses) robuste et réussie englobe plus qu'une pile de technologies, ou quelques personnes isolées sur un étage du bâtiment. Le D&A devrait être le pouls de l'organisation, intégré à toutes les décisions clés dans les domaines des ventes, du marketing, de la chaîne d'approvisionnement, de l'expérience client et d'autres fonctions essentielles. - Revue de Harvard business
Les images de produits peuvent faire partie d'un ensemble de données d'images Google ! Il y a 8,4 objets par image en moyenne dans certains ensembles de données. Voici une liste de jeux de données fréquemment mise à jour.
La page de documentation de Google inclut un exemple JSON-LD pour la mise en œuvre de schema.org/Dataset. Comme l'ensemble de données tubulaire est en version bêta, les meilleures pratiques pour la description et l'utilisation de l'ensemble de données émergeront. Au fur et à mesure que les exigences du code changent, effectuez un audit SEO technique pour localiser les mises à jour nécessaires.
Comment importer des ensembles de données de produits et d'images dans Google BigQuery ?
Google BigQuery (GBQ) permet aux spécialistes du marketing de recherche de collecter des données à partir de différentes sources. Nous vous recommandons d'utiliser Google Merchant Center, Cloud Storage, BigQuery, ou vous pouvez spécifier les données en ligne lors de la demande. Avant de télécharger des données, créez d'abord un ensemble de données et une table dans Google BigQuery qui incluent les informations sur votre produit, y compris les détails de l'image. ***
Nous préférons utiliser le format de données JSON-LD de l'élément de produit. Voici un exemple d'objet complet :
{
"name": "projects/[PROJECT_NUMBER]/locations/global/catalogs/default_catalog/branches/0/products/1234",
"id": "1234",
"categories": "Apparel & Accessories > Shoes",
"title": "ABC sneakers",
"description": "Sneakers for the rest of us",
"attributes": { "vendor": {"text": ["vendor123", "vendor456"]} },
"language_code": "en",
"tags": [ "black-friday" ],
"priceInfo": {"currencyCode": "USD", "price":100, "originalPrice":200, "cost": 50},
"availableTime": "2020-01-01T03:33:33.000001Z",
"availableQuantity": "1",
"uri":"http://foobar",
"images": [{"uri": "http://foobar/img1", "height": 320, "width": 320 }]
}
Tenez à jour votre catalogue de produits. Google se soucie de la qualité et son intelligence artificielle nécessite des données de haute qualité afin de faire des prédictions de haute qualité. Surveillez les produits qui ne sont plus en vente et maintenez les données à jour dans le balisage du schéma de produit de commerce électronique de votre site.
« Un ensemble de données tabulaire est un ensemble organisé principalement en termes de grille de lignes et de colonnes. Pour les pages qui intègrent des ensembles de données tabulaires, vous pouvez également créer un balisage plus explicite, en vous appuyant sur l'approche de base décrite ci-dessus. À l'heure actuelle, nous comprenons une variante de CSVW ("CSV sur le Web", voir W3C), fourni en parallèle avec un contenu tabulaire orienté utilisateur sur la page HTML", indique-t-il au 30.09.2019.
Restez à l'écoute de la page de documentation Google pour les mises à jour au cas où les propriétés répertoriées pour Dataset, DataCatalog ou DataDownload changent. La documentation actuelle a mis à jour l'aspect organisationnel; les spécifications des biens sont désormais regroupées sous le type auquel chacun appartient (auparavant, ils étaient organisés par thème). Ces nouvelles propriétés sont un moyen d'améliorer les attributs de votre site Web.
Comment créer un jeu de données à partir d'images pour la classification d'objets.
Dans la console de gestion de cluster IBM, sélectionnez (1) Workload, (2) Spark, puis (3) Deep Learning. **
* Cliquez sur l'onglet "Ensembles de données".
* Sélectionnez "Nouveau".
* Créez un ensemble de données à partir de "Images pour la classification d'objets".
* Entrez un nom de jeu de données.
* Indiquez le groupe d'instances Spark que vous souhaitez.
* Spécifiez votre format de stockage d'image préféré (nous préférons TFRecords pour TensorFlow).
* Si TFRecords a été choisi, accédez à la façon de générer des enregistrements, soit par partition, soit par classe. Si la partition est sélectionnée, entrez le numéro de partition.
* Spécifiez comment les images d'entraînement sont sélectionnées.
En adhérant aux directives de Google Image et aux exigences d'image AMP, vos produits ont de meilleures chances d'apparaître dans les extraits de code associés aux produits.
Propriétés des données structurées du jeu de données
Vraiment, il y a peu de propriétés requises pour le moment. Pour encourager son utilisation, le géant de la technologie peut adopter une stratégie « Keep it simple » lorsqu'il s'agit de fournir du contenu destiné aux consommateurs de données machine. L'objectif final est d'avoir des correspondances plus nombreuses et de meilleure qualité dans sa bibliothèque de données pour satisfaire l'intention de recherche de l'utilisateur.
Propriétés requises :
- Nom
- description
Propriétés recommandées :
- Nom alternatif
- créateur
- citation
- identifiant
- mots clés
- Licence
- pareil que
- couverture spatiale
- couverture temporelle
- variableMesure
- version
- URL
Vous n'avez peut-être pas déjà publié d'ensemble de données sur le Web, mais le marketing de recherche évolue rapidement vers une approche plus axée sur la science des données pour la recherche. À mesure que les individus et les personnes rendent de plus en plus d'ensembles de données accessibles, la recherche d'ensembles de données augmentera. Ce qui est surprenant, c'est que toute personne qui publie des données peut décrire son ensemble de données en utilisant le standard ouvert de schema.org pour décrire les informations.
Lorsque vous testez vos données dans le rapport d'index de la Search Console, lisez la section "Erreurs et avertissements connus", les "erreurs ou avertissements dans l'outil de test des données structurées de Google et le système de validation Structured Data Linter". Engagez un expert en implémentation de données de schéma ou utilisez les formulaires pour vous aider à filtrer les avertissements que vous pouvez laisser reposer en toute sécurité.
Comme cela concerne l'analyse du contenu Web - qu'il contienne ou non déjà des données structurées - il est préférable de rendre les données disponibles dans un format que le pourcentage le plus élevé de consommateurs de données (principalement, les moteurs de recherche) comprennent.
Les ensembles de données fournissent une feuille de route pour la création de graphes de connaissances
Trouvez des ensembles de données et tirez parti de la recherche universitaire à partir de sources de données ouvertes et de https schema.org.
Les chercheurs apprécient la clarté de l'analyse précise des solutions de science des données mondiales et d'apprentissage automatique qui révèlent la dynamique du marché. Les spécialistes du marketing de recherche qui cherchent à mesurer les tendances marketing durables s'appuient sur le Big Data pour soutenir la croissance future du marché. Une fois que Google Dataset Search sortira de la version bêta, il pourra disposer de nouvelles capacités pour effectuer des recherches de données susceptibles de réduire les risques et les défis actuels auxquels sont confrontées les entreprises. Des recherches approfondies sur les détails de vos données peuvent améliorer vos approches de vente.
Nous continuons à rechercher des approches pratiques pour créer des graphiques de connaissances client et des chances de les exploiter pour des applications commerciales. Essayez-vous à cela.
Une fois que vous avez utilisé le schéma d'ensemble de données sur votre site, vous trouverez un nouveau rapport dans votre GSC sous les améliorations. Nous les utilisons pour améliorer notre stratégie de marketing de contenu mobile pour les utilisateurs provenant de plusieurs appareils.
Fonctionnalités des ensembles de données et nouveau rapport d'amélioration de Google
Comme c'est le cas avec d'autres implémentations de données structurées, simplement parce que vous avez incorporé des données structurées de schéma, vous devenez éligible . Cependant, il ne garantit pas d'apparaître dans la recherche Google. Donnez la priorité à l'utilisation d'ensembles de données qui prennent en charge les ventes et vos pages de destination de vente au détail.
Simultanément à l'annonce de la fonctionnalité de données structurées, un nouveau rapport d'amélioration de l'ensemble de données dans la console de recherche Google est apparu. Cela informe les stratèges du marketing de recherche si oui ou non Google a appris et reconnaît vos données structurées pour votre schéma d'ensemble de données. Lisez et corrigez les erreurs de données structurées une fois que vous avez compris les spécifications de la documentation des données structurées de l'ensemble de données. Il alimentera vos données Google Assistant.
Peu de propriétaires d'entreprise ou de créateurs de contenu ont des heures libres pour se demander si vos métadonnées sont correctement formatées. Pourtant, ce doit être pour permettre à GoogleBot d'explorer votre site, de trouver vos données et de les indexer. Heureusement, nous l'aimons et sommes dans votre coin.
Autorisations de création d'ensembles de données
L'autorisation de génération est pertinente pour les ensembles de données. Lorsque les utilisateurs se voient accorder l'autorisation de construction, ils peuvent créer un nouveau contenu sur un ensemble de données existant. Ceci est courant pour les rapports, les tableaux de bord, les vignettes épinglées de QandA et Insights Discovery. Ils peuvent également créer de nouvelles entrées de données sur le jeu de données en dehors de Power BI, généralement des feuilles Excel via Analyser dans Excel, XMLA, et exporter les données sous-jacentes. Il aide les entreprises à effectuer une analyse client.
Aussi nouveau et complet que soit l'apprentissage en profondeur, Google et d'autres moteurs de recherche sont toujours confrontés à des défis de gestion des données qui apparaissent dans le contexte des pipelines d'apprentissage automatique déployés en production. De nouveaux efforts pour comprendre les requêtes de recherche sémantique sont destinés à soutenir la compréhension, la validation, le nettoyage et l'enrichissement des données de formation. À partir de là, la croissance des sources de bases de données fiables s'étendra, espérons-le, et sera plus utile pour générer du trafic en magasin.
Le marketing numérique est lié par le besoin de données et leur utilisation comme approche scientifique.
« Un outil de recherche comme celui-ci est aussi bon que les métadonnées que les éditeurs de données sont prêts à fournir. Nous espérons que vous serez nombreux à utiliser les standards ouverts pour décrire vos données, permettant ainsi à nos utilisateurs de trouver les données qu'ils recherchent. Si vous publiez des données et ne les voyez pas dans les résultats, consultez nos instructions sur notre site de développeurs qui comprend également un lien pour poser des questions et fournir des commentaires. - Google *
"Nous pouvons comprendre les données structurées dans les pages Web sur les ensembles de données, en utilisant soit le balisage de l'ensemble de données http://schema.org, soit des structures équivalentes représentées au format DCAT (Data Catalog Vocabulary) du W3C." – Commentaire d'Alan Morrison sur Twitter
Résumé du schéma de l'ensemble de données Google
L'utilisation d'ensembles de données pour répondre aux besoins des utilisateurs du site est davantage axée sur l'expérience utilisateur et l'ajout d'entités qui répondent et informent. Bien qu'il puisse provenir de la communauté des sciences des données, n'importe quelle entreprise peut l'utiliser. Nous vous recommandons également de rechercher des commentaires évalués par des pairs d'experts de haut niveau expérimentés dans le balisage de données structurées pour les ensembles de données.
Hill Web Marketing est impatient de participer à cette initiative et espère qu'elle encouragera nos lecteurs à augmenter le nombre d'ensembles de données actuellement disponibles. Bien qu'il puisse provenir de la communauté des sciences des données, n'importe quelle entreprise peut l'utiliser.
Appelez Jeannie Hill, propriétaire de Hill Web Marketing, stratège en marketing numérique, pour vous associer : 651-206-2410. Planifiez votre consultation pour gagner un avantage concurrentiel
* https://arxiv.org/pdf/1908.07442.pdf
** https://www.ibm.com/support/knowledgecenter/SSWQ2D_1.1.0/us/create-dataset-image-object-classification.html
*** https://cloud.google.com/retail/recommendations-ai/docs/upload-catalog
**** https://www.blog.google/products/search/making-it-easier-discover-datasets/
***** https://storage.googleapis.com/pub-tools-public-publication-data/pdf/40761.pdf