Come utilizzare la ricerca del set di dati di Google per lo schema del set di dati

Pubblicato: 2019-10-01

Ricerca del set di dati di Google: come utilizzare lo schema del set di dati per le query

Aggiornato il 12.6.2021

Con le crescenti quantità di dati digitali, gli strateghi del marketing di ricerca devono affrontare una crescente necessità di dare un senso ai dati.

Molte applicazioni di database avanzate stanno iniziando a supportare Google Database Search. Inoltre, i SEO hanno nuovi rapporti aggiunti a Google Search Console a settembre 2019 per comprendere meglio i propri dati. Si ottiene molto incorporando la conoscenza a livello di dominio codificata come ontologie nelle query sui dati relazionali. Con così tanto detto sulla SEO, i marketer della ricerca trovano più difficile separare i fatti dalla finzione, dannoso da utili tattiche SEO e testato rispetto al semplice parlare.

Affidarsi in gran parte alle esperienze e alle intuizioni passate di marketing dei motori di ricerca è bello, ma troppo spesso errato. Le decisioni influenzate dai dati si rivelano costantemente migliori di "me lo ha detto il mio istinto". Molti strumenti di analisi dei dati come Google Analytics forniscono prove a supporto effettive, ma ora è più facile che mai individuare i set di dati pubblici di Google Cloud.

Che cos'è la ricerca di set di dati di Google?

Un rapido quadro generale è che Google Data Search dipende dai fornitori di set di dati, grandi o piccoli, che aggiungono metadati strutturati all'interno dei loro siti Web utilizzando lo standard aperto schema.org/Dataset. Google Dataset Search consente ai ricercatori di individuare i set di dati archiviati sul Web tramite ricerche con frasi di ricerca specifiche. Secondo Google, lo strumento fa emergere informazioni sui set di dati ospitati in migliaia di repository sul Web, rendendo questi set di dati universalmente accessibili e utili.

Accedendo a set di dati pubblici ad alta richiesta relativi alla tua nicchia aziendale, puoi scoprire nuove informazioni sui consumatori dai dati cloud. Analizzando set di dati aggiuntivi ospitati in BigQuery e Cloud Storage, è più facile sperimentare tutto il valore di Google Cloud .

I giornalisti di dati hanno già familiarità con l'ottenimento di dati governativi e set di dati per le scienze sociali. Questo articolo ti aiuterà a stabilire una linea di base e impostare un framework basato sui dati per misurare i tuoi progressi digitali e sfruttare le più recenti opportunità di markup dello schema di Google.

La ricerca di set di dati di Google è riconosciuta come un tipo di motore di ricerca lanciato da Google con l'intento di aiutare gli studiosi a trovare i dati di cui potrebbero aver bisogno. I marketer della ricerca stanno sfruttando maggiormente i set di dati.

I set di dati semplificano l'intelligence dei dati e l'ontologia complicata?

Sì. I set di dati sono più semplici da individuare quando le informazioni di supporto come il nome del provider, la descrizione, il creatore e i formati di distribuzione vengono contrassegnati con dati strutturati. Google semplifica l'individuazione dei set di dati tramite schema.org e altri standard di metadati che possono essere aggiunti ai contenuti Web che descrivono i set di dati.

Una volta che Google ha creato il suo indice della libreria, inizia a rispondere alle domande degli utenti e a determinare quali risultati corrispondono meglio alla query di ogni persona, pronunciata o digitata.

“È estremamente difficile esprimere query su un'ontologia strutturata a grafo nel linguaggio di query SQL relazionale o nelle sue estensioni. Inoltre, le query semantiche di solito non sono precise, soprattutto quando i dati e la relativa ontologia sono complicati".

Gli utenti non hanno nemmeno bisogno di conoscere la rappresentazione dell'ontologia. Tutto ciò che è richiesto è che l'utente fornisca alcuni esempi che soddisfino la domanda che ha in mente. Successivamente, il sistema di Google trova automaticamente la risposta alla query . In questo processo, la semantica, che è un concetto solitamente difficile da esprimere, rimane un concetto nella mente dell'utente, senza dover essere espressa esplicitamente in un linguaggio di query. – Whitepaper di Google: query semantiche per esempio *****

Questo rappresenta un'opportunità. Modelli pre-addestrati su enormi set di dati sono disponibili per chiunque crei elaborazione del linguaggio naturale. Dalla comprensione della lettura all'analisi del sentimento al BERT; una tendenza chiave della ricerca è l'aumento del transfer learning nella PNL.

L'evoluzione del ruolo di un marketer di ricerca è diventata più complessa con una crescente necessità di assimilare i dati. La creazione del tuo set di dati è una forma di SEO positivo che può appoggiarsi alla letteratura accademica. Ripensare a come applicare i dati dell'immagine a un livello più ampio può essere un punto di partenza. Ciò aiuterà i sistemi scalabili a determinare percorsi brevi all'interno del grafico di collegamento e della rete di collegamenti web. È probabile che aiuti Google durante la nuova scansione e il ricalcolo della mappa dei collegamenti del tuo sito.

"Quando si descrivono raccolte di dati compressi, ad esempio pubblicati in archivi "open data" scientifici, accademici o governativi, è possibile utilizzare il tipo Dataset, insieme a DataCatalog per indicare la raccolta complessiva e DataDownload per rappresentazioni specifiche di un set di dati". – Dati e set di dati – schema.org

Passaggi per aggiungere lo schema del set di dati

  • Innanzitutto, leggi il markup della documentazione del set di dati per sapere come aggiungerlo al tuo dominio rispetto a un singolo file DCAT.
  • Successivamente, aggiungi alla tua raccolta di frammenti di dati strutturati nel formato di markup JSON-LD preferito di Google; utilizzare il tipo di schema Dataset.
  • Verifica l'implementazione del tuo set di dati con lo strumento di test dei dati strutturati di Google.
  • Infine, invia i tuoi URL in una mappa del sito che dice a Googlebot di iniziare a eseguire la scansione delle pagine del set di dati.

NOTA: Google accetta il markup con la formattazione DCAT. Lo schema del set di dati di Google ha lo scopo di mostrare un corpo di informazioni strutturate che descrivono alcune informazioni organizzate. Funziona per inserire dati strutturati JSON nel corpo o nella testa.

Set di dati di Google che utilizzano il codice JSON-LD e il vocabolario dello schema

Che cos'è il motore di ricerca del set di dati di Google?

Un motore di ricerca del set di dati di Google si verifica quando un utente coinvolge Google per cercare di individuare i dati online che sono pubblicamente disponibili per l'origine. Google Dataset Search è concepito per funzionare insieme a Google Scholar, il motore di ricerca delle aziende per studi accademici, ricerche e rapporti.

Le recenti modifiche alla pagina della documentazione dei set di dati di Google aggiornano il modo in cui i dati strutturati dei set di dati vengono distribuiti a webmaster, SEO ed editori nei risultati multimediali nella ricerca di Google. È diverso dal modo comune in cui utilizziamo Schema.org, lo schema del set di dati può essere in formati arbitrari o rappresentare statistiche aggregate.

Aaron spiega che Google ha eliminato l'icona della zampa nell'avviso con una stella, che ha detto: "suggerisce che il lancio dei risultati multimediali del set di dati è imminente".

Perché dovresti contrassegnare i tuoi set di dati con Schema?

L'esperienza del cliente ideale può spesso sembrare sfuggente. Non è facile mappare il percorso del cliente e smistare mucchi di stringhe di dati digitali. Non basta avere l'offerta giusta per il cliente giusto. Si inizia con i tempi di acquisto, quale canale digitale, la raccolta dei dati dalle offerte passate e, a volte, anche di più. La gestione dei dati è passata dal pensiero tattico sull'acquisto di media a come implementare le giuste informazioni strategiche che sono al centro delle esperienze dei clienti aziendali che creano fiducia nel marchio.

I tuoi contenuti possono essere meglio compresi, abbinati e utilizzati per risposte e soluzioni. Lo schema del set di dati sfrutta un approccio di apprendimento automatico per elaborare le query semantiche nei database relazionali. Nell'elaborazione di query semantiche, l'ostacolo più grande è fornire dati ontologici accurati in forma relazionale in modo che il motore di database relazionale possa manipolare l'ontologia in modo da allinearsi con la manipolazione dei dati.

I set di dati contrassegnati con lo schema sono più facili da interpretare per gli altri, così come per i motori di ricerca per comprendere meglio i dati. Questo li aiuta a tradurre quella comprensione in illustrazioni visive dei tuoi dati.

Google afferma che i set di dati possono essere utilizzati per questi casi:

  • Una tabella o un file CSV con alcuni dati
  • Una raccolta organizzata di tavoli
  • Un file in un formato proprietario che contiene dati
  • Una raccolta di file che insieme costituiscono un set di dati significativo
  • Un oggetto strutturato con dati in un altro formato che potresti voler caricare in uno strumento speciale per l'elaborazione
  • Immagini che acquisiscono dati
  • File relativi all'apprendimento automatico, come parametri addestrati o definizioni della struttura della rete neurale
  • Tutto ciò che ti sembra un set di dati

Abbiamo trovato alcuni enormi set di dati. È meglio mantenerlo semplice. Google consiglia di "limitare tutte le proprietà testuali a 5000 caratteri o meno. Google Dataset Search utilizza solo i primi 5000 caratteri di qualsiasi proprietà testuale. Nomi e titoli sono in genere poche parole o una breve frase”.

Come modernizzare i tuoi dati con database relazionali sicuri e affidabili

Un database relazionale raccoglie e ospita i dati in tabelle e colonne che organizza ed enfatizza le relazioni tra i dati. I database relazionali sono destinati a dati strutturati e connessi. Webopedia definisce i database relazionali come in grado di “impostare per aggiornare automaticamente i dati se un'istanza di essi viene modificata o modificata; gli altri dati correlati riceveranno aggiornamenti in tempo reale. Le persone usano spesso database relazionali e sistemi di gestione di database relazionali (RDBMS) in modo intercambiabile”.

Ciò aiuta le aziende a creare soluzioni di dati con architetture moderne e ad ottenere informazioni utili per il business in tempo reale per soddisfare meglio le intenzioni degli utenti.

I modelli da tabella a testo estraggono le informazioni testuali dai dati strutturati Esempio dello schema: set di dati di contesto JSON-LD

Sii basato sui dati e incentrato sulle persone

L'ottenimento di un meccanismo sequenziale per l'estrazione dei dati a livello di campo aiuta a eseguire l'attività di classificazione o regressione definitiva, valutando le funzioni di input generali, mappandole su un tipo di dati alternativo.

I rapporti sui set di dati di Google possono aiutare le tue conoscenze a potenziare il tuo pensiero sulla corrispondenza dell'intento di ricerca. Cerca nella libreria di dati online per trovare ciò di cui hai bisogno o assumi un data scientist. I risultati ricchi di set di dati sono utili per i flussi di lavoro di ricerca e sviluppo rapidi che aiutano a semplificare la codifica dei dati grezzi in informazioni significative. Aiutano a creare un approccio strutturato ai tuoi dati. Le aziende traggono vantaggio dalla razionalizzazione dei processi decisionali e dall'ottenimento di risultati con prestazioni più elevate più rapidamente.

“Uno dei principali fattori abilitanti del rapido progresso della ricerca e dello sviluppo è la disponibilità di architetture di reti neurali canoniche per codificare in modo efficiente i dati grezzi in rappresentazioni significative. Integrate con semplici livelli decisionali, queste architetture canoniche in genere producono prestazioni elevate su nuovi set di dati e attività correlate con un piccolo sforzo di ottimizzazione aggiuntivo". – Apprendimento tabulare interpretabile attento su Google Cloud AI

Cosa è cambiato nella versione beta di Google Dataset Search? Come funziona il motore di ricerca del set di dati di Google

In precedenza, i documenti di Google affermavano che: "Il markup del set di dati è disponibile per essere sperimentato prima che venga rilasciato alla disponibilità generale" e avvertevano che, sebbene tu sia in grado di utilizzare lo Strumento di test dei dati strutturati per la convalida, "non lo farai , tuttavia, vedrai che i tuoi set di dati vengono visualizzati nella Ricerca". Per coloro che hanno aspettato che questo venisse implementato, l'aggiunta di dati strutturati di set di dati al tuo sito può aiutare a misurare le sfide dei dispositivi mobili e le specifiche delle proprietà. Google Dataset Search supporta Google Scholar, il motore di ricerca dell'azienda tecnologica per studi accademici e report basati sui fatti.

Il 23 gennaio 2020, Natasha Noy di Google ha dichiarato che "Dataset Search ha indicizzato quasi 25 milioni di questi set di dati, offrendoti un unico posto per cercare i set di dati e trovare collegamenti a dove si trovano i dati. Nell'ultimo anno, le persone l'hanno provato e fornito feedback, e ora Dataset Search è ufficialmente fuori dalla versione beta".

L'articolo Alla scoperta di milioni di set di dati sul Web ci informa che la maggior parte dei governi del mondo pubblica i propri dati e li contrassegna con schema.org. "Gli Stati Uniti sono in testa per numero di set di dati governativi aperti disponibili, con oltre 2 milioni".

Ciò significa che i ricercatori di mercato hanno un accesso ai dati migliore che mai nella nostra storia digitale.

I set di dati possono gestire tutti i contenuti del tuo sito

Una volta che la raccolta di dati puliti e utili è avvenuta, anche se richiede molto tempo, può supportare e aiutare a gestire tutto quel contenuto sul tuo sito.

Puoi imparare come essere informato in modo più effettivo utilizzando diverse attività di apprendimento automatico con set di dati più realistici. Per ciascuno dei tuoi KPI aziendali, Hill Web Marketing può aiutarti a capire quali metriche sono importanti, come utilizzare lo schema per allinearle ai tuoi obiettivi di settore e tracciare come ottenere prestazioni migliori.

Natasha Noy, una ricercatrice scientifica per Google AI, ha pubblicato Rendere più facile scoprire i set di dati il ​​5 settembre 2018 e afferma: "La ricerca di set di dati funziona in più lingue con il supporto per altre lingue in arrivo".**** Chiaramente, questo è la direzione in cui sta andando il web; l'implementazione dei tipi essenziali di markup Schema aiuterà la tua azienda a farsi trovare.

L'uso dei set di dati aiuta a garantire flussi di entrate del prodotto

Come funziona la ricerca del set di dati di Google?

I set di dati possono essere scoperti facilmente quando fornisci informazioni che includono qualcosa come il loro nome, descrizione, creatore e formati di distribuzione come dati strutturati. Google sta consentendo la scoperta di set di dati e utilizza schema.org e altri formati di dati che possono essere incorporati in pagine Web che descrivono i set di dati. Questo schema può supportare le tue possibilità di essere nei risultati di ricerca del carosello di prodotti.

Il successo futuro della tua azienda dipende dalle informazioni necessarie per guidare la tua organizzazione verso flussi di entrate sostenuti. I messaggi sui tuoi prodotti devono ispirare la fiducia di un potenziale acquirente sufficiente per intraprendere le azioni necessarie per concludere l'affare. Hai un certo livello di controllo su ciò che appare nel grafico della conoscenza della tua azienda. "La posta in gioco è alta, con International Data Corporation che stima che gli investimenti aziendali globali in D&A supereranno i 200 miliardi di dollari all'anno entro il 2020", secondo Harvard Business Review.

“Una funzione di D&A (dati e analisi) solida e di successo comprende più di una pila di tecnologie o di poche persone isolate su un piano dell'edificio. D&A dovrebbe essere il fulcro dell'organizzazione, incorporato in tutte le decisioni chiave su vendite, marketing, catena di approvvigionamento, esperienza del cliente e altre funzioni principali". – Harvard Business Review

Le immagini dei prodotti possono far parte di un set di dati di immagini di Google! In alcuni set di dati sono presenti in media 8,4 oggetti per immagine. Ecco un elenco di set di dati che viene aggiornato frequentemente.

La pagina della documentazione di Google include un esempio JSON-LD per l'implementazione di schema.org/Dataset. Poiché il set di dati tubolare è in versione beta, emergeranno le migliori pratiche per la descrizione e l'utilizzo del set di dati. Man mano che i requisiti del codice cambiano, esegui un audit tecnico SEO per individuare dove sono necessari gli aggiornamenti.

Come caricare set di dati di prodotti e immagini su Google BigQuery?

Google BigQuery (GBQ) consente ai marketer di ricerca di raccogliere dati da diverse fonti. Ti consigliamo di utilizzare Google Merchant Center, Cloud Storage, BigQuery oppure puoi specificare i dati in linea al momento della richiesta. Prima di caricare qualsiasi dato, crea prima un set di dati e una tabella in Google BigQuery che includa le informazioni sul prodotto, inclusi i dettagli dell'immagine. ***

Preferiamo utilizzare il formato dati JSON-LD dell'articolo prodotto. Ecco un esempio di un oggetto completo:

 {
  "name": "projects/[PROJECT_NUMBER]/locations/global/catalogs/default_catalog/branches/0/products/1234",
  "id": "1234",
  "categories": "Apparel & Accessories > Shoes",
  "title": "ABC sneakers",
  "description": "Sneakers for the rest of us",
  "attributes": { "vendor": {"text": ["vendor123", "vendor456"]} },
  "language_code": "en",
  "tags": [ "black-friday" ],
  "priceInfo": {"currencyCode": "USD", "price":100, "originalPrice":200, "cost": 50},
  "availableTime": "2020-01-01T03:33:33.000001Z",
  "availableQuantity": "1",
  "uri":"http://foobar",
  "images": [{"uri": "http://foobar/img1", "height": 320, "width": 320 }]
}

Mantieni aggiornato il tuo catalogo prodotti. Google si preoccupa della qualità e la sua intelligenza artificiale richiede dati di alta qualità per fare previsioni di alta qualità. Controlla i prodotti non più in vendita e mantieni i dati aggiornati nel markup dello schema del prodotto e-commerce del tuo sito.

“Un set di dati tabulare è organizzato principalmente in termini di una griglia di righe e colonne. Per le pagine che incorporano set di dati tabulari, puoi anche creare markup più espliciti, basandoti sull'approccio di base descritto sopra. In questo momento comprendiamo una variazione di CSVW ("CSV sul Web", vedi W3C), fornita in parallelo al contenuto tabulare orientato all'utente sulla pagina HTML", afferma a partire dal 30.09.2019.

Resta sintonizzato sulla pagina della documentazione di Google per gli aggiornamenti nel caso in cui le proprietà elencate per Dataset, DataCatalog o DataDownload cambino. La documentazione attuale ha aggiornato l'aspetto organizzativo; i disciplinari immobiliari sono ora consolidati nella tipologia di appartenenza (in precedenza erano organizzati tematicamente). Queste nuove proprietà sono un modo per migliorare gli attributi del tuo sito web.

Come creare un set di dati dalle immagini per la classificazione degli oggetti.

All'interno della console di gestione del cluster IBM, seleziona (1) Carico di lavoro, (2) Spark e quindi (3) Deep Learning. **

* Fare clic sulla scheda "Set di dati".

* Seleziona "Nuovo".

* Crea un set di dati da "Immagini per la classificazione degli oggetti".

* Immettere un nome per il set di dati.

* Indica quale gruppo di istanze Spark desideri.

* Specifica il formato di archiviazione delle immagini preferito (preferiamo TFRecords per TensorFlow).

* Se è stato scelto TFRecords, vai a come generare record, per shard o classe. Se si seleziona shard, immettere il numero di shard.

* Specifica come vengono selezionate le immagini di allenamento.

Aderendo alle linee guida per le immagini di Google e ai requisiti per le immagini AMP, i tuoi prodotti hanno maggiori possibilità di essere visualizzati negli snippet in primo piano relativi ai prodotti.

Proprietà dei dati strutturati del set di dati

Davvero, ci sono poche proprietà richieste in questo momento. Per incoraggiarne l'uso, il gigante della tecnologia potrebbe adottare una strategia "mantenere le cose semplici" quando si tratta di fornire contenuti destinati ai consumatori di dati macchina. L'obiettivo finale è avere più e migliori corrispondenze nella sua libreria di dati per soddisfare l'intento di ricerca dell'utente.

Proprietà richieste:

  • nome
  • descrizione

Proprietà consigliate:

  • Nome alternativo
  • Creatore
  • citazione
  • identificatore
  • parole chiave
  • licenza
  • uguale a
  • copertura spaziale
  • copertura temporale
  • variabileMisurato
  • versione
  • url

Potresti non avere già un set di dati pubblicato sul Web, ma il marketing dei motori di ricerca si sta rapidamente spostando verso un approccio alla ricerca basato sulla scienza dei dati. Man mano che gli individui e le persone rendono accessibili sempre più set di dati, la ricerca di set di dati aumenterà. Ciò che sorprende è che chiunque pubblichi dati può descrivere il proprio set di dati utilizzando lo standard aperto di schema.org per la descrizione delle informazioni.

Quando esegui il test dei dati nel rapporto sull'indice di Search Console, leggi la sezione "Errori e avvisi noti", gli "errori o avvisi nello strumento di test dei dati strutturati di Google e il sistema di convalida di Structured Data Linter. Assumi un esperto di implementazione dei dati dello schema o usa i moduli per filtrare gli avvisi che puoi tranquillamente lasciar riposare.

Poiché si tratta dell'analisi del contenuto web, indipendentemente dal fatto che contenga già dati strutturati, è meglio rendere i dati disponibili in un formato compreso dalla percentuale più alta di consumatori di dati (in primis, motori di ricerca).

I set di dati forniscono una tabella di marcia per la creazione di grafici della conoscenza

Trova i set di dati di ricerca e sfrutta la ricerca accademica da origini dati aperte e https schema.org.

I ricercatori apprezzano la chiarezza sull'analisi puntuale della scienza dei dati globali e delle soluzioni di apprendimento automatico che rivelano le dinamiche del mercato. I marketer di ricerca con la ricerca di misurare le tendenze di marketing sostenibili si affidano ai big data per supportare la crescita futura del mercato. Una volta che Google Dataset Search uscirà dalla versione beta, potrebbe avere nuove capacità per condurre ricerche sui dati che potrebbero ridurre i rischi e le sfide attuali per le aziende. Ricerche approfondite sui dettagli nei tuoi dati possono migliorare i tuoi approcci di vendita.

Continuiamo a cercare approcci pratici per la creazione di grafici di conoscenza del cliente e possibilità di sfruttarli per applicazioni aziendali. Mettiti alla prova in questo.

Dopo aver utilizzato lo schema del set di dati sul tuo sito, troverai un nuovo rapporto nel tuo GSC sotto miglioramenti. Li utilizziamo per migliorare la nostra strategia di mobile content marketing per gli utenti provenienti da più dispositivi.

Funzionalità del set di dati e nuovo rapporto sul miglioramento di Google

Come nel caso di altre implementazioni di dati strutturati, solo perché hai incorporato i dati strutturati dello schema, diventi idoneo . Tuttavia, non garantisce che appaia nella ricerca di Google. Dai la priorità all'utilizzo di set di dati che supportano le vendite e le tue pagine di destinazione al dettaglio.

Contemporaneamente all'annuncio della funzione dei dati strutturati, è apparso un nuovo rapporto sul miglioramento del set di dati in Google Search Console. Questo informa gli strateghi del marketing di ricerca se Google ha appreso o meno i tuoi dati strutturati per lo schema del tuo set di dati. Leggere e correggere eventuali errori di dati strutturati una volta comprese le specifiche della documentazione dei dati strutturati del set di dati. Alimenta i dati dell'Assistente Google.

Pochi titolari di attività commerciali o creatori di contenuti hanno ore libere per pensare se i metadati sono formattati correttamente. Eppure deve essere per consentire a GoogleBot di eseguire la scansione del tuo sito, trovare i tuoi dati e indicizzarlo. Fortunatamente, lo adoriamo e siamo dalla tua parte.

Autorizzazioni per la creazione di set di dati

L'autorizzazione di compilazione è rilevante per i set di dati. Quando agli utenti viene concessa l'autorizzazione di compilazione, possono creare nuovo contenuto su un set di dati esistente. Questo è comune per report, dashboard, riquadri aggiunti da Domande e risposte e Insights Discovery. Possono anche creare nuove voci di dati nel set di dati al di fuori di Power BI, in genere fogli di Excel tramite Analizza in Excel, XMLA ed esportare i dati sottostanti. Aiuta le aziende a condurre analisi dei clienti.

Per quanto nuovo e completo sia il deep learning, Google e altri motori di ricerca devono ancora affrontare sfide di gestione dei dati che emergono nel contesto delle pipeline di machine learning distribuite in produzione. I nuovi sforzi per comprendere le query di ricerca semantica hanno lo scopo di supportare la comprensione, la convalida, la pulizia e l'arricchimento dei dati di addestramento. Da ciò, si spera che la crescita di fonti di database affidabili si espanda e sia più utile per indirizzare il traffico del negozio.

Il marketing digitale è vincolato dalla necessità di dati e dal loro utilizzo come approccio scientifico.

“Uno strumento di ricerca come questo è valido solo quanto i metadati che gli editori di dati sono disposti a fornire. Ci auguriamo che molti di voi utilizzino gli standard aperti per descrivere i propri dati, consentendo ai nostri utenti di trovare i dati che stanno cercando. Se pubblichi dati e non li vedi nei risultati, visita le nostre istruzioni sul nostro sito per sviluppatori che include anche un link per porre domande e fornire feedback". - Google *

"Possiamo comprendere i dati strutturati nelle pagine Web sui set di dati, utilizzando http://schema.org Dataset markup o strutture equivalenti rappresentate nel formato Data Catalog Vocabulary (DCAT) del W3C". – Il commento di Alan Morrison su Twitter

Riepilogo dello schema del set di dati di Google

L'utilizzo dei set di dati per soddisfare le esigenze degli utenti del sito è più focalizzato sull'esperienza dell'utente e sull'aggiunta di entità che rispondono e informano. Sebbene possa aver avuto origine dalla comunità della scienza dei dati, qualsiasi azienda può utilizzarlo. Ti consigliamo inoltre di cercare input sottoposti a revisione paritaria da esperti di alto livello con esperienza nel markup dei dati strutturati per i set di dati.

Hill Web Marketing è ansioso di partecipare a questa iniziativa e spera che incoraggi i nostri lettori ad espandere il numero di set di dati attualmente disponibili. Sebbene possa aver avuto origine dalla comunità della scienza dei dati, qualsiasi azienda può utilizzarlo.

Chiama Jeannie Hill, proprietaria di Hill Web Marketing, una stratega di marketing digitale, per collaborare: 651-206-2410. Pianifica la tua consulenza per ottenere un vantaggio competitivo

* https://arxiv.org/pdf/1908.07442.pdf

** https://www.ibm.com/support/knowledgecenter/SSWQ2D_1.1.0/us/create-dataset-image-object-classification.html

*** https://cloud.google.com/retail/recommendations-ai/docs/upload-catalog

**** https://www.blog.google/products/search/making-it-easy-discover-datasets/

***** https://storage.googleapis.com/pub-tools-public-publication-data/pdf/40761.pdf