Cum să utilizați Google Dataset Search pentru Dataset Schema
Publicat: 2019-10-01Căutare seturi de date Google: Cum se utilizează Schema setului de date pentru interogări
Actualizat 12.6.2021
Odată cu creșterea cantităților de date digitale, strategii de marketing în căutare se confruntă cu o nevoie tot mai mare de a înțelege datele.
Multe aplicații avansate de baze de date încep să accepte Google Database Search. De asemenea, SEO au adăugat noi rapoarte la Google Search Console în septembrie 2019 pentru a-și înțelege mai bine datele. Se câștigă mult prin încorporarea cunoștințelor la nivel de domeniu codificate ca ontologii în interogări asupra datelor relaționale. Cu atâtea spuse despre SEO, specialiștii în marketingul de căutare consideră că este mai dificil să trimită faptele din ficțiune, dăunătoare de la tactici utile SEO și testat-adevărat decât doar vorbire.
Să te bazezi în mare măsură pe experiențele și intuițiile anterioare de marketing de căutare este drăguț, dar prea frecvent incorect. Deciziile influențate de date se dovedesc în mod constant mai bune decât „mi-a spus instinctul”. Multe instrumente de analiză a datelor, cum ar fi Google Analytics, oferă dovezi reale, dar acum este mai ușor ca niciodată să localizați seturile de date publice Google Cloud.
Ce este Google Dataset Search?
O imagine de ansamblu rapidă este că Google Data Search depinde de furnizorii de seturi de date, mari sau mici, adăugând metadate structurate pe site-urile lor folosind standardul deschis schema.org/Dataset. Căutarea în seturi de date Google dă posibilitatea celor care caută să găsească seturi de date stocate pe web prin căutări cu expresii de căutare specifice. Potrivit Google, instrumentul prezintă informații despre seturile de date găzduite în mii de depozite de pe web, făcând aceste seturi de date universal accesibile și utile.
Accesând seturi de date publice cu cerere mare care se referă la nișa dvs. de afaceri, puteți descoperi noi informații despre consumatori din datele din cloud. Analizând seturi de date suplimentare găzduite în BigQuery și Cloud Storage, este mai ușor să experimentați întreaga valoare a Google Cloud .
Jurnaliştii de date sunt deja familiarizaţi cu obţinerea de date guvernamentale şi seturi de date pentru ştiinţele sociale. Acest articol vă va ajuta să stabiliți o bază de referință și să configurați un cadru bazat pe date pentru a vă măsura progresul digital și pentru a utiliza cele mai recente oportunități de marcare a schemei Google.
Căutarea în seturile de date Google este recunoscută ca un tip de motor de căutare care a fost lansat de Google cu intenția de a ajuta oamenii de știință să găsească datele de care ar putea avea nevoie. Specialiștii de marketing din căutarea prind să folosească mai mult seturile de date.
Seturile de date simplifică inteligența datelor și ontologia complicată?
Da. Seturile de date sunt mai ușor de localizat atunci când informațiile de sprijin, cum ar fi numele furnizorului, descrierea, creatorul și formatele de distribuție sunt marcate cu date structurate. Google facilitează descoperirea setului de date prin schema.org și alte standarde de metadate care pot fi adăugate la conținutul web care descrie seturi de date.
Odată ce Google și-a construit indexul bibliotecii, începe să răspundă la întrebările utilizatorilor și să stabilească care rezultate corespund cel mai bine interogării fiecărei persoane, rostite sau tastate.
„Este extrem de dificil să exprimați interogări împotriva ontologiei structurate în graf în limbajul de interogare SQL relațional sau extensiile sale. În plus, interogările semantice nu sunt de obicei precise, mai ales atunci când datele și ontologia aferentă sunt complicate.”
Utilizatorii nici nu au nevoie să cunoască reprezentarea ontologiei. Tot ceea ce este necesar este ca utilizatorul să ofere câteva exemple care să satisfacă interogarea pe care o are în minte. Apoi, sistemul Google găsește automat răspunsul la interogare . În acest proces, semantica, care este un concept de obicei greu de exprimat, rămâne ca un concept în mintea utilizatorului, fără a fi necesar să fie exprimată explicit într-un limbaj de interogare. – Cartea albă Google: Interogări semantice prin exemplu *****
Aceasta prezintă o oportunitate. Modelele pre-antrenate pe seturi masive de date sunt disponibile pentru oricine construiește procesarea limbajului natural. De la înțelegerea lecturii la analiza sentimentelor la BERT; o tendință cheie în cercetare este creșterea învățării prin transfer în NLP.
Evoluția rolului unui agent de marketing de căutare a devenit mai complexă, odată cu o nevoie tot mai mare de a digera datele. Crearea propriului set de date este o formă de SEO pozitivă care se poate baza în literatura academică. Regândirea modului în care puteți aplica datele de imagine la un nivel mai larg poate fi un loc de început. Acest lucru va ajuta sistemele scalabile pentru a determina căi scurte în graficul de legături și rețeaua de linkuri web. Este posibil să ajute Google atunci când accesează din nou cu crawlere și recalculează harta link-ului site-ului tău.
„Când descrieți colecții de date împachetate, de exemplu așa cum sunt publicate în depozite de „date deschise” științifice, academice sau guvernamentale, tipul Dataset poate fi utilizat, alături de DataCatalog pentru a indica colecția generală și DataDownload pentru reprezentări specifice ale unui set de date.” – Date și seturi de date – schema.org
Pași pentru adăugarea unei scheme de set de date
- Mai întâi, citiți marcajul documentației setului de date pentru a afla cum să îl adăugați la domeniul dvs. față de un singur fișier DCAT.
- Apoi, adăugați la colecția dvs. de fragmente de date structurate în formatul de marcare JSON-LD preferat de Google; utilizați tipul de schemă Dataset.
- Testați implementarea setului de date cu Instrumentul de testare a datelor structurate Google.
- În cele din urmă, v-ați trimis adresele URL într-o hartă a site-ului care îi spune lui Googlebot să înceapă să acceseze cu crawlere paginile setului de date.
NOTĂ: Google acceptă markup cu formatare DCAT. Schema setului de date Google este menită să arate un corp de informații structurate care descriu unele informații organizate. Funcționează fie pentru a insera date structurate JSON fie în corp, fie în cap.
Seturi de date Google folosind cod JSON-LD și Vocabular Schema
Ce este motorul de căutare a setului de date Google?
Un motor de căutare Google Dataset este atunci când un utilizator a angajat Google pentru a încerca să găsească date online care sunt disponibile public pentru sursă. Google Dataset Search este destinat să funcționeze alături de Google Scholar, motorul de căutare al corporațiilor pentru studii academice, cercetări și rapoarte.
Modificările recente aduse paginii de documentație pentru seturile de date Google actualizează modul de lansare a datelor structurate pentru seturile de date către webmasteri, SEO și editori în rezultatele bogate din căutarea Google. Este diferit de modul obișnuit în care folosim Schema.org, schema setului de date poate fi în formate arbitrare sau poate reprezenta statistici agregate.
Aaron explică că Google a aruncat pictograma labe în anunț cu o stea, despre care a spus: „sugerează că lansarea rezultatelor bogate în seturi de date este iminentă”.
De ce ar trebui să marcați seturile de date cu Schema?
Experiența ideală a clientului poate fi adesea evazivă. Nu este ușor să mapați călătoria clientului și să sortați grămezi de șiruri de date digitale. Este nevoie de mai mult decât de a avea doar oferta potrivită pentru clientul potrivit. Începe cu timpii de cumpărare, care canal digital, colectarea datelor din ofertele anterioare și, uneori, chiar mai mult. Managementul datelor a trecut de la gândirea tactică de cumpărare media la modul de implementare a perspectivelor strategice potrivite, care se află în centrul experiențelor clienților întreprinderii, care construiesc încrederea în brand.
Conținutul dvs. poate fi mai bine înțeles, potrivit și utilizat pentru răspunsuri și soluții. Schema setului de date folosește o abordare de învățare automată pentru a procesa interogări semantice în bazele de date relaționale. În procesarea interogărilor semantice, cel mai mare obstacol este furnizarea de date ontologice precise în formă relațională, astfel încât motorul bazei de date relaționale să poată manipula ontologia într-o manieră care să se alinieze cu manipularea datelor.
Seturile de date care sunt marcate cu schema sunt mai ușor de interpretat de către alții, precum și pentru motoarele de căutare să înțeleagă mai bine datele. Acest lucru îi ajută să traducă această înțelegere în ilustrații vizuale ale datelor dvs.
Google spune că seturile de date pot fi folosite pentru aceste cazuri:
- Un tabel sau un fișier CSV cu unele date
- O colecție organizată de tabele
- Un fișier într-un format proprietar care conține date
- O colecție de fișiere care împreună constituie un set de date semnificativ
- Un obiect structurat cu date într-un alt format pe care ați putea dori să îl încărcați într-un instrument special pentru procesare
- Imagini care captează date
- Fișiere referitoare la învățarea automată, cum ar fi parametrii antrenați sau definițiile structurii rețelei neuronale
- Orice lucru care vi se pare un set de date
Am găsit niște seturi de date uriașe. Cel mai bine este să fie simplu. Google recomandă „limitarea tuturor proprietăților textuale la 5000 de caractere sau mai puțin. Google Dataset Search folosește numai primele 5000 de caractere ale oricărei proprietăți textuale. Numele și titlurile sunt de obicei câteva cuvinte sau o propoziție scurtă”.
Cum să vă modernizați datele cu baze de date relaționale sigure și de încredere
O bază de date relațională adună și găzduiește date în tabele și coloane care organizează și subliniază relațiile dintre date. Bazele de date relaționale sunt destinate datelor care sunt structurate și conectate. Webopedia definește bazele de date relaționale ca fiind capabile să „seteze să actualizeze automat datele dacă o instanță a acestora este editată sau modificată; celelalte date aferente vor primi actualizări în timp real. Oamenii folosesc adesea bazele de date relaționale și sistemele de management al bazelor de date relaționale (RDBMS) în mod interschimbabil”.
Acest lucru ajută companiile să construiască soluții de date cu arhitecturi moderne și să obțină informații inteligente în timp real pentru a îndeplini mai bine intenția utilizatorului.
Modelele tabel-la-text extrag informații textuale din datele structurate 
Fii bazat pe date și concentrat pe oameni
Obținerea unui mecanism secvenţial pentru extragerea datelor la nivel de câmp ajută la realizarea sarcinii finale de clasificare sau regresie, evaluând caracteristicile generale de intrare, supra maparea lor la un tip de date alternativ.
Rapoartele Google seturi de date vă pot ajuta învățările să vă stimuleze gândirea în legătură cu potrivirea mai bună a intenției de căutare. Căutați în biblioteca de date online pentru a găsi ceea ce aveți nevoie sau angajați un cercetător de date. Rezultatele bogate în seturi de date sunt utile pentru fluxurile de lucru rapide de cercetare și dezvoltare care ajută la simplificarea codificării datelor brute în perspective semnificative. Ele ajută la crearea unei abordări structurate a datelor dvs. Afacerile beneficiază de eficientizarea proceselor lor de luare a deciziilor și de a obține mai rapid rezultate mai bune de performanță.
„Unul dintre factorii majori ai progresului rapid în cercetare și dezvoltare este disponibilitatea arhitecturilor canonice de rețele neuronale pentru a codifica eficient datele brute în reprezentări semnificative. Integrate cu straturi simple de luare a deciziilor, aceste arhitecturi canonice oferă de obicei performanțe ridicate pe seturi de date noi și sarcini aferente, cu un mic efort suplimentar de reglare.” – Învățare tabelară interpretabilă atentă pe Google Cloud AI
Ce s-a schimbat în Google Dataset Search Beta? 
Anterior, documentele Google indicau că: „Markupul setului de date este disponibil pentru experimentare înainte de a fi lansat la disponibilitatea generală” și avertizează că, deși puteți utiliza Instrumentul de testare a datelor structurate pentru validare, că „nu veți , vedeți totuși seturile dvs. de date care apar în Căutare.” Pentru cei care au așteptat ca acest lucru să fie lansat, adăugarea de date structurate pe site-ul dvs. poate ajuta la măsurarea provocărilor mobile și a specificațiilor proprietății. Google Dataset Search acceptă Google Scholar, motorul de căutare al companiei de tehnologie pentru studii academice și rapoarte bazate pe fapte.
La 23 ianuarie 2020, Natasha Noy de la Google a declarat că „Dataset Search a indexat aproape 25 de milioane dintre aceste seturi de date, oferindu-vă un singur loc pentru a căuta seturi de date și a găsi linkuri către unde se află datele. În ultimul an, oamenii l-au încercat și au oferit feedback, iar acum Dataset Search a ieșit oficial din versiunea beta.”
Articolul Discovering million of datasets on the web ne informează că majoritatea guvernelor din lume își publică datele și le marchează cu schema.org. „Statele Unite sunt lider în numărul de seturi de date guvernamentale deschise disponibile, cu peste 2 milioane.”
Aceasta înseamnă că cercetătorii de piață au un acces mai bun la date decât oricând în istoria noastră digitală.
Seturile de date pot gestiona tot conținutul site-ului dvs
Odată ce colectarea datelor curate și utile are loc, chiar dacă necesită mult timp, poate sprijini și ajuta la gestionarea întregului conținut de pe site-ul dvs.
Puteți învăța cum să fiți mai informat în mod real folosind diferite sarcini de învățare automată cu seturi de date mai realiste. Pentru fiecare dintre KPI-urile dvs. de afaceri, Hill Web Marketing vă poate ajuta să înțelegeți ce valori sunt importante, cum să utilizați schema pentru a le alinia cu obiectivele din industrie și să găsiți cum să obțineți performanțe îmbunătățite.

Natasha Noy, cercetător pentru Google AI, a publicat Making it easy to discover datasets pe 5 septembrie 2018 și afirmă: „Dataset Search funcționează în mai multe limbi cu suport pentru limbi suplimentare în curând”.**** În mod clar, acesta este direcția în care merge web-ul; implementarea tipurilor esențiale de markup Schema va ajuta afacerea dvs. să fie găsită.
Utilizarea seturilor de date ajută la asigurarea fluxurilor de venituri ale produselor
Cum funcționează căutarea setului de date Google?
Seturile de date pot fi descoperite cu ușurință atunci când furnizați informații care includ ceva precum numele lor, descrierea, creatorul și formatele de distribuție ca date structurate. Google împuternicește descoperirea setului de date și folosește schema.org și alte formate de date care pot fi încorporate în paginile web care descriu seturi de date. Această schemă vă poate sprijini șansele de a fi în rezultatele căutării caruselului de produse.
Succesul viitor al afacerii dvs. depinde de informațiile necesare pentru a conduce organizația dvs. către fluxuri susținute de venituri. Mesajele despre produsele dvs. trebuie să inspire suficientă încredere unui potențial cumpărător pentru a lua măsurile necesare pentru a încheia afacerea. Aveți un anumit nivel de control asupra a ceea ce apare în graficul de cunoștințe al companiei dvs. „Mizele sunt mari, International Data Corporation estimand că investițiile globale în afaceri în D&A vor depăși 200 de miliarde de dolari pe an până în 2020”, potrivit Harvard Business Review.
„O funcție robustă și de succes D&A (Date și Analytics) cuprinde mai mult decât un teanc de tehnologii sau câteva persoane izolate la un etaj al clădirii. D&A ar trebui să fie pulsul organizației, încorporat în toate deciziile cheie din vânzări, marketing, lanțul de aprovizionare, experiența clienților și alte funcții de bază.” - Recenzie de afaceri Harvard
Imaginile produselor pot face parte dintr-un set de date de imagini Google! Există în medie 8,4 obiecte pe imagine în unele seturi de date. Iată o listă de set de date care este actualizată frecvent.
Pagina de documentație Google include un exemplu JSON-LD pentru implementarea schema.org/Dataset. Deoarece setul de date tubular este în versiune beta, vor apărea cele mai bune practici pentru descrierea și utilizarea setului de date. Pe măsură ce cerințele codului se modifică, efectuați un audit tehnic SEO pentru a localiza unde sunt necesare actualizări.
Cum să încărcați seturi de date despre produse și imagini în Google BigQuery?
Google BigQuery (GBQ) le permite operatorilor de marketing să colecteze date din diferite surse. Vă recomandăm să utilizați Google Merchant Center, Cloud Storage, BigQuery sau puteți specifica datele în linie atunci când faceți cererea. Înainte de a încărca date, creați mai întâi un set de date și un tabel în Google BigQuery care să includă informații despre produsul dvs., inclusiv detalii despre imagine. ***
Preferăm să folosim formatul de date JSON-LD al articolului de produs. Iată un exemplu de obiect complet:
{
"name": "projects/[PROJECT_NUMBER]/locations/global/catalogs/default_catalog/branches/0/products/1234",
"id": "1234",
"categories": "Apparel & Accessories > Shoes",
"title": "ABC sneakers",
"description": "Sneakers for the rest of us",
"attributes": { "vendor": {"text": ["vendor123", "vendor456"]} },
"language_code": "en",
"tags": [ "black-friday" ],
"priceInfo": {"currencyCode": "USD", "price":100, "originalPrice":200, "cost": 50},
"availableTime": "2020-01-01T03:33:33.000001Z",
"availableQuantity": "1",
"uri":"http://foobar",
"images": [{"uri": "http://foobar/img1", "height": 320, "width": 320 }]
}
Păstrați-vă catalogul de produse la zi. Google îi pasă de calitate, iar inteligența sa artificială necesită date de înaltă calitate pentru a face predicții de înaltă calitate. Urmăriți produsele care nu mai sunt de vânzare și păstrați datele actualizate în marcajul schemei de produse de comerț electronic al site-ului dvs.
„Un set de date tabelar este unul organizat în primul rând în termeni de grilă de rânduri și coloane. Pentru paginile care încorporează seturi de date tabulare, puteți crea, de asemenea, un marcaj mai explicit, pornind de la abordarea de bază descrisă mai sus. În acest moment înțelegem o variație a CSVW („CSV pe Web”, vezi W3C), furnizată în paralel cu conținutul tabelar orientat către utilizator pe pagina HTML.”, se precizează din 30.9.2019.
Fiți la curent cu pagina de documentație Google pentru actualizări în cazul în care proprietățile enumerate pentru Dataset, DataCatalog sau DataDownload se modifică. Documentația actuală a actualizat aspectul organizatoric; specificațiile de proprietate sunt acum consolidate sub tipul căruia îi aparține fiecare (în trecut erau organizate tematic). Aceste noi proprietăți sunt o modalitate de a vă îmbunătăți atributele site-ului.
Cum se creează un set de date din imagini pentru clasificarea obiectelor.
În consola de gestionare a cluster-ului IBM, selectați (1) Workload, (2) Spark și apoi (3) Deep Learning. **
* Faceți clic pe fila „Seturi de date”.
* Selectați „Nou”.
* Creați un set de date din „Imagini pentru clasificarea obiectelor”.
* Introduceți un nume de set de date.
* Indicați ce grup de instanțe Spark doriți.
* Specificați formatul preferat de stocare a imaginii (Preferăm TFRecords pentru TensorFlow).
* Dacă a fost ales TFRecords, navigați la modul de generare a înregistrărilor, fie pe shard, fie pe clasă. Dacă este selectat fragment, introduceți numărul fragmentului.
* Specificați modul în care sunt selectate imaginile de antrenament.
Respectând Regulile Google pentru imagini și cerințele privind imaginea AMP, produsele dvs. au șanse mai mari de a apărea în fragmentele recomandate legate de produse.
Proprietățile datelor structurate ale setului de date
Într-adevăr, există puține proprietăți necesare în acest moment. Pentru a încuraja utilizarea acestuia, gigantul tehnologic ar putea merge cu o strategie de „păstrare simplă” atunci când vine vorba de furnizarea de conținut destinat consumatorilor de date ale mașinilor. Scopul final este de a avea mai multe potriviri și mai bune în biblioteca sa de date pentru a satisface intenția de căutare a utilizatorului.
Proprietăți necesare:
- Nume
- descriiopn
Proprietăți recomandate:
- nume alternativ
- creator
- citare
- identificator
- Cuvinte cheie
- licență
- la fel ca
- Acoperire spațială
- temporalAcoperire
- variabilă Măsurată
- versiune
- url
Poate că nu aveți deja un set de date publicat pe web, dar marketingul în căutare se îndreaptă rapid către o abordare mai mult de știință a datelor pentru căutare. Pe măsură ce indivizii și oamenii fac din ce în ce mai multe seturi de date accesibile, Căutarea setului de date va crește. Ceea ce este surprinzător este că oricine publică date își poate descrie setul de date folosind standardul deschis schema.org pentru descrierea informațiilor.
Când testați datele dvs. în raportul de index din Search Console, citiți secțiunea „Erori și avertismente cunoscute”, „erori sau avertismente din Instrumentul de testare a datelor structurate de la Google și sistemul de validare Linter pentru date structurate”. Angajați un expert în implementarea datelor de schemă sau utilizați formularele pentru a vă ajuta să identificați avertismentele pe care le puteți lăsa să se odihnească în siguranță.
Deoarece aceasta se referă la analizarea conținutului web – indiferent dacă acesta conține deja date structurate – cel mai bine este să faceți datele disponibile într-un format pe care cel mai mare procent de consumatori de date (în primul rând, motoarele de căutare) îl înțeleg.
Seturile de date oferă o foaie de parcurs pentru construirea de grafice de cunoștințe
Găsiți seturi de date și valorificați căutarea academică din surse de date deschise și https schema.org.
Cercetătorii apreciază claritatea în analiza precisă a științei datelor globale și a soluțiilor de învățare automată care dezvăluie dinamica pieței. Căutați specialiști în marketing cu încercarea de a măsura tendințele de marketing durabil se bazează pe date mari pentru a sprijini creșterea viitoare a pieței. Odată ce Google Dataset Search iese din versiunea beta, poate avea noi capabilități de a efectua cercetări de date care pot reduce riscurile și provocările actuale în fața companiilor. Cercetarea extensivă a detaliilor din datele dvs. vă poate îmbunătăți abordările de vânzare.
Continuăm să căutăm abordări practice pentru construirea graficelor de cunoștințe ale clienților și șansele de a le folosi pentru aplicații de afaceri. Încearcă-ți mâna la asta.
Odată ce ați folosit schema setului de date pe site-ul dvs., veți găsi un nou raport în GSC sub Îmbunătățiri. Le folosim pentru a ne îmbunătăți strategia de marketing de conținut mobil pentru utilizatorii care provin de pe mai multe dispozitive.
Funcții de set de date și noul raport Google Enhancement
Ca și în cazul altor implementări de date structurate, doar pentru că ați încorporat date structurate de schemă, deveniți eligibil . Cu toate acestea, nu garantează să apară în căutarea Google. Acordați prioritate utilizând seturi de date care sprijină vânzările și paginile dvs. de destinație de vânzare cu amănuntul.
Concomitent cu anunțul despre caracteristica datelor structurate, a apărut un nou raport de îmbunătățire a setului de date în Google Search Console. Acest lucru îi informează pe strategii de marketing de căutare dacă Google a învățat sau nu și recunoaște datele dvs. structurate pentru schema setului de date. Citiți și remediați orice erori de date structurate odată ce înțelegeți specificațiile Documentației de date structurate ale setului de date. Acesta vă va alimenta datele Asistentului Google.
Puțini proprietari de afaceri sau creatori de conținut au ore libere pentru a se gândi dacă metadatele tale sunt formatate corect. Cu toate acestea, trebuie să permită GoogleBot să vă acceseze cu crawlere site-ul, să vă găsească datele și să le indexeze. Din fericire, ne place și suntem în colțul tău.
Permisiuni de construire a setului de date
Permisiunea de construire este relevantă pentru seturile de date. Când utilizatorilor li se acordă permisiunea de construire, ei pot crea conținut nou pe un set de date existent. Acest lucru este obișnuit pentru rapoarte, tablouri de bord, plăci fixate de la QandA și Insights Discovery. De asemenea, pot crea noi intrări de date pe setul de date în afara Power BI, de obicei foi Excel prin Analiză în Excel, XMLA și pot exporta datele subiacente. Ajută companiile să efectueze analize ale clienților.
Oricât de nou și de cuprinzător este învățarea profundă, Google și alte motoare de căutare încă se confruntă cu provocări de gestionare a datelor care apar în contextul conductelor de învățare automată implementate în producție. Noile eforturi de a înțelege interogările de căutare semantică sunt menite să sprijine înțelegerea, validarea, curățarea și îmbogățirea datelor de instruire. De aici, creșterea surselor de baze de date de încredere se va extinde și va fi mai utilă pentru a genera trafic în magazine.
Marketingul digital este legat de nevoia de date și de utilizarea acestora ca abordare științifică.
„Un instrument de căutare ca acesta este la fel de bun ca metadatele pe care editorii de date sunt dispuși să le ofere. Sperăm să vedem mulți dintre voi folosind standardele deschise pentru a vă descrie datele, permițând utilizatorilor noștri să găsească datele pe care le caută. Dacă publicați date și nu le vedeți în rezultate, vizitați instrucțiunile noastre de pe site-ul dezvoltatorilor noștri, care include și un link pentru a pune întrebări și a oferi feedback.” - Google *
„Putem înțelege datele structurate din paginile Web despre seturi de date, folosind fie http://schema.org Dataset markup, fie structuri echivalente reprezentate în formatul Data Catalog Vocabulary (DCAT) al W3C.” – Comentariul lui Alan Morrison pe Twitter
Rezumatul schemei setului de date Google
Utilizarea seturilor de date pentru a satisface nevoile utilizatorilor site-ului se concentrează mai mult pe experiența utilizatorului și pe adăugarea de entități care răspund și informează. Deși poate să provină din comunitatea științei datelor, orice companie îl poate folosi. Vă recomandăm, de asemenea, să căutați informații evaluate de colegi de la experți de nivel înalt care au experiență în marcarea datelor structurate pentru seturi de date.
Hill Web Marketing este dornic să participe la această inițiativă și speră că va încuraja cititorii noștri să extindă numărul de seturi de date disponibile în prezent. Deși poate să provină din comunitatea științei datelor, orice companie îl poate folosi.
Sună-l pe Jeannie Hill, proprietarul Hill Web Marketing, un strateg de marketing digital, pentru a fi partener: 651-206-2410. Programați-vă consultația pentru a obține un avantaj competitiv
* https://arxiv.org/pdf/1908.07442.pdf
** https://www.ibm.com/support/knowledgecenter/SSWQ2D_1.1.0/us/create-dataset-image-object-classification.html
*** https://cloud.google.com/retail/recommendations-ai/docs/upload-catalog
**** https://www.blog.google/products/search/making-it-easier-discover-datasets/
***** https://storage.googleapis.com/pub-tools-public-publication-data/pdf/40761.pdf