Cómo usar Google Dataset Search para Dataset Schema

Publicado: 2019-10-01

Búsqueda de conjunto de datos de Google: cómo usar el esquema de conjunto de datos para consultas

Actualizado 12.6.2021

Con la creciente cantidad de datos digitales, los estrategas de marketing de búsqueda se enfrentan a una necesidad cada vez mayor de dar sentido a los datos.

Muchas aplicaciones de bases de datos avanzadas están comenzando a ser compatibles con Google Database Search. Además, los SEO tienen nuevos informes agregados a Google Search Console en septiembre de 2019 para comprender mejor sus datos. Se gana mucho al incorporar conocimiento a nivel de dominio codificado como ontologías en consultas sobre datos relacionales. Habiendo tanto dicho sobre el SEO, a los especialistas en marketing de búsqueda les resulta más difícil separar los hechos de la ficción, lo dañino de las tácticas útiles de SEO y las pruebas verdaderas en lugar de solo hablar.

Confiar en gran medida en experiencias e intuiciones pasadas de marketing de búsqueda es bueno, pero con demasiada frecuencia es incorrecto. Las decisiones influenciadas por datos resultan consistentemente mejores que "mi instinto me lo dijo". Muchas herramientas de conocimiento de datos, como Google Analytics, brindan evidencia de respaldo real, pero ahora es más fácil que nunca ubicar los conjuntos de datos públicos de Google Cloud.

¿Qué es la búsqueda de conjuntos de datos de Google?

Un panorama general rápido es que Google Data Search depende de los proveedores de conjuntos de datos, grandes o pequeños, que agregan metadatos estructurados dentro de sus sitios web utilizando el estándar abierto schema.org/Dataset. Google Dataset Search permite a los buscadores ubicar conjuntos de datos almacenados en la web a través de búsquedas con frases de búsqueda específicas. Según Google, la herramienta muestra información sobre conjuntos de datos alojados en miles de repositorios en la web, lo que hace que estos conjuntos de datos sean universalmente accesibles y útiles.

Al acceder a conjuntos de datos públicos de alta demanda que se relacionan con su nicho de negocio, puede descubrir nuevos conocimientos de los consumidores a partir de los datos de la nube. Al analizar conjuntos de datos adicionales alojados en BigQuery y Cloud Storage, es más fácil experimentar todo el valor de Google Cloud .

Los periodistas de datos ya están familiarizados con la obtención de datos gubernamentales y conjuntos de datos para las ciencias sociales. Este artículo lo ayudará a establecer una línea de base y configurar un marco basado en datos para medir su progreso digital y aprovechar las últimas oportunidades de marcado de esquema de Google.

La búsqueda de conjuntos de datos de Google se reconoce como un tipo de motor de búsqueda lanzado por Google con la intención de ayudar a los académicos a encontrar los datos que puedan necesitar. Los especialistas en marketing de búsqueda se están dando cuenta de que aprovechan más los conjuntos de datos.

¿Los conjuntos de datos simplifican la inteligencia de datos y la ontología complicada?

Si. Los conjuntos de datos son más fáciles de ubicar cuando la información de respaldo, como el nombre del proveedor, la descripción, el creador y los formatos de distribución, se marcan con datos estructurados. Google facilita el descubrimiento de conjuntos de datos a través de schema.org y otros estándares de metadatos que se pueden agregar al contenido web que representa conjuntos de datos.

Una vez que Google ha creado su índice de biblioteca, comienza a responder las consultas de los usuarios y determina qué resultados corresponden mejor a la consulta de cada persona, hablada o escrita.

“Es extremadamente difícil expresar consultas contra una ontología estructurada en grafos en el lenguaje de consulta SQL relacional o sus extensiones. Además, las consultas semánticas generalmente no son precisas, especialmente cuando los datos y su ontología relacionada son complicados”.

Los usuarios ni siquiera necesitan conocer la representación de la ontología. Todo lo que se requiere es que el usuario dé algunos ejemplos que satisfagan la consulta que tiene en mente. A continuación, el sistema de Google encuentra automáticamente la respuesta a la consulta . En este proceso, la semántica, que suele ser un concepto difícil de expresar, permanece como concepto en la mente del usuario, sin tener que expresarse explícitamente en un lenguaje de consulta. – Documento técnico de Google: Consultas semánticas por ejemplo *****

Esto presenta una oportunidad. Los modelos preentrenados en conjuntos de datos masivos están disponibles para cualquiera que construya procesamiento de lenguaje natural. Desde comprensión de lectura hasta análisis de sentimientos y BERT; una tendencia de investigación clave es el aumento de la transferencia de aprendizaje en la PNL.

La evolución del rol de un vendedor de búsqueda se ha vuelto más compleja con una necesidad creciente de digerir datos. Crear su propio conjunto de datos es una forma de SEO positivo que puede apoyarse en la literatura académica. Repensar cómo puede aplicar los datos de su imagen a un nivel más amplio puede ser un punto de partida. Esto ayudará a los sistemas escalables a determinar rutas cortas dentro de su gráfico de enlaces y red de enlaces web. Es probable que ayude a Google a rastrear y calcular de nuevo el mapa de enlaces de su sitio.

“Al describir colecciones de datos empaquetados, por ejemplo, tal como se publican en repositorios de “datos abiertos” científicos, académicos o gubernamentales, se puede usar el tipo de conjunto de datos, junto con DataCatalog para indicar la colección general, y DataDownload para representaciones específicas de un conjunto de datos. – Datos y conjuntos de datos – schema.org

Pasos para agregar un esquema de conjunto de datos

  • Primero, lea el marcado de la documentación del conjunto de datos para saber cómo agregarlo a su dominio en lugar de un solo archivo DCAT.
  • A continuación, agréguelos a su colección de fragmentos de datos estructurados en el formato de marcado JSON-LD preferido de Google; utilice el tipo de esquema Conjunto de datos.
  • Pruebe la implementación de su conjunto de datos con la herramienta de prueba de datos estructurados de Google.
  • Por último, envíe sus URL en un mapa del sitio que le indica a Googlebot que comience a rastrear las páginas del conjunto de datos.

NOTA: Google acepta marcas con formato DCAT. El esquema del conjunto de datos de Google está destinado a mostrar un cuerpo de información estructurada que describe alguna información organizada. Funciona para insertar datos estructurados JSON en el cuerpo o en la cabeza.

Conjuntos de datos de Google que usan código JSON-LD y vocabulario de esquema

¿Qué es el motor de búsqueda de conjuntos de datos de Google?

Un motor de búsqueda de conjunto de datos de Google es cuando un usuario interactúa con Google para tratar de localizar datos en línea que están disponibles públicamente para la fuente. Google Dataset Search está diseñado para funcionar junto con Google Scholar, el motor de búsqueda de las corporaciones para estudios académicos, investigaciones e informes.

Los cambios recientes en la página de documentación de los conjuntos de datos de Google actualizan la forma en que se implementan los datos estructurados de los conjuntos de datos para los webmasters, SEO y editores en los resultados enriquecidos en la búsqueda de Google. Es diferente de la forma común en que usamos Schema.org, el esquema del conjunto de datos puede estar en formatos arbitrarios o representar estadísticas agregadas.

Aaron explica que Google dejó caer el ícono de la pata en el aviso con una estrella, lo que dijo: "sugiere que el despliegue de resultados ricos en conjuntos de datos es inminente".

¿Por qué debería marcar sus conjuntos de datos con Schema?

La experiencia ideal del cliente a menudo puede parecer difícil de alcanzar. No es fácil mapear el viaje del cliente y clasificar montones de cadenas de datos digitales. Se necesita más que tener la oferta adecuada para el cliente adecuado. Comienza con los tiempos de compra, qué canal digital, la recopilación de datos de ofertas anteriores y, a veces, incluso más. La gestión de datos ha pasado del pensamiento táctico de compra de medios a cómo implementar los conocimientos estratégicos correctos que están en el corazón de las experiencias de los clientes empresariales que generan confianza en la marca.

Su contenido se puede comprender, combinar y utilizar mejor para obtener respuestas y soluciones. El esquema del conjunto de datos aprovecha un enfoque de aprendizaje automático para procesar consultas semánticas en bases de datos relacionales. En el procesamiento de consultas semánticas, el mayor obstáculo es proporcionar datos ontológicos precisos en forma relacional para que el motor de la base de datos relacional pueda manipular la ontología de una manera que se alinee con la manipulación de los datos.

Los conjuntos de datos que están marcados con un esquema son más fáciles de interpretar para otros, así como para que los motores de búsqueda entiendan mejor los datos. Esto les ayuda a traducir esa comprensión en ilustraciones visuales de sus datos.

Google dice que los conjuntos de datos se pueden usar para estos casos:

  • Una tabla o un archivo CSV con algunos datos
  • Una colección organizada de tablas.
  • Un archivo en un formato propietario que contiene datos
  • Una colección de archivos que juntos constituyen un conjunto de datos significativo
  • Un objeto estructurado con datos en algún otro formato que quizás desee cargar en una herramienta especial para el procesamiento
  • Imágenes capturando datos
  • Archivos relacionados con el aprendizaje automático, como parámetros entrenados o definiciones de estructuras de redes neuronales
  • Cualquier cosa que te parezca un conjunto de datos

Encontramos algunos conjuntos de datos enormes. Lo mejor es mantenerlo simple. Google recomienda “limitar todas las propiedades textuales a 5000 caracteres o menos. Google Dataset Search solo usa los primeros 5000 caracteres de cualquier propiedad textual. Los nombres y títulos son típicamente unas pocas palabras o una oración corta”.

Cómo modernizar sus datos con bases de datos relacionales seguras y confiables

Una base de datos relacional recopila y aloja datos en tablas y columnas que organizan y enfatizan las relaciones entre los datos. Las bases de datos relacionales están destinadas a datos que están estructurados y conectados. Webopedia define las bases de datos relacionales como capaces de “configurar para actualizar automáticamente los datos si se edita o modifica una instancia; los demás datos relacionados recibirán actualizaciones en tiempo real. La gente a menudo usa bases de datos relacionales y sistemas de administración de bases de datos relacionales (RDBMS) indistintamente”.

Esto ayuda a las empresas a crear soluciones de datos con arquitecturas modernas y obtener información empresarial inteligente en tiempo real para satisfacer mejor la intención del usuario.

Los modelos de tabla a texto extraen información textual de datos estructurados Ejemplo del esquema: conjunto de datos de contexto JSON-LD

Sea impulsado por los datos y centrado en las personas

Obtener un mecanismo secuencial para la extracción de datos a nivel de campo ayuda a realizar la última tarea de clasificación o regresión evaluando sus características de entrada generales, asignándolas a un tipo de datos alternativo.

Los informes de conjuntos de datos de Google pueden ayudar a sus aprendizajes a potenciar su pensamiento sobre cómo hacer coincidir mejor la intención de búsqueda. Busque en la biblioteca de datos en línea para encontrar lo que necesita o contrate a un científico de datos. Los resultados ricos en conjuntos de datos son útiles para los flujos de trabajo rápidos de investigación y desarrollo que ayudan a simplificar la codificación de los datos sin procesar en conocimientos significativos. Ayudan a crear un enfoque estructurado para sus datos. Las empresas se benefician al agilizar sus procesos de toma de decisiones y obtener resultados de mayor rendimiento más rápido.

“Uno de los principales facilitadores del rápido progreso de la investigación y el desarrollo es la disponibilidad de arquitecturas de redes neuronales canónicas para codificar de manera eficiente los datos sin procesar en representaciones significativas. Integradas con capas simples de toma de decisiones, estas arquitecturas canónicas generalmente brindan un alto rendimiento en nuevos conjuntos de datos y tareas relacionadas con un pequeño esfuerzo de ajuste adicional”. – Aprendizaje tabular interpretable atento en Google Cloud AI

¿Qué ha cambiado en Google Dataset Search Beta? Cómo funciona el motor de búsqueda de conjuntos de datos de Google

Anteriormente, los documentos de Google decían que: "El marcado del conjunto de datos está disponible para que experimente antes de que se publique para su disponibilidad general" y advertía que, si bien puede usar la Herramienta de prueba de datos estructurados para la validación, "no , sin embargo, verá que sus conjuntos de datos aparecen en la Búsqueda”. Para aquellos que esperaron a que esto se implementara, agregar datos estructurados de conjuntos de datos a su sitio puede ayudar a medir los desafíos móviles y las especificaciones de la propiedad. Google Dataset Search es compatible con Google Scholar, el motor de búsqueda de la empresa tecnológica para estudios académicos e informes basados ​​en hechos.

El 23 de enero de 2020, Natasha Noy de Google declaró que “Dataset Search ha indexado casi 25 millones de estos conjuntos de datos, brindándole un lugar único para buscar conjuntos de datos y encontrar enlaces a donde están los datos. Durante el año pasado, la gente lo probó y proporcionó comentarios, y ahora Dataset Search está oficialmente fuera de la versión beta”.

El artículo Descubriendo millones de conjuntos de datos en la web nos informa que la mayoría de los gobiernos del mundo publican sus datos y los marcan con schema.org. “Estados Unidos lidera la cantidad de conjuntos de datos de gobierno abierto disponibles, con más de 2 millones”.

Esto significa que los investigadores de mercado tienen mejor acceso a los datos que nunca en nuestra historia digital.

Los conjuntos de datos pueden administrar todo el contenido de su sitio

Una vez que se lleva a cabo la recopilación de datos limpios y útiles, aunque requiere mucho tiempo, puede respaldar y ayudar a administrar todo ese contenido en su sitio.

Puede aprender a estar más informado de los hechos utilizando diferentes tareas de aprendizaje automático con conjuntos de datos más realistas. Para cada uno de los KPI de su negocio, Hill Web Marketing puede ayudarlo a comprender qué métricas son importantes, cómo usar el esquema para alinearlas con los objetivos de su industria y trazar cómo obtener un mejor rendimiento.

Natasha Noy, científica investigadora de Google AI, publicó Facilitando el descubrimiento de conjuntos de datos el 5 de septiembre de 2018 y afirma: "La búsqueda de conjuntos de datos funciona en varios idiomas y pronto se admitirán idiomas adicionales".**** Claramente, esto es la dirección en la que va la web; implementar los tipos esenciales de marcado Schema ayudará a que se encuentre su empresa.

El uso de conjuntos de datos ayuda a garantizar flujos de ingresos de productos

¿Cómo funciona la búsqueda de conjuntos de datos de Google?

Los conjuntos de datos se pueden descubrir fácilmente cuando proporciona información que incluye algo como su nombre, descripción, creador y formatos de distribución como datos estructurados. Google está potenciando el descubrimiento de conjuntos de datos y utiliza schema.org y otros formatos de datos que se pueden incorporar en páginas web que describen conjuntos de datos. Este esquema puede respaldar sus posibilidades de estar en los resultados de búsqueda del carrusel de productos.

El éxito futuro de su negocio depende de los conocimientos necesarios para impulsar a su organización hacia flujos de ingresos sostenidos. Los mensajes sobre sus productos deben inspirar la confianza de un posible comprador lo suficiente como para tomar las medidas necesarias para sellar el trato. Tiene cierto nivel de control sobre lo que aparece en el gráfico de conocimiento de su empresa. “Hay mucho en juego, con International Data Corporation estimando que las inversiones comerciales globales en D&A superarán los $ 200 mil millones al año para 2020”, según Harvard Business Review.

“Una función sólida y exitosa de D&A (datos y análisis) abarca más que una pila de tecnologías o unas pocas personas aisladas en un piso del edificio. D&A debe ser el pulso de la organización, incorporado en todas las decisiones clave en ventas, marketing, cadena de suministro, experiencia del cliente y otras funciones centrales”. – Revista de negocios de Harvard

¡Las imágenes de productos pueden ser parte de un conjunto de datos de imágenes de Google! Hay 8,4 objetos por imagen en promedio en algunos conjuntos de datos. Aquí hay una lista de conjuntos de datos que se actualiza con frecuencia.

La página de documentación de Google incluye un ejemplo de JSON-LD para implementar schema.org/Dataset. Como el conjunto de datos tubulares está en versión beta, surgirán las mejores prácticas para la descripción y el uso del conjunto de datos. A medida que cambian los requisitos del código, realice una auditoría técnica de SEO para ubicar dónde se necesitan actualizaciones.

¿Cómo cargar conjuntos de datos de productos e imágenes en Google BigQuery?

Google BigQuery (GBQ) permite a los especialistas en marketing de búsqueda recopilar datos de diferentes fuentes. Recomendamos usar Google Merchant Center, Cloud Storage, BigQuery, o puede especificar los datos en línea al realizar la solicitud. Antes de cargar cualquier dato, primero cree un conjunto de datos y una tabla en Google BigQuery que incluya la información de su producto, incluidos los detalles de la imagen. ***

Preferimos utilizar el formato de datos JSON-LD del artículo del producto. Aquí hay un ejemplo de un objeto completo:

 {
  "name": "projects/[PROJECT_NUMBER]/locations/global/catalogs/default_catalog/branches/0/products/1234",
  "id": "1234",
  "categories": "Apparel & Accessories > Shoes",
  "title": "ABC sneakers",
  "description": "Sneakers for the rest of us",
  "attributes": { "vendor": {"text": ["vendor123", "vendor456"]} },
  "language_code": "en",
  "tags": [ "black-friday" ],
  "priceInfo": {"currencyCode": "USD", "price":100, "originalPrice":200, "cost": 50},
  "availableTime": "2020-01-01T03:33:33.000001Z",
  "availableQuantity": "1",
  "uri":"http://foobar",
  "images": [{"uri": "http://foobar/img1", "height": 320, "width": 320 }]
}

Mantenga actualizado su catálogo de productos. Google se preocupa por la calidad y su Inteligencia Artificial requiere datos de alta calidad para hacer predicciones de alta calidad. Esté atento a los productos que ya no están a la venta y mantenga los datos actualizados en el marcado de esquema de productos de comercio electrónico de su sitio.

“Un conjunto de datos tabulares está organizado principalmente en términos de una cuadrícula de filas y columnas. Para las páginas que incorporan conjuntos de datos tabulares, también puede crear un marcado más explícito, basándose en el enfoque básico descrito anteriormente. En este momento entendemos una variación de CSVW ("CSV en la Web", consulte W3C), proporcionada en paralelo al contenido tabular orientado al usuario en la página HTML”, afirma a partir del 30.9.2019.

Esté atento a la página de documentación de Google para obtener actualizaciones en caso de que cambien las propiedades enumeradas para Dataset, DataCatalog o DataDownload. La documentación actual ha actualizado el aspecto organizativo; Las especificaciones de las propiedades ahora se consolidan bajo el tipo al que pertenece cada una (antes se organizaban temáticamente). Estas nuevas propiedades son una forma de mejorar los atributos de su sitio web.

Cómo crear un conjunto de datos a partir de imágenes para la clasificación de objetos.

Dentro de la consola de administración de clústeres de IBM, seleccione (1) Carga de trabajo, (2) Spark y luego (3) Aprendizaje profundo. **

* Haga clic en la pestaña "Conjuntos de datos".

* Seleccione “Nuevo”.

* Crear un conjunto de datos a partir de "Imágenes para clasificación de objetos".

* Introduzca un nombre de conjunto de datos.

* Indique qué grupo de instancias de Spark desea.

* Especifique su formato de almacenamiento de imágenes preferido (preferimos TFRecords para TensorFlow).

* Si se eligió TFRecords, vaya a cómo generar registros, ya sea por fragmento o clase. Si se selecciona fragmento, ingrese el número de fragmento.

* Especificar cómo se seleccionan las imágenes de entrenamiento.

Al cumplir con las Directrices de imágenes de Google y los requisitos de imágenes de AMP, sus productos tienen más posibilidades de aparecer en fragmentos destacados relacionados con productos.

Propiedades de datos estructurados del conjunto de datos

Realmente, hay pocas propiedades requeridas en este momento. Para alentar su uso, el gigante de la tecnología puede optar por una estrategia de "mantenerlo simple" cuando se trata de proporcionar contenido destinado a consumidores de datos de máquinas. El objetivo final es tener más y mejores coincidencias en su biblioteca de datos para satisfacer la intención de búsqueda del usuario.

Propiedades requeridas:

  • nombre
  • descripción

Propiedades recomendadas:

  • Nombre alternativo
  • creador
  • citación
  • identificador
  • palabras clave
  • licencia
  • igual que
  • cobertura espacial
  • Cobertura temporal
  • variablemedido
  • versión
  • URL

Es posible que aún no tenga un conjunto de datos publicado en la web, pero el marketing de búsqueda se está moviendo rápidamente hacia un enfoque de búsqueda más de ciencia de datos. A medida que las personas hagan más y más conjuntos de datos accesibles, la búsqueda de conjuntos de datos aumentará. Lo sorprendente es que cualquiera que publique datos puede describir su conjunto de datos utilizando el estándar abierto de schema.org para describir información.

Al probar sus datos en el Informe de índice de Search Console, lea la sección "Errores y advertencias conocidos", los "errores o advertencias en la Herramienta de prueba de datos estructurados de Google y el sistema de validación de Linter de datos estructurados". Contrate a un experto en implementación de datos de esquema o use los formularios para ayudar a filtrar las advertencias que puede dejar descansar de manera segura.

Como esto se relaciona con el análisis del contenido web, independientemente de si ya contiene datos estructurados, es mejor hacer que los datos estén disponibles en un formato que comprenda el porcentaje más alto de consumidores de datos (principalmente, motores de búsqueda).

Los conjuntos de datos proporcionan una hoja de ruta para crear gráficos de conocimiento

Encuentre conjuntos de datos y aproveche la búsqueda académica de fuentes de datos abiertas y https schema.org.

Los investigadores valoran la claridad en el análisis preciso de la ciencia de datos globales y las soluciones de aprendizaje automático que revelan la dinámica del mercado. Los especialistas en marketing de búsqueda que buscan medir las tendencias de marketing sostenibles se basan en big data para respaldar el crecimiento futuro del mercado. Una vez que Google Dataset Search salga de la versión beta, es posible que tenga nuevas capacidades para realizar investigaciones de datos que pueden reducir los riesgos y desafíos actuales que enfrentan las empresas. Una investigación exhaustiva sobre los detalles de sus datos puede mejorar sus enfoques de ventas.

Continuamos buscando enfoques prácticos para crear gráficos de conocimiento del cliente y oportunidades para aprovecharlos para aplicaciones comerciales. Prueba tu mano en esto.

Una vez que haya utilizado el esquema del conjunto de datos en su sitio, encontrará un nuevo informe en su GSC en mejoras. Los usamos para mejorar nuestra estrategia de marketing de contenido móvil para usuarios que provienen de múltiples dispositivos.

Funciones del conjunto de datos y nuevo informe de mejoras de Google

Como es el caso con otras implementaciones de datos estructurados, solo porque incorporó datos estructurados de esquema, se vuelve elegible . Sin embargo, no garantiza aparecer en la búsqueda de Google. Priorice el uso de conjuntos de datos que respalden las ventas y sus páginas de destino minoristas.

Simultáneamente con el anuncio de la función de datos estructurados, apareció un nuevo informe de mejora del conjunto de datos en Google Search Console. Esto informa a los estrategas de marketing de búsqueda si Google ha aprendido o no y reconoce sus datos estructurados para su esquema de conjunto de datos. Lea y corrija cualquier error de datos estructurados una vez que comprenda las especificaciones de documentación de datos estructurados del conjunto de datos. Alimentará los datos de su Asistente de Google.

Pocos dueños de negocios o creadores de contenido tienen horas libres para pensar si sus metadatos tienen el formato correcto. Sin embargo, debe ser para permitir que GoogleBot rastree su sitio, encuentre sus datos e indexe. Afortunadamente, nos encanta y estamos de tu lado.

Permisos de compilación de conjuntos de datos

El permiso de compilación es relevante para los conjuntos de datos. Cuando a los usuarios se les otorga permiso de compilación, pueden crear contenido nuevo en un conjunto de datos existente. Esto es común para informes, tableros, mosaicos anclados de Preguntas y respuestas e Insights Discovery. También pueden crear nuevas entradas de datos en el conjunto de datos fuera de Power BI, normalmente hojas de Excel a través de Analizar en Excel, XMLA y exportar datos subyacentes. Ayuda a las empresas a realizar análisis de clientes.

A pesar de lo nuevo y completo que es el aprendizaje profundo, Google y otros motores de búsqueda aún enfrentan desafíos de administración de datos que surgen en el contexto de las canalizaciones de aprendizaje automático implementadas en producción. Los nuevos esfuerzos para comprender las consultas de búsqueda semántica están destinados a respaldar la comprensión, la validación, la limpieza y el enriquecimiento de los datos de capacitación. A partir de esto, se espera que el crecimiento de fuentes de bases de datos confiables se expanda y sea más útil para impulsar el tráfico de la tienda.

El marketing digital está obligado por la necesidad de datos y su uso como un enfoque científico.

“Una herramienta de búsqueda como esta es tan buena como los metadatos que los editores de datos estén dispuestos a proporcionar. Esperamos que muchos de ustedes utilicen los estándares abiertos para describir sus datos, lo que permitirá a nuestros usuarios encontrar los datos que buscan. Si publica datos y no los ve en los resultados, visite nuestras instrucciones en nuestro sitio para desarrolladores, que también incluye un enlace para hacer preguntas y proporcionar comentarios”. - Google *

"Podemos comprender los datos estructurados en páginas web sobre conjuntos de datos, utilizando el marcado de conjunto de datos de http://schema.org o estructuras equivalentes representadas en el formato de vocabulario de catálogo de datos (DCAT) de W3C". – comentario de Alan Morrison en Twitter

Resumen del esquema del conjunto de datos de Google

El uso de conjuntos de datos para satisfacer las necesidades de los usuarios del sitio se centra más en la experiencia del usuario y en agregar entidades que respondan e informen. Si bien puede haberse originado en la comunidad de ciencia de datos, cualquier empresa puede usarlo. También recomendamos buscar aportes revisados ​​por pares de expertos de alto nivel que tengan experiencia en el marcado de datos estructurados para conjuntos de datos.

Hill Web Marketing está ansioso por participar en esta iniciativa y espera que aliente a nuestros lectores a ampliar la cantidad de conjuntos de datos disponibles actualmente. Si bien puede haberse originado en la comunidad de ciencia de datos, cualquier empresa puede usarlo.

Llame a Jeannie Hill, propietaria de Hill Web Marketing, estratega de marketing digital, para asociarse: 651-206-2410. Programe su consulta para obtener una ventaja competitiva

* https://arxiv.org/pdf/1908.07442.pdf

** https://www.ibm.com/support/knowledgecenter/SSWQ2D_1.1.0/us/create-dataset-image-object-classification.html

*** https://cloud.google.com/retail/recommendations-ai/docs/upload-catalog

**** https://www.blog.google/products/search/making-it-easier-discover-datasets/

***** https://storage.googleapis.com/pub-tools-public-publication-data/pdf/40761.pdf