Comment obtenir une architecture de science des données pour propulser votre site Web
Publié: 2017-08-25Comment structurer l'architecture de votre site comme un gourou des data scientists
Chaque entreprise a besoin d'un moyen simple pour vraiment comprendre ses données Web , la visibilité numérique de ses produits et la façon dont les visiteurs du site mobile interagissent. .
Cela signifie-t-il que vous devez embaucher un data scientist pour poser les bonnes questions à partir de vos données ?
L'architecture de la science des données rassemble des idées qui transforment les données en connaissances exploitables. L'excitation dans cela est la capacité de prendre plus de décisions qui résolvent les problèmes de revenus des entreprises. Pour engager le référencement sémantique, il est nécessaire d'avoir une stratégie, des tactiques et les bons outils pour une approche structurée des données et une mise en page UX du site Web. Le Web moderne exige un contenu connecté basé sur le contexte de l'utilisateur, la reconnaissance des entités de données associées et la manière dont elles sont connectées aux recherches effectuées. Une compréhension du langage naturel, des utilisateurs, des KPI et de votre architecture de données structurées est fondamentale pour générer de meilleurs résultats de recherche.
Normes d'architecture de site d'intelligence d'affaires
Lorsqu'une entreprise dispose de métadonnées provenant de plusieurs sources, elles doivent être fusionnées de manière cohérente avant le développement de nouveaux produits. Vous devez regarder au-delà des technologies/plates-formes individuelles et voir de manière globale pour avoir une architecture de site solide. Hill Web Marketing aide les clients à valoriser le contenu au niveau des actifs pour acquérir des données. C'est là qu'un ingénieur ou un responsable du marketing numérique partageant les mêmes idées doit être là pour définir le champ, capturer les données, s'assurer que les systèmes enregistrent les insertions et peuvent les transmettre aux graphiques de connaissances sur les produits. Il s'agit de "contenu intelligent".
En acquérant une connaissance plus approfondie de l'architecture UX de base d'un site Web, vous pouvez l'utiliser pour stocker et analyser des données, en particulier des données structurées. Créez une stratégie commerciale claire sur la façon d'utiliser les données Google Analytics pour être compétitif et déployer la bonne UX, la technologie et l'architecture d'information pour stimuler l'engagement des utilisateurs. Ajuster votre culture d'entreprise pour créer du contenu numérique qui génère des résultats de recherche et des conversions mobiles nécessite une approche à multiples facettes.
Demandez à n'importe quel spécialiste du marketing numérique qui réussit ce qu'il considère comme des conditions préalables essentielles pour une campagne de marketing SEO réussie ou votre investissement dans la recherche payante, et sans aucun doute la plupart des réponses diront quelque chose sur l'obtention ou la réalisation d'intégrations judicieuses à partir de points de données. Il est utile d'aimer les données et d'être suffisamment avisé pour les exploiter correctement. Si un client ou un membre de l'équipe fournit une liste exhaustive de statistiques sur lesquelles il souhaite voir des rapports de données, approfondissez le raisonnement sous-jacent pour vous assurer qu'il correspond à ses objectifs commerciaux, puis gérez vos statistiques AdWords et publicité en conséquence.
Établissons une compréhension fondamentale des termes utilisés dans cet article pour commencer.
Qu'est-ce que l'architecture de la science des données ?
L'architecture de la science des données est la pratique de la science des données lors du choix de la meilleure architecture de site pour la distribution mondiale des données. Il englobe une architecture de lac de données pour ingérer différentes dimensions de données provenant de différentes sources telles que l'Internet des objets (IoT), l'activité de flux de clics sur les sites Web, les données de traitement des transactions en ligne (OLTP), à la fois les données hors site et sur site, pour nommer juste un peu. Un objectif final est de gagner plus de clics dans les SERPs Google immédiats .
Qu'est-ce que la science des données ?
La science des données est la pratique interdisciplinaire qui s'intéresse aux processus et aux systèmes pour extraire des connaissances ou des informations à partir de données dans divers formats, structurés ou non structurés, utiles pour fournir une continuation aux domaines d'analyse de données tels que les statistiques, l'apprentissage automatique, l'exploration de données et la prédiction. analytique. Il est similaire à la découverte des connaissances dans les bases de données (KDD).
Qu'est-ce qu'un architecte en science des données ?
L'architecte de la science des données (DSA) détermine la conception des processus de collecte, de stockage et d'analyse des données, et demande à l'entreprise les compromis de temps et de coût impliqués. Il facilite l'exploration et l'indexation de l'architecture d'un site .
Qu'est-ce qu'une base de données de graphes ?
En informatique, une base de données de graphes (GDB) est une base de données qui utilise des structures de graphes pour les requêtes de recherche sémantique avec des nœuds, des arêtes et des propriétés pour représenter des entités et stocker des données. Le cœur du système est le graphique, ou le mappage d'entités de bord ou de relation. Le graphique met en corrélation les éléments de données du magasin avec une collection de nœuds et d'arêtes, les arêtes lient les relations entre les nœuds.
Qu'est-ce que le chemin dans la structure de données du graphe ?
Un chemin dirigé, également connu sous le nom de dipath, dans un graphe orienté est une séquence série finie ou infinie d'arêtes qui rejoignent une progression de sommets distincts, mais avec l'exigence supplémentaire que les arêtes soient toutes dirigées dans la même direction.
Pipelines de données d'apprentissage automatique pour une architecture de science des données
Une architecture de science des données jette les bases d'une meilleure expérience utilisateur et d'ensembles de données produit .
Une tendance qui a toute une foule de gourous passionnés de la sémantique est le développement de bibliothèques qui rendent l'apprentissage automatique plus accessible que jamais. Les bibliothèques qui automatisent davantage la création de pipelines de données d'apprentissage automatique sont TPOT et AutoML/auto-sklearn. Les données et les algorithmes sont l'épine dorsale de l'apprentissage automatique qui produit des résultats intelligents.
Lorsque l'on s'attaque aux concepts initiaux de l'apprentissage automatique, on peut être plein d'émerveillement comme si tout était magique. En réalité, c'est bien plus qu'un simple « dans les données ; joyaux prédictifs des résultats. Il y a beaucoup de logique qui s'y applique. Données filtrées, algorithmes, apprentissage en profondeur et modèles créés en traitant les données via les algorithmes.
Si votre activité consiste à tirer des informations exploitables à partir de données via l'apprentissage automatique , cela aide le processus à ne pas se perdre dans l'émerveillement. Plus vous le comprendrez, mieux vous serez en mesure de transformer les données en prédictions utiles, et plus elles seront puissantes pour augmenter les flux de revenus. Les modèles d'apprentissage automatique stockent les données stockées applicables, ce qui oblige les entreprises à trouver un moyen de gérer ces fichiers de données volumineux.
Cependant, l'interprétation des résultats des tâches de modélisation prédictive et l'évaluation appropriée des résultats nécessiteront toujours une certaine quantité de connaissances. Les outils qui aident à récolter et à donner un sens aux données ne remplacent pas les experts humains dans le domaine, mais ils semblent habiliter un public plus large d'individus qui détestent les détails dans le domaine de l'apprentissage automatique.
L'architecture et l'analyse des mégadonnées structurées
Schema informe les moteurs de recherche de ce que vos données « signifient », pas seulement de ce qu'elles « disent ».
Il n'est peut-être pas nécessaire de dépenser des fonds pour évaluer les logiciels de « mégadonnées » à des fins d'analyse. Cela peut être utilisé pour améliorer votre architecture de science des données. Étant un mot à la mode lié à la puissance de calcul et aux capacités de stockage, le big data se rapporte à un grand ensemble de données ou à une série d'ensembles de données qui peuvent fournir des informations essentielles sur ce que les visiteurs du site préfèrent. Cependant, il ne s'avère pas souvent qu'il offre une plus grande probabilité d'analyse réussie ou qu'il donne à un spécialiste du marketing numérique la capacité de parvenir à une conclusion exploitable.
Pendant des années avant que le « Big Data » ne devienne une partie de notre langage commun, les statisticiens échantillonnaient avec succès à partir des données de la gamme de produits et utilisaient des tests d'échantillonnage pour déterminer de meilleures décisions marketing. Lors des tests, les valeurs alpha et bêta peuvent être très faibles même avec de petits échantillons de données (n> 30) si la question de collecte et de recherche est bien conçue et planifiée. Aujourd'hui, vos données sont si essentielles pour les entreprises en ligne que même une petite entreprise a besoin de disposer de données connectées pour un référencement efficace .
Que vous externalisiez votre référencement ou que vous le rameniez en interne, votre objectif d'utilisation de « mégadonnées » ou de petits échantillons de données doit d'abord être identifié. Des cadres tels que Hadoop, Cassandra et Spark sont facilement disponibles lorsque votre entreprise a atteint un état où la modification d'un grand nombre d'ensembles de données a du sens. Les entreprises qui ont d'abord investi dans une architecture de site à la pointe de la technologie ont généralement l'avantage de disposer d'ensembles de données plus clairs. Acquérir les compétences d'un SEO ou d'un data scientist soucieux du détail est devenu un avantage concurrentiel direct pour les entreprises.
Data Services permet à toute entreprise de faire évoluer facilement son approche des données en la plaçant au cœur de son activité. Tout le monde réussit : les développeurs Web adorent inventer de nouvelles expériences numériques, les spécialistes des données sémantiques peuvent découvrir des tendances d'utilisation nouvelles et inattendues, les architectes de données peuvent mélanger les sources de données traditionnelles avec de nouvelles.
La technologie affecte les avantages et les coûts de vos données liées
Selon la norme XBRL US Business Data Reporting Standard, c'est-à-dire les avantages et les coûts des données structurées, « les données qui peuvent être interprétées sans ambiguïté par un ordinateur peuvent l'être automatiquement ». Sa mission est de favoriser l'engagement d'informations commerciales publiques dans un format standardisé. La technologie choisie pour structurer vos données pourrait affecter les avantages et les coûts qui y sont associés. Élaborez un plan solide à l'échelle de l'entreprise afin qu'il puisse être facilement extrait, consommé et analysé.
Certains défis auxquels les entreprises sont confrontées pour les ensembles de données Google, les données liées et le Web sémantique s'adaptent assez rapidement aux nouveaux outils et processus. Le développement de riches graphes de connaissances d'entreprise est l'endroit où vous pouvez tirer parti des technologies de données liées en créant un modèle de connaissances basé sur des normes de votre domaine. Il est plus difficile pour les petits sites ou les nouveaux sites commerciaux avec une autorité de domaine relativement inférieure de gagner dans les SERP lorsqu'ils doivent deviner quel contenu les visiteurs veulent le plus. Cela souligne pourquoi un processus cohérent de lecture de vos données peut conduire à un contenu de qualité afin, à plus long terme, de fournir les meilleures informations.
Les utilisateurs mobiles consomment le contenu en ligne différemment de la lecture et des ventes attribuées aux utilisateurs de bureau. Nous avons vu émerger une conception Web adaptative avec des développeurs prenant en compte les différents modèles d'utilisateurs par appareil. Alors que les attentes des acheteurs numériques en matière de consommation de contenu facile continuent de dépasser les modèles actuels, le moyen le plus évolutif d'y répondre est une conception UX sémantiquement solide et une conservation intelligente par les consommateurs de données machine.
Commençons notre découverte de la façon dont vos données peuvent devenir aussi puissantes.
7 étapes pour obtenir des données qui apportent une valeur immédiate à votre entreprise 
Une liste récapitulative de ce qu'il faut pour générer des informations approfondies et apporter une valeur immédiate à votre entreprise grâce à un déploiement simple et précis :
1. PLANIFICATION D'ÉQUIPE :
Commencez par utiliser les meilleures pratiques dans l'architecture de votre site Web. Concevez une structure filaire détaillée avec une approche structurée pour éviter un projet « improvisé ».
Planifiez une hiérarchie avant de développer votre site Web. Cependant, évitez les problèmes rencontrés par certains départements informatiques en utilisant la méthode de développement « en cascade ». Bien qu'il soit bon de spécifier absolument tout, jusqu'à la taille en points de chaque type de police, la longueur de ligne des en-têtes de page et exactement comment une simple galerie de photos fonctionnera, le référencement exige une approche flexible. Et vos données doivent servir à apporter des améliorations continues afin que votre site ne soit pas seulement beau, mais fonctionne pour les utilisateurs et génère des revenus. Votre entreprise peut bénéficier d'informations plus avancées sur l'apprentissage automatique sur le comportement des utilisateurs .
2. DÉVELOPPEMENT DES AFFAIRES ET DU SITE WEB :
Disposez le contenu de chaque page Web d'une manière logique qui crée une expérience utilisateur exceptionnelle. Après avoir planifié l'esthétique visuelle du projet avec les meilleures pratiques SEO fondamentales, il est temps de passer au code. De nombreuses tâches principales sont impliquées ici, telles que la construction de la structure du site, la construction des modèles, l'importation de données, l'actualisation du contenu, le remplissage des lacunes de contenu et l'ajout d'un balisage de données structurées par schéma, etc.
Restez étroitement aligné sur vos objectifs commerciaux finaux.
3. OPTIMISATION DU SITE ET DE LA BASE DE DONNÉES :
Pour aider les moteurs de recherche à comprendre ce contenu, marquez-le avec autant de code de schéma que possible. Si votre site est en cours de refonte, tout le code et les données nécessaires à votre nouveau site doivent être sur le serveur à l'avance afin que l'optimisation SEO de base puisse être effectuée à l'avance. Pour tirer parti des nouvelles opportunités de référencement de données structurées, prévoyez dès maintenant qu'un spécialiste du référencement ajoute continuellement des éléments de balisage.
4. VÉRIFICATION ET CORRECTION :
Un audit des données techniques garantira que les spécialistes du marketing numérique peuvent surmonter leurs principaux obstacles à la création de contenu. Il conclut qu'un processus basé sur les données est essentiel ** pour publier le bon contenu dont profitent à la fois l'utilisateur et l'entreprise.
Nous utilisons des audits techniques qui se concentrent sur des aspects spécifiques et fournissent un suivi régulier pour identifier et atténuer une structure organisationnelle de site Web faible. Nous pouvons vous aider à examiner vos données Google Webmaster Tools pour mettre à niveau la fonction technique et l'architecture de votre site Web.
5. ANALYSEZ VOS JEUX DE DONNÉES :
L'exploitation des données Google Analytics et d'autres rapports de données pour glaner des informations sur les utilisateurs ouvre la voie à de futures améliorations. Les métadonnées racontent des histoires sur vos données. Au fil du temps, la valeur des bonnes données augmente. Lorsqu'un site Web est à peine praticable et n'offre aucun avantage concurrentiel, il peut en fait ennuyer les clients, laisser une impression négative et décourager les visites de retour. Tirez parti des informations essentielles glanées uniquement à partir de vos données pour prendre en charge le contenu axé sur l'utilisateur.
Un véritable scientifique des données aura des compétences telles que la capacité de manipuler les données à l'aide de quelque chose comme une trame de données dask ou un tableau qui peut lire des colonnes de données dans divers formats, tels que CSV. Le véritable avantage réside dans le fait qu'il peut être enregistré en tant que fichier parquet et utilisé ultérieurement pour les futurs besoins de prétraitement hors cœur. Pour beaucoup d'entre nous, Google 360 Analytics de SEO fait un excellent travail en fournissant des rapports de données plus approfondis que ceux que nous avions auparavant dans notre Google Analytics traditionnel.
Ajoutez un schéma d'examen client approprié pour prendre en charge votre graphique de données .
6. USE ML : base de données de graphes native pour les pipelines d'apprentissage automatique
La gestion des données des entrepôts de données passe du reporting et de l'analyse des événements historiques à la planification des revenus de l'entreprise.
Il fournit également les informations nécessaires pour améliorer l'expérience utilisateur client (CX) en temps réel et les performances du site. À l'avenir, attendez-vous à voir une augmentation du nombre d'entreprises qui commencent à utiliser des données en temps réel et un pipeline ML pour offrir une expérience utilisateur personnalisée à grande échelle.
Ceci est souvent réalisé grâce à des bases de données de graphes natives. Une base de données graphique native utilise la contiguïté sans index pour sillonner des millions d'enregistrements de données avec des temps de réponse inférieurs à la seconde, même si ces requêtes exploitent les données sur plusieurs couches.
Vous pouvez traiter les relations entre des éléments de données graphiques hautement connectés comme des éléments de base de données de première classe pour les pipelines d'apprentissage automatique. Ils créent des composants de pipeline complets avec des propriétés directionnelles et de quantification utilisées par le moteur de base de données de graphes.
"L'analyse augmentée utilisera les capacités de l'IA et de l'apprentissage automatique pour traiter automatiquement les données rapidement et efficacement, réduisant ainsi le temps nécessaire pour transformer les données en informations. Cela signifie que les analystes passeront plus de temps sur l'analyse des données plutôt que de passer du temps à préparer les données pour l'analyse.
En 2020, les analystes de données devront se tenir au courant des modifications apportées aux lois locales et internationales sur la protection des données en travaillant en étroite collaboration avec les équipes de conformité et les entreprises pour traiter les informations personnellement identifiables avec soin. Avec une prise de conscience accrue de la protection des données et l'accent mis sur celle-ci, les outils d'analyse vont se concentrer sur la protection de la confidentialité et de la sécurité des données personnelles des utilisateurs. » – James E. Powell, directeur éditorial de TDWI
7. PLAN D'AMÉLIORATIONS CONTINUES :
Enfin, mettez en œuvre les bonnes actions révélées par vos données pour mieux engager les utilisateurs. Parfois, la formation de votre équipe interne vous aide à approfondir la gestion et la création de nouveaux contenus, et à mieux vous familiariser avec leurs rapports de données SEO.
Avec l'annotation sémantique, les sources textuelles prennent en charge les attributs de données dont les machines ont besoin pour organiser, faire correspondre et diffuser le contenu Web avec précision et efficacité. C'est un pas en avant vers la révolution des disciplines que nous utilisons pour la gestion de l'information sur les données et une meilleure connaissance des utilisateurs.
Andre Valente, responsable du programme technique chez Google, exhorte les SEO à creuser dans les données de votre console de recherche pour la mise en œuvre de vos données de structure. Il offre une mine de rapports de données qui identifient la façon dont les pages sont reconnues afin que vous puissiez résoudre les problèmes critiques. En approfondissant, il est possible de voir où vos données sont brisées. La qualité de votre balisage impacte directement vos ensembles de données.
Alors, comment allons-nous obtenir les secrets derrière les utilisateurs de notre site et leurs actions ?
Le Data Mining révèle le comportement des internautes
DIVVY HQ a étudié ce qu'il faut pour qu'un spécialiste du marketing numérique surmonte ses principaux obstacles à la création de contenu. Il conclut qu'un processus basé sur les données est essentiel pour que les entreprises restent sur la bonne voie avec leurs objectifs commerciaux de croissance.
Il a constaté que "64 % ont déclaré que le développement d'une stratégie de contenu complète est un défi majeur, tandis que 46 % ont déclaré qu'il était également difficile de s'assurer que les idées de contenu s'alignent sur la stratégie. Pour compléter le top 3, 42 % des répondants ont indiqué qu'ils gardaient leurs données et leurs idées organisées.
Pour ajuster votre contenu Web pour un meilleur clustering basé sur les produits, vous devez d'abord vous faire une idée de vos préférences de comportement d'utilisateur. Une fois que votre entreprise a créé des profils de clients détaillés, il est plus facile de faire des prédictions sur ce qui stimule les ventes et sur la valeur à vie de chaque client. Vos données structurées sont essentielles pour prévoir ce qui affecte votre ligne d'objet, le moment des nouveaux messages, où et quand publier des articles de presse, le nombre d'e-mails envoyés, si les offres de réduction sont efficaces, etc.
10 avantages d'une approche de science des données
De solides pratiques en science des données permettent aux entreprises de tirer parti du Big Data et d'obtenir des avantages impossibles à obtenir sans elles.
* Boostez l'engagement des utilisateurs sur site
* Taux de désabonnement inférieur
* Améliorer les taux de clics moyens
* Générer des taux de conversion
* Augmentation des revenus des campagnes marketing
* Battez votre concurrence
* Trouver de la croissance de manière innovante en dévoilant de nouvelles opportunités
* Aidez votre entreprise à adopter l'efficacité et l'intégration des données
* Obtenir une infrastructure évolutive prête pour la production
* Accroître la collaboration productive
* Si vous avez plusieurs emplacements, l'expérience utilisateur structurée améliore le marketing de recherche local
Bases de données de graphes et systèmes analytiques
Les systèmes de gestion de bases de données relationnelles classiques SGBDR sont toujours au cœur de nombreuses entreprises qui gèrent leurs données. Cependant, la structure tabulaire d'un tel SGBDR remet souvent en cause certains types d'analyses avancées. C'est une chose de capturer et de stocker des données dans le SGBDR, mais la journalisation et la compréhension des caractéristiques des relations entre vos entités clés peuvent être un casse-tête. Il est préférable d'utiliser une approche structurée du contenu pour accroître l'engagement des utilisateurs .

La mise à jour vers un modèle relationnel comme les bases de données de graphes est un moyen d'obtenir une plus grande flexibilité pour analyser les entités modélisées à la lumière de leurs relations. "Les bases de données de graphes et les systèmes d'analyse, basés sur l'abstraction mathématique des graphes pour représenter la connectivité, s'appuient sur une approche alternative de la représentation des données qui capture des informations sur les entités et leurs attributs et élève les relations entre les entités pour en faire des objets de première classe", selon David Loshin de l'intégrité des connaissances. (das2017.dataversity.net/sessionPop.cfm)
Une architecture de données bien définie offre aux entreprises la capacité de relever les défis du volume de données. Il fonctionne comme une empreinte et des guides pour les projets de données actuels et futurs qui soutiennent les décisions marketing de haut niveau. Si nécessaire, nous pouvons vous aider à mettre en place un plan qui vous aidera à tirer pleinement parti des données de votre site Web.
Prendre les bonnes décisions sur la base des bonnes données
Alors que la recherche personnalisée de Google prend en charge un plus grand pourcentage des résultats de recherche, les référenceurs sont confrontés à de nouveaux défis. Pendant longtemps, le suivi du classement d'un site a été l'un des principaux KPI SEO, qui repose sur la précision des données. Le nouveau fil d'actualité Google est également confronté à la localisation de l'utilisateur, à l'analyse des recherches précédentes et à l'historique du navigateur, ce qui a un impact sur les résultats obtenus par les utilisateurs. La portée de l'exactitude des données elle-même est floue dans le flou. Étant donné que la recherche personnalisée signifie désormais des variations SERP sans fin, par emplacement et comment les utilisateurs basculent leurs paramètres mobiles, la signification de «données précises» semble changer.
Il devient de plus en plus difficile de s'assurer que vos données de classement ne sont pas faussées ou déformées par une forme de personnalisation dont vous n'avez pas été pris en compte. Comment votre équipe marketing peut-elle être sûre de prendre les meilleures décisions sur la base de données précises ?
Les SERP varient pour chaque utilisateur en fonction de son emplacement, ce qui rend plus difficile le suivi précis du classement - mais cela reste important. Tout d'abord, déterminez quels sont vos emplacements cibles, puis sélectionnez un outil de vérification de classement pour suivre les classements individuels. Que vous ayez une entreprise locale de brique et de mortier ou plusieurs adresses physiques, il est nécessaire d'identifier vos emplacements cibles et de suivre chacun d'eux au fil du temps pour générer suffisamment de données à analyser et à faire confiance.
En effectuant des audits de site réguliers , votre entreprise peut prendre les bonnes décisions grâce à des informations basées sur les données.
Conception d'infrastructure du futur : architecture centrée sur les données
Avec une plus grande dépendance à l'apprentissage automatique et aux technologies d'intelligence artificielle, les données sont passées d'un statut important pour les actifs informationnels à un rôle au cœur de l'innovation. Il ne suffit plus d'être axé sur les données - les organisations doivent être centrées sur les données.
Une enquête récente menée par MIT Technology Review à la demande de Pure Storage rapporte que « 86 % des dirigeants déclarent que les données sont le fondement de la prise de décisions commerciales, tandis que 87 % disent qu'elles sont essentielles pour fournir des résultats aux clients ». Dans son article du 24 mai 2018, Inside Big Data aborde ensuite les défis auxquels les entreprises sont confrontées en utilisant les données à bon escient. 79 % déclarent qu'il est difficile de s'assurer que l'entreprise utilise des sources de données pertinentes.
Présenter d'abord les concepts clés et le contenu
Les robots de recherche et les utilisateurs n'aiment pas qu'il faille trop de clics pour atteindre une page à partir de votre page d'accueil. Il est préférable d'avoir des structures de liaison horizontales ou une «architecture de site mince» plutôt qu'une structure verticale profonde. Bien qu'une fonction de recherche interne puisse être utile, si les utilisateurs doivent s'y fier souvent, cela devient un indicateur clair qu'il est difficile d'aller plus loin dans le site ou de trouver votre contenu.
Recherchez ensuite les extensions à un stade de développement utilisable qui contribuent à rendre ce contenu principal largement disponible pour les robots de recherche et l'apprentissage automatique.
• Si vous êtes dans l'industrie automobile et que vous avez plusieurs magasins locaux, utilisez auto.schema.org pour différencier les emplacements d'adresses pour les chercheurs locaux.
• Pour les ressources bibliographiques et lorsque vous avez besoin du secteur des bibliothèques, utilisez bib.schema.org
• Pour l'Internet des objets (IoT), essayez iot.schema.org
• Les sites du créneau médical peuvent sourcer health-lifesci.schema.org
• Suivez fibo.schema.org (un nom en attente) si votre créneau est le secteur financier
Examinez attentivement la quantité et la qualité de vos données d'entrée. Les algorithmes d'apprentissage automatique ont d'énormes «appétits de données» nécessitant souvent des millions de points de données pour atteindre des niveaux de performance acceptables. Combiné, avec les biais des scientifiques des données dans la collecte de données, il peut être considérablement réduit. Beaucoup dans le créneau médical dépensent des ressources gigantesques pour accumuler des niveaux suffisants de données impartiales de haute qualité pour alimenter leurs algorithmes et les données existantes dans les dossiers de santé électroniques (DSE). Si vous appartenez à ce créneau, une approche basée sur les données des listes d'entreprises Google des sites de soins de santé est essentielle. Intégrez les avis de vos patients sur votre site Web à l'aide du balisage du schéma d'avis.
Les National Institutes of Health (NIH) affirment que « l'apprentissage automatique ne résout aucun des problèmes fondamentaux de l'inférence causale dans les ensembles de données d'observation. La médecine clinique a toujours exigé que les médecins traitent d'énormes quantités de données, de la physiologie et du comportement au niveau macro aux études de laboratoire et d'imagerie et, de plus en plus, aux données «-omiques». La capacité à gérer cette complexité a toujours distingué les bons médecins. L'article du 9 septembre 2016 intitulé Predicting the Future — Big Data, Machine Learning, and Clinical Medicine souligne qu'en fin de compte, les données doivent être analysées, interprétées et mises en œuvre.
Blueshift classe la science des données en temps réel et actionnée comme la tendance numéro 1 du marketing de croissance pour 2017. « Les données sont la pierre angulaire, le fondement de l'identité et du comportement des clients qui alimentent les modèles d'apprentissage automatique et diverses applications marketing. En tant que spécialistes du marketing de croissance, nous cherchons à actionner ces données de plus en plus rapidement. Les informations sont excellentes, cependant, nous avons besoin de moyens de découper les données manuellement et automatiquement pour vraiment affecter nos résultats », déclare Uruba Niazi.
Le Web sémantique constitue des entités de données communes et des connaissances exploitables
Le Dr Mirek Sopek, fondateur de l'agence de solutions numériques MakoLab SA, est le président de sa division R&D orientée Web sémantique. De plus, en tant que président de Chemical Semantics Inc., son expérience est vaste dans le Web sémantique. Lors de l'événement Enterprise Data World 2017 Conference, il a énuméré comment il englobe les entités de données communes, les actions et l'intersection de leurs relations.
Les principaux sites commerciaux d'aujourd'hui découvrent qu'un avantage de pointe dans la recherche est possible grâce à une connaissance approfondie du cadre opportun de schema.org pour créer et fournir des ontologies spécifiques à un créneau, une sous-classe d'ontologies de domaine, et pour incarner des concepts essentiels au schéma d'un secteur donné. Vous pouvez utiliser schema.org dans tous les domaines, pour n'importe quelle langue.
À ce jour:
* Il contient plus de 2 000 termes, 753 types, 1 200 propriétés et 220 énumérations.
* Schema.org couvre les entités, les relations entre les entités et les actions.
* Environ 15 millions de sites utilisent Schema.org.
* Des analyses aléatoires mais représentatives (Web Data Commons) montrent qu'environ 30 % des URL sur le Web renvoient une forme de triplets à partir de schema.org.
Tout comme une page de produit individuelle doit être correctement imbriquée sous une page contenant tous les produits vendus, votre schéma de produit doit également être organisé et imbriqué de manière structurée.
Architecture de science des données : ingérez, traitez, stockez et analysez vos données
Après avoir lu plusieurs articles sur le blog Google Cloud et Machine Learning, j'ai déménagé sur mon site vers Google Cloud Platform (GCP) plus tôt cette année. Je suis sur un parcours d'apprentissage passionnant en acquérant une expérience de première main sur son utilisation pour obtenir de meilleures données pour prédire l'intention de l'utilisateur . Un article qui m'inspire, publié le 21 février 2017 par Lorenzo Ridi, est Adding machine learning to a serverless data analysis pipeline .
C'est un exemple fascinant de la façon dont une entreprise, ACME, a utilisé plusieurs composants GCP pour créer un pipeline d'analyse de données sans serveur, puis a mélangé des fonctionnalités d'apprentissage automatique pour l'analyse des sentiments via une API REST hautement consommable. Il adhère à un processus simple qui engage un modèle commun dans les projets d'analyse de données en temps réel. Vous reconnaîtrez cette séquence de flux de données : ingérez, traitez, stockez et analysez vos données.
Il nous a fallu des mois pour choisir parmi Amazon Web Services, Google Compute Engine, Microsoft Azure et autres. Jusqu'à présent, nous constatons que la mise à l'échelle à la demande sur le GCP génère des économies par rapport à notre ancien hébergeur Web tout en offrant une agilité opérationnelle supplémentaire pour nos besoins de traitement des données.
Lorsque vous décidez d'une pratique Data Science (DS) dans votre organisation, même les environnements de données complexes bénéficient toujours de la méthodologie Keep It Simple Stupid (KISS). Bien qu'il soit possible d'exécuter votre architecture de science des données exclusivement à partir de vos machines internes, à un moment donné, la plupart des entreprises constatent que cela ne s'adaptera pas aux besoins.
Explorez les données de votre console de recherche pour la mise en œuvre de vos données structurées. Il offre une mine de rapports de données qui identifient la façon dont les pages sont reconnues afin que vous puissiez résoudre les problèmes critiques. En approfondissant, il est possible de voir où vos données sont brisées. La qualité de votre balisage impacte directement vos ensembles de données.
Recherche par mot-clé de bases de données relationnelles
Nous comptons souvent sur Ahrefs car il exploite deux index de mots-clés indépendants qui nous aident à évaluer de grandes quantités de données pour les décisions de marketing de recherche. Il s'agit d'une plus grande source de données de 4,6 milliards d'index de mots-clés et de phrases de recherche idéales pour étudier les modèles de recherche des internautes lors de l'utilisation de son explorateur de mots-clés. Son secondaire se compose de 429 millions et est l'une de nos sources de référence pour rechercher les requêtes de recherche pour lesquelles un site se classe dans les résultats de recherche organiques, cette fois en utilisant Site Explorer d'Ahref .
Google Cloud Data Extended à des fins d'audit
Une annonce du 21 août 2017 indique que "la période de conservation de tous les journaux d'audit des activités d'administration de Google Cloud Platform (GCP) passera à 13 mois (à partir de la période de conservation actuelle d'un mois) pour tous les journaux reçus à compter du 12 septembre 2017. ”.
Cette augmentation de la rétention est limitée aux journaux d'audit d'activité GCP, qui se trouvent dans Stackdriver Logging and Activity Stream et sont disponibles pendant un total de 400 jours. "Tous les autres types de journaux continueront d'être conservés pendant 7 jours dans le niveau de base et 30 jours dans le niveau Premium", indique l'annonce. L'intention de Google est de faciliter à la fois la conformité des données et l'exécution des audits. Les journaux d'audit d'activité sur GCP à compter du 12 septembre 2017 seront stockés et prêts pour une utilisation de 13 mois dans Stackdriver Logging.
Si votre entreprise pose les mauvaises questions à partir de vos données, un temps précieux avec des heures limitées dans votre journée de travail pour utiliser efficacement vos données peut être perdu. Au lieu de cela, responsabilisez votre Assistant Google en répondant aux questions que les consommateurs posent le plus souvent. Votre entreprise peut définir les bons KPI et savoir quelles questions poser lors de l' analyse des résultats de la recherche mobile . Hill Web Marketing veille à ce que vous trouviez des réponses exploitables, hiérarchisées et pertinentes.
Bases de données relationnelles
Personnalisation et expérience utilisateur : libérez le potentiel de vos données, écoutez le comportement des consommateurs et ciblez les besoins non satisfaits.
Les gestionnaires de campagnes SEO et SEM sont généralement plongés dans des graphiques, des statistiques et des rapports détaillés qui les aident à effectuer une analyse des données. Offrir cela aux autres d'une manière facile à examiner aide tout le monde dans une organisation à mieux comprendre le marketing relationnel.
Avec le Big Data qui devrait faire grimper les dépenses technologiques des entreprises à un niveau supérieur à près de 242 milliards de dollars selon Gartner, l'exploitation des données de requête est là pour rester et, par conséquent, de plus en plus d'entreprises de toutes tailles se lancent dans les données de bases de données relationnelles. Pour de nombreuses entreprises, les modèles d'apprentissage automatique sont un atout stratégique. Chaque client, partenaire commercial, fournisseur, transaction, défection, panier abandonné, paiement refusé et réclamation existants peut fournir à votre entreprise une mine de données relationnelles dont vous pouvez tirer des enseignements. Cela augmentera votre capacité à répondre à plus de questions dans les SERPs immédiats . Du point de vue de l'individu utilisant Internet, chaque demande tapée ou activée par la voix, chaque vente conclue, les informations sur les produits demandées, les médicaments prescrits recherchés et les anomalies environnementales sont suivies et intégrées dans des graphiques de bases de données par quelqu'un.
Les bases de données relationnelles fournissent un moyen communément accepté de stocker et d'accéder à de vastes ensembles de données. Machine Learning Practitioner Jason Brownlee says, “Internally, the data is stored on disk can be progressively loaded in batches and can be queried using a standard query language (SQL). Free open-source database tools like MySQL or Postgres can be used and most (all?) programming languages and many machine learning tools can connect directly to relational databases”.
For an easier approach, he recommends first experimenting with SQLite. There are many examples and conversations on GitHub on how to read and manage data files. Or consider reaching out to Brownlee for computer science-related questions. What everyone does agree on is that your site's composite architecture and the data you gain when someone visits it is growing in importance. It helps if you see your data in a new light; it is rich with insights on you can be more customer-focused.
Your Evergreen Content Needs to Becomes More Personal and Compelling
The future of digital marketing is not like it was yesterday. Today you can win best in organic search with the best evergreen content in your niche . Businesses must create a lasting and meaningful relational bridge with consumers that proves mindfulness of their shopping preferences and builds loyalty among their clientele.
Content is no longer simply words on a web page. Today, it must be richer, better than your competition, better prepared for visual search with items like videos, slides, meaningful white papers, infographics, etc. Then they can become entities that add richness to your Knowledge Graph .
We have evolved to a new form of content marketing that requires using personalized marketing technology to deliver the right content to the right person with compelling responsive web pages, mobile apps, in paid search Ad copy, and more. It is pretty tough to reach the ideal consumer at the ideal time with the ideal message without data science technology to get it done.
You can use your data to tell the future. No, it is not guesswork nor is it mystical. Semantic search, based on machine learning, is the contemporary science of finding consumer patterns and making predictions from data drawn from multivariate statistics, data mining, pattern recognition, and sophisticated predictive analytics. It lets you anticipate what your prospective buyers want and need even before they think of it.
Semantic Big Data Analysis
People, like you and I, probably many times a day, use contextual clues surrounding the words and phrases we read to better understand the implied or practical meaning of what is said. That's semantic analysis (SA). As human beings, we do this intuitively, efficiently, and often without a conscious effort. We sort out the context surrounding a word, phrase, image, or situation, pull out what seems most relevant, compare that to our past experiences, and use them to determine our take on the content at hand. Proper UX Design for e-Commerce resolves technical issues that may otherwise be missed.
Machines have historically performed poorly at this because they were deficient of that filter. They must decipher what is relevant and why a different way. Advances in Machine Intelligence and Natural Language Processing (NLP) have dramatically improved deep semantic analysis. Without our human intuition, they lean heavily on advanced algorithms, computers, and a lot of data collection and crunching.
The number of relational data patterns machines can determine and how well they can connect the relationships determines the relevance of the data. That relevance is both the goal and the unit of measure when it comes to Semantic Big Data Analysis. If your business can understand the content, intent, and user behavior at a deep level, you can provide more relevant content and thereby create a more resonant user experience.
Two Major Challenges for Reliable Linked Data
1. Business leaders often struggle to take the time to become sufficiently informed to understand the value of the latest advances in linked data technologies.
2. The cost of updating to newer data systems across large enterprises is often organizationally complex, time-consuming, and costly. One has to find sufficient promise in a data upgrade to believe that real-life problems they are currently facing can be fixed by deploying linked data technologies.
A practical business application for pages with referential information – If your data shows that a great post is dropping from consumer interest, in the event of related breaking news, this content with referential information might be bumped from their original rankings in favor of breaking news. So updating your existing post or a page to include current information about what's happening might be a good way to keep the post live.
Data Products created by Data Science Teams
Data products fueled by machine learning and Artificial Intelligence may source prevailing methods of solving users' needs that outpace your competition. Give data science teams a role in your decision-making processes. This can balance and liven up different roles in the organization. Having data science leaders involved in product and business strategy discussions accelerates data product development. It creates a co-operative effort that successful semantic search strategies and implementation strong> and visual search require.
”The lifecycle of a so-called “data product” mirrors standard product development: identifying the opportunity to solve a core user need, building an initial version, and then evaluating its impact and iterating. But the data component adds an extra layer of complexity. To tackle the challenge, companies should emphasize cross-functional collaboration, evaluate and prioritize data product opportunities with an eye to the long-term, and start simple.” – Emily Glassberg Sands on Harvard Business Review
“Data science today is fundamentally different from what it was before. Over the past year, machine learning has gone mainstream. Gartner forecasted the growth of predictive analytics by $1.1 billion in two years and scientists have been using deep learning algorithms everywhere from medicine to space exploration.” – Altexsoft
“Think of content writing as sowing seeds of collaboration, of business, of exchange. Think of text that communicates messages and values in a conversational, ready to engage in a dialogue way. Think of data as one of your best friends, think Vision vs Data.+ – Theodora Petkova
“Data is becoming the currency of marketing, and marketers will now have access to more data than ever…marketers will be able to use data to create more personalized and targeted products, messages, and customer engagements than ever before.” – Steve Fund, CMO of Intel
The bottom line is that you need to know what people prefer, their preferences, if your site's architecture and categories helping them find solutions, and how to improve. It is called customer-centric marketing . We can help you explore your data in more detail and then design content to answer the questions they ask and that fit how algorithms link a search query to the best content.
SOMMAIRE
If you need a proven set of services from a digital strategy and site architecture, Google analytic data mining set-up , data science, managed services and on-site training, Hill Web Marketing can help your company turn your big data challenges into tangible business outcomes.
Our experts can easily work in partnership with your development team to find advanced and valuable solutions that drive business outcomes faster.
Call Jeannie Hill at 651-206-2410. We love helping others build a more successful business. We can help you increase your online sales, attract more clients and Boost Your Revenue Profit Margins
* https://machinelearningmastery.com/large-data-files-machine-learning/
** https://divvyhq.com/2017-content-planning-report/