كيفية استخدام Google Dataset Search for Dataset Schema
نشرت: 2019-10-01بحث Google Dataset: كيفية استخدام مخطط مجموعة البيانات لطلبات البحث
تم التحديث في 12.6.2021
مع الكميات المتزايدة من البيانات الرقمية ، يواجه استراتيجيي التسويق عبر البحث حاجة متزايدة لفهم البيانات.
بدأت العديد من تطبيقات قواعد البيانات المتقدمة في دعم بحث قاعدة بيانات Google. بالإضافة إلى ذلك ، تمت إضافة تقارير جديدة لـ SEO إلى Google Search Console في سبتمبر 2019 لفهم بياناتهم بشكل أفضل. يتم اكتساب الكثير من خلال دمج المعرفة على مستوى المجال المشفرة على أنها علم الوجود في استعلامات حول البيانات العلائقية. مع الكثير من الحديث عن مُحسّنات محرّكات البحث ، يجد المسوقون عبر شبكة البحث صعوبة أكبر في فرز الحقيقة من الخيال ، وضارًا من تكتيكات تحسين محركات البحث المفيدة ، والاختبار الحقيقي مقابل الحديث فقط.
يعد الاعتماد إلى حد كبير على تجارب التسويق عبر البحث السابقة والحدس أمرًا لطيفًا ، ولكنه غير صحيح في كثير من الأحيان. أثبتت القرارات المتأثرة بالبيانات أنها أفضل باستمرار مما "أخبرني حدسي بذلك". توفر العديد من أدوات رؤى البيانات مثل Google Analytics أدلة داعمة فعلية ، ولكن الآن أصبح تحديد موقع مجموعات بيانات Google Cloud العامة أسهل من أي وقت مضى.
ما هو بحث Google Dataset؟
الصورة الكبيرة السريعة هي أن Google Data Search يعتمد على موفري مجموعات البيانات ، كبيرة كانت أم صغيرة ، مضيفًا بيانات وصفية منظمة داخل مواقع الويب الخاصة بهم باستخدام معيار schema.org/Dataset المفتوح. يمكّن Google Dataset Search الباحثين من تحديد مجموعات البيانات المخزنة عبر الويب من خلال عمليات البحث بعبارات بحث محددة. وفقًا لـ Google ، تعرض الأداة معلومات حول مجموعات البيانات المستضافة في آلاف المستودعات عبر الويب ، مما يجعل مجموعات البيانات هذه مفيدة ومتاحة عالميًا.
من خلال الوصول إلى مجموعات البيانات العامة عالية الطلب والتي تتعلق بمكان عملك ، يمكنك الكشف عن رؤى جديدة للمستهلكين من البيانات السحابية. من خلال تحليل مجموعات البيانات الإضافية المستضافة في BigQuery و Cloud Storage ، يكون من الأسهل تجربة القيمة الكاملة لـ Google Cloud .
صحفيو البيانات معتادون بالفعل على الحصول على البيانات الحكومية ومجموعات البيانات للعلوم الاجتماعية. ستساعدك هذه المقالة في إنشاء خط أساس وإعداد إطار عمل يعتمد على البيانات لقياس تقدمك الرقمي والاستفادة من أحدث فرص ترميز مخطط Google.
يُعرف البحث في مجموعة البيانات في Google كنوع من محركات البحث التي أطلقتها Google بهدف مساعدة العلماء في العثور على البيانات التي قد يحتاجون إليها. يسعى مسوقو البحث إلى الاستفادة من مجموعات البيانات بشكل أكبر.
هل تعمل مجموعات البيانات على تبسيط ذكاء البيانات وعلم الوجود المعقدة؟
نعم. من الأسهل تحديد مجموعات البيانات عند ترميز معلومات الدعم مثل اسم الموفر ووصفه ومنشئه وتنسيقات التوزيع ببيانات منظمة. تعمل Google على تسهيل اكتشاف مجموعة البيانات من خلال schema.org ومعايير البيانات الوصفية الأخرى التي يمكن إضافتها إلى محتوى الويب الذي يصور مجموعات البيانات.
بمجرد أن تنشئ Google فهرس مكتبتها ، فإنها تبدأ في الرد على استفسارات المستخدم - وتحديد أفضل النتائج التي تتوافق مع استعلام كل شخص ، منطوقًا أو مكتوبًا.
"من الصعب للغاية التعبير عن استفسارات مقابل الأنطولوجيا المبنية على الرسوم البيانية في لغة استعلام SQL العلائقية أو امتداداتها. علاوة على ذلك ، عادةً ما تكون الاستعلامات الدلالية غير دقيقة ، لا سيما عندما تكون البيانات والأنطولوجيا المرتبطة بها معقدة ".
لا يحتاج المستخدمون حتى إلى معرفة تمثيل الأنطولوجيا. كل ما هو مطلوب هو أن يعطي المستخدم بعض الأمثلة التي ترضي الاستعلام الذي يدور في ذهنه. بعد ذلك ، يبحث نظام Google تلقائيًا عن إجابة الاستعلام . في هذه العملية ، تظل الدلالات ، وهو مفهوم يصعب التعبير عنه عادةً ، كمفهوم في ذهن المستخدم ، دون الحاجة إلى التعبير عنها صراحةً بلغة الاستعلام. - مستند Google التقني: الاستعلامات الدلالية حسب المثال *****
هذا يمثل فرصة. النماذج المدربة مسبقًا على مجموعات بيانات ضخمة متاحة لأي شخص يقوم ببناء معالجة لغة طبيعية. من فهم القراءة إلى تحليل المشاعر إلى BERT ؛ يتمثل اتجاه البحث الرئيسي في صعود التعلم الانتقالي في البرمجة اللغوية العصبية.
أصبح تطور دور المسوق البحثي أكثر تعقيدًا مع الحاجة المتزايدة لهضم البيانات. يعد إنشاء مجموعة البيانات الخاصة بك شكلاً من أشكال تحسين محركات البحث الإيجابية التي يمكنها الاعتماد على الأدبيات الأكاديمية. قد تكون إعادة التفكير في كيفية تطبيق بيانات صورتك على مستوى أوسع مكانًا للبدء. سيساعد هذا الأنظمة القابلة للتطوير في تحديد المسارات القصيرة داخل الرسم البياني للارتباط وشبكة ارتباط الويب. من المحتمل أن تساعد Google عند إعادة الزحف إلى خريطة الارتباط الخاصة بموقعك وإعادة حسابها.
"عند وصف مجموعات البيانات المعبأة ، على سبيل المثال التي تم نشرها في مستودعات" البيانات المفتوحة "العلمية أو الأكاديمية أو الحكومية ، يمكن استخدام نوع مجموعة البيانات ، جنبًا إلى جنب مع DataCatalog للإشارة إلى المجموعة الكلية وتنزيل البيانات لتمثيلات محددة لمجموعة البيانات." - البيانات ومجموعات البيانات - schema.org
خطوات إضافة مخطط مجموعة البيانات
- أولاً ، اقرأ ترميز وثائق مجموعة البيانات لمعرفة كيفية إضافته إلى المجال الخاص بك مقابل ملف DCAT واحد.
- بعد ذلك ، أضف إلى مجموعتك من مقتطفات البيانات المنظمة بتنسيق ترميز JSON-LD المفضل من Google ؛ استخدم نوع مخطط مجموعة البيانات.
- اختبر تنفيذ مجموعة البيانات باستخدام أداة اختبار البيانات المنظمة من Google.
- أخيرًا ، أرسل عناوين URL الخاصة بك في خريطة موقع تخبر Googlebot بالبدء في الزحف إلى صفحات مجموعة البيانات.
ملاحظة: تقبل Google الترميز بتنسيق DCAT. يهدف مخطط مجموعة البيانات من Google إلى إظهار مجموعة من المعلومات المنظمة التي تصف بعض المعلومات المنظمة. إنه يعمل إما على إدخال بيانات منظمة JSON إما في الجسم أو الرأس.
مجموعات بيانات Google باستخدام كود JSON-LD ومفردات المخطط
ما هو محرك بحث مجموعة بيانات Google؟
محرك بحث Google Dataset هو عندما يقوم المستخدم بإشراك Google لمحاولة تحديد موقع البيانات المتاحة للجمهور على الإنترنت. يهدف Google Dataset Search إلى العمل جنبًا إلى جنب مع Google Scholar ، محرك بحث الشركات للدراسات الأكاديمية والبحوث والتقارير.
تعمل التغييرات الأخيرة التي تم إجراؤها على صفحة وثائق مجموعات بيانات Google على تحديث طريقة طرح البيانات المنظمة لمجموعات البيانات لمشرفي المواقع وتحسين محركات البحث والناشرين في النتائج المنسقة في بحث Google. إنها تختلف عن الطريقة الشائعة التي نستخدم بها Schema.org ، يمكن أن يكون مخطط مجموعة البيانات بتنسيقات عشوائية أو يمثل إحصائيات مجمعة.
يوضح آرون أن Google أسقطت رمز المخلب في الإشعار بنجمة ، والذي قال: "يشير إلى أن نشر النتائج المنسقة لمجموعة البيانات وشيك."
لماذا يجب عليك ترميز مجموعات البيانات الخاصة بك باستخدام المخطط؟
غالبًا ما تشعر تجربة العميل المثالية بأنها بعيدة المنال. ليس من السهل تخطيط رحلة العميل وفرز أكوام سلاسل البيانات الرقمية. يتطلب الأمر أكثر من مجرد الحصول على العرض المناسب للعميل المناسب. يبدأ بأوقات الشراء ، والقناة الرقمية ، وجمع البيانات من العروض السابقة ، وأحيانًا أكثر من ذلك. انتقلت إدارة البيانات من التفكير التكتيكي في شراء الوسائط إلى كيفية تنفيذ الرؤى الإستراتيجية الصحيحة التي تقع في صميم تجارب عملاء المؤسسة التي تبني ثقة العلامة التجارية.
يمكن فهم المحتوى الخاص بك ومطابقته واستخدامه بشكل أفضل للحصول على إجابات وحلول. يستفيد مخطط مجموعة البيانات من نهج التعلم الآلي لمعالجة الاستعلامات الدلالية في قواعد البيانات العلائقية. في معالجة الاستعلام الدلالية ، تتمثل العقبة الأكبر في توفير بيانات وجودية دقيقة في شكل علائقي بحيث يمكن لمحرك قاعدة البيانات العلائقية معالجة الأنطولوجيا بطريقة تتماشى مع معالجة البيانات.
مجموعات البيانات التي تم ترميزها بالمخطط يسهل على الآخرين تفسيرها ، وكذلك لمحركات البحث لفهم البيانات بشكل أفضل. يساعدهم هذا في ترجمة هذا الفهم إلى رسوم توضيحية مرئية لبياناتك.
تقول Google إنه يمكن استخدام مجموعات البيانات لهذه الحالات:
- جدول أو ملف CSV به بعض البيانات
- مجموعة منظمة من الجداول
- ملف بتنسيق خاص يحتوي على بيانات
- مجموعة من الملفات التي تشكل معًا مجموعة بيانات ذات معنى
- كائن منظم يحتوي على بيانات بتنسيق آخر قد ترغب في تحميله في أداة خاصة للمعالجة
- التقاط الصور للبيانات
- الملفات المتعلقة بالتعلم الآلي ، مثل المعلمات المدربة أو تعريفات بنية الشبكة العصبية
- أي شيء يشبه مجموعة بيانات بالنسبة لك
وجدنا بعض مجموعات البيانات الضخمة. من الأفضل إبقائها بسيطة. توصي Google "بقصر جميع الخصائص النصية على 5000 حرف أو أقل. يستخدم "بحث مجموعة البيانات من Google" أول 5000 حرف فقط من أي خاصية نصية. عادةً ما تكون الأسماء والعناوين بضع كلمات أو جملة قصيرة ".
كيفية تحديث بياناتك بقواعد بيانات علائقية آمنة وموثوقة
تجمع قاعدة البيانات العلائقية البيانات وتضمينها في جداول وأعمدة والتي تنظم وتؤكد العلاقات بين البيانات. قواعد البيانات العلائقية مخصصة للبيانات المنظمة والمتصلة. يعرّف Webopedia قواعد البيانات العلائقية بأنها قادرة على "التعيين لتحديث البيانات تلقائيًا إذا تم تحرير مثيل واحد منها أو تغييره ؛ ستتلقى البيانات الأخرى ذات الصلة تحديثات في الوقت الفعلي. غالبًا ما يستخدم الأشخاص قواعد البيانات العلائقية وأنظمة إدارة قواعد البيانات العلائقية (RDBMS) بالتبادل ".
يساعد هذا الشركات على بناء حلول البيانات باستخدام البنى الحديثة واكتساب رؤى ذكية للأعمال في الوقت الفعلي لتلبية هدف المستخدم بشكل أفضل.
تستخلص نماذج جدول إلى نص المعلومات النصية من البيانات المنظمة 
كن مدفوعًا بالبيانات ومركّزًا على الناس
يساعد الحصول على آلية متسلسلة لاستخراج البيانات على مستوى الحقل في إجراء التصنيف النهائي أو مهمة الانحدار لتقييم ميزات الإدخال الشاملة الخاصة بك ، عبر تعيينها إلى نوع بيانات بديل.
يمكن أن تساعد تقارير مجموعات بيانات Google ما تعلمته في تعزيز تفكيرك حول مطابقة هدف البحث بشكل أفضل. ابحث في مكتبة البيانات عبر الإنترنت للعثور على ما تحتاجه أو قم بتعيين عالم بيانات. تُعد النتائج المنسقة لمجموعة البيانات مفيدة لعمليات سير عمل البحث والتطوير السريعة التي تساعد على تبسيط تشفير البيانات الأولية إلى رؤى مفيدة. إنها تساعد في إنشاء نهج منظم لبياناتك. تستفيد الشركات من خلال تبسيط عمليات اتخاذ القرار والتوصل إلى نتائج أداء أعلى بشكل أسرع.
"أحد العوامل التمكينية الرئيسية للتقدم السريع في البحث والتطوير هو توافر بنيات الشبكات العصبية الكنسية لترميز البيانات الأولية بكفاءة إلى تمثيلات ذات مغزى. متكاملة مع طبقات صنع القرار البسيطة ، هذه البنى الأساسية عادةً ما تحقق أداءً عاليًا في مجموعات البيانات الجديدة والمهام ذات الصلة بجهد ضبط إضافي صغير. " - التعلم الجدولي اليقظ القابل للتفسير على Google Cloud AI
ما الذي تغير في Google Dataset Search Beta؟ 
في السابق ، ذكرت مستندات Google أن: "ترميز مجموعة البيانات متاح لك لتجربته قبل طرحه للتوافر العام" وحذرت من أنه بينما يمكنك استخدام أداة اختبار البيانات المنظمة للتحقق من الصحة ، فإنك "لن ، ومع ذلك ، يمكنك مشاهدة مجموعات البيانات الخاصة بك تظهر في البحث ". بالنسبة لأولئك الذين انتظروا حتى يتم طرح هذا ، فإن إضافة البيانات المنظمة لمجموعة البيانات إلى موقعك يمكن أن تساعد في قياس تحديات الجوال ومواصفات الممتلكات. يدعم Google Dataset Search الباحث العلمي من Google ، محرك بحث الشركة التقنية للدراسات الأكاديمية والتقارير المستندة إلى الحقائق.
في 23 كانون الثاني (يناير) 2020 ، صرحت Natasha Noy من Google بأن "Dataset Search قد فهرس ما يقرب من 25 مليونًا من مجموعات البيانات هذه ، مما يمنحك مكانًا واحدًا للبحث عن مجموعات البيانات والعثور على روابط إلى مكان البيانات. على مدار العام الماضي ، جربه الأشخاص وقدموا تعليقات ، والآن أصبح Dataset Search رسميًا خارج الإصدار التجريبي ".
تخبرنا مقالة اكتشاف الملايين من مجموعات البيانات على الويب أن معظم الحكومات في العالم تنشر بياناتها وترميزها باستخدام schema.org. "الولايات المتحدة تتصدر عدد مجموعات البيانات الحكومية المفتوحة ، بأكثر من 2 مليون."
هذا يعني أن باحثي السوق يتمتعون بوصول أفضل إلى البيانات أكثر من أي وقت مضى في تاريخنا الرقمي.
يمكن لمجموعات البيانات إدارة كل محتوى موقعك
بمجرد أن يتم جمع البيانات النظيفة والمفيدة ، على الرغم من أنها تتطلب الكثير من الوقت ، يمكن أن تدعم وتساعد في إدارة كل هذا المحتوى على موقعك.
يمكنك تعلم كيفية الحصول على معلومات أكثر واقعية باستخدام مهام مختلفة للتعلم الآلي مع مجموعات بيانات أكثر واقعية. لكل من مؤشرات الأداء الرئيسية الخاصة بشركتك ، يمكن أن تساعدك Hill Web Marketing على فهم المقاييس المهمة ، وكيفية استخدام المخطط لمواءمتها مع أهداف الصناعة الخاصة بك ، ورسم كيفية الحصول على أداء محسن.
نشرت ناتاشا نوي ، عالمة أبحاث في Google AI ، نشر " تسهيل اكتشاف مجموعات البيانات " في 5 سبتمبر 2018 ، وتذكر أن "البحث في مجموعة البيانات يعمل بلغات متعددة مع دعم للغات إضافية قريبًا". **** من الواضح أن هذا هو الاتجاه الذي يسير فيه الويب ؛ سيساعد تنفيذ الأنواع الأساسية لترميز المخطط في العثور على نشاطك التجاري.

يساعد استخدام مجموعات البيانات في ضمان تدفقات إيرادات المنتج
كيف يعمل البحث في مجموعة بيانات Google؟
يمكن اكتشاف مجموعات البيانات بسهولة عندما تقدم معلومات تتضمن شيئًا مثل الاسم والوصف والمنشئ وتنسيقات التوزيع كبيانات منظمة. تعمل Google على تمكين اكتشاف مجموعة البيانات واستخدام schema.org وتنسيقات البيانات الأخرى التي يمكن دمجها في صفحات الويب التي تصف مجموعات البيانات. يمكن أن يدعم هذا المخطط فرصك في الظهور في نتائج البحث الدوارة للمنتج.
يعتمد نجاح عملك في المستقبل على الرؤى اللازمة لدفع مؤسستك نحو تدفقات إيرادات مستدامة. يجب أن تلهم الرسائل المتعلقة بمنتجاتك ثقة المشتري المحتمل بما يكفي لاتخاذ الإجراءات المطلوبة لإتمام الصفقة. لديك مستوى معين من التحكم فيما يظهر في الرسم البياني المعرفي لشركتك. "المخاطر كبيرة ، حيث تقدر مؤسسة البيانات الدولية أن الاستثمارات التجارية العالمية في D&A ستتجاوز 200 مليار دولار سنويًا بحلول عام 2020" ، وفقًا لـ Harvard Business Review.
"تشمل وظيفة D & A (البيانات والتحليلات) القوية والناجحة أكثر من مجموعة من التقنيات ، أو عدد قليل من الأشخاص معزولين في طابق واحد من المبنى. يجب أن يكون D & A هو نبض المؤسسة ، وأن يتم دمجه في جميع القرارات الرئيسية عبر المبيعات والتسويق وسلسلة التوريد وتجربة العملاء والوظائف الأساسية الأخرى ". - مراجعة أعمال هارفارد
يمكن أن تكون صور المنتج جزءًا من مجموعة بيانات صور Google! يوجد 8.4 عنصر لكل صورة في المتوسط في بعض مجموعات البيانات. فيما يلي قائمة بمجموعة البيانات التي يتم تحديثها بشكل متكرر.
تشتمل صفحة وثائق Google على مثال JSON-LD لتنفيذ schema.org/Dataset. نظرًا لأن مجموعة البيانات الأنبوبية في مرحلة تجريبية ، فستظهر أفضل الممارسات لوصف مجموعة البيانات واستخدامها. مع تغير متطلبات الكود ، قم بإجراء تدقيق تقني لتحسين محركات البحث لتحديد مكان التحديثات المطلوبة.
كيفية تحميل مجموعات بيانات المنتج والصور إلى Google BigQuery؟
يسمح Google BigQuery (GBQ) للمسوقين بجمع البيانات من مصادر مختلفة. نوصي باستخدام Google Merchant Center أو Cloud Storage أو BigQuery أو يمكنك تحديد البيانات المضمنة عند إجراء الطلب. قبل تحميل أي بيانات ، أنشئ أولاً مجموعة بيانات وجدولاً في Google BigQuery يتضمن معلومات منتجك ، بما في ذلك تفاصيل الصورة. ***
نحن نفضل استخدام تنسيق بيانات عنصر المنتج JSON-LD. فيما يلي مثال على كائن كامل:
{
"name": "projects/[PROJECT_NUMBER]/locations/global/catalogs/default_catalog/branches/0/products/1234",
"id": "1234",
"categories": "Apparel & Accessories > Shoes",
"title": "ABC sneakers",
"description": "Sneakers for the rest of us",
"attributes": { "vendor": {"text": ["vendor123", "vendor456"]} },
"language_code": "en",
"tags": [ "black-friday" ],
"priceInfo": {"currencyCode": "USD", "price":100, "originalPrice":200, "cost": 50},
"availableTime": "2020-01-01T03:33:33.000001Z",
"availableQuantity": "1",
"uri":"http://foobar",
"images": [{"uri": "http://foobar/img1", "height": 320, "width": 320 }]
}
حافظ على كتالوج المنتج محدثًا. تهتم Google بالجودة ، ويتطلب ذكاءها الاصطناعي بيانات عالية الجودة لعمل تنبؤات عالية الجودة. راقب المنتجات التي لم تعد معروضة للبيع واحتفظ بالبيانات محدثة في ترميز مخطط منتج التجارة الإلكترونية لموقعك.
"مجموعة البيانات المجدولة هي مجموعة منظمة بشكل أساسي من حيث شبكة من الصفوف والأعمدة. بالنسبة للصفحات التي تتضمن مجموعات بيانات مجدولة ، يمكنك أيضًا إنشاء ترميز أكثر وضوحًا ، بناءً على النهج الأساسي الموضح أعلاه. في الوقت الحالي ، نتفهم نوعًا مختلفًا من CSVW ("CSV على الويب" ، راجع W3C) ، والذي يتم توفيره بالتوازي مع المحتوى المجدول الموجه للمستخدم على صفحة HTML. "، كما ورد اعتبارًا من 9.30.2019.
ابق على اتصال بصفحة وثائق Google للحصول على تحديثات في حالة تغيير الخصائص المدرجة لمجموعة البيانات أو DataCatalog أو DataDownload. أحدثت الوثائق الحالية الجانب التنظيمي ؛ يتم الآن دمج مواصفات الممتلكات تحت النوع الذي ينتمي إليه كل منها (كان يتم تنظيمها حسب الموضوع سابقًا). هذه الخصائص الجديدة هي طريقة واحدة لتحسين سمات موقع الويب الخاص بك.
كيفية إنشاء مجموعة بيانات من الصور لتصنيف الكائنات.
ضمن وحدة تحكم إدارة نظام مجموعة IBM ، حدد (1) عبء العمل ، (2) شرارة ، ثم (3) التعلم العميق. **
* انقر فوق علامة التبويب "مجموعات البيانات".
* حدد "جديد".
* إنشاء مجموعة بيانات من "صور لتصنيف الكائنات".
* أدخل اسم مجموعة البيانات.
* حدد مجموعة مثيل Spark التي تريدها.
* حدد تنسيق تخزين الصور المفضل لديك (نفضل TFRecords لـ TensorFlow).
* إذا تم اختيار TFRecords ، فانتقل إلى كيفية إنشاء السجلات ، إما عن طريق الجزء أو الفئة. إذا تم تحديد جزء ، أدخل رقم الجزء.
* حدد كيفية اختيار صور التدريب.
من خلال الالتزام بإرشادات صور Google ومتطلبات صور AMP ، تتمتع منتجاتك بفرصة أفضل للظهور في المقتطفات المميزة المتعلقة بالمنتج.
خصائص البيانات المنظمة لمجموعة البيانات
حقًا ، هناك عدد قليل من الخصائص المطلوبة في هذا الوقت. لتشجيع استخدامه ، قد يكون عملاق التكنولوجيا قد بدأ في "إبقائه بسيطًا" عندما يتعلق الأمر بتوفير محتوى مخصص لمستهلكي بيانات الآلة. الهدف النهائي هو الحصول على تطابقات أكثر وأفضل في مكتبة البيانات الخاصة بها لتلبية هدف بحث المستخدم.
الخصائص المطلوبة:
- اسم
- ديسكريتوبن
Proplerties الموصى بها:
- أسم بديل
- المنشئ
- الاقتباس
- المعرف
- الكلمات الدالة
- رخصة
- مثل
- التغطية المكانية
- التغطية الزمنية
- متغير
- الإصدار
- عنوان url
قد لا يكون لديك بالفعل مجموعة بيانات منشورة على الويب ، ولكن التسويق عبر البحث ينتقل سريعًا نحو المزيد من نهج علم البيانات للبحث. نظرًا لأن الأفراد والأشخاص يتيحون الوصول إلى المزيد والمزيد من مجموعات البيانات ، سيزداد بحث مجموعة البيانات. الأمر المثير للدهشة هو أن أي شخص ينشر البيانات يمكنه وصف مجموعة البيانات الخاصة به باستخدام معيار schema.org المفتوح لوصف المعلومات.
عند اختبار بياناتك في تقرير فهرس Search Console ، اقرأ قسم "الأخطاء والتحذيرات المعروفة" و "الأخطاء أو التحذيرات في أداة اختبار البيانات المنظمة من Google ونظام التحقق من البيانات المنظمة Linter. استعن بخبير في تنفيذ بيانات المخطط أو استخدم النماذج للمساعدة في تحديد التحذيرات التي يمكنك تركها بأمان.
نظرًا لأن هذا يتعلق بتحليل محتوى الويب - بغض النظر عما إذا كان يحتوي بالفعل على بيانات منظمة - فمن الأفضل إتاحة البيانات بتنسيق يمكن لأعلى نسبة مئوية من مستهلكي البيانات (في المقام الأول ، محركات البحث) فهمه.
توفر مجموعات البيانات خارطة طريق لبناء الرسوم البيانية المعرفية
ابحث عن مجموعات البيانات واستفد من البحث الأكاديمي من مصادر البيانات المفتوحة و https schema.org.
يقدر الباحثون الوضوح في التحليل الدقيق لعلوم البيانات العالمية وحلول التعلم الآلي التي تكشف عن ديناميكيات السوق. يعتمد البحث عن المسوقين الذين يسعون إلى قياس اتجاهات التسويق المستدامة على البيانات الضخمة لدعم نمو السوق في المستقبل. بمجرد أن يخرج Google Dataset Search من الإصدار التجريبي ، فقد يكون لديه إمكانات جديدة لإجراء أبحاث البيانات التي قد تقلل من المخاطر والتحديات الحالية أمام الشركات. يمكن أن يؤدي البحث المكثف حول التفاصيل الموجودة في بياناتك إلى تحسين أساليب البيع الخاصة بك.
نواصل البحث عن مناهج عملية لبناء الرسوم البيانية لمعرفة العميل وفرص الاستفادة منها لتطبيقات الأعمال. جرب يدك في هذا.
بمجرد استخدام مخطط مجموعة البيانات على موقعك ، ستجد تقريرًا جديدًا في GSC ضمن التحسينات. نستخدمها لتحسين إستراتيجيتنا لتسويق محتوى الجوال للمستخدمين القادمين من أجهزة متعددة.
ميزات مجموعة البيانات وتقرير تحسين Google الجديد
كما هو الحال مع تطبيقات البيانات المنظمة الأخرى ، فقط لأنك قمت بدمج البيانات المنظمة للمخطط ، فأنت تصبح مؤهلاً . ومع ذلك ، فإنه لا يضمن الظهور في بحث Google. حدد أولويات استخدام مجموعات البيانات التي تدعم المبيعات وصفحات البيع بالتجزئة المقصودة.
بالتزامن مع الإعلان عن ميزة البيانات المنظمة ، ظهر تقرير جديد لتحسين مجموعة البيانات في Google Search Console. يقوم هذا بإعلام استراتيجيي التسويق عبر البحث بما إذا كانت Google قد تعلمت وتعرف على بياناتك المنظمة لمخطط مجموعة البيانات الخاصة بك. اقرأ أي أخطاء في البيانات المنظمة وأصلحها بمجرد فهمك لمواصفات توثيق البيانات المنظمة لمجموعة البيانات. سوف تغذي بيانات مساعد Google الخاصة بك.
قلة من أصحاب الأعمال أو منشئو المحتوى لديهم ساعات فراغ للتفكير فيما إذا كانت البيانات الوصفية الخاصة بك منسقة بشكل صحيح. ومع ذلك ، يجب السماح لبرنامج GoogleBot بالزحف إلى موقعك والعثور على بياناتك وفهرستها. لحسن الحظ ، نحن نحبها ونحن في ركنك.
أذونات إنشاء مجموعة البيانات
إذن البناء مناسب لمجموعات البيانات. عندما يتم منح المستخدمين إذن البناء ، يمكنهم إنشاء محتوى جديد على مجموعة بيانات موجودة. هذا شائع بالنسبة للتقارير ولوحات المعلومات والبلاط المثبت من QandA و Insights Discovery. يمكنهم أيضًا إنشاء إدخالات بيانات جديدة في مجموعة البيانات خارج Power BI ، عادةً أوراق Excel عبر التحليل في Excel و XMLA وتصدير البيانات الأساسية. يساعد الشركات على إجراء تحليل العملاء.
نظرًا لكون التعلم العميق جديدًا وشاملًا ، لا تزال Google ومحركات البحث الأخرى تواجه تحديات إدارة البيانات التي تظهر في سياق خطوط أنابيب التعلم الآلي المنتشرة في الإنتاج. تهدف الجهود الجديدة لفهم استعلامات البحث الدلالية إلى دعم فهم بيانات التدريب والتحقق منها وتنظيفها وإثرائها. من هذا ، نأمل أن يتوسع نمو مصادر قاعدة البيانات الموثوقة وأن يكون أكثر فائدة لزيادة حركة مرور المتجر.
يرتبط التسويق الرقمي بالحاجة إلى البيانات واستخدامها كنهج علمي.
"أداة بحث مثل هذه جيدة فقط مثل البيانات الوصفية التي يرغب ناشرو البيانات في تقديمها. نأمل أن نرى العديد منكم يستخدم المعايير المفتوحة لوصف بياناتك ، مما يمكّن مستخدمينا من العثور على البيانات التي يبحثون عنها. إذا قمت بنشر البيانات ولم ترها في النتائج ، فانتقل إلى إرشاداتنا على موقع المطورين لدينا والتي تتضمن أيضًا رابطًا لطرح الأسئلة وتقديم التعليقات. " - غوغل *
"يمكننا فهم البيانات المنظمة في صفحات الويب حول مجموعات البيانات ، باستخدام إما http://schema.org ترميز مجموعة البيانات ، أو الهياكل المكافئة الممثلة في تنسيق مفردات كتالوج البيانات (DCAT) الخاص بـ W3C." - تعليق آلان موريسون على تويتر
ملخص مخطط مجموعة بيانات Google
يتركز استخدام مجموعات البيانات لخدمة احتياجات مستخدمي الموقع بشكل أكبر على تجربة المستخدم وإضافة الكيانات التي تجيب وتبلغ. على الرغم من أنه قد يكون نشأ من مجتمع علوم البيانات ، يمكن لأي شركة استخدامه. نوصي أيضًا بالبحث عن مدخلات تمت مراجعتها من قِبل الأقران من خبراء رفيعي المستوى من ذوي الخبرة في ترميز البيانات المنظمة لمجموعات البيانات.
إن شركة Hill Web Marketing حريصة على المشاركة في هذه المبادرة وتأمل أن تشجع قرائنا على زيادة عدد مجموعات البيانات المتاحة حاليًا. في حين أنه قد يكون نشأ من مجتمع علوم البيانات ، يمكن لأي شركة استخدامه.
اتصل بجيني هيل ، مالكة Hill Web Marketing ، وهو محلل إستراتيجي للتسويق الرقمي ، للشريك: 651-206-2410. حدد موعدًا لاستشارتك للحصول على ميزة تنافسية
* https://arxiv.org/pdf/1908.07442.pdf
** https://www.ibm.com/support/knowledgecenter/SSWQ2D_1.1.0/us/create-dataset-image-object-classification.html
*** https://cloud.google.com/retail/recommendations-ai/docs/upload-catalog
**** https://www.blog.google/products/search/making-it-easier-discover-datasets/
***** https://storage.googleapis.com/pub-tools-public-publication-data/pdf/40761.pdf