웹 사이트를 활성화하기 위해 데이터 과학 아키텍처를 확보하는 방법

게시 됨: 2017-08-25

데이터 과학자 전문가처럼 사이트 아키텍처를 구성하는 방법

모든 비즈니스는 웹 데이터 , 제품의 디지털 가시성모바일 사이트 방문자가 참여하는 방식을 진정으로 이해할 수 있는 쉬운 방법이 필요합니다. .

데이터 과학자를 고용하여 데이터에서 올바른 질문을 해야 한다는 뜻입니까?

데이터 과학 아키텍처는 데이터를 실행 가능한 지식으로 변환하는 아이디어를 결합합니다. 여기서 흥분되는 것은 비즈니스 수익 문제를 해결하는 더 많은 결정을 내릴 수 있다는 것입니다. 시맨틱 SEO에 참여하려면 데이터 및 웹사이트 UX 레이아웃에 대한 구조화된 접근 방식을 위한 전략, 전술 및 올바른 도구가 필요합니다. 현대 웹은 사용자의 컨텍스트, 관련 데이터 엔터티의 인식 및 검색에 연결된 방식을 기반으로 하는 연결된 콘텐츠를 요구합니다. 자연어, 사용자, KPI 및 구조화된 데이터 아키텍처 에 대한 이해는 더 나은 검색 결과를 생성하는 데 기본입니다.

비즈니스 인텔리전스 사이트 아키텍처 표준

비즈니스에 여러 소스의 메타데이터가 있는 경우 신제품 개발 전에 함께 응집력 있게 병합해야 합니다. 강력한 사이트 아키텍처를 갖기 위해서는 과거의 개별 기술/플랫폼을 살펴보고 전체적으로 볼 필요가 있습니다. Hill Web Marketing은 고객이 자산 수준에서 콘텐츠를 평가하여 데이터를 수집할 수 있도록 지원합니다. 여기에 엔지니어 또는 비슷한 생각을 가진 디지털 마케팅 리더가 있어야 필드를 정의하고, 데이터를 포착하고, 시스템 기록이 데이터를 삽입하고, 제품 지식 그래프로 전달할 수 있습니다. "지능형 콘텐츠"입니다.

웹사이트의 핵심 UX 아키텍처에 대한 더 깊은 지식을 얻음으로써 데이터, 특히 구조화된 데이터를 저장하고 분석하는 데 사용할 수 있습니다. Google 분석 데이터를 사용하여 사용자 참여를 유도하는 올바른 UX, 기술 및 정보 아키텍처 를 경쟁하고 배포하는 방법에 대한 명확한 비즈니스 전략을 만드십시오. 모바일 검색 결과와 전환을 유도하는 디지털 콘텐츠를 만들기 위해 비즈니스 문화를 조정하려면 다각적인 접근 방식이 필요합니다.

성공적인 디지털 마케터에게 성공적인 SEO 마케팅 캠페인 또는 유료 검색 투자를 위한 핵심 전제 조건이 무엇인지 물어보십시오. 의심할 여지 없이 대부분의 응답은 데이터 포인트에서 현명한 통합을 얻거나 만드는 것에 대해 말할 것입니다. 데이터를 사랑하고 이를 올바르게 활용할 수 있을 만큼 지식을 갖추는 데 도움이 됩니다. 고객이나 팀의 누군가가 데이터 보고서를 보고자 하는 측정항목의 전체 목록을 제공하는 경우 그 이유를 자세히 조사하여 비즈니스 목표에 적합한지 확인한 다음 궁극적으로 애드워즈 측정항목을 관리 하고 그에 따른 광고.

시작하기 위해 이 기사에서 사용된 용어에 대한 기초적인 이해를 합시다.

데이터 과학 아키텍처란 무엇입니까?

데이터 과학 아키텍처는 글로벌 데이터 배포를 위한 최상의 사이트 아키텍처를 선택할 때 데이터 과학의 실천입니다. 여기에는 IoT(사물 인터넷), 웹 사이트의 클릭스트림 활동, OLTP(온라인 거래 처리) 데이터, 오프사이트 및 온사이트 데이터와 같은 다양한 소스에서 다양한 차원의 데이터를 수집하는 데이터 레이크 아키텍처가 포함됩니다. 단지 몇 가지. 한 가지 최종 목표는 즉각적인 Google SERP에서 더 많은 클릭 을 얻는 것입니다.

데이터 과학이란 무엇입니까?

데이터 과학은 통계, 기계 학습, 데이터 마이닝 및 예측과 같은 데이터 분석 분야에 연속성을 제공하는 데 유용한 구조적 또는 비구조적 다양한 형식의 데이터에서 지식이나 통찰력을 추출하는 프로세스 및 시스템에 관심을 갖는 학제 간 실습입니다. 해석학. KDD(Knowledge Discovery in Databases)와 유사합니다.

데이터 사이언스 아키텍트란?

데이터 과학 설계자(DSA)는 데이터 수집, 저장 및 데이터 분석 프로세스의 설계와 관련된 시간 및 비용 절충에 대한 비즈니스 요구 사항을 결정합니다. 사이트 아키텍처를 쉽게 크롤링하고 인덱싱 할 수 있습니다.

그래프 데이터베이스란 무엇입니까?

데이터 컴퓨팅에서 그래프 데이터베이스(GDB)는 노드, 에지 및 속성이 있는 의미 검색 쿼리에 그래프 구조를 활용하여 엔티티를 나타내고 데이터를 저장하는 데이터베이스입니다. 시스템의 핵심은 그래프 또는 에지 또는 관계 엔터티 매핑입니다. 그래프는 저장소의 데이터 항목을 노드 및 에지 컬렉션과 연관시키고, 에지는 노드 간의 관계를 함께 묶습니다.

그래프 데이터 구조에서 경로는 무엇입니까?

방향 그래프에서 양방향 경로라고도 하는 방향 경로는 고유한 꼭짓점의 진행을 연결하는 유한 또는 무한 일련의 모서리 시퀀스이지만 모서리가 모두 같은 방향으로 향해야 한다는 요구 사항이 추가되었습니다.

데이터 과학 아키텍처를 위한 머신 러닝 데이터 파이프라인

데이터 과학 아키텍처는 더 나은 사용자 경험과 제품 데이터 세트 를 위한 토대를 마련합니다.

열정적인 시맨틱 전문가들로 가득 찬 한 가지 트렌드는 머신 러닝을 그 어느 때보다 쉽게 ​​접근할 수 있도록 하는 라이브러리의 개발입니다. 머신 러닝 데이터 파이프라인 구축을 추가로 자동화하는 라이브러리는 TPOT 및 AutoML/auto-sklearn입니다. 데이터 플러스 알고리즘은 지능적인 결과를 생성하는 기계 학습의 중추입니다.

기계 학습의 초기 개념과 씨름할 때 모든 것이 마법인 것처럼 별이 빛나는 눈으로 놀라움으로 가득 차 있을 수 있습니다. 실제로는 "데이터가 들어갑니다. 결과 예측 보석. 많은 논리가 적용됩니다. 필터링된 데이터, 알고리즘, 딥 러닝 및 알고리즘을 통해 데이터를 처리하여 생성된 모델.

머신 러닝을 통해 데이터에서 실행 가능한 인사이트를 도출하는 비즈니스에 종사하고 있다면 프로세스에 대해 궁금해하지 않는 데 도움이 됩니다. 더 많이 이해할수록 데이터를 유용한 예측으로 더 잘 변환할 수 있고 수익원을 늘리는 데 더 강력해질 수 있습니다. 기계 학습 모델은 적용 가능한 저장된 데이터를 저장하므로 기업은 이러한 대용량 데이터 파일을 처리할 방법을 찾아야 합니다.

그러나 예측 모델링 작업의 결과를 해석하고 결과를 적절하게 평가하려면 항상 어느 정도의 지식이 필요합니다. 데이터를 수집하고 이해하는 데 도움이 되는 도구가 해당 분야의 전문가를 대체하는 것은 아니지만 머신 러닝을 이해하는 영역에서 세부 사항을 싫어하는 개인의 더 많은 청중에게 권한을 부여하는 것 같습니다.

구조화된 빅데이터의 아키텍처 및 분석

스키마는 검색 엔진에 데이터가 "말하는 것"이 ​​아니라 "의미하는 것"을 알려줍니다.

분석을 위해 "빅 데이터" 소프트웨어를 평가하는 데 자금을 지출할 필요가 없을 수도 있습니다. 이는 데이터 과학 아키텍처를 개선하는 데 사용할 수 있습니다. 컴퓨팅 성능 및 스토리지 기능과 관련된 유행어인 빅 데이터는 사이트 방문자가 선호하는 것에 대한 중요한 통찰력을 얻을 수 있는 대규모 데이터 세트 또는 일련의 데이터 세트와 관련됩니다. 그러나 성공적인 분석의 더 큰 가능성을 제공하거나 디지털 마케터에게 실행 가능한 결론에 도달할 수 있는 능력을 제공하지 않는 경우가 많습니다.

"빅 데이터"가 공통 언어의 일부가 되기 몇 년 전에 통계학자들은 제품 라인 데이터에서 성공적으로 샘플링하고 샘플링 테스트를 사용하여 더 나은 마케팅 결정을 결정했습니다. 테스트할 때 수집 및 연구 질문이 잘 설계되고 계획된 경우 알파 및 베타 값은 작은 데이터 샘플(n>30)로도 정말 낮을 수 있습니다. 오늘날 귀하의 데이터는 온라인 비즈니스의 핵심이 되었기 때문에 소규모 비즈니스라도 효과적인 SEO를 위해 연결된 데이터가 필요합니다 .

SEO를 아웃소싱하든 내부적으로 가져오든 "빅 데이터" 또는 작은 데이터 샘플을 사용하는 목적을 먼저 식별해야 합니다. Hadoop, Cassandra 및 Spark와 같은 프레임워크는 비즈니스가 많은 데이터 세트를 수정하는 것이 타당한 상태에 도달했을 때 즉시 사용할 수 있습니다. 최첨단 사이트 아키텍처에 먼저 투자한 기업은 일반적으로 데이터 세트가 더 명확하다는 이점이 있습니다. 세부 지향적인 SEO 또는 데이터 과학자의 기술을 습득하는 것은 기업의 직접적인 경쟁 우위가 되었습니다.

데이터 서비스를 사용하면 모든 비즈니스에서 데이터를 비즈니스 핵심으로 이동하여 데이터 접근 방식을 쉽게 발전시킬 수 있습니다. 모두가 성공합니다. 웹 개발자는 새로운 디지털 경험을 발명하는 것을 좋아하고, 시맨틱 데이터 전문가는 새롭고 예상치 못한 사용자 트렌드를 발견할 수 있으며, 데이터 설계자는 기존 데이터 소스와 새로운 데이터 소스를 혼합할 수 있습니다.

기술은 연결된 데이터의 이점과 비용에 영향을 미칩니다.

XBRL US Business Data Reporting Standard, 즉 구조화된 데이터의 이점과 비용에 따르면 "컴퓨터에서 명확하게 해석할 수 있는 데이터는 자동으로 변환될 수 있습니다". 그 임무는 표준화된 형식으로 공공 비즈니스 정보의 참여를 촉진하는 것입니다. 데이터를 구조화하기 위해 선택한 기술은 이와 관련된 이점과 비용에 영향을 미칠 수 있습니다. 쉽게 추출, 소비, 분석할 수 있도록 견고한 전사적 계획을 수립합니다.

Google 데이터 세트, 연결된 데이터 및 시맨틱 웹에 대해 기업이 직면한 몇 가지 문제는 새로운 도구와 프로세스에 충분히 빠르게 적응하고 있습니다. 풍부한 엔터프라이즈 지식 그래프의 개발은 도메인의 표준 기반 지식 모델을 생성하여 연결된 데이터 기술의 이점을 얻을 수 있는 곳입니다. 방문자가 가장 원하는 콘텐츠를 추측하게 놔두면 SERP에서 상대적으로 낮은 도메인 권한을 가진 소규모 또는 신규 비즈니스 사이트에서 승리하기가 더 어렵습니다. 이는 데이터를 읽는 일관된 프로세스가 양질의 콘텐츠로 이어질 수 있으므로 장기적으로 최상의 정보를 제공할 수 있는 이유를 강조합니다.

모바일 사용자는 데스크톱 사용자의 읽기 및 판매와는 다른 방식으로 온라인 콘텐츠를 소비합니다. 우리는 개발자가 장치마다 다른 사용자 패턴을 고려하면서 적응형 웹 디자인이 등장하는 것을 보았습니다. 손쉬운 콘텐츠 소비에 대한 디지털 구매자의 기대가 계속해서 현재 모델을 초과함에 따라, 이에 주의를 기울이는 가장 확장 가능한 수단은 의미론적으로 건전한 UX 디자인과 머신 데이터 소비자의 지능적 큐레이션을 통하는 것입니다.

데이터가 어떻게 이렇게 강력해질 수 있는지에 대한 탐색을 시작하겠습니다.

비즈니스에 즉각적인 가치를 제공하는 데이터를 얻는 7단계 데이터 과학 아키텍처란 무엇입니까?

쉽고 정확한 배포를 통해 깊은 통찰력을 생성하고 비즈니스에 즉각적인 가치를 제공하는 데 필요한 개요 목록:

1. 팀 계획:

웹 사이트 아키텍처에서 모범 사례를 사용하여 시작하십시오. "날개" 프로젝트를 방지하기 위해 구조화된 접근 방식으로 상세한 와이어프레임을 설계합니다.

웹 사이트를 개발하기 전에 계층 구조를 계획하십시오. 그러나 "폭포" 개발 방법을 사용하여 일부 IT 부서에서 발생하는 문제를 방지하십시오. 각 글꼴 유형의 포인트 크기, 페이지 헤더의 행 길이 및 간단한 사진 갤러리의 작동 방식에 이르기까지 절대적으로 모든 것을 지정하는 것이 좋지만 SEO는 유연한 접근 방식을 요구합니다. 그리고 귀하의 데이터는 귀하의 사이트가 단순히 멋지게 보이기만 하는 것이 아니라 사용자를 위해 작동하고 수익을 창출할 수 있도록 지속적으로 개선하는 데 도움이 되어야 합니다. 귀하의 비즈니스는 사용자 행동에 대한 고급 기계 학습 통찰력 의 이점을 누릴 수 있습니다.

2. 사업 및 웹사이트 개발:

훌륭한 사용자 경험을 만드는 논리적인 방식으로 각 웹 페이지의 콘텐츠를 레이아웃합니다. 기본적인 SEO 모범 사례로 프로젝트의 시각적 미학을 계획한 후에는 코드로 뛰어들 시간입니다. 여기에는 사이트 구조 구축, 템플릿 구성, 데이터 가져오기, 콘텐츠 새로고침, 콘텐츠 공백 채우기, 스키마 구조화된 데이터 마크업 추가 등과 같은 많은 핵심 작업이 포함됩니다.

최종 비즈니스 목표와 밀접하게 일치하십시오.

3. 사이트 및 데이터베이스 최적화:

검색 엔진이 이 콘텐츠를 이해하는 데 도움이 되도록 가능한 한 많은 스키마 코드로 마크업하세요. 사이트를 재설계하는 경우 기본 SEO 최적화를 미리 수행할 수 있도록 새 사이트에 필요한 모든 코드와 데이터가 미리 서버에 있어야 합니다. 새로운 구조화된 데이터 SEO 기회의 이점을 얻으려면 지금 SEO 전문가가 마크업 항목을 지속적으로 추가하도록 계획하십시오.

4. 감사 및 수정:

기술 데이터 감사 를 통해 디지털 마케터는 최고의 콘텐츠 제작 장벽을 극복할 수 있습니다. 데이터 기반 프로세스는 사용자와 비즈니스 모두가 얻는 올바른 콘텐츠를 게시하는 데 필수적입니다**.

우리는 특정 측면에 중점을 둔 기술 감사를 사용하고 정기적인 모니터링을 제공하여 취약한 웹사이트 조직 구조를 식별하고 완화합니다. Google 웹마스터 도구 데이터를 검토하여 웹사이트의 기술적 기능과 아키텍처를 업그레이드하는 데 도움을 드릴 수 있습니다.

5. 데이터 세트 분석:

Google 분석 데이터 및 기타 데이터 보고서를 활용하여 사용자 통찰력을 수집하면 향후 개선을 위한 경로를 제공합니다. 메타데이터는 데이터에 대한 이야기를 알려줍니다. 시간이 지남에 따라 좋은 데이터의 가치는 높아집니다. 웹 사이트가 거의 통과할 수 없고 경쟁 우위를 제공하지 않으면 실제로 고객을 짜증나게 하고 부정적인 인상을 남기고 재방문을 방해할 수 있습니다. 데이터에서만 수집한 중요한 통찰력을 활용하여 사용자 중심 콘텐츠를 지원합니다.

진정한 데이터 과학자는 CSV와 같은 다양한 형식의 데이터 열을 읽을 수 있는 dask 데이터 프레임 또는 배열과 같은 것을 사용하여 데이터를 조작하는 능력과 같은 기술을 가지고 있습니다. 진정한 장점은 쪽모이 세공 파일로 저장하고 나중에 코어 외 사전 처리 요구 사항에 사용할 수 있다는 것입니다. 많은 사람들에게 SEO의 Google 360 ​​Analytics는 기존의 Google Analytics에서 제공했던 것보다 더 깊은 데이터 보고서를 제공하는 데 큰 역할을 합니다.

데이터 그래프를 지원하는 데 적합한 클라이언트 검토 스키마를 추가합니다 .

6. USE ML: 머신 러닝 파이프라인을 위한 네이티브 그래프 데이터베이스

데이터 웨어하우스의 데이터 관리는 과거 이벤트의 보고 및 분석에서 비즈니스 수익 계획 추진으로 이동합니다.

또한 실시간 및 사이트 성능에서 고객 사용자 경험(CX)을 개선하는 데 필요한 통찰력을 제공합니다. 앞으로 실시간 데이터와 ML 파이프라인을 사용하여 맞춤형 사용자 경험을 대규모로 추진하는 기업의 수가 증가할 것으로 예상됩니다.

이것은 종종 기본 그래프 데이터베이스를 통해 달성됩니다. 기본 그래프 데이터베이스는 인덱스가 없는 인접성을 사용하여 쿼리가 여러 계층 깊이의 데이터를 마이닝하더라도 1초 미만의 응답 시간으로 수백만 개의 데이터 레코드를 교차합니다.

고도로 연결된 그래프 데이터 요소 간의 관계를 기계 학습 파이프라인을 위한 일급 데이터베이스 요소로 취급할 수 있습니다. 그래프 데이터베이스 엔진에서 사용하는 방향성 및 수량화 속성으로 완전한 파이프라인 구성 요소를 구축합니다.

“증강 분석은 AI 및 머신 러닝 기능을 사용하여 데이터를 빠르고 효율적으로 자동 처리하여 데이터를 통찰력으로 변환하는 데 걸리는 시간을 줄입니다. 이는 분석가가 분석을 위해 데이터를 준비하는 데 시간을 보내는 것보다 데이터 분석에 더 많은 시간을 할애할 수 있음을 의미합니다.

2020년에 데이터 분석가는 개인 식별 정보를 신중하게 다루기 위해 규정 준수 팀 및 회사와 긴밀하게 협력하여 지역 및 국제 데이터 보호법의 변화에 ​​뒤쳐지지 않아야 합니다. 데이터 보호에 대한 인식이 높아지고 강조되면서 분석 도구는 사용자 개인 데이터의 개인 정보 보호 및 보안에 중점을 두게 될 것입니다.” – James E. Powell, TDWI 편집 이사

7. 지속적인 개선 계획:

마지막으로, 사용자의 참여도를 높이기 위해 데이터가 나타내는 올바른 작업을 구현하세요. 때로는 사내 팀을 위한 교육을 통해 새 콘텐츠를 더 깊이 관리 및 생성하고 SEO 데이터 보고서에 익숙해질 수 있습니다.

의미론적 주석을 통해 텍스트 소스는 웹 콘텐츠를 정확하고 효율적으로 구성, 일치 및 제공하기 위해 기계가 필요로 하는 데이터 속성을 취합니다. 데이터 정보 관리 및 사용자 지식 향상을 위해 사용하는 분야를 혁신하는 도약입니다.

Google의 기술 프로그램 관리자인 Andre Valente는 SEO가 구조 데이터 구현을 위해 Search Console의 데이터를 자세히 조사할 것을 촉구합니다. 중요한 문제를 해결할 수 있도록 페이지가 인식되는 방식을 식별하는 풍부한 데이터 보고서를 제공합니다. 더 깊이 파고 들면 데이터가 손상된 위치를 확인할 수 있습니다. 마크업의 품질은 데이터 세트에 직접적인 영향을 미칩니다.

그렇다면 사이트 사용자와 그들의 행동 뒤에 숨겨진 비밀을 얻으려면 어떻게 해야 합니까?

데이터 마이닝은 인터넷 사용자의 행동을 보여줍니다

DIVVY HQ는 디지털 마케터가 최고의 콘텐츠 제작 장벽을 극복하는 데 필요한 것이 무엇인지 연구했습니다. 데이터 기반 프로세스는 성장을 위한 비즈니스 목표를 지속적으로 유지하는 비즈니스에 중요합니다.

그는 “64%는 포괄적인 콘텐츠 전략을 개발하는 것이 가장 큰 과제라고 답했으며 46%는 콘텐츠 아이디어를 전략에 맞추는 것도 어렵다고 말했습니다. 상위 3위 안에 들면 응답자의 42%가 데이터와 아이디어를 체계적으로 유지하고 있다고 답했습니다.

더 나은 제품 기반 클러스터링을 위해 웹 콘텐츠를 조정하려면 먼저 사용자 행동 기본 설정을 염두에 두어야 합니다. 비즈니스에 심층적인 고객 프로필이 생성되면 판매를 촉진하는 요인과 각 고객의 평생 가치를 예측하기가 더 쉽습니다. 구조화된 데이터는 제목에 영향을 미치는 요소, 새 게시물의 타이밍, 뉴스 기사를 게시할 위치와 시기, 보낸 이메일 수, 할인 제안이 유효한지 여부 등을 예측하는 데 핵심 입니다.

데이터 과학 접근 방식의 10가지 이점

견고한 데이터 과학 사례를 통해 기업은 빅 데이터를 활용하고 빅 데이터 없이는 얻을 수 없는 이점을 얻을 수 있습니다.

* 현장에서 사용자 참여 촉진

* 낮은 이탈률

* 평균 클릭률 향상

* 전환율 유도

* 마케팅 캠페인을 통한 수익 증대

* 경쟁에서 이겨라

* 새로운 기회를 발굴하여 혁신적으로 성장을 모색

* 귀사가 효율성과 데이터 통합을 수용할 수 있도록 지원

* 확장 가능한 생산 준비 인프라 확보

* 생산적인 협업 증대

* 위치가 여러 개인 경우 구조화된 UX는 지역 검색 마케팅을 향상시킵니다 .

그래프 데이터베이스 및 분석 시스템

기존의 관계형 데이터베이스 관리 시스템 RDBMS는 여전히 데이터를 관리하는 많은 기업의 핵심입니다. 그러나 그러한 RDBMS의 표 구조는 종종 일부 유형의 고급 분석에 도전합니다. RDBMS에서 데이터를 캡처하고 저장하는 것은 한 가지이지만 주요 엔터티 간의 관계 특성을 기록하고 이해하는 것은 골칫거리일 수 있습니다. 콘텐츠에 대한 구조화된 접근 방식을 사용하여 사용자 참여를 늘리는 것이 가장 좋습니다.

그래프 데이터베이스와 같은 관계형 모델로 업데이트하는 것은 관계에 비추어 모델링된 엔터티를 분석하는 데 더 큰 유연성을 얻는 한 가지 방법입니다. "연결을 나타내기 위한 수학적 그래프 추상화를 기반으로 하는 그래프 데이터베이스 및 분석 시스템은 엔터티 및 해당 속성에 대한 정보를 캡처하고 엔터티 간의 관계를 일급 개체로 높이는 데이터 표현에 대한 대체 접근 방식에 의존합니다." 지식 무결성의 David Loshin. (das2017.dataversity.net/sessionPop.cfm)

잘 정의된 데이터 아키텍처는 기업이 데이터 볼륨 문제를 해결할 수 있는 능력을 제공합니다. 이는 높은 수준의 마케팅 결정을 지원하는 현재 및 미래의 데이터 프로젝트에 대한 발자국 및 가이드 역할을 합니다. 필요한 경우 웹사이트 데이터의 전체 가치를 실현하는 데 도움이 되는 계획을 세우는 데 도움을 드릴 수 있습니다.

올바른 데이터를 기반으로 올바른 결정 내리기

Google의 개인화된 검색이 검색 결과의 더 많은 부분을 차지함에 따라 SEO는 새로운 도전에 직면해 있습니다. 오랫동안 사이트의 순위를 추적하는 것은 데이터 정확성에 의존하는 핵심 SEO KPI 중 하나였습니다. 새로운 Google 뉴스 피드는 또한 사용자 위치, 이전 검색 분석 및 사용자가 얻는 결과에 영향을 미치는 브라우저 기록에 대한 도전을 받습니다. 데이터 정확도 자체의 범위가 모호합니다. 이제 개인화된 검색은 위치 및 사용자가 모바일 설정을 전환하는 방식에 따라 끝없는 SERP 변형을 의미하므로 "정확한 데이터"의 의미가 이동하는 것 같습니다.

당신의 순위 데이터가 당신이 고려하지 않은 어떤 형태의 개인화로 인해 교만하거나 잘못된 형태가 아니라는 확신을 갖는 것이 점점 더 어려워지고 있습니다. 마케팅 팀은 정확한 데이터를 기반으로 최선의 결정을 내리고 있다고 어떻게 확신할 수 있습니까?

SERP는 위치에 따라 사용자마다 다르므로 정확한 순위 추적이 더 어려워지지만 여전히 중요합니다. 먼저 목표 위치를 결정한 다음 순위 확인 도구를 선택하여 개별 순위를 추적합니다. 하나의 지역 오프라인 비즈니스 또는 여러 개의 물리적 주소가 있든 관계없이 대상 위치를 식별하고 시간이 지남에 따라 각각을 추적하여 분석하고 신뢰할 수 있는 충분한 데이터를 생성해야 합니다.

정기적인 현장 감사 를 수행하면 비즈니스에서 데이터 기반 통찰력으로 올바른 결정을 내릴 수 있습니다.

미래의 인프라 설계: 데이터 중심 아키텍처

머신 러닝과 인공 지능 기술에 대한 의존도가 높아짐에 따라 데이터는 정보 자산의 중요한 것으로 간주되는 것에서 혁신의 핵심으로 옮겨졌습니다. 더 이상 데이터 중심적인 것만으로는 충분하지 않습니다. 조직은 데이터 중심적이어야 합니다.
퓨어스토리지의 요청에 따라 MIT Technology Review가 진행한 최근 설문조사에 따르면 "리더의 압도적인 86%는 데이터가 비즈니스 의사결정의 기초라고 말했으며 87%는 데이터가 고객에게 결과를 제공하는 핵심이라고 말했습니다." Inside Big Data는 2018년 5월 24일 게시물에서 기업이 데이터를 현명하게 사용하는 데 직면한 문제에 대해 설명합니다. 79%는 비즈니스에서 관련 데이터 소스를 사용하도록 하는 것이 어려운 일이라고 말합니다.

핵심 개념과 내용을 먼저 제시하라

검색 봇과 사용자는 홈페이지에서 페이지에 도달하는 데 너무 많은 클릭이 필요한 것을 좋아하지 않습니다. 깊은 수직 구조가 아닌 수평 연결 구조 또는 "씬 사이트 아키텍처"를 사용하는 것이 가장 좋습니다. 내부 검색 기능이 도움이 될 수 있지만 사용자가 자주 사용해야 하는 경우 사이트에 더 깊이 들어가거나 콘텐츠를 찾는 것이 어렵다는 분명한 지표가 됩니다.

그런 다음 이 기본 콘텐츠를 검색 봇 및 기계 학습에 널리 사용할 수 있도록 지원하는 사용 가능한 개발 단계에서 확장을 확인하십시오.

• 자동차 산업에 종사하고 여러 지역 상점이 있는 경우 auto.schema.org를 사용 하여 지역 검색자를 위한 주소 위치를 구분하십시오.

• 서지 리소스 및 도서관 부문이 필요할 때 bib.schema.org 활용

• 사물 인터넷(IoT)의 경우 iot.schema.org를 사용해 보십시오.

• 의료 틈새 시장의 사이트 출처는 health-lifesci.schema.org일 수 있습니다.

• 틈새 시장이 금융 부문인 경우 fibo.schema.org(대기 중인 이름)를 따르십시오.

입력 데이터의 양과 품질을 신중하게 고려하십시오. 머신 러닝 알고리즘은 수용 가능한 성능 수준에 도달하기 위해 종종 수백만 개의 데이터 포인트를 필요로 하는 거대한 "데이터 요구 사항"을 가지고 있습니다. 데이터 수집에 대한 데이터 과학자의 편견과 결합하면 상당히 감소할 수 있습니다. 의료 틈새 시장의 많은 사람들이 EHR(전자 건강 기록)에 알고리즘과 기존 데이터를 제공하기 위해 충분한 수준의 편향되지 않은 고품질 데이터를 축적하기 위해 막대한 자원을 소비하고 있습니다. 이 틈새 시장에 속한다면 의료 사이트의 Google 비즈니스 목록 에 대한 데이터 기반 접근 방식이 중요합니다. 리뷰 스키마 마크업을 사용 하여 웹사이트에 환자 리뷰를 통합합니다 .

NIH(National Institutes of Health)는 "머신 러닝은 관찰 데이터 세트의 인과 추론의 근본적인 문제를 해결하지 못합니다. 임상 의학은 항상 의사가 거시적 수준의 생리 및 행동에서 실험실 및 영상 연구에 이르기까지 엄청난 양의 데이터를 처리해야 하며 점점 더 "-omic" 데이터를 처리해야 합니다. 이러한 복잡성을 관리하는 능력은 항상 우수한 의사를 차별화해 왔습니다.” 2016년 9월 9일자 미래 예측 - 빅 데이터, 머신 러닝 및 임상 의학 이라는 제목의 기사에서는 결국 데이터를 분석하고 해석하고 이에 따라 조치를 취해야 한다고 강조합니다.

Blueshift 는 실시간 데이터 과학을 2017년 최고의 성장 마케팅 트렌드로 선정했습니다. “데이터는 머신 러닝 모델과 다양한 마케팅 애플리케이션을 구동하는 고객 아이덴티티와 행동의 빌딩 블록이자 기초입니다. 성장 마케터로서 우리는 이 데이터를 더 빠르고 빠르게 실행하려고 합니다. 통찰력은 훌륭하지만 실제로 수익에 영향을 미치려면 데이터를 수동 및 자동으로 분할하고 분석하는 방법이 필요합니다.”라고 Uruba Niazi는 말합니다.

시맨틱 웹은 공통 데이터 엔티티와 실행 가능한 지식을 구성합니다.

디지털 솔루션 에이전시 MakoLab SA의 설립자인 Dr. Mirek Sopek은 Semantic Web 지향 R&D 부문의 리더입니다. 또한 Chemical Semantics Inc.의 사장으로서 그의 경험은 Semantic Web에서 방대합니다. Enterprise Data World 2017 컨퍼런스 이벤트에서 그는 공통 데이터 엔터티, 작업 및 관계의 교차점을 포함하는 방법을 열거했습니다.

오늘날의 주요 비즈니스 사이트는 schema.org의 기회 프레임워크에 대한 심층적인 지식을 통해 도메인 온톨로지의 하위 클래스인 틈새별 온톨로지를 구축 및 제공하고 주어진 산업의 스키마 에 필수적인 개념을 요약할 수 있음을 통해 검색이 가능하다는 것을 발견하고 있습니다. 모든 언어에 대해 모든 도메인에서 schema.org를 사용할 수 있습니다.

오늘의로:

* 2,000개 이상의 용어, 753개 유형, 1,200개 속성 및 220개 열거형을 포함합니다.

* Schema.org는 엔터티, 엔터티 및 작업 간의 관계를 다룹니다.

* 약 1,500만 사이트가 Schema.org를 사용합니다.

* 무작위이지만 대표적인 크롤링(Web Data Commons)은 웹에 있는 URL의 약 30%가 schema.org에서 어떤 형태의 트리플을 반환한다는 것을 보여줍니다.

개별 제품 페이지가 판매된 모든 제품을 포함하는 페이지 아래에 적절하게 중첩되어야 하는 것처럼 제품 스키마도 구조화된 방식으로 구성되고 중첩되어야 합니다.

데이터 과학 아키텍처: 데이터 수집, 처리, 저장 및 분석

Google Cloud 및 Machine Learning 블로그에서 여러 기사를 읽은 후 올해 초 내 사이트를 Google Cloud Platform(GCP)으로 옮겼습니다. 저는 사용자 의도를 예측하기 위해 더 나은 데이터를 얻기 위한 사용에 대한 직접적인 경험을 얻는 흥미진진한 학습 경로에 있습니다. 2017년 2월 21일 Lorenzo Ridi가 저에게 영감을 준 기사 중 하나 는 서버리스 데이터 분석 파이프라인에 기계 학습 추가 입니다 .

ACME라는 한 회사가 여러 GCP 구성요소를 활용하여 서버리스 데이터 분석 파이프라인을 만든 다음, 소모성이 높은 REST API를 통해 감정 분석을 위해 기계 학습 기능을 혼합한 방법을 보여주는 매력적인 예입니다. 실시간 데이터 분석 프로젝트에서 공통 패턴을 사용하는 간단한 프로세스를 따릅니다. 데이터를 수집, 처리, 저장 및 분석하는 일련의 데이터 흐름을 인식하게 될 것입니다.

Amazon Web Services, Google Compute Engine, Microsoft Azure 등을 선택하는 데 몇 달이 걸렸습니다. 지금까지 우리는 GCP의 온디맨드 확장이 이전 웹 호스트에 비해 비용을 절감하는 동시에 데이터 처리 요구 사항에 대한 추가 운영 민첩성을 제공한다는 것을 알게 되었습니다.

조직에서 데이터 과학(DS) 사례를 결정할 때 복잡한 데이터 환경에서도 KISS(Keep It Simple Stupid) 방법론의 이점을 얻을 수 있습니다. 내부 시스템에서만 데이터 과학 아키텍처를 실행할 수 있지만 어느 시점에서 대부분의 기업은 요구 사항에 맞게 확장되지 않는다는 것을 알게 됩니다.

구조화된 데이터 구현을 위해 Search Console에서 데이터를 살펴보세요. 중요한 문제를 해결할 수 있도록 페이지가 인식되는 방식을 식별하는 풍부한 데이터 보고서를 제공합니다. 더 깊이 파고 들면 데이터가 손상된 위치를 확인할 수 있습니다. 마크업의 품질은 데이터 세트에 직접적인 영향을 미칩니다.

관계형 데이터베이스의 키워드 검색

Ahrefs는 검색 마케팅 결정을 위해 방대한 양의 데이터를 평가하는 데 도움이 되는 두 개의 독립적인 키워드 색인을 운영하기 때문에 종종 Ahrefs에 의존합니다. Keywords Explorer를 사용할 때 인터넷 사용자의 검색 패턴을 연구하기 위한 이상적인 검색 구문의 키워드 색인 ID의 더 큰 46억 데이터 소스입니다. 보조 쿼리는 4억 2900만개로 구성되어 있으며 이번에는 Ahref의 사이트 탐색기 를 사용하여 자연 검색 결과에서 사이트의 순위를 매기는 검색 쿼리를 조사하기 위해 우리가 찾는 소스 중 하나입니다.

감사 목적으로 확장된 Google Cloud 데이터

2017년 8월 21일 발표에서는 "모든 Google Cloud Platform(GCP) 관리자 활동 감사 로그의 보관 기간이 2017년 9월 12일 또는 그 이후에 수신된 모든 로그에 대해 13개월(현재 1개월 보관 기간에서)로 증가합니다. ".

이 보존 증가는 Stackdriver Logging 및 활동 스트림에 있으며 총 400일 동안 사용할 수 있는 GCP 활동 감사 로그로 제한됩니다. "다른 모든 로그 유형은 기본 등급에서 7일, 프리미엄 등급에서 30일 동안 계속 유지됩니다."라고 발표 내용이 나와 있습니다. Google의 의도는 데이터 규정 준수와 감사 실행을 더 쉽게 만드는 것입니다. 2017년 9월 12일부터 GCP의 활동 감사 로그는 Stackdriver Logging에서 13개월 동안 저장 및 사용할 준비가 됩니다.

비즈니스에서 데이터에 대해 잘못된 질문을 하는 경우 근무 시간 중 데이터를 효과적으로 사용하기 위해 제한된 시간과 함께 귀중한 시간을 잃을 수 있습니다. 그보다 는 소비자가 가장 자주 묻는 질문에 답하여 Google 어시스턴트를 강화하세요 . 귀하의 비즈니스는 올바른 KPI를 설정하고 모바일 검색 결과를 분석 할 때 어떤 질문을 해야 하는지 알 수 있습니다. Hill Web Marketing은 실행 가능하고 우선순위가 있으며 관련성이 높은 답변을 찾을 수 있도록 합니다.

관계형 데이터베이스

개인화 및 사용자 경험: 데이터의 잠재력을 최대한 활용하고 소비자 행동에 귀를 기울이며 충족되지 않은 요구 사항을 목표로 삼으십시오.

SEO 및 SEM 캠페인 관리자는 일반적으로 데이터 분석을 수행하는 데 도움이 되는 그래프, 통계 및 상세 보고서에 깊이 관여합니다. 검토하기 쉬운 방식으로 다른 사람에게 제공하면 조직의 모든 사람이 관계 마케팅을 더 잘 이해할 수 있습니다.

Gartner에 따르면 빅 데이터가 엔터프라이즈 기술 지출을 거의 2,420억 달러에 가까운 새로운 수준으로 끌어올릴 것으로 예상됨에 따라 쿼리 데이터 마이닝은 계속될 것이며, 결과적으로 모든 규모의 더 많은 기업이 관계형 데이터베이스 데이터에 접근하고 있습니다. 많은 엔터프라이즈급 비즈니스에서 머신 러닝 모델은 전략적 자산입니다. 모든 기존 고객, 비즈니스 파트너, 공급업체, 거래, 이탈, 장바구니 포기, 결제 이탈 및 불만 사항은 비즈니스에 배울 수 있는 풍부한 관계 관련 데이터를 제공할 수 있습니다. 이것은 즉각적인 SERP에서 더 많은 질문에 답할 수 있는 능력을 강화할 것 입니다. 인터넷을 사용하는 개인의 관점에서, 모든 입력 또는 음성 활성화 요청, 모든 판매 완료, 요청된 제품 정보, 검색된 처방약 및 환경 이상은 누군가에 의해 추적되고 데이터베이스 그래프에 구축됩니다.

관계형 데이터베이스는 광범위한 데이터 세트를 저장하고 액세스하기 위해 일반적으로 허용되는 수단을 제공합니다. Machine Learning Practitioner Jason Brownlee says, “Internally, the data is stored on disk can be progressively loaded in batches and can be queried using a standard query language (SQL). Free open-source database tools like MySQL or Postgres can be used and most (all?) programming languages and many machine learning tools can connect directly to relational databases”.

For an easier approach, he recommends first experimenting with SQLite. There are many examples and conversations on GitHub on how to read and manage data files. Or consider reaching out to Brownlee for computer science-related questions. What everyone does agree on is that your site's composite architecture and the data you gain when someone visits it is growing in importance. It helps if you see your data in a new light; it is rich with insights on you can be more customer-focused.

Your Evergreen Content Needs to Becomes More Personal and Compelling

The future of digital marketing is not like it was yesterday. Today you can win best in organic search with the best evergreen content in your niche . Businesses must create a lasting and meaningful relational bridge with consumers that proves mindfulness of their shopping preferences and builds loyalty among their clientele.

Content is no longer simply words on a web page. Today, it must be richer, better than your competition, better prepared for visual search with items like videos, slides, meaningful white papers, infographics, etc. Then they can become entities that add richness to your Knowledge Graph .

We have evolved to a new form of content marketing that requires using personalized marketing technology to deliver the right content to the right person with compelling responsive web pages, mobile apps, in paid search Ad copy, and more. It is pretty tough to reach the ideal consumer at the ideal time with the ideal message without data science technology to get it done.

You can use your data to tell the future. No, it is not guesswork nor is it mystical. Semantic search, based on machine learning, is the contemporary science of finding consumer patterns and making predictions from data drawn from multivariate statistics, data mining, pattern recognition, and sophisticated predictive analytics. It lets you anticipate what your prospective buyers want and need even before they think of it.

Semantic Big Data Analysis

People, like you and I, probably many times a day, use contextual clues surrounding the words and phrases we read to better understand the implied or practical meaning of what is said. That's semantic analysis (SA). As human beings, we do this intuitively, efficiently, and often without a conscious effort. We sort out the context surrounding a word, phrase, image, or situation, pull out what seems most relevant, compare that to our past experiences, and use them to determine our take on the content at hand. Proper UX Design for e-Commerce resolves technical issues that may otherwise be missed.

Machines have historically performed poorly at this because they were deficient of that filter. They must decipher what is relevant and why a different way. Advances in Machine Intelligence and Natural Language Processing (NLP) have dramatically improved deep semantic analysis. Without our human intuition, they lean heavily on advanced algorithms, computers, and a lot of data collection and crunching.

The number of relational data patterns machines can determine and how well they can connect the relationships determines the relevance of the data. That relevance is both the goal and the unit of measure when it comes to Semantic Big Data Analysis. If your business can understand the content, intent, and user behavior at a deep level, you can provide more relevant content and thereby create a more resonant user experience.

Two Major Challenges for Reliable Linked Data

1. Business leaders often struggle to take the time to become sufficiently informed to understand the value of the latest advances in linked data technologies.

2. The cost of updating to newer data systems across large enterprises is often organizationally complex, time-consuming, and costly. One has to find sufficient promise in a data upgrade to believe that real-life problems they are currently facing can be fixed by deploying linked data technologies.

A practical business application for pages with referential information – If your data shows that a great post is dropping from consumer interest, in the event of related breaking news, this content with referential information might be bumped from their original rankings in favor of breaking news. So updating your existing post or a page to include current information about what's happening might be a good way to keep the post live.

Data Products created by Data Science Teams

Data products fueled by machine learning and Artificial Intelligence may source prevailing methods of solving users' needs that outpace your competition. Give data science teams a role in your decision-making processes. This can balance and liven up different roles in the organization. Having data science leaders involved in product and business strategy discussions accelerates data product development. It creates a co-operative effort that successful semantic search strategies and implementation strong> and visual search require.

”The lifecycle of a so-called “data product” mirrors standard product development: identifying the opportunity to solve a core user need, building an initial version, and then evaluating its impact and iterating. But the data component adds an extra layer of complexity. To tackle the challenge, companies should emphasize cross-functional collaboration, evaluate and prioritize data product opportunities with an eye to the long-term, and start simple.” – Emily Glassberg Sands on Harvard Business Review

“Data science today is fundamentally different from what it was before. Over the past year, machine learning has gone mainstream. Gartner forecasted the growth of predictive analytics by $1.1 billion in two years and scientists have been using deep learning algorithms everywhere from medicine to space exploration.” – Altexsoft

“Think of content writing as sowing seeds of collaboration, of business, of exchange. Think of text that communicates messages and values in a conversational, ready to engage in a dialogue way. Think of data as one of your best friends, think Vision vs Data.+ – Theodora Petkova

“Data is becoming the currency of marketing, and marketers will now have access to more data than ever…marketers will be able to use data to create more personalized and targeted products, messages, and customer engagements than ever before.” – Steve Fund, CMO of Intel

The bottom line is that you need to know what people prefer, their preferences, if your site's architecture and categories helping them find solutions, and how to improve. It is called customer-centric marketing . We can help you explore your data in more detail and then design content to answer the questions they ask and that fit how algorithms link a search query to the best content.

요약

If you need a proven set of services from a digital strategy and site architecture, Google analytic data mining set-up , data science, managed services and on-site training, Hill Web Marketing can help your company turn your big data challenges into tangible business outcomes.

Our experts can easily work in partnership with your development team to find advanced and valuable solutions that drive business outcomes faster.

Call Jeannie Hill at 651-206-2410. We love helping others build a more successful business. We can help you increase your online sales, attract more clients and Boost Your Revenue Profit Margins

* https://machinelearningmastery.com/large-data-files-machine-learning/

** https://divvyhq.com/2017-content-planning-report/