클러스터 분석: 정의 및 사용 방법
게시 됨: 2022-07-21데이터는 브랜드와 조직이 추론을 도출하고 고객의 마음에 결론을 도출하는 데 필수적입니다. 클러스터 분석 은 트렌드를 도출하고, 고객의 다양한 인구 통계, 구매 행동, 좋아하는 것과 싫어하는 것 등의 그룹을 식별하는 데 도움이 되는 시장 조사 데이터 분석의 중요한 구성 요소입니다 .
시장 조사 프로세스의 이 분석 방법은 정보를 더 작은 그룹으로 분류하는 통찰력을 제공하여 다양한 개인 그룹이 유사한 상황에서 어떻게 행동하는지 이해하는 데 도움이 됩니다. 다양한 조직과 연구자는 클러스터를 이해하는 데 미리 정의된 기준에 따라 클러스터를 다양한 범주로 분류할 수 있지만 기본 데이터 분석 주제는 비슷합니다.
클러스터 분석이란 무엇입니까?
클러스터 분석은 연구자가 개체 집합을 다른 클러스터와 특성이 다른 작지만 뚜렷한 클러스터로 버킷 또는 그룹화할 수 있도록 하는 연구의 통계적 방법입니다. 탐색적 데이터 분석 의 기본 주제는 브랜드, 조직 및 연구원이 시각적 데이터에서 통찰력을 도출하여 추세를 파악하고 가설과 명시적 가정을 검증하는 데 도움이 됩니다.
이 연구 분석 방법은 일반적으로 패턴 인식, 기계 학습, 시장 조사의 통찰력 관리, 데이터 스크러빙, 생물 정보학 등 다양한 분야에서 사용되는 통계 데이터 분석을 기반으로 합니다.
클러스터 분석의 목적은 행동 변화가 뚜렷하지만 기본 특성과 사물이 동일한 통제 그룹에 있는 개체 그룹을 찾는 것입니다. 이 연구 방법의 훌륭한 예는 정성적 및 정량적 데이터를 사용하여 고객 간의 청구 처리 추세를 그리는 은행입니다. 클러스터 분석을 사용하면 사기성 청구를 결론짓고 소비자 행동 을 더 잘 이해하는 데 도움이 됩니다 .
클러스터 분석 방법
클러스터 분석은 연구원과 통계학자가 데이터를 더 깊이 이해하고 더 나은 결정을 내리는 데 도움이 됩니다. 데이터는 정성적 연구 또는 정량적 연구 의 일부가 될 수 있지만 데이터 분석은 여전히 데이터가 그래프에 표시되는 연구 플랫폼에서 수행됩니다. 그러나 위에서 언급한 바와 같이 연구 요구에 맞게 다양한 클러스터 분석 방법이 사용됩니다.
그러나 특정 방식으로 가야 하는 수학적 추론이 없는 한 클러스터링 방법은 실험적으로 선택해야 한다는 점에 유의해야 합니다. 가장 일반적으로 사용되는 클러스터 분석 방법을 살펴보겠습니다.
계층적 클러스터링 또는 연결 기반 클러스터링 분석
계층적 클러스터링 또는 연결 기반 클러스터링 분석은 클러스터 분석에서 가장 일반적으로 사용되는 방법입니다. 이 방법에서는 유사한 구성 요소를 보여주는 데이터를 그룹화하여 클러스터를 형성합니다.
그런 다음 이러한 클러스터는 다른 클러스터를 형성하기 위해 동일한 속성을 나타내는 다른 세트와 상관됩니다. 조사 연구 에서 이 방법의 중심 전제는 가까운 물체가 멀리 있는 물체보다 훨씬 더 관련이 있다는 것입니다.
계층적 클러스터링의 다른 방법은 데이터 집합으로 시작한 다음 유사한 정보의 더 작은 클러스터로 나누는 분할 방법입니다. 이 방법에서는 클러스터 간의 거리와 그 관계를 이해하기 위해 클러스터 간의 연결 기준을 더 잘 정의합니다. 이 분석 모델에는 단일 데이터 분할이 없다는 점에 유의하는 것이 중요합니다.
중심 기반 클러스터링
이 클러스터링 방법에서는 클러스터가 형성되지만 단일 중심 벡터 점으로 정의됩니다. K-means 방법 클러스터링 알고리즘을 사용하여 정의된 목적이 있는 축에서 중심점을 찾습니다. 그런 다음 클러스터와 이 중심점 사이의 거리가 최소화되도록 더 작은 클러스터가 이 중심에 연결됩니다.

이 클러스터 분석 기술의 단점은 클러스터의 수, k-클러스터를 처음부터 정의해야 하므로 데이터 분석 및 표현이 제한된다는 것입니다.
배포 기반 클러스터링
분포 기반 클러스터링 분석 방법은 데이터를 동일한 분포의 개체로 그룹화합니다. 이 방법은 가장 널리 사용되는 통계 분석 방법입니다. 이 방법의 뚜렷한 특징은 분포에서 표본 개체를 수집하기 위해 단순 무작위 샘플링을 사용한다는 것입니다.
이 모델은 속성과 개체 간의 상관 관계를 표시해야 할 때 가장 잘 작동합니다. 그러나 이 모델의 단점은 개체가 미리 정의된 속성을 기반으로 그룹화되기 때문에 각 개체가 분포와 일치해야 하므로 클러스터링에 편향 요소가 있을 수 있다는 것입니다.
밀도 기반 클러스터링
밀도 기반 클러스터링 방법은 일반적으로 사용되는 네 번째 클러스터 분석 기법으로 전체 데이터 세트와 비교하여 밀도를 기반으로 클러스터를 정의합니다. 희소 영역의 개체는 일반적으로 그래픽 표현에서 클러스터를 분리하므로 노이즈 및 경계 지점입니다.
DBSCAN은 가장 일반적으로 사용되는 밀도 기반 클러스터링 방법입니다. 그러나 이 방법의 단점은 종종 부자연스럽게 느껴지는 두 클러스터 간의 차이를 나타내기 위해 밀도를 떨어뜨려야 한다는 것입니다.
클러스터 분석 예
클러스터 분석은 확실한 이점이며 산업, 기능 및 연구 분야에서 널리 사용됩니다. 연구 에서 클러스터 분석의 유용성을 더 잘 설명하기 위해 아래의 두 가지 예를 살펴보겠습니다.
소매 마케팅의 클러스터 분석
브랜드는 전통적으로 클러스터 분석을 사용하여 고객 기반 간의 인구 통계학적 세분화 를 사용하여 구매 행동 연구 및 추세를 이해 합니다. 일반적으로 고려되는 몇 가지 요소는 지리적 위치, 성별, 연령, 연간 가족 소득 등입니다.
이러한 매개변수는 다양한 소비자 그룹이 다른 구매 결정을 내리는 방식을 조명합니다. 따라서 대형 소매업체는 이 데이터를 사용하여 이러한 청중에게 마케팅하는 방법에 대한 유사점을 도출합니다. 이는 또한 고객 이탈 을 줄이는 동시에 지출에 대한 ROI를 최대화하는 데 도움이 됩니다 .
스포츠 과학의 클러스터 분석
클러스터 분석의 또 다른 일상적인 사용 사례는 스포츠 분야입니다. 데이터 과학자, 연구원, 의사, 팀 관리, 스카우트 등은 유사한 플레이어가 다양한 시나리오에서 어떻게 대처하고 그들이 스포츠에서 얼마나 효과적인지 살펴봅니다. 선수는 신체 유형, 나이, 위치 및 유사한 기준으로 버킷되어 효율성을 확인합니다.
QuestionPro를 사용한 클러스터 분석
정확한 데이터를 보고 분석하는 것은 연구원과 브랜드에 매우 유익합니다. QuestionPro와 같은 성숙한 연구 플랫폼 을 사용하면 연구 데이터를 수집하고 도구 내에서 고급 분석을 실행하여 중요한 통찰력을 제공할 수 있습니다.
QuestionPro 를 활용 하면 고객 및 기타 연구 대상을 더 잘 이해하고 중요한 결정을 빠르게 내릴 수 있습니다. 지금 엔터프라이즈급 연구 제품군의 기능을 활용하십시오!