聚类分析:它是什么以及如何使用它
已发表: 2022-07-21数据对于品牌和组织来说是必不可少的,以便在客户的脑海中得出推论和结论。 聚类分析是市场研究中数据分析的重要组成部分,可帮助品牌了解趋势、识别各种客户人口统计数据、购买行为、好恶等等。
市场研究过程中的这种分析方法提供了洞察力,将信息分成更小的群体,有助于了解不同群体在类似情况下的行为方式。 各种组织和研究人员可以根据预定义的集群意义标准将集群划分为不同的类别,但基本数据分析主题是相似的。
什么是聚类分析?
聚类分析是研究中的一种统计方法,它允许研究人员将一组对象存储或分组为小而不同的集群,这些集群的特征与其他此类不同的集群不同。 探索性数据分析的基本主题有助于品牌、组织和研究人员从视觉数据中获得洞察力,以发现趋势并验证假设和明确的假设。
研究中的这种分析方法通常基于不同领域中使用的统计数据分析,包括模式识别、机器学习、市场研究中的洞察管理、数据清理、生物信息学等。
聚类分析的目的是找到具有明显行为变化但基本特征和事物在同一控制组中的对象组。 这种研究方法的一个很好的例子是银行使用定性和定量数据来绘制客户之间索赔处理的趋势。 使用聚类分析可以帮助他们得出欺诈性声明并更好地了解消费者行为。
聚类分析方法
聚类分析有助于研究人员和统计学家对数据做出更深刻的理解并做出更好的决策。 虽然数据可以是定性研究或定量研究的一部分,但数据分析仍然在研究平台中进行,数据绘制在图表上。 但是,如上所述,为了满足研究需要,使用了各种聚类分析方法。
但是,必须注意,除非有数学推理可以采用特定方式,否则需要通过实验选择聚类方法。 让我们看一下最常用的聚类分析方法。
层次聚类或基于连通性的聚类分析
层次聚类或基于连通性的聚类分析是聚类分析中最常用的方法。 在这种方法中,展示相似组件的数据被分组以形成一个集群。
然后将这些集群与显示相同属性的其他集合相关联以形成其他集群。 这种方法在调查研究中的中心前提是,距离较近的物体比距离较远的物体更相关。
层次聚类中的另一种方法是分裂法,您从一组数据开始,然后将它们划分为具有相似信息的较小集群。 在这种方法中,可以更好地定义集群之间的链接标准,以了解集群之间的距离及其关系。 需要注意的是,此分析模型中没有单一的数据分区。
基于质心的聚类
在这种聚类方法中,聚类形成但由单个中心向量点定义。 使用 K-means 方法聚类算法,在具有定义目标的轴上找到中心点。 然后将较小的集群连接到该中心,以使集群与该中心点之间的距离最小化。

这种集群分析技术的一个缺点是集群的数量,k-clusters 将在一开始就被定义,限制了数据分析和表示。
基于分布的聚类
基于分布的聚类分析方法将数据分组为具有相同分布的对象。 该方法是应用最广泛的统计分析方法。 该方法的显着特点是使用简单的随机抽样从分布中收集样本对象。
当需要显示属性和对象之间的相关性时,此模型效果最佳。 然而,该模型的缺点是,由于对象是根据预定义的属性进行分组的,因此聚类中可能存在偏差元素,因为每个对象都必须匹配一个分布。
基于密度的聚类
基于密度的聚类方法是第四种常用的聚类分析技术,其中聚类是根据与整个数据集相比的密度来定义的。 稀疏区域中的对象是噪声点和边界点,因为它们通常在图形表示上分离集群。
DBSCAN 是最常用的基于密度的聚类方法。 然而,这种方法的一个缺点是需要降低密度来展示两个集群之间的差异,这通常会让人感觉不自然。
聚类分析示例
聚类分析是一个明确的好处,它广泛应用于行业、功能和研究领域。 为了更好地描述聚类分析在研究中的有用性,让我们看一下底部的两个例子。
零售营销中的聚类分析
品牌传统上使用聚类分析通过在其客户群中使用人口统计细分来理解购买行为研究和趋势。 通常考虑的几个因素是地理位置、性别、年龄、家庭年收入等。
这些参数揭示了不同消费者群体如何做出其他购买决定; 因此,零售巨头使用这些数据来比较如何向此类受众进行营销。 这也有助于最大限度地提高支出的投资回报率,同时减少客户流失。
体育科学中的聚类分析
聚类分析的另一个日常用例是在体育领域。 数据科学家、研究人员、医生、团队管理人员、球探等,研究相似球员在不同场景中的表现以及他们在运动中的效率。 球员被分为体型、年龄、位置和类似标准来检查他们的有效性。
使用 QuestionPro 进行聚类分析
查看正确的数据并对其进行分析对研究人员和品牌非常有益。 使用像 QuestionPro 这样的成熟研究平台,您可以收集研究数据,并帮助您在工具中运行高级分析,从而为您提供重要的见解。
利用QuestionPro ,可以更好地了解您的客户和其他研究对象并快速做出重要决策。 立即利用企业级研究套件的强大功能!