聚類分析:它是什麼以及如何使用它

已發表: 2022-07-21

數據對於品牌和組織來說是必不可少的,以便在客戶的腦海中得出推論和結論。 聚類分析市場研究中數據分析的重要組成部分,可幫助品牌了解趨勢、識別各種客戶人口統計數據、購買行為、好惡等等。

市場研究過程中的這種分析方法提供了洞察力,將信息分成更小的群體,有助於了解不同群體在類似情況下的行為方式。 各種組織和研究人員可以根據預定義的集群意義標準將集群劃分為不同的類別,但基本數據分析主題是相似的。

什麼是聚類分析?

聚類分析是研究中的一種統計方法,它允許研究人員將一組對象存儲或分組為小而不同的集群,這些集群的特徵與其他此類不同的集群不同。 探索性數據分析的基本主題有助於品牌、組織和研究人員從視覺數據中獲得洞察力,以發現趨勢並驗證假設和明確的假設。

研究中的這種分析方法通常基於不同領域中使用的統計數據分析,包括模式識別、機器學習、市場研究中的洞察管理、數據清理、生物信息學等。

聚類分析的目的是找到具有明顯行為變化但基本特徵和事物在同一控制組中的對象組。 這種研究方法的一個很好的例子是銀行使用定性和定量數據來繪製客戶之間索賠處理的趨勢。 使用聚類分析可以幫助他們得出欺詐性聲明並更好地了解消費者行為

聚類分析方法

聚類分析有助於研究人員和統計學家對數據做出更深刻的理解並做出更好的決策。 雖然數據可以是定性研究定量研究的一部分,但數據分析仍然在研究平台中進行,數據繪製在圖表上。 但是,如上所述,為了滿足研究需要,使用了各種聚類分析方法。

但是,必須注意,除非有數學推理可以採用特定方式,否則需要通過實驗選擇聚類方法。 讓我們看一下最常用的聚類分析方法。

層次聚類或基於連通性的聚類分析

層次聚類或基於連通性的聚類分析是聚類分析中最常用的方法。 在這種方法中,展示相似組件的數據被分組以形成一個集群。

然後將這些集群與顯示相同屬性的其他集合相關聯以形成其他集群。 這種方法在調查研究中的中心前提是,距離較近的物體比距離較遠的物體更相關。

層次聚類中的另一種方法是分裂法,您從一組數據開始,然後將它們劃分為具有相似信息的較小集群。 在這種方法中,可以更好地定義集群之間的鏈接標準,以了解集群之間的距離及其關係。 需要注意的是,此分析模型中沒有單一的數據分區。

基於質心的聚類

在這種聚類方法中,聚類形成但由單個中心向量點定義。 使用 K-means 方法聚類算法,在具有定義目標的軸上找到中心點。 然後將較小的集群連接到該中心,以使集群與該中心點之間的距離最小化。

這種集群分析技術的一個缺點是集群的數量,k-clusters 將在一開始就被定義,限制了數據分析和表示。

基於分佈的聚類

基於分佈的聚類分析方法將數據分組為具有相同分佈的對象。 該方法是應用最廣泛的統計分析方法。 該方法的顯著特點是使用簡單的隨機抽樣從分佈中收集樣本對象。

當需要顯示屬性和對象之間的相關性時,此模型效果最佳。 然而,該模型的缺點是,由於對像是根據預定義的屬性進行分組的,因此聚類中可能存在偏差元素,因為每個對像都必須匹配一個分佈。

基於密度的聚類

基於密度的聚類方法是第四種常用的聚類分析技術,其中聚類是根據與整個數據集相比的密度來定義的。 稀疏區域中的對像是噪聲點和邊界點,因為它們通常在圖形表示上分離集群。

DBSCAN 是最常用的基於密度的聚類方法。 然而,這種方法的一個缺點是需要降低密度來展示兩個集群之間的差異,這通常會讓人感覺不自然。

聚類分析示例

聚類分析是一個明確的好處,它廣泛應用於行業、功能和研究領域。 為了更好地描述聚類分析在研究中的有用性,讓我們看一下底部的兩個例子。

零售營銷中的聚類分析

品牌傳統上使用聚類分析通過在其客戶群中使用人口統計細分來理解購買行為研究和趨勢通常考慮的幾個因素是地理位置、性別、年齡、家庭年收入等。

這些參數揭示了不同消費者群體如何做出其他購買決定; 因此,零售巨頭使用這些數據來比較如何向此類受眾進行營銷。 這也有助於最大限度地提高支出的投資回報率,同時減少客戶流失

體育科學中的聚類分析

聚類分析的另一個日常用例是在體育領域。 數據科學家、研究人員、醫生、團隊管理人員、球探等,研究相似球員在不同場景中的表現以及他們在運動中的效率。 球員被分為體型、年齡、位置和類似標準來檢查他們的有效性。

使用 QuestionPro 進行聚類分析

查看正確的數據並對其進行分析對研究人員和品牌非常有益。 使用像 QuestionPro 這樣的成熟研究平台,您可以收集研究數據,並幫助您在工具中運行高級分析,從而為您提供重要的見解。

利用QuestionPro ,可以更好地了解您的客戶和其他研究對象并快速做出重要決策。 立即利用企業級研究套件的強大功能!