通過推理分析得出正確的結論
已發表: 2020-03-23我們都因時不時下結論而感到內疚。
無論是說服自己沒有人會為您努力計劃的會議買票,還是提前兩小時到達機場根本不夠時間,我們都做到了。
在我們的日常生活之外,很容易在工作中得出不准確的結論,無論行業如何。 當我們這樣做時,我們本質上是在泛化,但是如果你可以更準確地進行這些泛化呢? 當您運行推理分析測試時,這是可能的。
什麼是推理分析?
推論分析用於得出和衡量基於從人口樣本中收集的信息得出的關於人口的結論的可靠性。 由於推理分析不會對總體中的每個人進行抽樣,因此結果將始終包含某種程度的不確定性。
在深入進行統計分析時,我們要分析的人口規模通常太大,因此無法研究每個人。 在這些情況下,數據是使用特定人群中個體的隨機樣本收集的。 然後,對數據進行推理分析,得出關於總體人口的結論。
因為通常不可能測量整個人群,推理分析依賴於從人群中的個人樣本中收集數據。 從本質上講,推理分析用於嘗試從數據樣本中推斷出人群可能會想什麼或表現出什麼。
有兩種主要方法可以解決這個問題:
- 估計參數:從數據樣本中獲取統計數據(如樣本均值)並使用它來得出有關總體的某些信息(總體均值)。
- 假設檢驗:使用數據樣本來回答特定的研究問題。
在估計參數時,除了置信區間外,樣本還用於估計描述整個總體的值。 然後,創建估計。
在假設檢驗中,數據用於確定它是否足以支持或拒絕假設。
描述性分析與推理分析
人們最常使用的兩種主要統計分析類型是描述性分析和推理分析。 正因為如此,兩者相互混淆的情況並不少見,即使它們為數據分析師提供了對所收集數據的不同見解。
雖然無法顯示全貌,但當它們一起使用時,它們為數據可視化和預測分析提供了強大的工具,因為它們依賴於同一組數據。
描述性統計分析提供以某種方式描述數據的信息。 這有時是通過使用數據可視化軟件製作的圖表來完成的,以解釋數據呈現的內容。 這種統計分析方法不用於得出結論,僅用於總結信息。
推論統計分析是用於得出結論的方法。 它允許用戶根據所分析的樣本推斷或得出更大群體的趨勢。 基本上,它從樣本中獲取數據,然後對更大的人口或群體做出結論。
這種類型的統計分析通常用於研究樣本內變量之間的關係,從而得出準確代表總體的結論和概括。 與描述性分析不同,企業可以檢驗假設並從這些數據中得出各種結論。

讓我們這樣想。 你在看一場棒球比賽,詢問 100 名球迷是否喜歡熱狗。 您可以製作是或否答案的條形圖,這將是描述性分析。 或者您可以使用您的研究得出結論,即 93% 的人口(所有棒球場中的所有棒球迷)喜歡熱狗,這將是推理分析。
推理分析測試的類型
統計領域有許多類型的推理分析測試。 您選擇使用哪一個將取決於您的樣本量、您嘗試解決的假設以及被測試人口的規模。
線性回歸分析
線性回歸分析用於理解數據集中兩個變量(X 和 Y)之間的關係,作為估計未知變量以對事件和目標進行未來預測的一種方式。
回歸分析的主要目標是根據已知(或固定)變量(X 和 Y)的值來估計隨機變量 (Z) 的值。 這通常由散點圖表示,如下圖所示。

在分析中使用回歸的一個關鍵優勢是它提供了對數據的詳細查看,並包含一個可用於預測分析和未來優化數據的方程。
回歸分析的公式為:
Y = a + b(x)
A→指y截距,x=0時y的值
B→指坡度,或上升超過運行
相關性分析
另一種推理分析測試是相關分析,用於了解兩個變量相互依賴的程度。 該分析主要測試兩個變量之間關係的強度,以及它們的相關性是強還是弱。
取決於變量,兩個變量之間的相關性也可以是負的或正的。 當一個變量的變化不影響另一個變量時,變量被認為是“不相關的”。
這方面的一個例子是價格和需求。 這是因為需求的增加會導致價格的相應上漲。 價格會上漲,因為更多的消費者想要某樣東西並且願意為此付出更多。
總體而言,相關分析的目標是找到顯示兩個變量之間的關係以及它們如何一起移動的數值。 與回歸一樣,這通常是通過利用數據可視化軟件創建圖表來完成的。

相關:詳細了解相關性與回歸的來龍去脈,包括差異以及您的企業應使用的方法。
方差分析
方差分析 (ANOVA) 統計方法用於測試和分析數據集中兩個或多個均值之間的差異。 這是通過檢查樣本之間的變化量來完成的。
簡而言之,ANOVA 提供了兩個或多個總體均值是否相等的統計檢驗,此外還可以推廣兩個均值之間的 t 檢驗。
了解更多: t 檢驗用於顯示兩組之間的差異有多顯著。 從本質上講,它允許了解差異(以均值/平均值衡量)是否可能是偶然發生的。

這種方法將允許測試組以查看它們之間是否存在差異。 例如,您可以對參加同一考試的兩所不同高中的學生進行測試,以查看一所高中的考試成績是否高於另一所。
ANOVA也可以分為兩種類型:
- 單向:只有一個具有兩個水平的自變量。 一個例子是花生醬品牌。
- 雙向:兩個可以有多個水平的自變量。 一個例子是花生醬品牌和卡路里。
一個級別只是變量內的不同組。 因此,使用與上述相同的示例,花生醬的品牌級別可能是 Jif、Skippy 或 Peter Pan。 卡路里的水平可以是光滑的、奶油的或有機的。
協方差分析
協方差分析 (ANCOVA) 是方差分析 (ANOVA) 和回歸分析的獨特組合。 ANCOVA 可以顯示在一次考慮一個自變量或因素時可以獲得哪些額外信息,而不會影響其他變量。
它經常被使用:
- 對於多元回歸的擴展,作為比較多元回歸線的一種方式
- 控制不是研究重點的協變量(其他變量)
- 對於方差分析的擴展
- 研究其他感興趣變量的組合
- 控制不能隨機但可以測量的因素
當回歸均值會影響統計數據的後測測量時,ANCOVA 還可用於對分析進行前測或後測。
例如,假設您的企業為公眾生產降低血壓的新藥物。 您可以進行一項監測四個治療組和一個對照組的研究。
如果您使用方差分析,您將能夠判斷治療是否確實降低了血壓。 當您加入 ANCOVA 時,您可以控制可能影響結果的其他因素,例如家庭生活、職業或其他處方藥的使用。
置信區間
置信區間是一種用於推斷分析的工具,用於估計整個總體的參數,通常是平均值。 從本質上講,它是任何特定統計數據的不確定性,並且通常在誤差範圍內使用。
置信區間用一個數字表示,該數字反映了您對調查或民意調查結果是否符合您在可以調查整個人口時所期望的結果的把握程度。
例如,如果民意調查或調查的結果具有 98% 的置信區間,則這定義了您可以 98% 確定包含總體均值的值範圍。 要得出這個結論,需要三個信息:
- 置信水平:描述與採樣方法相關的不確定性
- 統計數據:從調查或民意調查中收集的數據
- 誤差範圍:您的結果將與實際人口值相差多少個百分點
卡方檢驗
卡方檢驗,也稱為 x2 檢驗,用於在所有變量都是名義變量(也稱為值沒有數值的變量)時識別組之間的差異,例如性別、工資差距、政治派別等等。
這些測試通常與特定的列聯表一起使用,這些列聯表根據共同特徵對觀察進行分組。
卡方檢驗可以回答的問題可能是:
- 美國所有人的教育水平和婚姻狀況是否相關?
- 選民意圖和政黨成員之間有關係嗎?
- 性別會影響人們喜歡哪個假期嗎?
通常,這些測試是使用稱為簡單隨機抽樣的統計分析方法完成的,以從特定樣本中收集數據,從而可能得出準確的結論。 如果我們使用上面列出的第一個問題,數據可能如下所示:
姓名 | 地位 | 教育 | |
1 | 梅麗莎 | 離婚 | 博士或以上 |
2 | 凱西 | 已婚 | 學士學位 |
3 | 安吉拉 | 已婚 | 蓋德 |
4 | 艾麗莎 | 寡 | 學士學位 |
5 | 珍娜 | 從未結婚 | 蓋德 |
這些列聯表用作組織通過簡單隨機抽樣收集的數據的起點。
推理分析的優點
使用推理分析有很多優點,主要是它提供了豐富的詳細信息——比運行描述性分析測試後的信息要多得多。
這些信息為研究人員和分析師提供了對兩個變量之間關係的全面洞察。 它還可以顯示對因果關係的認識以及對整個行業趨勢和模式的預測。
此外,由於它在商界和學術界如此廣泛使用,因此它是一種普遍接受的統計分析方法。
推理分析的局限性
在推論統計方面,有兩個主要限制。
第一個限制來自這樣一個事實,即由於正在分析的數據來自尚未完全測量的人群,因此數據分析師無法 100% 確定正在計算的統計數據是正確的。 由於推論分析是基於使用樣本中測量的值來得出將從總人口中測量的值的過程,因此結果總是存在一定程度的不確定性。
第二個限制是一些推理測試需要分析師或研究人員根據理論做出有根據的猜測來運行測試。 與第一個限制類似,這些猜測也存在不確定性,這也意味著對某些統計檢驗結果的可靠性產生一些影響。
不要妄下結論
在您跳到關於數據的可能不准確的結論之前,請確保利用推理分析測試中等待的信息。
無論您希望得出哪種類型的結論,或者您開始的假設是什麼,您都可能會對推理分析測試可以帶來的結果感到驚訝。
尋找統計分析軟件來更好地解釋您的所有數據集? 或者也許是一個工具,即使是最複雜的統計分析也能變得簡單而有說服力? 查看我們對 G2 的公正評論列表!