Vieni alla giusta conclusione con l'analisi inferenziale
Pubblicato: 2020-03-23Siamo tutti colpevoli di saltare alle conclusioni di tanto in tanto.
Che si tratti di convincerti che nessuno comprerà un biglietto per la conferenza che hai lavorato così duramente per pianificare o che arrivare in aeroporto con due ore di anticipo semplicemente non è abbastanza tempo, l'abbiamo fatto tutti.
Al di fuori della nostra vita quotidiana, è facile saltare a conclusioni imprecise sul lavoro, indipendentemente dal settore. Quando lo facciamo, stiamo essenzialmente generalizzando, ma se potessi rendere queste generalizzazioni in modo più accurato? È possibile quando si eseguono test di analisi inferenziale.
Che cos'è l'analisi inferenziale?
L'analisi inferenziale viene utilizzata per trarre e misurare l'affidabilità delle conclusioni su una popolazione che si basa sulle informazioni raccolte da un campione della popolazione. Poiché l'analisi inferenziale non campiona tutti in una popolazione, i risultati conterranno sempre un certo livello di incertezza.
Quando ci si immerge nell'analisi statistica, spesso la dimensione della popolazione che stiamo cercando di analizzare è troppo grande, rendendo impossibile studiare tutti. In questi casi, i dati vengono raccolti utilizzando campioni casuali di individui all'interno di una specifica popolazione. Quindi, l'analisi inferenziale viene utilizzata sui dati per trarre conclusioni sulla popolazione complessiva.
Poiché spesso è impossibile misurare un'intera popolazione di persone, l'analisi inferenziale si basa sulla raccolta di dati da un campione di individui all'interno della popolazione. In sostanza, l'analisi inferenziale viene utilizzata per cercare di dedurre da un campione di dati ciò che la popolazione potrebbe pensare o mostrare.
Ci sono due modi principali per farlo:
- Parametri di stima: prendere una statistica da un campione di dati (come la media campionaria) e utilizzarla per concludere qualcosa sulla popolazione (la media della popolazione).
- Test di ipotesi: l'uso di campioni di dati per rispondere a domande di ricerca specifiche.
Nella stima dei parametri, il campione viene utilizzato per stimare un valore che descrive l'intera popolazione, oltre a un intervallo di confidenza. Quindi, viene creato il preventivo.
Nella verifica delle ipotesi, i dati vengono utilizzati per determinare se sono sufficientemente forti da supportare o rifiutare un'ipotesi.
Analisi descrittiva vs. analisi inferenziale
I due principali tipi di analisi statistica che le persone usano più spesso sono l'analisi descrittiva e l'analisi inferenziale. Per questo motivo, non è raro che i due siano confusi l'uno con l'altro, anche se forniscono agli analisti di dati informazioni diverse sui dati raccolti.
Sebbene non sia possibile mostrare l'intero quadro, se utilizzati insieme, forniscono un potente strumento per la visualizzazione dei dati e l'analisi delle previsioni, poiché si basano sullo stesso insieme di dati.
L'analisi statistica descrittiva fornisce informazioni che descrivono i dati in qualche modo. Questo a volte viene fatto con grafici e grafici realizzati con un software di visualizzazione dei dati per spiegare cosa presentano i dati. Questo metodo di analisi statistica non viene utilizzato per trarre conclusioni, ma solo per riassumere le informazioni.
L'analisi statistica inferenziale è il metodo che verrà utilizzato per trarre le conclusioni. Consente agli utenti di dedurre o concludere tendenze su una popolazione più ampia in base ai campioni analizzati. Fondamentalmente, prende i dati da un campione e poi trae conclusioni su una popolazione o un gruppo più ampio.
Questo tipo di analisi statistica viene spesso utilizzata per studiare la relazione tra le variabili all'interno di un campione, consentendo conclusioni e generalizzazioni che rappresentano accuratamente la popolazione. E a differenza dell'analisi descrittiva, le aziende possono testare un'ipotesi e trarre varie conclusioni da questi dati.

Pensiamola in questo modo. Sei a una partita di baseball e chiedi a un campione di 100 fan se gli piacciono gli hot dog. Potresti creare un grafico a barre con risposte sì o no, che sarebbe un'analisi descrittiva. Oppure potresti usare la tua ricerca per concludere che il 93% della popolazione (tutti gli appassionati di baseball in tutti gli stadi di baseball) ama gli hot dog, il che sarebbe un'analisi inferenziale.
Tipi di test di analisi inferenziale
Esistono molti tipi di test di analisi inferenziale che si trovano nel campo statistico. Quale scegli di utilizzare dipenderà dalla dimensione del tuo campione, dall'ipotesi che stai cercando di risolvere e dalla dimensione della popolazione sottoposta a test.
Analisi di regressione lineare
L'analisi di regressione lineare viene utilizzata per comprendere la relazione tra due variabili (X e Y) in un set di dati come un modo per stimare la variabile sconosciuta per fare proiezioni future su eventi e obiettivi.
L'obiettivo principale dell'analisi di regressione è stimare i valori di una variabile casuale (Z) in base ai valori delle variabili note (o fisse) (X e Y). Questo è tipicamente rappresentato da un grafico a dispersione, come quello qui sotto.

Uno dei principali vantaggi dell'utilizzo della regressione all'interno dell'analisi è che fornisce uno sguardo dettagliato ai dati e include un'equazione che può essere utilizzata per l'analisi predittiva e l'ottimizzazione dei dati in futuro.
La formula per l'analisi di regressione è:
Y = a + b(x)
A → si riferisce all'intercetta y, il valore di y quando x = 0
B → si riferisce alla pendenza, o al dislivello
Analisi di correlazione
Un altro test di analisi inferenziale è l'analisi di correlazione, che viene utilizzata per comprendere la misura in cui due variabili dipendono l'una dall'altra. Questa analisi essenzialmente verifica la forza della relazione tra due variabili e se la loro correlazione è forte o debole.
La correlazione tra due variabili può anche essere negativa o positiva, a seconda delle variabili. Le variabili sono considerate "non correlate" quando un cambiamento in una non influisce sull'altra.
Un esempio di questo potrebbe essere il prezzo e la domanda. Questo perché un aumento della domanda provoca un corrispondente aumento del prezzo. Il prezzo aumenterebbe perché più consumatori vogliono qualcosa e sono disposti a pagare di più per questo.
Nel complesso, l'obiettivo dell'analisi di correlazione è trovare il valore numerico che mostri la relazione tra le due variabili e come si muovono insieme. Come la regressione, questa operazione viene in genere eseguita utilizzando un software di visualizzazione dei dati per creare un grafico.

Correlati: scopri di più sui dettagli delle correlazioni rispetto alla regressione, comprese le differenze e il metodo che la tua azienda dovrebbe utilizzare.
Analisi della varianza
Il metodo statistico dell'analisi della varianza (ANOVA) viene utilizzato per testare e analizzare le differenze tra due o più medie da un set di dati. Questo viene fatto esaminando la quantità di variazione tra i campioni.
In termini più semplici, ANOVA fornisce un test statistico per verificare se due o più medie della popolazione sono uguali, oltre a generalizzare il test t tra due medie.
Ulteriori informazioni: un test t viene utilizzato per mostrare quanto siano significative le differenze tra due gruppi. In sostanza, permette di capire se le differenze (misurate in medie/medie) possano essere avvenute per caso.

Questo metodo consentirà di testare i gruppi per vedere se c'è una differenza tra loro. Ad esempio, puoi testare gli studenti di due scuole superiori diverse che sostengono lo stesso esame per vedere se una scuola superiore supera l'altra.
L'ANOVA può anche essere suddivisa in due tipi:
- Unidirezionale: una sola variabile indipendente con due livelli. Un esempio potrebbe essere una marca di burro di arachidi.
- Bidirezionale: due variabili indipendenti che possono avere più livelli. Un esempio potrebbe essere una marca di burro di arachidi e le calorie.
Un livello è semplicemente i diversi gruppi all'interno della variabile. Quindi, usando lo stesso esempio di cui sopra, i livelli delle marche di burro di arachidi potrebbero essere Jif, Skippy o Peter Pan. I livelli di calorie potrebbero essere lisci, cremosi o biologici.
Analisi della covarianza
L'analisi della covarianza (ANCOVA) è una miscela unica di analisi della varianza (ANOVA) e regressione. ANCOVA può mostrare quali informazioni aggiuntive sono disponibili quando si considera una variabile o fattore indipendente, alla volta, senza influenzarne altri.
Si usa spesso:
- Per un'estensione della regressione multipla come modo per confrontare più linee di regressione
- Per controllare le covariate (altre variabili) che non sono l'obiettivo principale del tuo studio
- Per un'estensione dell'analisi della varianza
- Studiare combinazioni di altre variabili di interesse
- Per controllare i fattori che non possono essere randomizzati ma che possono essere misurati
ANCOVA può anche essere utilizzato per testare o post-testare un'analisi quando la regressione alla media influenzerà la misurazione della statistica post-test.
Ad esempio, supponiamo che la tua azienda crei nuovi prodotti farmaceutici per il pubblico che abbassano la pressione sanguigna. È possibile condurre uno studio che monitori quattro gruppi di trattamento e un gruppo di controllo.
Se usi ANOVA, sarai in grado di dire se il trattamento, in effetti, abbassa la pressione sanguigna. Quando incorpori ANCOVA, puoi controllare altri fattori che potrebbero influenzare il risultato, come la vita familiare, l'occupazione o l'uso di altri farmaci da prescrizione.
Intervallo di confidenza
Un intervallo di confidenza è uno strumento utilizzato nell'analisi inferenziale che stima un parametro, solitamente la media, di un'intera popolazione. In sostanza, è quanta incertezza c'è con una particolare statistica e viene generalmente utilizzata con un margine di errore.
L'intervallo di confidenza è espresso con un numero che riflette quanto sei sicuro che i risultati del sondaggio o del sondaggio siano quelli che ti aspetteresti se fosse possibile sondare l'intera popolazione.
Ad esempio, se i risultati di un sondaggio o di un sondaggio hanno un intervallo di confidenza del 98%, questo definisce l'intervallo di valori di cui puoi essere certo al 98% che contenga la media della popolazione. Per giungere a questa conclusione sono necessarie tre informazioni:
- Livello di confidenza : Descrive l'incertezza associata a un metodo di campionamento
- Statistica: dati raccolti dal sondaggio o dal sondaggio
- Margine di errore : di quanti punti percentuali i tuoi risultati differiranno dal valore reale della popolazione
Test del chi quadrato
Un test del chi quadrato, altrimenti noto come test x2, viene utilizzato per identificare la differenza tra i gruppi quando tutte le variabili sono nominali (noto anche come una variabile con valori che non hanno un valore numerico), come il sesso, divario salariale, affiliazione politica e così via.
Questi test vengono in genere utilizzati con tabelle di emergenza specifiche che raggruppano le osservazioni in base a caratteristiche comuni.
Le domande a cui il test del chi quadrato potrebbe rispondere potrebbero essere:
- Il livello di istruzione e lo stato civile sono correlati per tutte le persone negli Stati Uniti?
- C'è una relazione tra l'intenzione dell'elettore e l'appartenenza a un partito politico?
- Il genere influisce sulle preferenze delle persone in vacanza?
Di solito, questi test vengono eseguiti utilizzando il metodo di analisi statistica chiamato campionamento casuale semplice per raccogliere dati da un campione specifico per giungere potenzialmente a una conclusione accurata. Se utilizziamo la prima domanda sopra elencata, i dati potrebbero apparire come:
Nome | Stato | Formazione scolastica | |
1 | Melissa | Divorziato | Dottorato di ricerca o superiore |
2 | Casey | Sposato | Laurea triennale |
3 | Angela | Sposato | GED |
4 | Alissa | vedova | Laurea triennale |
5 | Jenna | Mai sposato | GED |
Queste tabelle di contingenza vengono utilizzate come punto di partenza per organizzare i dati raccolti attraverso un semplice campionamento casuale.
Vantaggi dell'analisi inferenziale
Ci sono molti vantaggi nell'usare l'analisi inferenziale, principalmente che fornisce un'eccedenza di informazioni dettagliate, molto più di quelle che avresti dopo aver eseguito un test di analisi descrittiva.
Queste informazioni forniscono a ricercatori e analisti informazioni complete sulle relazioni tra due variabili. Può anche mostrare consapevolezza di causa ed effetto e previsioni relative a tendenze e modelli in tutti i settori.
Inoltre, poiché è così ampiamente utilizzato nel mondo degli affari e nel mondo accademico, è un metodo di analisi statistica universalmente accettato.
Limiti dell'analisi inferenziale
Quando si tratta di statistiche inferenziali, ci sono due limiti principali.
La prima limitazione deriva dal fatto che poiché i dati analizzati provengono da una popolazione che non è stata completamente misurata, gli analisti di dati non possono mai essere sicuri al 100% che le statistiche calcolate siano corrette. Poiché l'analisi inferenziale si basa sul processo di utilizzo dei valori misurati in un campione per concludere i valori che sarebbero misurati dalla popolazione totale, ci sarà sempre un certo livello di incertezza riguardo ai risultati.
La seconda limitazione è che alcuni test inferenziali richiedono all'analista o al ricercatore di formulare un'ipotesi plausibile basata su teorie per eseguire i test. Analogamente alla prima limitazione, ci sarà incertezza attorno a queste ipotesi, il che comporterà anche alcune ripercussioni sull'affidabilità dei risultati di alcuni test statistici.
Non saltare alle conclusioni
Prima di saltare a una conclusione potenzialmente imprecisa sui dati, assicurati di sfruttare le informazioni che ti attendono all'interno di un test di analisi inferenziale.
Indipendentemente dal tipo di conclusione a cui stai cercando di arrivare o dall'ipotesi con cui inizi, potresti essere sorpreso dai risultati che un test di analisi inferenziale può portare.
Cerchi un software di analisi statistica per interpretare al meglio tutti i tuoi set di dati? O forse uno strumento che renda semplice e conclusiva anche l'analisi statistica più complessa? Dai un'occhiata al nostro elenco di recensioni imparziali su G2!