Ajungeți la concluzia corectă cu analiza inferențială
Publicat: 2020-03-23Cu toții suntem vinovați că sărim la concluzii din când în când.
Fie că vă convingeți că nimeni nu va cumpăra un bilet pentru conferința pe care ați muncit atât de mult să o planificați sau că sosirea la aeroport cu două ore înainte pur și simplu nu este timp suficient, toți am făcut-o.
În afara vieții noastre de zi cu zi, este ușor să sari la concluzii inexacte la locul de muncă, indiferent de industrie. Când facem acest lucru, în esență generalizăm, dar dacă ați putea face aceste generalizări mai precis? Este posibil atunci când rulați teste de analiză inferențială.
Ce este analiza inferenţială?
Analiza inferențială este utilizată pentru a trage și măsura fiabilitatea concluziilor despre o populație care se bazează pe informațiile colectate dintr-un eșantion al populației. Deoarece analiza inferențială nu eșantionează toată lumea dintr-o populație, rezultatele vor conține întotdeauna un anumit nivel de incertitudine.
Când ne aruncăm în analize statistice, de multe ori dimensiunea populației pe care căutăm să o analizăm este prea mare, ceea ce face imposibil să studiem pe toată lumea. În aceste cazuri, datele sunt colectate folosind eșantioane aleatorii de indivizi dintr-o anumită populație. Apoi, analiza inferenţială este utilizată asupra datelor pentru a ajunge la concluzii despre populaţia totală.
Deoarece este adesea imposibil să măsurați o întreagă populație de oameni, analiza inferențială se bazează pe colectarea datelor de la un eșantion de indivizi din cadrul populației. În esență, analiza inferențială este folosită pentru a încerca să deducă dintr-un eșantion de date ceea ce ar putea crede sau arăta populația.
Există două moduri principale de a proceda în acest sens:
- Estimarea parametrilor: luarea unei statistici dintr-un eșantion de date (cum ar fi media eșantionului) și utilizarea acesteia pentru a concluziona ceva despre populație (media populației).
- Teste de ipoteză: Utilizarea eșantioanelor de date pentru a răspunde întrebărilor specifice de cercetare.
În estimarea parametrilor, eșantionul este utilizat pentru a estima o valoare care descrie întreaga populație, pe lângă un interval de încredere. Apoi, estimarea este creată.
În testarea ipotezelor, datele sunt utilizate pentru a determina dacă sunt suficient de puternice pentru a susține sau a respinge o ipoteză.
Analiza descriptivă vs. analiza inferenţială
Cele două tipuri principale de analiză statistică pe care oamenii le folosesc cel mai des sunt analiza descriptivă și analiza inferențială. Din această cauză, nu este neobișnuit ca cei doi să fie confundați unul pentru celălalt, deși oferă analiștilor de date perspective diferite asupra datelor care sunt colectate.
Deși nu se poate afișa întreaga imagine, atunci când sunt utilizate împreună, acestea oferă un instrument puternic pentru vizualizarea datelor și analiza de predicție, deoarece se bazează pe același set de date.
Analiza statistică descriptivă oferă informații care descriu datele într-un fel. Acest lucru se face uneori cu diagrame și grafice realizate cu software de vizualizare a datelor pentru a explica ce prezintă datele. Această metodă de analiză statistică nu este folosită pentru a trage concluzii, ci doar pentru a rezuma informațiile.
Analiza statistică inferenţială este metoda care va fi folosită pentru a trage concluziile. Permite utilizatorilor să deducă sau să concluzioneze tendințe despre o populație mai mare pe baza eșantioanelor care sunt analizate. Practic, preia date dintr-un eșantion și apoi face concluzii despre o populație sau un grup mai mare.
Acest tip de analiză statistică este adesea folosit pentru a studia relația dintre variabilele dintr-un eșantion, permițând concluzii și generalizări care reprezintă cu exactitate populația. Și, spre deosebire de analiza descriptivă, companiile pot testa o ipoteză și pot ajunge la diverse concluzii din aceste date.

Să ne gândim la asta în felul acesta. Sunteți la un joc de baseball și întrebați un eșantion de 100 de fani dacă le plac hotdog-urile. Ai putea face un grafic cu bare cu răspunsuri da sau nu, care ar fi o analiză descriptivă. Sau ați putea folosi cercetările pentru a concluziona că 93% din populație (toți fanii de baseball de pe toate stadioanele de baseball) îi plac hotdog-urile, ceea ce ar fi o analiză inferențială.
Tipuri de teste de analiză inferenţială
Există multe tipuri de teste de analiză inferenţială care sunt în domeniul statisticii. Ceea ce alegeți să utilizați va depinde de dimensiunea eșantionului dvs., de ipoteza pe care încercați să o rezolvați și de dimensiunea populației care este testată.
Analiza regresiei liniare
Analiza de regresie liniară este utilizată pentru a înțelege relația dintre două variabile (X și Y) într-un set de date ca o modalitate de a estima variabila necunoscută pentru a face proiecții viitoare asupra evenimentelor și obiectivelor.
Obiectivul principal al analizei de regresie este de a estima valorile unei variabile aleatoare (Z) pe baza valorilor variabilelor tale cunoscute (sau fixe) (X și Y). Acesta este de obicei reprezentat printr-un grafic de dispersie, ca cel de mai jos.

Un avantaj cheie al utilizării regresiei în cadrul analizei dvs. este că oferă o privire detaliată asupra datelor și include o ecuație care poate fi utilizată pentru analiza predictivă și optimizarea datelor în viitor.
Formula pentru analiza de regresie este:
Y = a + b(x)
A → se referă la intersecția cu y, valoarea lui y când x = 0
B → se referă la pantă sau ridicare peste alergare
Analiza corelației
Un alt test de analiză inferențială este analiza corelației, care este utilizată pentru a înțelege măsura în care două variabile sunt dependente una de cealaltă. Această analiză testează în esență puterea relației dintre două variabile și dacă corelația lor este puternică sau slabă.
Corelația dintre două variabile poate fi și negativă sau pozitivă, în funcție de variabile. Variabilele sunt considerate „necorelate” atunci când o modificare a uneia nu o afectează pe cealaltă.
Un exemplu în acest sens ar fi prețul și cererea. Acest lucru se datorează faptului că o creștere a cererii determină o creștere corespunzătoare a prețului. Prețul ar crește pentru că mai mulți consumatori doresc ceva și sunt dispuși să plătească mai mult pentru asta.
În general, obiectivul analizei de corelație este de a găsi valoarea numerică care arată relația dintre cele două variabile și modul în care acestea se mișcă împreună. La fel ca regresia, aceasta se face de obicei prin utilizarea unui software de vizualizare a datelor pentru a crea un grafic.

Înrudit: Aflați mai multe despre dezavantajele corelațiilor vs regresiei, inclusiv diferențele și ce metodă ar trebui să folosească afacerea dvs.
Analiza variatiei
Metoda statistică de analiză a varianței (ANOVA) este utilizată pentru a testa și analiza diferențele dintre două sau mai multe medii dintr-un set de date. Acest lucru se realizează prin examinarea cantității de variație între eșantioane.
În termeni cei mai simpli, ANOVA oferă un test statistic dacă două sau mai multe medii ale populației sunt egale, în plus față de generalizarea testului t între două medii.

Aflați mai multe: Un test t este folosit pentru a arăta cât de semnificative sunt diferențele dintre două grupuri. În esență, permite înțelegerea dacă diferențele (măsurate în medii/medii) s-ar fi putut întâmpla întâmplător.
Această metodă va permite testarea grupurilor pentru a vedea dacă există o diferență între ele. De exemplu, puteți testa elevii de la două licee diferite care susțin același examen pentru a vedea dacă un liceu testează mai mult decât celălalt.
ANOVA poate fi, de asemenea, împărțit în două tipuri:
- Unidirecțional: o singură variabilă independentă cu două niveluri. Un exemplu ar fi o marcă de unt de arahide.
- Bidirecțional: două variabile independente care pot avea mai multe niveluri. Un exemplu ar fi o marcă de unt de arahide și caloriile.
Un nivel reprezintă pur și simplu diferitele grupuri din cadrul variabilei. Deci, folosind același exemplu ca mai sus, nivelurile mărcilor de unt de arahide ar putea fi Jif, Skippy sau Peter Pan. Nivelurile de calorii pot fi netede, cremoase sau organice.
Analiza covarianței
Analiza covarianței (ANCOVA) este un amestec unic de analiză a varianței (ANOVA) și regresie. ANCOVA poate arăta ce informații suplimentare sunt disponibile atunci când se ia în considerare o variabilă independentă, sau un factor, la un moment dat, fără a influența pe alții.
Este adesea folosit:
- Pentru o extensie a regresiei multiple ca o modalitate de a compara mai multe linii de regresie
- Pentru a controla covariabile (alte variabile) care nu reprezintă obiectivul principal al studiului dvs
- Pentru o extindere a analizei varianței
- Pentru a studia combinații ale altor variabile de interes
- Pentru a controla factorii care nu pot fi randomizați, dar care pot fi măsurați
ANCOVA poate fi folosit și pentru a pretesta sau posttest o analiză atunci când regresia la medie va afecta măsurarea posttest a statisticii.
De exemplu, să presupunem că afacerea dvs. creează noi produse farmaceutice pentru public care scad tensiunea arterială. Puteți efectua un studiu care monitorizează patru grupuri de tratament și un grup de control.
Dacă utilizați ANOVA, veți putea spune dacă tratamentul scade, de fapt, tensiunea arterială. Când încorporați ANCOVA, puteți controla alți factori care ar putea influența rezultatul, cum ar fi viața de familie, ocupația sau consumul de alte medicamente eliberate pe bază de rețetă.
Interval de încredere
Un interval de încredere este un instrument care este utilizat în analiza inferențială care estimează un parametru, de obicei media, al unei întregi populații. În esență, este cât de multă incertitudine există cu o anumită statistică și este de obicei folosită cu o marjă de eroare.
Intervalul de încredere este exprimat printr-un număr care reflectă cât de sigur sunteți că rezultatele sondajului sau sondajului sunt cele la care v-ați aștepta dacă ar fi posibil să sondați întreaga populație.
De exemplu, dacă rezultatele unui sondaj sau sondaj au un interval de încredere de 98%, atunci acesta definește intervalul de valori despre care puteți fi sigur de 98% că conține media populației. Pentru a ajunge la această concluzie, sunt necesare trei informații:
- Nivel de încredere : Descrie incertitudinea asociată cu o metodă de eșantionare
- Statistică: date colectate din sondaj sau sondaj
- Marja de eroare : Câte puncte procentuale vor diferi rezultatele dvs. de valoarea reală a populației
Testul chi-pătrat
Un test chi-pătrat, altfel cunoscut sub numele de test x2, este utilizat pentru a identifica diferența dintre grupuri atunci când toate variabilele sunt nominale (cunoscută și ca o variabilă cu valori care nu au o valoare numerică), cum ar fi sexul, diferența salarială, apartenența politică și așa mai departe.
Aceste teste sunt utilizate în mod obișnuit cu tabele de contingență specifice care grupează observațiile pe baza caracteristicilor comune.
Întrebările la care ar putea răspunde testul chi-pătrat ar putea fi:
- Nivelul de educație și starea civilă sunt legate pentru toți oamenii din Statele Unite?
- Există o relație între intenția alegătorului și apartenența la un partid politic?
- Genul afectează ce preferă oamenii de vacanță?
De obicei, aceste teste sunt efectuate folosind metoda de analiză statistică numită eșantionare aleatorie simplă pentru a colecta date dintr-un eșantion specific pentru a putea ajunge la o concluzie exactă. Dacă folosim prima întrebare enumerată mai sus, datele pot arăta astfel:
| Nume | stare | Educaţie | |
| 1 | Melissa | Divorţat | doctorat sau mai mare |
| 2 | Casey | Căsătorit | Licențiat |
| 3 | Angela | Căsătorit | GED |
| 4 | Alyssa | Văduvă | Licențiat |
| 5 | Jenna | Niciodata casatorit | GED |
Aceste tabele de contingență sunt folosite ca punct de plecare pentru a organiza datele colectate prin eșantionare aleatorie simplă.
Avantajele analizei inferenţiale
Există multe avantaje în utilizarea analizei inferențiale, în principal că oferă un surplus de informații detaliate – mult mai mult decât ați avea după rularea unui test de analiză descriptivă.
Aceste informații oferă cercetătorilor și analiștilor perspective cuprinzătoare asupra relațiilor dintre două variabile. De asemenea, poate arăta conștientizarea cauzei și efectului și previziunilor cu privire la tendințele și modelele din industrii.
În plus, deoarece este atât de utilizat pe scară largă în lumea afacerilor, precum și în mediul academic, este o metodă universal acceptată de analiză statistică.
Limitările analizei inferenţiale
Când vine vorba de statistici inferenţiale, există două limitări principale.
Prima limitare vine din faptul că, deoarece datele analizate provin dintr-o populație care nu a fost măsurată în totalitate, analiștii de date nu pot fi niciodată 100% siguri că statisticile calculate sunt corecte. Deoarece analiza inferențială se bazează pe procesul de utilizare a valorilor măsurate într-un eșantion pentru a concluziona valorile care ar fi măsurate din populația totală, va exista întotdeauna un anumit nivel de incertitudine cu privire la rezultate.
A doua limitare este că unele teste inferențiale necesită ca analistul sau cercetătorul să facă o presupunere educată bazată pe teorii pentru a rula testele. Similar cu prima limitare, va exista incertitudine în jurul acestor ipoteze, ceea ce va însemna și unele repercusiuni asupra fiabilității rezultatelor unor teste statistice.
Nu sari la concluzii
Înainte de a ajunge la o concluzie potențial inexactă cu privire la date, asigurați-vă că profitați de informațiile care vă așteaptă în cadrul unui test de analiză inferențială.
Indiferent de tipul de concluzie la care doriți să ajungeți sau de ipoteza cu care începeți, puteți fi surprins de rezultatele pe care le poate aduce un test de analiză inferențială.
Căutați un software de analiză statistică pentru a interpreta mai bine toate seturile dvs. de date? Sau poate un instrument care face chiar și cea mai complexă analiză statistică simplă și concludentă? Consultați lista noastră de recenzii imparțiale despre G2!
