Dojdź do właściwego wniosku dzięki analizie wnioskowej
Opublikowany: 2020-03-23Wszyscy jesteśmy winni od czasu do czasu wyciągania pochopnych wniosków.
Niezależnie od tego, czy chodzi o przekonanie siebie, że nikt nie kupi biletu na konferencję, nad którą tak ciężko pracowałeś, czy też przybycie na lotnisko z dwugodzinnym wyprzedzeniem to po prostu za mało, wszyscy to zrobiliśmy.
Poza naszym codziennym życiem, w pracy, bez względu na branżę, łatwo jest poskoczyć do nieprecyzyjnych wniosków. Kiedy to robimy, zasadniczo uogólniamy, ale co by było, gdybyś mógł dokonać tych uogólnień dokładniej? Jest to możliwe po uruchomieniu testów analizy wnioskowania.
Co to jest analiza wnioskowa?
Analiza wnioskowania służy do wyciągania i mierzenia wiarygodności wniosków dotyczących populacji, które są oparte na informacjach zebranych z próbki populacji. Ponieważ analiza wnioskowania nie obejmuje wszystkich próbek w populacji, wyniki zawsze będą zawierać pewien poziom niepewności.
Zagłębiając się w analizę statystyczną, często wielkość populacji, którą chcemy analizować, jest zbyt duża, co uniemożliwia zbadanie wszystkich. W takich przypadkach dane są zbierane przy użyciu losowych próbek osób z określonej populacji. Następnie na danych stosuje się analizę wnioskowania, aby wyciągnąć wnioski na temat całej populacji.
Ponieważ często niemożliwe jest zmierzenie całej populacji ludzi, analiza wnioskowania polega na gromadzeniu danych z próbki osób z populacji. Zasadniczo, analiza wnioskowa służy do próby wywnioskowania z próbki danych, co populacja może pomyśleć lub pokazać.
Można to zrobić na dwa główne sposoby:
- Parametry szacowania: Pobranie statystyki z próbki danych (takiej jak średnia próbki) i użycie jej do wywnioskowania czegoś o populacji (średnia populacji).
- Testy hipotez: Wykorzystanie próbek danych do odpowiedzi na konkretne pytania badawcze.
Podczas szacowania parametrów próbka służy do oszacowania wartości opisującej całą populację, oprócz przedziału ufności. Następnie tworzone jest oszacowanie.
W testowaniu hipotez dane są wykorzystywane do określenia, czy są wystarczająco silne, aby poprzeć lub odrzucić założenie.
Analiza opisowa a analiza wnioskowa
Dwa główne rodzaje analizy statystycznej, z których ludzie korzystają najczęściej, to analiza opisowa i analiza wnioskowa. Z tego powodu często zdarza się, że te dwa elementy są ze sobą mylone, mimo że zapewniają analitykom danych różne wglądy w gromadzone dane.
Chociaż nie można pokazać całego obrazu, użyte razem stanowią potężne narzędzie do wizualizacji danych i analizy predykcyjnej, ponieważ opierają się na tym samym zestawie danych.
Opisowa analiza statystyczna dostarcza informacji, które w jakiś sposób opisują dane. Czasami robi się to za pomocą wykresów i wykresów wykonanych za pomocą oprogramowania do wizualizacji danych, aby wyjaśnić, co przedstawiają dane. Ta metoda analizy statystycznej nie służy do wyciągania wniosków, a jedynie do podsumowania informacji.
Wnioskowa analiza statystyczna to metoda, która zostanie wykorzystana do wyciągnięcia wniosków. Pozwala użytkownikom wywnioskować lub wnioskować o trendach dotyczących większej populacji na podstawie analizowanych próbek. Zasadniczo pobiera dane z próbki, a następnie wyciąga wnioski dotyczące większej populacji lub grupy.
Ten rodzaj analizy statystycznej jest często używany do badania relacji między zmiennymi w próbie, co pozwala na wyciągnięcie wniosków i uogólnień, które dokładnie reprezentują populację. I w przeciwieństwie do analizy opisowej, firmy mogą testować hipotezę i wyciągać z tych danych różne wnioski.

Pomyślmy o tym w ten sposób. Jesteś na meczu baseballowym i pytasz 100 fanów, czy lubią hot dogi. Możesz zrobić wykres słupkowy z odpowiedziami tak lub nie, co byłoby analizą opisową. Możesz też wykorzystać swoje badania, aby wywnioskować, że 93% populacji (wszyscy fani baseballu na wszystkich stadionach baseballowych) lubią hot-dogi, co byłoby analizą inferencyjną.
Rodzaje testów analizy wnioskowej
Istnieje wiele rodzajów testów analizy wnioskowania, które znajdują się w polu statystyki. Wybór, który wybierzesz, będzie zależeć od wielkości próbki, hipotezy, którą próbujesz rozwiązać, oraz wielkości badanej populacji.
Analiza regresji liniowej
Analiza regresji liniowej służy do zrozumienia związku między dwiema zmiennymi (X i Y) w zestawie danych jako sposób na oszacowanie nieznanej zmiennej w celu dokonania przyszłych prognoz dotyczących wydarzeń i celów.
Głównym celem analizy regresji jest oszacowanie wartości zmiennej losowej (Z) na podstawie wartości znanych (lub ustalonych) zmiennych (X i Y). Jest to zazwyczaj reprezentowane przez wykres punktowy, taki jak ten poniżej.

Jedną z kluczowych zalet korzystania z regresji w ramach analizy jest to, że zapewnia ona szczegółowy wgląd w dane i zawiera równanie, które można wykorzystać do analizy predykcyjnej i optymalizacji danych w przyszłości.
Wzór na analizę regresji to:
Y = a + b(x)
A → odnosi się do punktu przecięcia y, wartości y, gdy x = 0
B → odnosi się do nachylenia lub wzniesienia nad przebiegiem
Analiza korelacji
Innym testem analizy wnioskowania jest analiza korelacji, która służy do zrozumienia stopnia, w jakim dwie zmienne są od siebie zależne. Analiza ta zasadniczo sprawdza siłę związku między dwiema zmiennymi oraz to, czy ich korelacja jest silna czy słaba.
Korelacja między dwiema zmiennymi może być również ujemna lub dodatnia, w zależności od zmiennych. Zmienne są uważane za „nieskorelowane”, gdy zmiana jednej nie wpływa na drugą.
Przykładem może być cena i popyt. Dzieje się tak, ponieważ wzrost popytu powoduje odpowiedni wzrost ceny. Cena wzrosłaby, ponieważ więcej konsumentów czegoś chce i jest gotowych zapłacić za to więcej.
Ogólnie rzecz biorąc, celem analizy korelacji jest znalezienie wartości liczbowej, która pokazuje związek między dwiema zmiennymi i sposób ich wzajemnego poruszania się. Podobnie jak w przypadku regresji, zwykle odbywa się to za pomocą oprogramowania do wizualizacji danych w celu utworzenia wykresu.

Powiązane: Dowiedz się więcej o tajnikach korelacji i regresji, w tym o różnicach i metodzie, którą powinna stosować Twoja firma.
Analiza wariancji
Metoda statystyczna analizy wariancji (ANOVA) służy do testowania i analizowania różnic między dwiema lub większą liczbą średnich ze zbioru danych. Odbywa się to poprzez zbadanie wielkości zmienności między próbkami.
Mówiąc najprościej, ANOVA zapewnia test statystyczny, czy dwie lub więcej średnich populacji jest równych, oprócz uogólnienia testu t między dwiema średnimi.
Dowiedz się więcej: Test t służy do wykazania, jak istotne są różnice między dwiema grupami. Zasadniczo pozwala zrozumieć, czy różnice (mierzone w średnich/średnich) mogły zaistnieć przypadkowo.

Ta metoda pozwoli na przetestowanie grup, aby sprawdzić, czy jest między nimi różnica. Na przykład możesz sprawdzić uczniów w dwóch różnych szkołach średnich, którzy zdają ten sam egzamin, aby sprawdzić, czy jedno ze szkół średnich wypadnie wyżej od drugiego.
ANOVA można również podzielić na dwa typy:
- Jednokierunkowa: Tylko jedna niezależna zmienna z dwoma poziomami. Przykładem może być marka masła orzechowego.
- Dwukierunkowa: Dwie niezależne zmienne, które mogą mieć wiele poziomów. Przykładem może być marka masła orzechowego i kalorie.
Poziom to po prostu różne grupy w zmiennej. Korzystając z tego samego przykładu, co powyżej, poziomy marek masła orzechowego mogą być Jif, Skippy lub Peter Pan. Poziomy kalorii mogą być gładkie, kremowe lub organiczne.
Analiza kowariancji
Analiza kowariancji (ANCOVA) to unikalne połączenie analizy wariancji (ANOVA) i regresji. ANCOVA może pokazać, jakie dodatkowe informacje są dostępne, gdy rozważa się jedną zmienną niezależną lub czynnik na raz, bez wpływu na inne.
Jest często używany:
- Dla rozszerzenia regresji wielokrotnej jako sposobu porównywania linii regresji wielokrotnej
- Aby kontrolować współzmienne (inne zmienne), które nie są głównym przedmiotem Twojego badania
- Dla rozszerzenia analizy wariancji
- Aby zbadać kombinacje innych interesujących zmiennych
- Aby kontrolować czynniki, których nie można zrandomizować, ale można je zmierzyć
ANCOVA może być również używana do wstępnego lub końcowego testu analizy, gdy regresja do średniej wpłynie na pomiar statystyki po teście.
Załóżmy na przykład, że Twoja firma tworzy nowe leki dla społeczeństwa, które obniżają ciśnienie krwi. Możesz przeprowadzić badanie, które monitoruje cztery grupy leczenia i jedną grupę kontrolną.
Jeśli użyjesz ANOVA, będziesz w stanie stwierdzić, czy leczenie faktycznie obniża ciśnienie krwi. Po włączeniu ANCOVA możesz kontrolować inne czynniki, które mogą wpływać na wynik, takie jak życie rodzinne, zawód lub zażywanie innych leków na receptę.
Przedział ufności
Przedział ufności to narzędzie używane w analizie wnioskowania, które szacuje parametr, zwykle średnią, całej populacji. Zasadniczo jest to stopień niepewności związany z jakąkolwiek konkretną statystyką i jest zwykle używany z marginesem błędu.
Przedział ufności jest wyrażony liczbą, która odzwierciedla Twoją pewność, że wyniki ankiety lub ankiety są zgodne z oczekiwaniami, gdyby można było zbadać całą populację.
Na przykład, jeśli wyniki ankiety lub ankiety mają 98% przedział ufności, to definiuje zakres wartości, co do którego możesz mieć 98% pewność, że zawiera średnią populacji. Aby dojść do tego wniosku, potrzebne są trzy informacje:
- Poziom ufności : opisuje niepewność związaną z metodą pobierania próbek
- Statystyka: dane zebrane z ankiety lub sondażu
- Margines błędu : o ile punktów procentowych Twoje wyniki będą się różnić od rzeczywistej wartości populacji?
Test chi-kwadrat
Test chi-kwadrat, inaczej zwany testem x2, służy do identyfikacji różnicy między grupami, gdy wszystkie zmienne są nominalne (znane również jako zmienna z wartościami, które nie mają wartości liczbowej), np. płeć, różnica w wynagrodzeniach, przynależność polityczna i tak dalej.
Testy te są zwykle używane z określonymi tabelami kontyngencji, które grupują obserwacje na podstawie wspólnych cech.
Pytania, na które może odpowiedzieć test chi-kwadrat, mogą brzmieć:
- Czy poziom wykształcenia i stan cywilny są powiązane dla wszystkich ludzi w Stanach Zjednoczonych?
- Czy istnieje związek między intencjami wyborców a przynależnością do partii politycznych?
- Czy płeć ma wpływ na to, które wakacje faworyzują?
Zazwyczaj testy te są wykonywane przy użyciu metody analizy statystycznej zwanej prostym losowym próbkowaniem w celu zebrania danych z określonej próbki, aby potencjalnie dojść do dokładnych wniosków. Jeśli użyjemy pierwszego pytania wymienionego powyżej, dane mogą wyglądać tak:
Nazwa | Status | Edukacja | |
1 | Melisa | Rozwiedziony | Doktorat lub wyższy |
2 | Casey | Żonaty | Licencjat |
3 | Angela | Żonaty | GED |
4 | Alyssa | Wdowiec | Licencjat |
5 | Jenna | Nigdy się nie ożeniłem | GED |
Te tabele kontyngencji są wykorzystywane jako punkt wyjścia do organizowania danych zebranych poprzez proste losowe pobieranie próbek.
Zalety analizy wnioskowania
Korzystanie z analizy wnioskowania ma wiele zalet, przede wszystkim to, że zapewnia nadmiar szczegółowych informacji — znacznie więcej niż po uruchomieniu testu analizy opisowej.
Informacje te dostarczają badaczom i analitykom wszechstronnego wglądu w relacje między dwiema zmiennymi. Może również pokazać świadomość przyczyn i skutków oraz prognoz dotyczących trendów i wzorców w różnych branżach.
Dodatkowo, ponieważ jest tak szeroko stosowana w świecie biznesu, a także w środowisku akademickim, jest powszechnie akceptowaną metodą analizy statystycznej.
Ograniczenia analizy wnioskowania
Jeśli chodzi o statystyki inferencyjne, istnieją dwa główne ograniczenia.
Pierwsze ograniczenie wynika z faktu, że ponieważ analizowane dane pochodzą z populacji, która nie została w pełni zmierzona, analitycy danych nigdy nie mogą być w 100% pewni, że obliczane statystyki są poprawne. Ponieważ analiza wnioskowania opiera się na procesie wykorzystywania wartości zmierzonych w próbce do wyciągnięcia wartości, które byłyby mierzone z całej populacji, zawsze będzie istniał pewien poziom niepewności co do wyników.
Drugim ograniczeniem jest to, że niektóre testy wnioskowania wymagają od analityka lub badacza zgadywania opartego na teoriach w celu przeprowadzenia testów. Podobnie jak w przypadku pierwszego ograniczenia, te domysły będą niepewne, co będzie również oznaczać pewne reperkusje dla wiarygodności wyników niektórych testów statystycznych.
Nie wyciągaj pochopnych wniosków
Zanim przejdziesz do potencjalnie niedokładnych wniosków dotyczących danych, skorzystaj z informacji, które czekają w teście analizy wnioskowania.
Bez względu na rodzaj wniosku, do którego chcesz dojść, lub hipotezę, od której zaczynasz, możesz być zaskoczony wynikami, jakie może przynieść test analizy wnioskowania.
Szukasz oprogramowania do analizy statystycznej, aby lepiej zinterpretować wszystkie swoje zbiory danych? A może narzędzie, które sprawia, że nawet najbardziej skomplikowana analiza statystyczna jest prosta i rozstrzygająca? Sprawdź naszą listę bezstronnych recenzji na temat G2!