Analiza podgrup: Co to jest + Jak uniknąć błędów

Opublikowany: 2022-05-25

Pierwszym krokiem w przeprowadzeniu analizy podgrup jest zdefiniowanie grup, które chcesz uwzględnić w swoim badaniu. Twoim celem jest ustalenie, czy którakolwiek z tych grup ma wyższe ryzyko rozwoju określonej choroby niż inne grupy. Na przykład, jeśli studiujesz raka piersi, możesz chcieć wiedzieć, czy kobiety, które przeszły wcześniej operacje, są bardziej zagrożone niż kobiety, które nie przeszły operacji.

Gdy już zdecydujesz, jakie będą Twoje podgrupy, nadszedł czas, aby zebrać dane z każdej grupy. Będziesz chciał zebrać informacje od populacji docelowej. Można to zrobić za pomocą ankiet, ankiet lub zbierając dokumentację medyczną osób, u których zdiagnozowano chorobę podczas projektu.

Po zebraniu danych zarówno od osób zdrowych, jak i tych z chorobą lub schorzeniem będącym przedmiotem badania, nadszedł czas na analizę statystyczną! Cel analizy statystycznej jest dwojaki: po pierwsze, musimy upewnić się, że w naszej próbie nie ma błędów; po drugie, musimy sprawdzić, czy są jakieś różnice między naszymi próbkami (to znaczy, czy istnieją różnice między populacjami o różnych cechach).

Co to jest analiza podgrup?

Analiza podgrup to proces, który umożliwia drążenie w dół, aby zobaczyć, jak określone zmienne wpływają na wynik wtórnej analizy danych. Respondenci są pogrupowani według cech demograficznych, takich jak rasa, pochodzenie etniczne, wiek, wykształcenie lub płeć. Innymi zmiennymi mogą być identyfikacja partii, stan zdrowia lub nastawienie do określonych sytuacji.

Badacz może analizować różnice w zmiennych średnich lub rozkładach w podgrupach, aby zidentyfikować rozbieżności lub inne różnice.

Załóżmy na przykład, że prowadzisz ankietę dotyczącą nastawienia ludzi do wykorzystywania zwierząt do badań naukowych i interesuje Cię, czy istnieją różnice między kobietami a mężczyznami w ich opiniach na ten temat.

Możesz przeprowadzić analizę podgrup, dzieląc próbkę na respondentów płci męskiej i żeńskiej i badając ich odpowiedzi, aby sprawdzić, czy jest między nimi jakaś różnica.

W analizach podgrup (na przykład interwencji lub leczenia) staramy się określić wynik czynnika w określonych segmentach populacji lub na określonych parametrach.

Analizę podgrup można podzielić na dwa typy:

  1. Z góry określony
  2. Post-hoc.

Jak uniknąć błędów

Wykonywanie wielu testów na tych samych danych może skutkować fałszywymi alarmami w projektach na dużą skalę. Niektórzy badacze mogą zignorować dużą liczbę żmudnych lub powtarzających się wyników na rzecz wyników podzbioru, w stosunku do których są skłonni.

Jest to szczególnie ważne podczas pracy z algorytmami uczenia maszynowego, które są często używane do generowania wielu powtarzalnych wyników, które mogą być nieprzydatne dla użytkownika. Czas potrzebny na uruchomienie tych algorytmów może być bardzo długi i należy go uwzględnić w kosztach przeprowadzenia eksperymentu.

Jest to problem, ponieważ może poprowadzić naukowców na ścieżkę bez rozważenia innych możliwości, które mogą istnieć w ich zbiorze danych lub alternatywnych podejść, które przyniosłyby lepsze wyniki.

Kiedy analizujesz dane za pomocą podgrup, dzielisz je na mniejsze grupy, aby sprawdzić, czy są między nimi jakieś różnice.

Jeśli chcesz przyjrzeć się, jak płeć wpływa na określony wynik, możesz podzielić próbkę badawczą na mężczyzn i kobiety, a następnie porównać ich odpowiedzi. Ale ile osób powinno być w każdej grupie? A ile porównań musisz zrobić?

Istnieją dwa główne powody, dla których podgrupy mogą prowadzić do błędów. Wielkość próbki może być zbyt mała i można dokonać zbyt wielu porównań. Kiedy podzielisz swoją próbkę badawczą na wiele podgrup, możesz skończyć z zbyt małą liczbą uczestników, aby wykryć różnice lub upewnić się, że różnice nie są tylko kwestią przypadku.

Zalety analizy podgrupy

Główną zaletą analizy podgrup jest to, że umożliwia ona badaczom bardziej szczegółowe testowanie swoich hipotez. Mogą na przykład dowiedzieć się, że niektóre podgrupy reagują lepiej niż inne lub że istnieją różnice między mężczyznami i kobietami.

Analiza podgrup jest powszechną techniką stosowaną w badaniach medycznych. Można to traktować jako rozszerzenie podejścia stosowanego w standardowym badaniu, w którym bada się różne grupy w celu sprawdzenia, czy reagują inaczej na leczenie. Jednak ta technika może być problematyczna z kilku powodów:

  • Niektóre badania nie definiują z góry swoich podgrup ani nie określają, ile podgrup zostanie przebadanych. Jeśli badacz tego nie robi, innym trudno jest zrozumieć, dlaczego wybrali określone grupy i co próbowali pokazać za pomocą każdej analizy. Dobry badacz powinien także zrelacjonować wszystkie analizowane przez siebie podgrupy, a nie tylko te, które dały początek interesującym odkryciom.
  • Możliwe, że podczas analizy podgrup badacze mogą znaleźć coś istotnego statystycznie, ale nieistotnego klinicznie (czyli coś, co tak naprawdę nie ma znaczenia). Załóżmy na przykład, że badamy, czy aspiryna działa lepiej niż paracetamol w leczeniu bólów głowy; okazuje się, że 80 procent osób, które zażywały aspirynę, nie odczuwało żadnej ulgi.

Jak przeprowadzić analizę podgrup

Nie sposób przecenić ważnej roli analizy podgrup w znaczących badaniach. Z tego powodu ważne jest, aby w każdym raporcie uwzględnić następujące elementy:

  1. Wyraźne wskazanie, że wyniki analizy są wynikami podgrup.

  2. Obliczane i raportowane są odpowiednie poziomy istotności.

  3. Jeżeli badanie było z góry określone lub post hoc, należy to zaznaczyć w opisie.

Analiza podgrup jest ważnym elementem projektu badawczego. Na rynku znajdziesz wiele różnych produktów. Wszystkie zostały zaprojektowane tak, aby przynosić korzyści Twoim wysiłkom badawczym, ale musisz wiedzieć, jak skutecznie je wykorzystać.

QuestionPro do analizy

W QuestionPro mamy logikę kontroli kwot, której możesz użyć do analizy podgrup. Możemy dostarczać i dystrybuować adresy URL ankiet ze zmiennymi niestandardowymi w celu rozróżnienia podgrup. Możesz również utworzyć pytania specyficzne dla podgrupy w tej samej ankiecie, tworząc logikę opartą na podgrupie.

Załóżmy na przykład, że chcesz przeanalizować 50 mężczyzn i 50 kobiet. Możesz dodać płeć jako jedno pytanie, a następnie dodać logikę kontroli kwot dla mężczyzn i kobiet. Na podstawie odpowiedzi na pytania dotyczące płci możemy stworzyć logikę dla pytań dotyczących mężczyzn lub kobiet.

W ten sposób, w odpowiedzi, możesz łatwo podzielić na grupy respondentów płci męskiej i żeńskiej z ich odpowiedziami i w oparciu o limity kontroli kwot, upewnisz się, że otrzymasz dokładną liczbę respondentów.

Dowiedz się, jak korzystać z najlepszych funkcji QuestionPro, aby wspierać Twoje potrzeby w zakresie badań rynku

Autorzy: Danielle Figueroa, Virat Harsoda