Смещение выбора: что это такое, типы и примеры

Опубликовано: 2022-09-02

Что такое предвзятость выбора?

Все статистические модели в науках об обучении требуют данных. Хорошие данные имеют решающее значение для разработки статистически достоверного набора моделей, но получить неверную информацию на удивление легко. Предвзятость отбора влияет на исследователей на всех этапах процесса, от сбора данных до анализа. Например, исследователи могут не осознавать, что их выводы могут быть неприменимы к другим людям или другим условиям. Этот тип ошибки представляет людей, случайно отнесенных к одной из двух или более групп, но не все, кого можно зачислить, фактически участвуют.

Это означает, что люди, которые считаются подходящими кандидатами для конкретной программы, могут участвовать или не участвовать в ней. Таким образом, те, кто участвует в программе, могут иметь другие характеристики, чем те, кто не участвует. Существование неслучайного процесса отбора может привести к неверным выводам о причинно-следственной связи и связанных с ней статистических данных, а также к аннулированию собранных данных.

Типы смещения выбора

Существует много типов предвзятости выбора, каждый из которых по-своему влияет на достоверность ваших данных. Давайте рассмотрим некоторые из наиболее распространенных:

  • Смещение выборки:

Систематическая ошибка выборки — это форма систематической ошибки выборки, которая возникает, когда мы не собираем данные от всех людей, которые могли бы входить в нашу популяцию по важной переменной. Некоторые из причин этого могут быть следующими: Исследователь собирает свою выборку в основном из удобной или удобной выборки, а иногда путем тщательного отбора лиц, которые похожи и имеют схожие характеристики с субъектами исследования, но не были выбраны случайным образом из их населения.

Это может исказить любой статистический анализ и понимание результатов в этом конкретном случае.

Подробнее: Предвзятость в исследованиях от QuestionPro

  • Смещение самовыбора:

Этот тип предвзятости отбора, также известный как «предвзятость добровольцев», возникает, когда люди, решившие принять участие в исследовании, не представляют большую часть интересующей его группы. Например, если вы хотите изучить предпочтения студентов в отношении карьеры, вы сможете привлекать только студентов из школ, известных тем, что привлекают богатых студентов. Предвзятость добровольцев также может возникать, когда в исследовании исследуются люди определенной расы, но недостаточно участников, которые идентифицируют себя как представители этой расы.

Как и любая другая форма предвзятости, предвзятость самоотбора искажает данные, собираемые в ходе исследования, и в большинстве случаев исследователь в конечном итоге получает чрезвычайно неточные результаты и отсутствие достоверности вашего систематического исследования.

  • Ошибка исключения:

Смещение включения возникает, когда исследователь намеренно включает некоторые подгруппы в выборку. Это тесно связано с систематической ошибкой выборки, связанной с отсутствием ответов, и влияет на внутреннюю достоверность вашего систематического исследования.

Эксперты определяют предвзятость включения как «собирательный термин, охватывающий различные потенциальные предубеждения, которые могут возникнуть в результате включения пациентов в исследование и последующие анализы после рандомизации». Когда это происходит, результаты вашего исследования могут установить ложную связь между переменными.

Систематическая ошибка исключения возникает, когда вы намеренно исключаете некоторые подгруппы из выборки, прежде чем рандомизировать их в группы. Возможно, вы исключили пациентов с определенными заболеваниями, такими как рак или ВИЧ/СПИД, потому что с вашей стороны было бы неэтично изучать этих людей без их согласия. Или, может быть, вы исключили их, потому что не хотели предоставлять им доступ к другому варианту лечения во время клинических испытаний. Некоторые исследователи также предпочитают не включать людей, которые слишком больны или слишком стары для участия в клинических испытаниях (поскольку эти люди могут быть не в состоянии эффективно участвовать или могут не получить от участия достаточной пользы).

  • Отзыв смещения:

Одна из наиболее распространенных форм искажения памяти называется ретроактивным искажением памяти. Искажение ретроактивной памяти происходит, когда люди вспоминают события и переживания таким образом, который соответствует их текущим потребностям, а не их первоначальной цели. Например, кто-то может вспомнить событие как положительное или даже приятное, если оно должно было быть негативным. Кроме того, ретроактивное искажение памяти может произойти, когда люди с трудом запоминают детали, важные для темы исследования, такие как факты из своей собственной жизни или жизни других людей.

Искажение ретроактивной памяти также может произойти, когда люди включают неточную информацию в свои отчеты о воспоминаниях. Это происходит, когда они сообщают о чем-то, чего никогда не было, или о том, что произошло не в то время, когда это произошло на самом деле.

Например, человек может сообщить, что в какой-то день он потратил пять часов на дорогу с работы домой, тогда как на самом деле это заняло у него всего три часа, потому что он заранее пообедал за своим столом и забыл об этом до позднего вечера.

Как избежать предвзятого выбора

Оценка силы взаимосвязи между результатом (зависимой переменной) и несколькими переменными-предикторами важна для многих исследовательских вопросов. Двумерный анализ и методы множественной регрессии обычно используются, чтобы избежать систематической ошибки выбора.

Двумерный анализ — это количественный анализ, часто используемый для определения эмпирической связи между двумя переменными. В этом методе исследователи измеряют каждую предикторную переменную по отдельности, а затем применяют статистические тесты, чтобы определить, влияет ли она на переменную результата. Если между переменными-предикторами и результатом нет связи, то они не смогут найти никаких доказательств предвзятости отбора в процессе сбора данных. Однако, если между этими переменными существует какая-то взаимосвязь, то вполне возможно, что при сборе этих данных присутствовал некоторый уровень систематической ошибки отбора. Методы множественной регрессии позволяют исследователям оценить силу этой взаимосвязи между результатом (зависимой переменной) и несколькими переменными-предикторами.

Узнайте, как избежать предвзятости при выборе, с помощью этого короткого видеоролика Audience by QuestionPro !

Как QuestionPro Audience может помочь вам собрать ценные данные из вашей идеальной выборки.

Когда вы проводите исследование, важно понимать природу систематической ошибки отбора. Это тенденция к тому, что на результаты вашего исследования будут влиять характеристики ваших участников или выборки .

Если вы проводите исследование влияния сахара на диабет, например, и у вас есть группа людей с диабетом, которые являются членами вашей церкви, это может быть источником систематической ошибки при отборе. Они могут с большей вероятностью участвовать в церковных мероприятиях, чем те, у кого нет диабета, поэтому они с большей вероятностью окажутся в выборке. Если вы хотите избежать такого рода предвзятости в своем исследовании, вам следует собирать данные из самых разных надежных источников с помощью QuestionPro Audience .

УЧИТЬ БОЛЬШЕ