选择偏差:它是什么,类型和例子
已发表: 2022-09-02什么是选择偏差?
学习科学中的所有统计模型都需要数据。 好的数据对于开发一组统计上有效的模型至关重要,但很容易得到坏信息。 选择偏差会影响从数据收集到分析的所有过程阶段的研究人员。 例如,研究人员可能没有意识到他们的发现可能不适用于其他人或不同的环境。 这种类型的错误将个人随机分配到两个或多个组中的一个,但是,并不是每个可以注册的人都实际参与。
这意味着被认为适合特定计划的人可能会或可能不会选择参与。 因此,参加该计划的人可能与未参加该计划的人具有不同的特征。 非随机选择过程的存在可能导致对因果关系和与之相关的统计数据的错误推断以及收集的数据无效。
选择偏差类型
选择偏差有很多种,每一种都会以特定的方式影响数据的有效性。 让我们来看看一些最常见的:
抽样偏差:
抽样偏差是一种选择偏差,当我们没有从可能在我们人口中的所有人那里收集关于重要变量的数据时,就会出现这种偏差。 造成这种情况的一些原因可能是:研究人员主要从方便或便利抽样中收集样本,或者有时通过仔细选择与研究对象相似且具有相似特征的个体,但不是从他们的人群中随机选择的。
这可能会扭曲任何统计分析和对该特定情况下结果的理解
阅读更多: QuestionPro 的研究偏见
自我选择偏差:
这种类型的选择偏差,也称为“志愿者偏差”,发生在选择参与研究的人不能代表更大的感兴趣人群时。 例如,如果您想研究学生对职业的偏好,您可能只能吸引来自以吸引富有学生而闻名的学校的学生。 当一项研究检查某个种族的人但没有足够的参与者认定为该种族的成员时,也可能出现志愿者偏见。
就像任何其他形式的偏见一样,自我选择偏见会扭曲研究中收集的数据,在大多数情况下,研究人员最终会得到极其不准确的结果,并且系统研究的有效性不存在。
排除偏差:
当研究人员有意在样本总体中包含一些子组时,就会发生包含偏差。 它与无应答抽样偏差密切相关,它会影响您系统调查的内部有效性。
专家将纳入偏倚定义为“涵盖各种潜在偏倚的总称,这些偏倚可能是由于在试验和后续分析中随机纳入患者而导致的。” 发生这种情况时,您的研究结果可能会在变量之间建立错误的联系。
当您在将某些子组随机分组之前有意从样本总体中排除它们时,就会出现排除偏差。 您可能已排除患有某些疾病的患者,例如癌症或 HIV/AIDS,因为未经他们同意对您进行研究是不道德的。 或者,也许您排除了他们,因为您不想在他们的临床试验期间让他们获得另一种治疗选择。 一些研究人员还选择不包括因病太重或太老而无法参与临床试验的人(因为这些人可能无法有效参与或可能无法从参与中获得足够的收益)。

召回偏差:
最常见的回忆偏差形式之一称为追溯记忆失真。 当人们以适合他们当前需求而不是最初目的的方式记住事件和经历时,就会发生追溯性记忆扭曲。 例如,有人可能会回忆起一个事件是一种积极的经历,如果它本来是消极的,甚至是令人愉快的。 此外,当人们难以记住对研究主题很重要的细节时,例如关于他们自己或他人生活的事实,就会发生追溯性记忆失真。
当人们在回忆报告中包含不准确的信息时,也会发生追溯性记忆失真。 当他们报告从未发生过的事情或发生的事情与实际发生的时间不同时,就会发生这种情况。
例如,一个人可能会报告说他在某一天从工作到家花了五个小时,而实际上他只花了三个小时,因为他事先在办公桌前吃过午饭,直到当天晚些时候才忘记。
如何避免选择偏差
估计结果(因变量)和几个预测变量之间的关系强度对于许多研究问题都很重要。 双变量分析和多元回归方法通常用于避免选择偏差。
双变量分析是一种定量分析,通常用于确定两个变量之间的经验关系。 在这种方法中,研究人员单独测量每个预测变量,然后应用统计检验来确定它是否会影响结果变量。 如果预测变量与结果之间没有关系,那么他们将无法在其数据收集过程中找到任何选择偏差的证据。 但是,如果这些变量之间存在某种关系,那么在收集这些数据时可能存在某种程度的选择偏差。 多元回归方法允许研究人员评估结果(因变量)和几个预测变量之间的这种关系的强度
通过 QuestionPro 视频快速了解如何避免选择偏差!
QuestionPro Audience 如何帮助您从理想样本中收集有价值的数据。
当您进行研究时,了解选择偏差的性质很重要。 这是您的研究结果受参与者或样本特征影响的趋势。
例如,如果您正在研究糖对糖尿病的影响,并且您有一群糖尿病患者都是您教会的成员,那么这可能是选择偏差的来源。 他们可能比没有糖尿病的人更有可能参加教会活动,因此更有可能在样本中找到自己。 如果您想在研究中避免这种偏见,您应该使用QuestionPro Audience从各种可靠来源收集数据
学到更多