선택 편향: 정의, 유형 및 예
게시 됨: 2022-09-02선택 편향이란 무엇입니까?
학습 과학의 모든 통계 모델에는 데이터가 필요합니다. 좋은 데이터는 통계적으로 유효한 모델 집합을 개발하는 데 중요하지만 잘못된 정보를 얻는 것은 놀라울 정도로 쉽습니다. 선택 편향은 데이터 수집에서 분석에 이르는 모든 프로세스 단계에서 연구자에게 영향을 미칩니다. 예를 들어, 연구자들은 자신의 발견이 다른 사람이나 다른 환경에 적용되지 않을 수 있다는 사실을 깨닫지 못할 수 있습니다. 이 유형의 오류는 두 개 이상의 그룹 중 하나에 무작위로 할당된 개인을 표시하지만 등록할 수 있는 모든 사람이 실제로 참여하는 것은 아닙니다.
이것은 특정 프로그램에 적합한 후보자라고 생각되는 사람들이 참여를 선택할 수도 있고 선택하지 않을 수도 있음을 의미합니다. 따라서 프로그램에 참여하는 사람들은 그렇지 않은 사람들과 다른 특성을 가질 수 있습니다. 비무작위 선택 프로세스의 존재는 수집된 데이터의 무효화는 물론 인과관계 및 관련 통계에 대한 잘못된 추론을 초래할 수 있습니다.
선택 바이어스 유형
선택 편향에는 여러 가지 유형이 있으며 각각 특정 방식으로 데이터의 유효성에 영향을 미칩니다. 가장 일반적인 몇 가지를 살펴보겠습니다.
샘플링 바이어스:
샘플링 편향은 중요한 변수에 대해 모집단에 포함될 수 있는 모든 사람들로부터 데이터를 수집하지 않을 때 발생하는 선택 편향의 한 형태입니다. 그 이유 중 일부는 다음과 같습니다. 연구자는 주로 편의 또는 편의 샘플링에서 또는 때때로 연구 대상과 유사하고 유사한 특성을 갖지만 모집단에서 무작위로 선택되지 않은 개인을 신중하게 선택하여 표본을 수집합니다.
이것은 특정 경우에 결과에 대한 통계 분석 및 이해를 왜곡할 수 있습니다.
더 읽어보기: QuestionPro의 연구에서의 편견
자기 선택 편향:
"자원자 편향"이라고도 하는 이러한 유형의 선택 편향은 연구에 참여하기로 선택한 사람들이 더 많은 관심 대상 집단을 대표하지 않을 때 발생합니다. 예를 들어, 직업에 대한 학생의 선호도를 연구하려는 경우 부유한 학생을 유치하는 것으로 알려진 학교의 학생만 유치할 수 있습니다. 자원 봉사자 편향은 특정 인종의 사람들을 조사했지만 해당 인종의 구성원으로 식별하는 참가자가 충분하지 않은 경우에도 발생할 수 있습니다.
다른 형태의 편향과 마찬가지로 자기 선택 편향은 연구에서 수집한 데이터를 왜곡합니다. 대부분의 경우 연구자는 시스템 연구의 매우 부정확한 결과와 존재하지 않는 타당성을 갖게 됩니다.
배제 편향:
포함 편향은 연구자가 표본 모집단에 일부 하위 그룹을 의도적으로 포함할 때 발생합니다. 무응답 표본 편향과 밀접한 관련이 있으며 체계적인 조사의 내부 타당도에 영향을 미칩니다.
전문가들은 포함 편향을 "시험 및 후속 분석에서 무작위 배정 후 환자를 포함함으로써 발생할 수 있는 다양한 잠재적 편향을 포괄하는 집합적 용어"로 정의합니다. 이런 일이 발생하면 연구 결과가 변수 간에 잘못된 연결을 설정할 수 있습니다.
제외 편향은 일부 하위 그룹을 그룹으로 무작위화하기 전에 표본 모집단에서 의도적으로 제외할 때 발생합니다. 암이나 HIV/AIDS와 같은 특정 질환이 있는 환자를 제외했을 수도 있습니다. 동의 없이 그러한 사람들을 연구하는 것은 비윤리적이기 때문입니다. 또는 임상 시험 중에 다른 치료 옵션에 대한 액세스 권한을 부여하고 싶지 않았기 때문에 제외했을 수 있습니다. 일부 연구자들은 또한 임상 시험에 참여하기에 너무 아프거나 너무 나이가 많은 사람들을 포함하지 않기로 선택합니다(이러한 사람들은 효과적으로 참여할 수 없거나 참여로부터 충분한 혜택을 받지 못할 수 있기 때문에).

리콜 바이어스:
회상 편향의 가장 일반적인 형태 중 하나는 소급 기억 왜곡이라고 합니다. 소급기억 왜곡은 사람들이 원래 목적보다는 현재의 필요에 맞는 방식으로 사건과 경험을 기억할 때 발생합니다. 예를 들어, 누군가는 어떤 사건이 긍정적인 경험이었다고 회상할 수도 있고, 부정적인 의미였을 경우에는 즐거웠을 수도 있습니다. 또한 사람들이 자신의 삶이나 다른 사람의 삶에 대한 사실과 같이 연구 주제에 중요한 세부 사항을 기억하는 데 어려움을 겪을 때 소급 기억 왜곡이 발생할 수 있습니다.
사람들이 회상 보고서에 부정확한 정보를 포함할 때도 소급 기억 왜곡이 발생할 수 있습니다. 이것은 일어나지 않은 일이나 실제로 발생한 것과 다른 시간에 일어난 일을 보고할 때 발생합니다.
예를 들어, 어떤 사람은 특정 날에 직장에서 집까지 이동하는 데 5시간을 보냈다고 보고할 수 있지만 실제로는 사전에 책상에서 점심을 먹고 늦게까지 잊어버렸기 때문에 실제로는 3시간 밖에 걸리지 않았습니다.
선택 편향을 피하는 방법
결과(종속 변수)와 여러 예측 변수 간의 관계의 강도를 추정하는 것은 많은 연구 질문에 중요합니다. 선택 편향을 피하기 위해 이변량 분석 및 다중 회귀 방법이 일반적으로 사용됩니다.
이변량 분석은 두 변수 간의 경험적 관계를 결정하는 데 자주 사용되는 정량적 분석입니다. 이 방법에서 연구자들은 각 예측 변수를 개별적으로 측정한 다음 통계 테스트를 적용하여 결과 변수에 영향을 미치는지 여부를 결정합니다. 예측 변수와 결과 사이에 관계가 없으면 데이터 수집 프로세스에서 선택 편향의 증거를 찾을 수 없습니다. 그러나 이러한 변수 사이에 어떤 종류의 관계가 있는 경우 이 데이터를 수집할 때 어느 정도의 선택 편향이 있을 수 있습니다. 다중 회귀 방법을 통해 연구자는 결과(종속 변수)와 여러 예측 변수 간의 이러한 관계의 강도를 평가할 수 있습니다.
이 빠른 Audience by QuestionPro 비디오 로 선택 편향을 피하는 방법을 알아보십시오 !
QuestionPro Audience가 이상적인 샘플에서 귀중한 데이터를 수집하는 데 어떻게 도움이 됩니까?
연구를 수행할 때 선택 편향의 본질을 이해하는 것이 중요합니다. 이것은 연구 결과가 참가자 또는 표본 의 특성에 의해 영향을 받는 경향입니다 .
예를 들어, 설탕이 당뇨병에 미치는 영향에 대한 연구를 수행하고 있고 당뇨병 환자가 모두 교회 회원인 경우 선택 편향의 원인이 될 수 있습니다. 그들은 당뇨병이 없는 사람들보다 교회 활동에 참여할 가능성이 더 높기 때문에 표본에 포함될 가능성이 더 높습니다. 연구에서 이러한 종류의 편향을 피하려면 QuestionPro Audience 를 사용하여 다양하고 신뢰할 수 있는 출처에서 데이터를 수집해야 합니다.
더 알아보기