층화 표본 추출: 확률 표본 추출의 한 유형

게시 됨: 2022-08-30

계층화 샘플링은 대상 모집단을 고유하고 동질적인 세그먼트(계층)로 분리한 다음 각 세그먼트(계층)에서 간단한 무작위 샘플을 선택하는 샘플링 절차입니다. 다양한 계층에서 선택된 샘플이 단일 샘플로 결합됩니다. 이 샘플링 절차를 "비정기 수수료 샘플링"이라고 합니다. 최상의 캡처를 위해 기억해야 할 몇 가지 고려 사항에 대해 아래를 읽으십시오.

계층화 샘플링은 우리가 사용할 수 있는 확률적 샘플링 유형 중 하나입니다. 약점과 강점에 대해 자세히 알아보려면 계속 읽으시기 바랍니다.

계층화 조사를 위한 선택 단계

계층화된 무작위 표본을 선택하는 데는 8가지 주요 단계가 있습니다.

  1. 대상 인구를 정의합니다.
  2. 계층화 변수를 식별하고 사용할 계층 수를 결정합니다. 계층화 변수는 연구 목적과 관련되어야 합니다. 연구의 목적이 부분군을 추정하는 것이라면 계층화 변수를 해당 부분군에 연결해야 합니다. 보조 정보의 가용성은 종종 사용되는 계층화 변수를 결정합니다. 하나 이상의 계층화 변수를 사용할 수 있습니다. 계층화 변수의 수가 증가함에 따라 일부 변수가 다른 변수의 효과를 상쇄할 확률이 증가한다는 점을 고려하십시오. 특히, 계층화 변수는 4~6개 이하, 변수의 계층은 6개 이하로 사용해야 합니다.
  3. 기존 테스트 프레임을 식별하거나 대상 모집단의 각 항목에 대한 계층화 변수에 대한 정보를 포함하는 테스트 프레임을 개발합니다. 샘플 프레임에 계층화 변수에 대한 정보가 포함되어 있지 않으면 계층화가 불가능합니다.
  4. 위장, 위장, 다중 및 클러스터링에 대한 샘플링 프레임을 평가하고 필요에 따라 조정합니다.
  5. 샘플링 프레임을 계층과 변수 계층의 범주로 나누어 각 계층에 대한 샘플링 프레임을 만듭니다. 계층 내에서 차이는 최소화되어야 하고 계층 간의 차이는 최대화되어야 합니다. 계층은 겹치지 않아야 하며 함께 전체 인구를 구성해야 합니다. 계층은 인구의 하위 집합과 독립적이고 배타적이어야 합니다. 모집단의 각 요소는 단일 계층에 있어야 합니다.
  6. 각 항목에 고유 번호를 할당합니다.
  7. 각 계층의 표본 크기를 결정합니다. 다양한 계층에 걸쳐 샘플에 포함된 항목의 숫자 분포는 구현할 테스트 유형을 결정합니다. 그것은 비례 계층화 시연 또는 여러 유형의 불균형 계층화 시연 중 하나일 수 있습니다.
  8. 각 계층에서 지정된 수의 항목을 무작위로 선택합니다. 샘플을 나타내려면 각 계층에서 하나 이상의 요소를 선택해야 합니다. 수집된 데이터에서 계산된 추정치의 오차 한계를 계산하기 위해 각 계층에서 최소 두 개의 요소를 선택해야 합니다.

비례 계층화 샘플링

계층화 샘플링에는 비례 샘플링과 불균형 샘플링의 두 가지 주요 하위 유형이 있습니다. 비례 계층화에서 다양한 계층에 할당된 항목의 수는 대상 인구에 대한 계층의 표현에 비례합니다. 즉, 각 계층에서 추출한 표본 크기는 대상 모집단의 해당 계층의 상대적 크기에 비례합니다.

샘플링 비율은 각 계층에 적용되어 각 모집단 요소를 선택할 수 있는 동등한 기회를 제공합니다. 결과 샘플은 자체 가중됩니다. 이 샘플링 절차는 연구가 모집단 매개변수를 추정하는 것을 목표로 할 때 사용됩니다.

연구자는 종종 인구 매개변수를 추정할 뿐만 아니라 상대적으로 작은 계층 내에서 상세한 분석을 수행하거나 계층을 서로 비교하기를 원합니다. 비례 계층화 샘플링은 이러한 유형의 분석의 일부 계층을 생성하지 않을 수 있습니다.

표에 설명된 예를 보면 샘플에서 12개의 요소만 발견되기 때문에 영역 2의 요소에 대한 자세한 분석을 수행할 수 없습니다. 또한, Zone 2의 요소를 다른 Zone과 비교하는 것은 의심의 여지가 있습니다.

비례 층화 샘플링은 이러한 유형의 분석을 수행하기 위한 좋은 샘플링 선택이 아닙니다. 불균형이 더 나은 선택일 수 있습니다.

불균형 계층화 샘플링

불균형 표본 추출은 각 계층의 표본에 포함된 요소의 수가 전체 모집단에서 차지하는 비율에 비례하지 않는 절차입니다. 모집단의 요소는 표본에 포함될 확률이 동일하지 않습니다. 동일한 샘플링 비율이 각 계층에 적용되지 않습니다.

반면에 지층은 샘플링 비율이 다르므로 이 샘플링 절차는 동일 확률 선택이 아닙니다. 모집단 모수를 추정하려면 모집단 구성이 표본의 불균형을 보상해야 합니다. 그러나 일부 연구 프로젝트의 경우 불균형 계층화 샘플링이 비례보다 더 적절할 수 있습니다.

불균형 샘플링은 할당 목적에 따라 세 가지 하위 유형으로 나눌 수 있습니다. 예를 들어 계층 내 분석을 용이하게 하고 비용, 정확성 또는 정확성과 비용 모두를 최적화하는 데 집중할 수 있습니다.

연구의 목적은 연구원이 샘플 지층에 대한 상세한 분석을 수행하도록 요구할 수 있습니다. 비례 계층화가 사용되는 경우 계층의 표본 크기는 매우 작습니다. 따라서 연구 목표를 달성하는 것이 어려울 수 있습니다.

비례 할당은 이러한 유형의 세부 분석에 대해 충분한 수의 케이스를 생성하지 않을 수 있습니다. 한 가지 옵션은 작거나 드물게 발생하는 계층을 과표본하는 것입니다. 이러한 과잉 표본 추출은 모집단과 비교하여 표본 계층의 불균형한 분포를 생성합니다. 그러나 연구 목적에 따라 필요한 지층 분석을 수행하기에 충분한 경우가 있을 수 있습니다.

계층화 샘플링의 강점과 약점

계층화 샘플링은 비확률 샘플링 절차에 비해 대부분의 확률 샘플링 절차와 관련된 많은 강점과 약점을 가지고 있습니다.

단순 무작위 샘플링과 비교하여 계층화된 샘플링의 장점은 다음과 같습니다.

  • 인구 매개변수를 추정할 수 있을 뿐만 아니라 각 계층 내에서 추론하고 계층 간 비교를 수행할 수 있습니다. 단순 무작위 샘플링은 관심 있는 부분군에 대한 충분한 데이터를 캡처하지 못할 수 있습니다. 계층화된 샘플은 동일한 샘플 크기의 단순 무작위 샘플에서 얻은 것보다 더 작은 무작위 샘플링 오류를 생성합니다. 계층화된 샘플은 동일한 샘플 크기의 단순 무작위 샘플만큼 정확한 샘플을 생성합니다.
  • 계층화된 표본은 모집단의 각 계층 요소가 표본에 표시되도록 하기 때문에 모집단을 더 잘 대표하는 경향이 있습니다. 샘플링을 계층화하여 샘플이 지리적 하위 영역 및 인구 하위 그룹에 분산되도록 할 수 있습니다.
  • 계층화된 샘플링을 사용하여 연구자가 인구에 대해 가지고 있는 지식을 활용합니다.
  • 계층화된 샘플링을 사용하면 연구자가 다른 계층 내에서 다른 샘플링 절차를 사용할 수 있습니다.

계층화 샘플링, 샘플링 및 할당량 샘플링의 차이점은 무엇입니까?

계층화된 샘플링과 할당량 샘플링은 서로 다소 유사합니다. 둘 다 대상 인구를 범주로 나눈 다음 각 범주에서 특정 수의 항목을 선택하는 것을 포함합니다. 두 절차 모두 대표 표본의 선택 및/또는 하위 그룹 분석의 촉진을 주요 목표로 합니다. 그러나 중요한 차이점이 있습니다.

계층화 샘플링은 단순 무작위 샘플링을 사용합니다. 계층화 샘플링에는 샘플링 프레임이 필요하지만 할당량 샘플링에는 필요하지 않습니다.

할당량 샘플링의 장점:

  • 가장 저렴한 샘플링 방법입니다.
  • 그것은 여론 조사와 언론의 설문 조사에서 널리 사용됩니다.
  • 이 방법은 우리가 얻고자 하는 정보가 모집단과 상관관계가 있다고 가정하지만, 증명하기 어려운 대표성의 가설입니다.

요컨대 다음과 같은 경우 계층화된 샘플링을 선택하는 것이 좋습니다.

  • 모집단을 둘 이상의 계층으로 나누고 각 계층에 대해 균질한 샘플링 프레임을 구축하는 것이 가능합니다.
  • 모집단의 일부 하위 그룹은 다른 하위 그룹과 매우 다릅니다.
  • 샘플링 오류를 최소화하는 것이 중요합니다.
  • 인구는 이질적입니다.
  • 지층에 대한 비교 분석이 필요합니다.

마지막으로 다른 유형의 샘플링인 체계적인 샘플링의 특성에 대한 기사를 공유합니다.

복잡한 실시간 통찰력을 제공하는 간단한 설문 조사를 생성하여 연구 과제를 해결하십시오. 맞춤형 포인트 앤 클릭 로직, 고급 질문 유형 및 통합을 활용하고 선택 기반 연구, 소비자 연구 등을 위한 성숙하고 복잡한 연구 모델을 만드십시오.