層化サンプリング: 確率サンプリングの一種
公開: 2022-08-30層化サンプリングは、ターゲット母集団を一意の均一なセグメント (層) に分割し、各セグメント (層) から単純なランダム サンプルを選択するサンプリング手順です。 さまざまな階層から選択されたサンプルが 1 つのサンプルに結合されます。 このサンプリング手順は、「不定期料金サンプリング」と呼ばれることもあります。 最適なキャプチャのために覚えておくべきいくつかの考慮事項について、以下をお読みください。
層化サンプリングは、使用できる確率的サンプリングの 1 つです。 その弱点と強みについてさらに学ぶために、読み続けてください。
層別調査の選択手順
層別無作為標本の選択には、主に 8 つの手順があります。
- 対象母集団を定義します。
- 層化変数を特定し、使用する層の数を決定します。 層化変数は、研究の目的に関連している必要があります。 研究の目的がサブグループの推定を行うことである場合、層化変数はそれらのサブグループに関連付けられている必要があります。 多くの場合、補助情報の可用性によって、使用される層化変数が決まります。 複数の層化変数を使用できます。 層化変数の数が増えると、一部の変数が他の変数の効果を相殺する確率が高くなると考えてください。 特に、層化変数は 4 ~ 6 個以下、変数の階層は 6 個以下にする必要があります。
- 既存のテスト フレームを特定するか、ターゲット母集団の各項目の層化変数に関する情報を含むテスト フレームを作成します。 サンプル フレームに層化変数に関する情報が含まれていない場合、層化は不可能です。
- アンダーカバー、オーバーカバー、マルチプル、クラスタリングのサンプリング フレームを評価し、必要に応じて調整します。
- サンプリング フレームを階層に分割し、変数のカテゴリを階層化して、各階層のサンプリング フレームを作成します。 ストラタム内では差異を最小限に抑え、ストラタ間の差異を最大化する必要があります。 地層は重複してはならず、一緒になって人口全体を構成する必要があります。 階層は独立していて、母集団のサブセットから除外されている必要があります。 母集団の各要素は、単一の階層にある必要があります。
- 各アイテムに一意の番号を割り当てます。
- 各階層のサンプル サイズを決定します。 さまざまな階層にわたるサンプルに含まれる項目の数値分布によって、実装するテストのタイプが決まります。 これは、比例層化されたデモンストレーション、またはいくつかのタイプの不均衡な層別化されたデモンストレーションのいずれかです。
- 各ストラタムから指定された数のアイテムをランダムに選択します。 サンプルを表すには、各階層から少なくとも 1 つの要素を選択する必要があります。 また、収集されたデータから計算された推定値の誤差範囲を計算するには、各階層から少なくとも 2 つの要素を選択する必要があります。
比例層別サンプリング
層化サンプリングには、比例サンプリングと不均衡サンプリングの 2 つの主要なサブタイプがあります。 比例成層法では、さまざまな層に割り当てられたアイテムの数は、ターゲット母集団の層の表現に比例します。 つまり、各階層から抽出されたサンプル サイズは、ターゲット母集団のその階層の相対的なサイズに比例します。
サンプリングの割合は各階層に適用され、各母集団要素が選択される機会が均等になります。 結果のサンプルは自己加重です。 このサンプリング手順は、研究が人口パラメータを推定することを目的としている場合に使用されます。
研究者は、母集団パラメータを推定するだけでなく、比較的小さな層内で詳細な分析を行いたい、および/または層を相互に比較したいと考えることがよくあります。 比例成層抽出では、このタイプの分析の層の一部が得られない場合があります。
この表に記載されている例を取り上げると、ゾーン 2 の元素の詳細な分析を実行することはできません。これは、サンプルに 12 の元素しか含まれていないためです。 さらに、ゾーン 2 の要素を他のゾーンと比較することは疑わしいでしょう。
比例層化サンプリングは、このタイプの分析を実行するための適切なサンプリング方法ではありません。 不均衡はより良い選択かもしれません。
不均衡な層化サンプリング
不均衡サンプリングは、各層からのサンプルに含まれる要素の数が、母集団全体でのそれらの表現に比例しない手順です。 母集団の要素がサンプルに含まれる可能性は等しくありません。 同じサンプリング比率が各階層に適用されるわけではありません。
一方、地層には異なるサンプリング率があり、そのため、このサンプリング手順は等確率選択ではありません。 母集団パラメーターを推定するには、母集団の構成がサンプルの不均衡を補正する必要があります。 ただし、一部の研究プロジェクトでは、不均衡な階層化サンプリングが比例よりも適切な場合があります。

不均衡なサンプリングは、課題の目的に基づいて 3 つのサブタイプに分けることができます。 たとえば、ストラタ内の分析を促進したり、コスト、精度、または精度とコストの両方を最適化することに重点を置いたりすることができます。
研究の目的により、研究者はサンプル層の詳細な分析を行う必要がある場合があります。 比例成層法を使用する場合、層のサンプル サイズは非常に小さくなります。 したがって、研究の目標を達成するのは難しいかもしれません。
比例配分では、このタイプの詳細な分析に十分な数のケースが生成されない場合があります。 1 つのオプションは、小規模または頻度の低い層をオーバーサンプリングすることです。 このようなオーバーサンプリングは、母集団と比較してサンプル階層の不均衡な分布を作成します。 ただし、調査の目的に必要な階層分析を実行するのに十分な数のケースがある場合があります。
層化サンプリングの長所と短所
層化サンプリングには、非確率サンプリング手順と比較して、ほとんどの確率サンプリング手順に関連する多くの長所と短所があります。
単純な無作為抽出と比較すると、層化抽出には次のような長所があります。
- 母集団パラメータを推定するだけでなく、各層内での推論と層間の比較を行う能力。 単純なランダム サンプリングでは、関心のあるサブグループに関する十分なデータを取得できない場合があります。 層化サンプルは、同じサンプル サイズの単純なランダム サンプルで得られるよりも小さいランダム サンプリング エラーを生成します。 層別サンプルは、同じサンプル サイズの単純な無作為サンプルと少なくとも同じくらい正確なサンプルになります。
- 層化されたサンプルは、母集団の各層の要素がサンプルで確実に表されるため、母集団をより代表する傾向があります。 サンプリングを階層化して、サンプルが地理的サブエリアと人口サブグループに分散していることを確認できます。
- 層化サンプリングを使用することにより、研究者が母集団について持っている知識が利用されます。
- 層化サンプリングを使用すると、研究者は異なる階層内で異なるサンプリング手順を使用できます。
層化サンプリング、サンプリング、クォータ サンプリングの違いは何ですか?
層化サンプリングとクォータ サンプリングは、互いに多少似ています。 どちらも、対象母集団をカテゴリに分割し、各カテゴリから特定の数の項目を選択することを伴います。 どちらの手順も、代表的なサンプルの選択および/またはサブグループ分析の促進を主な目的としています。 ただし、重要な違いがあります。
層別抽出では、単純な無作為抽出が使用されます。 階層化サンプリングにはサンプリング フレームが必要ですが、クォータ サンプリングには必要ありません。
クォータ サンプリングの利点:
- 最も安価なサンプリング方法です。
- メディアによる世論調査や世論調査で広く使用されています。
- この方法は、取得したい情報が母集団と相関していることを前提としていますが、証明が難しいのは代表性の仮説です。
つまり、次の場合は層化サンプリングの選択を検討してください。
- 母集団を 2 つ以上の階層に分割し、各階層に対して均一なサンプリング フレームを構築することができます。
- 母集団の一部のサブグループは、他のサブグループとは大きく異なります。
- サンプリングエラーを最小限に抑えることが不可欠です。
- 人口は異質です。
- 地層の比較分析が望まれます。
最後に、別のタイプのサンプリングであるシステマティック サンプリングの特性に関する記事を紹介します。
複雑なリアルタイムの洞察を提供する簡単に作成できる調査で、研究の課題を解決します。 カスタムのポイント アンド クリック ロジック、高度な質問タイプ、および統合を活用して、選択に基づく調査、消費者調査などのための成熟した複雑な調査モデルを作成します。