Co je stratifikovaný náhodný vzorek?

Vše o stratifikovaném náhodném výběru vzorků

Stratifikovaný náhodný vzorek je pravděpodobnostní postup odběru vzorků. Dvě základní části tohoto typu vzorku jsou: 1) rozvrstvené a 2) pravděpodobné. Co to znamená přesně a proč je to důležité? Stratifikovaný náhodný vzorek je také známý jako poměrný náhodný výběr vzorků nebo náhodný výběr vzorku kvót.

Co je stratifikovaný náhodný vzorek?

Vzorek je mini reprezentace větší populace.

Vzorky lze stanovit neformálně nebo formálně. Ale vzorky, které jsou systematicky vyvíjeny podle určitých vědeckých metod, jsou obecně vnímány jako užitečnější pro vytváření zobecnění o větší populaci.

Co znamená stratifikace?

Stratifikované vzorky se skládají z homogenních podskupin, které jsou považovány za výrazné. Sbírka těchto homogenních podskupin se označuje jako vrstvy. Tato metoda odběru vzorků umožňuje rozdělení populace na homogenní podskupiny, ze kterých mohou být vybrány jednoduché náhodné vzorky.

Proč je užitečný stratifikovaný vzorek?

Cílem stratifikovaného náhodného výběru je vybrat účastníky z různých podskupin, o nichž se předpokládá, že mají význam pro výzkum, který bude proveden. Například výsledky studie by mohly být ovlivněny atributy subjektů , jako je jejich věk, pohlaví, úroveň pracovních zkušeností, rasová a etnická skupina, ekonomická situace, stupeň dosaženého vzdělání a tak dále.

Stratifikovaný vzorek je konstruován tak, že tyto potenciálně vlivné charakteristiky lze rozumně předpokládat, že odrážejí charakter těchto vlastností v celkové populaci. Tímto způsobem vzorek odráží populaci, ze které byl odebrán, ale vzorek nelze považovat za reprezentativní pro větší populaci .

Nezapomeňte, že výběr členů stratifikovaného vzorku není náhodný proces. To znamená, že jakmile byly vytvořeny vrstvy, použije se jednoduchý náhodný výběr pro výběr členů vzorků pro každou vrstvu .

Co znamená pravděpodobnostní?

Stratifikovaný náhodný vzorek je pravděpodobnostní, protože každá metoda použitá k výběru populace vzorku poskytuje rozumně spolehlivý způsob, jak odhadnout, jak reprezentativní je populace vzorku pro větší populaci (vesmír), ze které byl vzorek vybrán. Jinými slovy, pravděpodobnostní vzorek dovoluje výzkumníkovi odhadnout , že vybraný vzorek nepředstavuje větší populaci, ze které byl vzorek odebrán.

Příklady

Použijte stratifikované metody náhodného odběru vzorků, pokud existuje zájem o rozdíly mezi homogenními podskupinami a větší populací vzorků jako celku.

Řekněme, že populaci obchodních klientů lze rozdělit do tří skupin: Gen-Xers, Gen-Yers (tisíciletí) a Baby Boomers. Mimoto máme důvod se domnívat, že jak Gen-Xers, tak Gen-Yers jsou relativně menšími minoritami z celkové obchodní klientely. Gen-Xers tvoří zhruba 5 procent z celkové populace klientely a Gen-Yers tvoří přibližně 10 procent klientů.

Jednoduchý náhodný vzorek s 100 členy (n = 100) by mohl generovat 5 Gen-Xers a 10 Gen-Yers, pokud bychom použili vzorkovací zlomek 10 procent. Bylo by možné získat ještě méně Gen-Xers a méně Gen-Yers než ve vzorku - jen náhodou. Stratifikace bude pravděpodobně produkovat reprezentativnější výsledky. Řekněme, že chceme mít nejméně 25 lidí v každé skupině. Pokud budeme vzít vzorek 100 (n = 100), pak můžeme vzorkovat 25 Gen-Xers, 25 Gen-Yers a 50 Baby Boomers.

Víme, že 10 procent populace je Millennials nebo Gen-Yers (nebo asi 100 našich klientů.) Náhodný vzorek 25 klientů poskytne vzorkovací zlomek 25/100 nebo 25% uvnitř vrstvy. z 50 klientů, kteří nejsou, jsou Baby Boomers Gen-Xers, což znamená, že frakce uvnitř vrstvy bude 25/50 nebo 50%.

Takže 50 Gen-Xers plus 100 Gen-Yers je celkem 150 našich klientských vzorků. Vzhledem k tomu, že celková populace klientů je 1000, odečteme Gen-Xers plus Gen-Yers (celkem 150 klientů), což zanechává 850 klientů, kteří jsou Baby Boomers. Frakce vzorkování uvnitř vrstvy pro Baby Boomers je 50/850 nebo asi 5,88%.

Dvě věci jsou zřejmé: (1) Tři skupiny jsou homogennější uvnitř skupiny než v celé populaci. To znamená, že existuje menší rozptyl, který poskytuje příležitost pro větší statistickou přesnost . (2) Vzhledem k tomu, že vzorek byl rozvrstvený, bude mít z každé skupiny dostatek členů, aby bylo možné vytvořit smysluplné podskupiny .

Stratifikovaný vzorek může být upřednostňován před jednoduchým náhodným odběrem vzorků, je-li důležité reprezentovat celkovou populaci a reprezentovat klíčové podskupiny populace, zvláště když jsou podskupiny poměrně malé, ale významně se vyznačují. Při použití stratifikovaných metod odběru vzorků může výzkumník efektivně zajistit, že podskupiny mohou být rozlišeny v diskusi o výsledcích výzkumu.