Základní statistický přístup k analýze kvantitativních dat
Modely lineární regrese se používají k zobrazení nebo předvídání vztahu mezi dvěma proměnnými nebo faktory . Faktor, který se předpovídá (faktor, který rovnice řeší ) se nazývá závislá proměnná. Faktory, které se používají k předpovědi hodnoty závislé proměnné, se nazývají nezávislé proměnné.
Dobré údaje vždy neříkají celý příběh. Regresní analýza se běžně používá ve výzkumu, neboť zjišťuje, že mezi proměnnými existuje korelace.
Korelace však není totožná s příčinami . Dokonce i linka v jednoduché lineární regresi, která odpovídá datovým bodům dobře, nemusí říkat něco definitivního o vztahu příčin a následků.
V jednoduché lineární regresi se každé pozorování skládá ze dvou hodnot. Jedna hodnota je pro závislou proměnnou a jedna hodnota je pro nezávislou proměnnou.
- Jednoduchá analýza lineární regrese Nejjednodušší forma regresní analýzy používá na závislé proměnné a jednu nezávislou proměnnou. V tomto jednoduchém modelu se přímka blíží vztahu mezi závislou proměnnou a nezávislou proměnnou.
- Analýza více regresních analýz Když jsou v regresní analýze používány dvě nebo více nezávislých proměnných, model již není jednoduchý lineární.
Jednoduchý lineární regresní model
Jednoduchý lineární regresní model je reprezentován takto: y = ( β 0 + β 1 + Ε
Podle matematické konvence jsou dva faktory, které se podílejí na jednoduché lineární regresní analýze, označeny jako x a y .
Rovnice, která popisuje, jak y souvisí s x, je známa jako regresní model . Lineární regresní model také obsahuje chybový termín, který je reprezentován symbolem E nebo řeckým písmem epsilon. Chybový termín se používá pro zohlednění variability y, kterou nelze vysvětlit lineárním vztahem mezi x a y .
Existují také parametry, které představují studovanou populaci. Tyto parametry modelu jsou reprezentovány ( β 0+ β 1 x ).
Jednoduchý lineární regresní model
Jednoduchá rovnice lineární regrese je znázorněna takto: E ( y ) = ( β 0 + β 1 x ).
Jednoduchá rovnice lineární regrese je grafována jako přímka.
( β 0 je y zachycení regresní linie.
β 1 je sklon.
E ( y ) je střední nebo očekávaná hodnota y pro danou hodnotu x .
Regresní linie může vykazovat pozitivní lineární vztah, negativní lineární vztah nebo žádný vztah. Pokud je grafovaná čára v jednoduché lineární regresi rovná (bez sklonu), neexistuje žádný vztah mezi oběma proměnnými. Pokud je regresní čára nakloněna směrem vzhůru se spodním koncem čáry na zachycení y (osy) grafu a horní konec čáry probíhá směrem nahoru do polí grafu, mimo záběr x (osa) existuje pozitivní lineární vztah . Pokud se regresní čára nakloní směrem dolů s horním koncem čáry na zachycení y (osy) grafu a dolní konec čáry směřující dolů do pole grafu směrem k zachycení x (osa) existuje negativní lineární vztah.
Odhadovaná rovnice lineární regrese
Pokud by byly známy parametry populace , jednoduchá lineární regresní rovnice (znázorněná níže) by mohla být použita k výpočtu střední hodnoty y pro známou hodnotu x .
E ( y ) = ( β 0 + β 1 x ).
V praxi však nejsou hodnoty parametrů známy, takže je třeba je odhadnout pomocí dat ze vzorku populace. Parametry populace se odhadují pomocí statistických šablon . Štatistické údaje o vzorcích jsou reprezentovány b 0 + b 1. Když jsou statistické údaje o vzorku nahrazeny parametry populace, vytvoří se odhadovaná regresní rovnice.
Odhadovaná regresní rovnice je uvedena níže.
( ŷ ) = ( β 0 + β 1 x
( ŷ ) je vyslovován y klobouk .
Graf odhadované jednoduché regresní rovnice se nazývá odhadovaná regresní linie.
B 0 je zachycení y.
B 1 je sklon.
Ŷ ) je odhadovaná hodnota y pro danou hodnotu x .
Důležitá poznámka: Regresní analýza se nepoužívá k interpretaci vztahu příčin a vlivů mezi proměnnými. Regresní analýza však může uvést, jak jsou proměnné příbuzné nebo v jakém rozsahu jsou navzájem spojeny proměnné .
Přitom regresní analýza má tendenci vytvářet výrazné vztahy, které vyžadují, aby znalý výzkumník shledal blíže .
Také známá jako: bivariátní regrese, regresní analýza
Příklady: Metoda nejmenších čtverců je statistický postup pro použití vzorových dat k nalezení hodnoty odhadované regresní rovnice. Metoda nejmenších čtverců navrhla Carl Friedrich Gauss, který se narodil v roce 1777 a zemřel v roce 1855. Metoda nejmenších čtverců je stále široce používána.
Zdroje:
Anderson, DR, Sweeney, DJ a Williams, TA (2003). Základy statistiky pro podnikání a ekonomiku (3. vydání) Mason, Ohio: Southwestern, Thompson Learning.
______. (2010). Vysvětleno: regresní analýza. MIT News.
McIntyre, L. (1994). Použití dat o cigaretě pro úvod k více regresi. Journal of Statistics Education, 2 (1).
Mendenhall, W. a Sincich, T. (1992). Statistiky pro inženýrství a vědy (3. vydání), New York, NY: Dellen Publishing Co.
Panchenko, D. 18.443 Statistika aplikací, podzim 2006, oddíl 14, jednoduchá lineární regrese. (Massachusetts Institute of Technology: MIT OpenCourseWare)