Zjistěte, jaká jednoduchá lineární regrese je a jak funguje

Základní statistický přístup k analýze kvantitativních dat

Zdvořilost Colin Broug, fotograf. © June 10, 2010 Stock.xchng

Modely lineární regrese se používají k zobrazení nebo předvídání vztahu mezi dvěma proměnnými nebo faktory . Faktor, který se předpovídá (faktor, který rovnice řeší ) se nazývá závislá proměnná. Faktory, které se používají k předpovědi hodnoty závislé proměnné, se nazývají nezávislé proměnné.

Dobré údaje vždy neříkají celý příběh. Regresní analýza se běžně používá ve výzkumu, neboť zjišťuje, že mezi proměnnými existuje korelace.

Korelace však není totožná s příčinami . Dokonce i linka v jednoduché lineární regresi, která odpovídá datovým bodům dobře, nemusí říkat něco definitivního o vztahu příčin a následků.

V jednoduché lineární regresi se každé pozorování skládá ze dvou hodnot. Jedna hodnota je pro závislou proměnnou a jedna hodnota je pro nezávislou proměnnou.

Jednoduchý lineární regresní model

Jednoduchý lineární regresní model je reprezentován takto: y = ( β 0 + β 1 + Ε

Podle matematické konvence jsou dva faktory, které se podílejí na jednoduché lineární regresní analýze, označeny jako x a y .

Rovnice, která popisuje, jak y souvisí s x, je známa jako regresní model . Lineární regresní model také obsahuje chybový termín, který je reprezentován symbolem E nebo řeckým písmem epsilon. Chybový termín se používá pro zohlednění variability y, kterou nelze vysvětlit lineárním vztahem mezi x a y .

Existují také parametry, které představují studovanou populaci. Tyto parametry modelu jsou reprezentovány ( β 0+ β 1 x ).

Jednoduchý lineární regresní model

Jednoduchá rovnice lineární regrese je znázorněna takto: E ( y ) = ( β 0 + β 1 x ).

Jednoduchá rovnice lineární regrese je grafována jako přímka.

( β 0 je y zachycení regresní linie.

β 1 je sklon.

E ( y ) je střední nebo očekávaná hodnota y pro danou hodnotu x .

Regresní linie může vykazovat pozitivní lineární vztah, negativní lineární vztah nebo žádný vztah. Pokud je grafovaná čára v jednoduché lineární regresi rovná (bez sklonu), neexistuje žádný vztah mezi oběma proměnnými. Pokud je regresní čára nakloněna směrem vzhůru se spodním koncem čáry na zachycení y (osy) grafu a horní konec čáry probíhá směrem nahoru do polí grafu, mimo záběr x (osa) existuje pozitivní lineární vztah . Pokud se regresní čára nakloní směrem dolů s horním koncem čáry na zachycení y (osy) grafu a dolní konec čáry směřující dolů do pole grafu směrem k zachycení x (osa) existuje negativní lineární vztah.

Odhadovaná rovnice lineární regrese

Pokud by byly známy parametry populace , jednoduchá lineární regresní rovnice (znázorněná níže) by mohla být použita k výpočtu střední hodnoty y pro známou hodnotu x .

E ( y ) = ( β 0 + β 1 x ).

V praxi však nejsou hodnoty parametrů známy, takže je třeba je odhadnout pomocí dat ze vzorku populace. Parametry populace se odhadují pomocí statistických šablon . Štatistické údaje o vzorcích jsou reprezentovány b 0 + b 1. Když jsou statistické údaje o vzorku nahrazeny parametry populace, vytvoří se odhadovaná regresní rovnice.

Odhadovaná regresní rovnice je uvedena níže.

( ŷ ) = ( β 0 + β 1 x

( ŷ ) je vyslovován y klobouk .

Graf odhadované jednoduché regresní rovnice se nazývá odhadovaná regresní linie.

B 0 je zachycení y.

B 1 je sklon.

Ŷ ) je odhadovaná hodnota y pro danou hodnotu x .

Důležitá poznámka: Regresní analýza se nepoužívá k interpretaci vztahu příčin a vlivů mezi proměnnými. Regresní analýza však může uvést, jak jsou proměnné příbuzné nebo v jakém rozsahu jsou navzájem spojeny proměnné .

Přitom regresní analýza má tendenci vytvářet výrazné vztahy, které vyžadují, aby znalý výzkumník shledal blíže .

Také známá jako: bivariátní regrese, regresní analýza

Příklady: Metoda nejmenších čtverců je statistický postup pro použití vzorových dat k nalezení hodnoty odhadované regresní rovnice. Metoda nejmenších čtverců navrhla Carl Friedrich Gauss, který se narodil v roce 1777 a zemřel v roce 1855. Metoda nejmenších čtverců je stále široce používána.

Zdroje:

Anderson, DR, Sweeney, DJ a Williams, TA (2003). Základy statistiky pro podnikání a ekonomiku (3. vydání) Mason, Ohio: Southwestern, Thompson Learning.

______. (2010). Vysvětleno: regresní analýza. MIT News.

McIntyre, L. (1994). Použití dat o cigaretě pro úvod k více regresi. Journal of Statistics Education, 2 (1).

Mendenhall, W. a Sincich, T. (1992). Statistiky pro inženýrství a vědy (3. vydání), New York, NY: Dellen Publishing Co.

Panchenko, D. 18.443 Statistika aplikací, podzim 2006, oddíl 14, jednoduchá lineární regrese. (Massachusetts Institute of Technology: MIT OpenCourseWare)