Nespojitá regrese jako nástroj pro hodnocení kauzálních efektů

V oblasti ekonomie a sociálních věd se často setkáváme s potřebou stanovit kauzální vztahy mezi různými proměnnými. Jednou z pokročilých metod, která k tomuto účelu slouží, je takzvaná regresní diskontinuita (Regression Discontinuity Design - RDD). Tato metoda umožňuje odhadnout kauzální vliv intervence, která je spuštěna překročením určité prahové hodnoty.

Nespojitá regrese, neboli regresní diskontinuita, představuje kvaziexperimentální design a analytickou metodu. Jejím hlavním cílem je stanovit kauzální vliv intervence v okolí prahové hodnoty. Tato prahová hodnota je klíčová, protože její překročení spouští samotnou intervenci.

Základní princip metody spočívá v porovnání případů, které se nacházejí těsně pod a těsně nad touto prahovou hodnotou. Předpokládá se, že pokud se tyto případy jinak navzájem podobají, jejich zařazení do skupiny s intervencí nebo bez ní lze považovat za vcelku náhodné. Tímto způsobem lze efektivně izolovat vliv samotné intervence.

Pro ilustraci si můžeme představit příklad z oblasti zdravotnictví. V České republice mají ženy od věku 45 let nárok na bezplatné mamografické vyšetření. Efekt tohoto výdaje zdravotních pojišťoven na zdraví populace by bylo možné zkoumat pomocí regresní diskontinuity. Porovnávaly by se dvě skupiny žen: ženy ve věku mezi 43 a nedosaženými 45 lety (kontrolní skupina bez intervence) a ženy ve věku mezi dosaženými 45 lety a 47 lety (skupina s intervencí). V tomto případě je prahovou hodnotou věk 45 let a intervencí je bezplatné mamografické vyšetření.

V matematickém vyjádření můžeme tento příklad popsat následovně:

  • Y je závislá proměnná (např. výskyt rakoviny prsu).
  • X je běhová proměnná (v tomto případě věk).
  • T je prahová hodnota pro intervenci (T = 45 let).
  • D je binární proměnná, která je rovna jedné, pokud je intervence aplikována (tj. XT), a nule v opačném případě (X < T).
  • h je šířka intervalu kolem prahu, pro který se používají data.

Na obou stranách prahu se odhadují různé regresní koeficienty, včetně konstantního členu. Tyto odhady pak umožňují kvantifikovat vliv intervence.

Metoda regresní diskontinuity je široce využívána v různých oblastech výzkumu. Například v diplomové práci zaměřené na prediktivní modelování v řízení kreditních rizik se banky a finanční instituce snaží odhadnout pravděpodobnost defaultu klientů. K tomu využívají modely diskrétní volby, jako je lineární pravděpodobnostní model, probitový model nebo logitový model. Logitový model je pak často používán pro samotný odhad defaultu.

Praktická část takové diplomové práce se obvykle soustředí na statistický popis datového souboru a jeho přípravu pro výstavbu kredit scoringového modelu. Zde se můžeme setkat s různými typy dat a potřebou zvolit adekvátní regresní metody.

V kontextu analýzy mediace, jak je popsáno v diplomové práci "Analýza mediace v sociologii", se rozlišují dva hlavní případy v závislosti na typu závislé proměnné. Pokud je závislá proměnná spojitá, lze k analýze mediace využít program SPSS a jeho doplněk PROCESS. V případě, kdy je závislá proměnná binární, doplněk PROCESS tuto variantu nepodporuje. Analýza je pak provedena v programu SPSS pomocí sady lineárních a logistických regresí podle metody Baron & Kenny.

Nespojitá regrese tak představuje silný nástroj pro odhad kauzálních efektů v situacích, kdy není možné provést klasický randomizovaný experiment. Její pečlivá aplikace umožňuje získat spolehlivé a interpretovatelné výsledky.

Grafické znázornění principu regresní diskontinuity

Metoda regresní diskontinuity je založena na porovnání případů pod a nad prahovou hodnotou.

Vysvětlení diskontinuity fuzzy regrese (RD)

Pro hlubší pochopení metody je vhodné seznámit se s klíčovými publikacemi v této oblasti.

  • THISTLETHWAITE, D.; CAMPBELL, D. Regression-Discontinuity Analysis: An alternative to the ex post facto experiment. Journal of Educational Psychology. 1960, s. 309-317.
  • IMBENS, G.; LEMIEUX, T. Regression Discontinuity Designs: A Guide to Practice. Journal of Econometrics. 2008, s. 615-635.
  • FAN; GIJBELS. Local Polynomial Modelling and Its Applications. London: Chapman and Hall, 1996.

tags: #nespojita #regrese #diplomova #prace