V dnešním světě je Empirická distribuční funkce tématem neustálých diskusí a zájmu širokého spektra lidí. Od svého dopadu na společnost až po svůj význam v populární kultuře, Empirická distribuční funkce dokázal upoutat pozornost lidí všech věkových kategorií, pohlaví a profesí. V průběhu historie byl Empirická distribuční funkce předmětem studia, analýzy a diskuse, což vedlo k lepšímu pochopení jeho důsledků a dopadů v různých oblastech. V tomto článku prozkoumáme důležitost Empirická distribuční funkce a jak se vyvíjel v průběhu času, stejně jako jeho vliv na moderní svět.
Zelená křivka, která se asymptoticky blíží v 0 a v 1, je skutečná distribuční funkce normálního rozdělení. Šedé křížky reprezentují pozorování v určitém výběrovém souboru z tohoto rozdělení, a konstantní části modré schodovité funkce (kam v každé konstantní části patří levý krajní bod, a pravý krajní bod ne) tvoří empirickou distribuční funkci tohoto vzorku. (Klikněte zde pro načtení nového grafu.)
Empirická distribuční funkce (obvykle označovaná eCDF podle anglickéhoempirical Cumulative Distribution Function) je ve statistice distribuční funkce vytvořená na základě empirické míry určené hodnotami určitého znaku z výběrového souboru.[1] Tato distribuční funkce je schodovitá funkce tvořená skoky velikosti 1/n v každém z n datových bodů. Její hodnota v každém bodě je zlomek, jehož čitatelem je počet pozorování, v nichž je měřená proměnná menší nebo rovna zadané hodnotě, a jmenovatelem je rozsah souboru, N.
Empirická distribuční funkce je odhadem distribuční funkce, která generuje datové body. Podle Glivenkovy–Cantelliho věty konverguje k tomuto podkladovému rozdělení s pravděpodobností 1. Rychlost konvergence empirické distribuční funkce k podkladové distribuční funkci popisují různé matematické věty.
Odhad je tedy konzistentní. Tento výraz vyjadřuje bodovou konvergenci empirické distribuční funkce ke skutečné distribuční funkci. Silnější tvrzení poskytuje Glivenkova–Cantelliho věta, která říká, že konvergence je stejnoměrná přes t:[6]
Rovnoměrnou konvergenci v Donskerově větě lze kvantifikovat výsledkem známým jako maďarské vnoření:[7]
Rychlost konvergence výrazu lze také kvantifikovat asymptotickým chováním suprémové normy tohoto výrazu. V této oblasti existují další výsledky, například Dvoretzkého–Kieferova–Wolfowitzova nerovnost poskytuje meze tail probabilities of :[7]
Kolmogorov ukázal, že pokud je distribuční funkce F spojitá, pak výraz konverguje v rozdělení k , který má Kolmogorovovo–Smirnovovo rozdělení, které nezávisí na tvaru funkce F.
Grafické znázornění empirické distribuční funkce, distribuční funkce a intervalu spolehlivosti pro různé velikosti vzorku Cauchyho rozdělení
Podle výše uvedených mezí můžeme graficky znázornit empirickou distribuční funkci, distribuční funkci a intervaly spolehlivosti pro různé distribuce pomocí libovolné statistické implementace. Následuje syntax z Statsmodel[nedostupný zdroj] pro grafické znázornění empirického rozdělení.
Grafické znázornění empirické distribuční funkce, distribuční funkce a intervalu spolehlivosti pro vzorky různé velikosti trojúhelníkového rozdělení
Statistické implementace
K softwarovým implementacím empirické distribuční funkce patří:
V programovacím jazyce R lze počítat empirické distribuční funkce, k dispozici je několik metod pro grafické znázornění a tisk a výpočty empirických distribučních funkcí.
V Mathworks lze použít vykreslení grafu empirické distribuční funkce (cdf)
jmp ze SAS obsahuje CDF plot, který vytváří graf empirické distribuční funkce