Hisztogram (statisztika)

Grafikailag a hisztogram a következőképpen épül fel. Először is, a mintaelemek által megkapott értékek több intervallumra oszthatók (tartályok). Leggyakrabban ezek az intervallumok ugyanazok, de ez nem szigorú követelmény. Ezeket az intervallumokat a vízszintes tengelyen ábrázolják, majd egy téglalapot rajzolnak fel. Ha minden intervallum azonos, akkor minden téglalap magassága arányos a megfelelő intervallumba eső mintavételi elemek számával. Ha az intervallumok eltérőek, akkor a téglalap magassága úgy van megválasztva, hogy területe arányos az ezen intervallumra eső mintaelemek számával.

Tegyük fel, hogy X 1 .... X n. ..., \ ldots, X _, \ ldots> egy minta egy eloszlásból. Meghatározzuk a valós vonal bomlását - ∞ . enged

- az i-edik intervallum alá eső mintavételi elemek száma. Ezután a darabos állandó függvény h

(x) = n i n Δ a i. Δ a i = a i - a i - 1. i = 1. k> (x) = >>>, \ Delta a_ = a_-a _, \; i = 1, \ ldots, k \; Normál hisztogramnak hívják.

A normalizált hisztogram a valószínűségi sűrűség. Különösen:

Teljesen folyamatos eloszlású hisztogram

Így a terület alakja egy normalizált hisztogram korlátozott időtartam (ai -. 1. ai], a _]> megközelíti a valószínűsége, elfogadó értékek ebben az intervallumban, sem a véletlen változók X j> Azonban a normalizált hisztogram nem konvergál pontonkénti az elméleti eloszlás sűrűsége ezeket. véletlen változók.

A hisztogramokat elsősorban az adatok vizualizálására használják a statisztikai feldolgozás kezdeti szakaszában.

A hisztogramok felépítését egy véletlen változó eloszlási sűrűségének empirikus becsléséhez használják. Hisztogram készítéséhez a véletlen változó megfigyelt tartományát több intervallumra osztjuk, és számoljuk az egyes intervallumokra eső összes mérés frakcióját. Az egyes frakciók értékét, amelyet az intervallum értékére utalunk, az elosztási sűrűség értékének becslésén alapul a megfelelő időközönként.

A hisztogram elkészítéséhez elengedhetetlen az optimális válaszfal választása, mivel növekvő intervallumokkal a sűrűségeloszlás részletezése csökken, és az érték pontosságának csökkenésével csökken. Az n intervallumok optimális számának kiválasztásához a Sturges szabályt gyakran alkalmazzák

Gyakran van egy olyan szabály is, amely az intervallumok optimális számát az összes mérési szám négyzetgyöke alapján becsüli meg:

Kapcsolódó cikkek