Když si výzkumníci přejí zaznamenat počet pozorování nebo počet výskytů určitého jevu, mohou použít nástroje jako relativní rozdělení četností a kumulativní rozdělení četností ke sdílení hodnot dat ve snadno stravitelném formátu. Přečtěte si další informace o tom, jak může rozdělení frekvence usnadnit analýzu velkého počtu hodnot v sadě dat.
Co je distribuce frekvence?
Frekvenční distribuce je kvantitativní datový soubor, který ukazuje, kolikrát se vyskytují kategorické proměnné. Často se používají ke správě velkých souborů dat s rozsahem hodnot. Jakmile jsou data shromážděna a roztříděna, lze rozložení četnosti zobrazit pomocí vizuálních nástrojů, jako jsou koláčové grafy, sloupcové grafy a histogramy, nebo vykreslit do tabulek pro snadnou konzumaci.
Příklad rozdělení frekvence
Jako příklad distribuce frekvence v reálném světě si představte univerzitního registrátora, který se snaží vyhodnotit chování studentů, aby naplánoval nabídku kurzů a limity třídy. Registrátor může použít rozdělení frekvence k analýze počtu tříd, do kterých se vysokoškoláci za semestr registrovali. Registrátor mohl naskenovat registrační záznamy a zjistit počet studentů, kteří absolvují dvě třídy za semestr, tři třídy za semestr, čtyři třídy za semestr a tak dále. Poté by mohli tato data znázornit na koláčovém grafu nebo sloupcovém grafu, aby je mohli sdílet s učiteli, když se připravují na úpravu nabídky kurzů pro budoucí semestry.
2 Typy rozdělení frekvencí
V analýze dat se používají dva hlavní typy frekvenčních distribucí: relativní frekvenční distribuce a kumulativní frekvenční distribuce. Obojí závisí na frekvenci, což je v popisné statistice počet případů, kdy se něco v daném souboru dat vyskytne.
1. Relativní rozdělení četnosti : Relativní četnost se vztahuje k počtu případů, kdy se určitý výsledek vyskytne, děleno celkovým počtem výsledků. Relativní četnost můžete zapsat jako zlomek, desetinné číslo nebo procento. Pokud například pizzerie zaznamenala, že si zákazníci objednali feferonky na pěti z dvanácti koláčů, relativní četnost feferonek by byla 5/12. Pokud by si zákazníci objednali cibuli na třech z dvanácti koláčů, relativní četnost cibule by byla 3/12 (což se sníží na 1/4).
2. Kumulativní rozdělení četností : Kumulativní četnost je součtem více relativních četností. Chcete-li pokračovat v příkladu pizzy, vypočítejte kumulativní četnost objednávek feferonek plus objednávek cibule. Na základě existujících údajů přidejte 5/12 (pro feferonky) a 3/12 (pro cibuli), výsledkem je kumulativní relativní četnost 8/12 (která se sníží na 2/3). To znamená, že na základě údajů o velikosti vzorku bude osm z každých dvanácti pizz obsahovat feferonky nebo cibuli.
Kdy jsou frekvenční rozdělení užitečná?
Rozdělení četnosti se mohou ukázat jako užitečná při reprezentaci jednoduchých souborů dat, ale mohou se také použít pro popisné statistiky vyšší úrovně.
- Testování statistických hypotéz : Testování statistických hypotéz v souladu se svým názvem používá soubory statistických dat k testování předpovědí vytvořených v hypotéze. Když výzkumníci shromažďují data v distribuci frekvence, mohou provádět měření centrálních tendencí (vymyšlený výraz pro průměr nebo průměr). Mohou také najít směrodatnou odchylku (rozptyl) mezi datovými body a statistický rozptyl (celkovou variabilitu) souboru dat.
- Frekvenční analýza : Kryptografové (ti, kteří studují zakódovanou komunikaci a neznámé jazyky) používají rozdělení frekvence písmen, aby pomohli přeložit písmo v esoterickém písmu.
- Teorie pravděpodobnosti : Forma matematiky na vysoké úrovni známá jako teorie pravděpodobnosti používá rozdělení frekvence k pozorování sběru dat. Statistici hledají frekvenční rozdělení, která ukazují normální rozdělení, kde se data shodují se směrodatnými odchylkami. Ve světě statistik se taková data nazývají „platykurtic“. Pokud se frekvenční distribuce neshodují s normální distribucí, statistici říkají, že vykazují šikmost a jsou popisováni jako „leptokurtické“.
4 Formáty distribuce frekvence
V mnoha každodenních aplikacích nabývá frekvenční rozložení jedno z následujících grafických znázornění.
1. Koláčové grafy : Koláčové grafy představují celkový soubor dat jako kruh a každý sektor dat představuje „klín“ koláče.
2. Sloupcové grafy : Sloupcové grafy představují frekvenci dat pomocí svislých pruhů stejné šířky a stejných rozestupů. Sloupcové grafy představují diskrétní proměnné, které lze spočítat.
3. Histogramy : Histogramy připomínají sloupcové grafy, ale nemají mezery mezi svislými sloupci. Histogramy představují spojité proměnné, které se nepočítají, ale spíše měří (a tedy odpovídají rozsahům dat).
4. Frekvenční polygony : Histogram můžete přeměnit na frekvenční polygon spojením středů každého sloupce v histogramu. Tyto spojené středy nakonec vypadají jako spojnicový graf, který napodobuje obrysy histogramu.
Jak vytvořit tabulku rozdělení frekvencí
Můžete vytvořit tabulku rozložení frekvence, která zobrazuje buď seskupené rozložení frekvence, nebo neseskupené rozložení frekvence. Seskupená data znamenají, že kombinujete více hodnot do jednoho datového bodu. Neseskupená data znamenají, že každý datový bod se rovná pouze jedné jediné hodnotě. Zkuste například vytvořit seskupenou tabulku rozdělení četností pro výsledky zkoušek studentů v hypotetické hodině dějepisu.
1. Shromážděte všechny datové body . Nejprve shromážděte všechna skóre ze zkoušek z hypotetické třídy historie. Tyto hypotetické výsledky zkoušek jsou od nejnižší hodnoty po nejvyšší hodnotu: 68, 72, 74, 79, 81, 85, 85, 89, 92, 95.
2. Seskupte data . Protože se jedná o seskupenou tabulku rozdělení frekvence, seskupte výsledky testu do čtyř kategorií: As, Bs, Cs a Ds. Máte dvě As, čtyři B, tři C a jedno D.
3. Vložte data do tabulky . Vytvořte tabulku se dvěma sloupci, kde první sloupec bude pro konkrétní známku z písmen a druhý sloupec bude pro počet studentů, kteří u zkoušky dosáhli této známky.
4. Podle potřeby vytvořte další tabulky . Ze stejného souboru dat můžete také vytvořit tabulku kumulativního rozdělení frekvence. Můžete mít například položku, která kombinuje studenty, kteří získali As a studenty, kteří získali B, nebo položku, která kombinuje As, B a C.
5. Převeďte data do grafických znázornění podle potřeby . Pokud máte v plánu sdílet svá data s ostatními, můžete se rozhodnout převést svou tabulku distribuce frekvence na koláčový graf, sloupcový graf, histogram, mnohoúhelník frekvence nebo jinou grafickou reprezentaci.