Co je co aneb základní datové typy v jazyce R
S tímto tématem se setkáte na našich kurzech ExcelTown.
Aktuálně: kurzy můžete absolvovat jak online, tak prezenčně.
V R rozlišujeme několik základních datových typů.
Vektory
Jedná se o množinu čísel, písmen apod. Podstatné je, že vektory mají pouze jeden rozměr (čili jeden řádek, případně jeden sloupec).
> vektor = c(1, 4, 8) > vektor [1] 1 4 8
Podrobnější informace k vektorům najdete zde:
https://exceltown.com/navody/jazyk-r/vektory-v-jazyce-r/
Matice
Matice jsou podobné vektorům s tím rozdílem, že mají dva rozměry. Jinak řečeno, je u nich potřeba určit počet řádků a počet sloupců. Například matice s dvěma řádky a třemi sloupci by mohla vypadat takto.
> matice = matrix(c(1:6), ncol = 3) > matice [,1] [,2] [,3] [1,] 1 3 5 [2,] 2 4 6
Podrobnější informace k maticím najdete zde:
https://exceltown.com/navody/jazyk-r/matice-v-jazyce-r/ [LF2]
Faktory (kategoriální proměnné)
Tyto proměnné vypadají typicky jako vektory. Rozdíl je však ten, že je R chápe jako přiřazení do kategorie. Tak například následující kategoriální proměnná obsahuje pět hodnot 0 nebo 1. Každá z nich říká, jestli daný prvek patří do kategorie 0, nebo 1 (například muž / žena). Protože se jedná o přiřazení do kategorií, nedají se tyto nuly a jedničky sčítat, ani s nimi nelze dělat žádné další početní operace (R je nechápe jako čísla).
> faktor = as.factor(c(0,1,0,0,1)) > faktor [1] 0 1 0 0 1 Levels: 0 1
Podrobnější informace ke kategoriálním proměnným najdete zde:
https://exceltown.com/navody/jazyk-r/kategorialni-promenne-v-jazyce-r-factors/
Data frames
Jedná se typicky o množinu dat, kde každý řádek představuje jedno pozorování (např. jednoho člověka) a každý sloupec jednu proměnnou, vlastnost (například jméno, věk apod.). V každém sloupci může být proměnná jiného typu (vektory, kategoriální proměnné…).
Data framy typicky načítáme z externího zdroje. Návod k načítání dat naleznete zde:
https://exceltown.com/navody/jazyk-r/import-a-export-dat/
a zde:
https://exceltown.com/navody/jazyk-r/rychle-nacteni-datasetu-z-excelu-do-r/
Podrobnější informace k data framům najdete zde:
https://exceltown.com/navody/jazyk-r/data-frames-v-jazyce-r/
Listy
List je seznam proměnných různých typů. Může se skládat z data framů, matic, vektorů apod., které tvoří složky listu. Listy jsou typicky výstupem funkcí spíše než že bychom je v R cíleně vytvářeli (funkce uloží do jedné složky listu například informace o výpočtu, do druhé vstupní hodnoty, do třetí výstupní hodnoty apod.).
Podrobnější informace k listům najdete zde:
https://exceltown.com/navody/jazyk-r/listy-v-jazyce-r/
Autor článku: Lenka Fiřtová
S tímto tématem se setkáte na našich kurzech ExcelTown.
Aktuálně: kurzy můžete absolvovat jak online, tak prezenčně.