V kurzu se seznámíte s tím, jak ve firemní praxi používat nejzajímavější techniky pokročilého vyhodnocování dat.

Před tímto kurzem není mít žádné zvláštní znalosti práce s daty. Není nutné předem absolvovat ani kurz R - vše z R-ka, co budete potřebovat, si na začátku tohoto kurzu vysvětlíme.

Téma kurzu

Základní seznámení s jazykem R v rozsahu důležitém pro následující části kurzu

 • Stažení a instalace R, Rstudia a packages
 • Načítání dat do prostředí R
 • Základní struktury v R (vectors, matrices, factors, data.frame, data.table, list)
 • Užitečné funkce při práci s R

Úvod do prediktivní analytiky

 • Co vlastně znamená Data Science a jak ji používat?
 • Jaké úlohy můžeme pomocí prediktivní analytiky řešit?
 • Principy a smysl prediktivní analytiky.

  

Jaké modely můžeme použít?

 • Existuje celá řada zajímavých modelů – od jednodušších (ZeroR, OneR, Naive Bayesian, Linear Regression, Logistic Regression) po složitější (Decision Tree, Random Forest). 

  

Jak modelovat?

Jak prakticky vybrat a sestavit model s dobrou predikcí – jak se vyvarovat nedoučení a nebo přeučení modelu?

  

Reporting a interpretace výsledků

 • Jak určit přesnost a kvalitu modelu?
 • Interpretace výsledků vrácených modelem
 • Vizualizace výsledků v R (package ggplot)