V kurzu se seznámíte s tím, jak ve firemní praxi používat nejzajímavější techniky pokročilého vyhodnocování dat.

Před tímto kurzem není mít žádné zvláštní znalosti práce s daty. Není nutné předem absolvovat ani kurz R - vše z R-ka, co budete potřebovat, si na začátku tohoto kurzu vysvětlíme.

Téma kurzu

Základní seznámení s jazykem R v rozsahu důležitém pro následující části kurzu

  • Stažení a instalace R, Rstudia a packages
  • Načítání dat do prostředí R
  • Základní struktury v R (vectors, matrices, factors, data.frame, data.table, list)
  • Užitečné funkce při práci s R

Úvod do prediktivní analytiky

  • Co vlastně znamená Data Science a jak ji používat?
  • Jaké úlohy můžeme pomocí prediktivní analytiky řešit?
  • Principy a smysl prediktivní analytiky.

  

Jaké modely můžeme použít?

  • Existuje celá řada zajímavých modelů – od jednodušších (ZeroR, OneR, Naive Bayesian, Linear Regression, Logistic Regression) po složitější (Decision Tree, Random Forest). 

  

Jak modelovat?

Jak prakticky vybrat a sestavit model s dobrou predikcí – jak se vyvarovat nedoučení a nebo přeučení modelu?

  

Reporting a interpretace výsledků

  • Jak určit přesnost a kvalitu modelu?
  • Interpretace výsledků vrácených modelem
  • Vizualizace výsledků v R (package ggplot)