Data Science v praxi (dva dny)

V kurzu se seznámíte s tím, jak ve firemní praxi používat nejzajímavější techniky pokročilého vyhodnocování dat.

Před tímto kurzem není mít žádné zvláštní znalosti práce s daty. Není nutné předem absolvovat ani kurz R - vše z R-ka, co budete potřebovat, si na začátku tohoto kurzu vysvětlíme.

Termíny kurzu

Tento kurz bohužel nemá aktuálně vypsané termíny. Je však možné uspořádat ho na zakázku pro Vaši firmu.

Téma kurzu

Základní seznámení s jazykem R v rozsahu důležitém pro následující části kurzu

  • Stažení a instalace R, Rstudia a packages
  • Načítání dat do prostředí R
  • Základní struktury v R (vectors, matrices, factors, data.frame, data.table, list)
  • Užitečné funkce při práci s R

Úvod do prediktivní analytiky

  • Co vlastně znamená Data Science a jak ji používat?
  • Jaké úlohy můžeme pomocí prediktivní analytiky řešit?
  • Principy a smysl prediktivní analytiky.

  

Jaké modely můžeme použít?

  • Existuje celá řada zajímavých modelů - od jednodušších (ZeroR, OneR, Naive Bayesian, Linear Regression, Logistic Regression) po složitější (Decision Tree, Random Forest). 

  

Jak modelovat?

Jak prakticky vybrat a sestavit model s dobrou predikcí - jak se vyvarovat nedoučení a nebo přeučení modelu?

  

Reporting a interpretace výsledků

  • Jak určit přesnost a kvalitu modelu?
  • Interpretace výsledků vrácených modelem
  • Vizualizace výsledků v R (package ggplot)