Tento článek popisuje, jak v Power BI vytvářet rozhodovací stromy.

Vyjdeme z tabulky, kterou přímo s doplňkem dodává Microsoft – klikněte sem pro stažení.

Naším úkolem, který budeme řešit pomocí rozhodovacích stromů, je zjišťovat, které faktory mají největší vliv na to, jestli si zákazník koupí nebo nekoupí kolo.

Stáhneme si custom visual, nepřekvapivě pojmenovaný Decision tree.

Načteme data a pak do polí vizuálu dáme Target Variable (proměnná, na níž některé proměnné mají vliv), a pak do Input Variables dáme tyto vstupní proměnné. Má samozřejmě smysl přidávat ty, které mohou mít reálně na cílovou proměnnou vliv.

Vytvořil se strom.

  • Např. s našimi proměnnými jsme se dozvěděli, že 46% zákazníků si kolo koupilo.
  • Velký vliv na nákup kola má ale to, jestli má zákazník jedno nebo více aut. Pokud má méně než 1,5 auta (Power BI neví, že půlit auta není moc rozumné), pak už je ale pravděpodobnost nákupu kola 54%.
  • Pokud bychom z nich ještě vydělili ty, kteří to mají do práce mezi 5 a 10 mílemi, dostali bychom se na pravděpodobnost 58%.
  • Takto můžeme postupovat až dolů.

Výsledný soubor si můžete stáhnout tady

Je dobré uvědomit si, že i tento vizuál je, stejně jako všechny ostatní, filtrován ostatními vizuály na stránce – např. průřezem.

Je tedy velmi snadné strom rychle měnit – např. podle pohlaví, vzdělání, počtu aut…