Tento článek popisuje výpočet korelačního koeficientu v Power BI. Je to trochu piplačka, protože (alespoň ne teď) nenabízí Power BI žádnou funkci pro přímý výpočet (jako je v Excelu CORREL). Musíme to tedy řešit ručně. Jednu možnost nabízím, budu ale rád, když někdo do diskuse navrhne něco elegantnějšího - já jsem nic nenašel ani nevygooglil...

Také upozorňuji, že je možné problém obejít tím, že si data z Power Bi vytáhneme do Excelu a tam korelační koeficient snadno spočteme, nebo si nad daty v Power BI spustíme R-ko.

Obojí má ale zřejmé nevýhody, proto tento návod popisuje, jak počítat přímo v Power BI.

Budeme pracovat s touto tabulkou. Obsahuje dvě řady hodnot (navíc ještě rozdělené do skupin A a B, které můžeme porovnávat...).

Vyjdeme z toho, že korelační koeficient se počítá tímto vzorcem:

Rozdělil jsem to pro přehlednost na tři barevné části. Ty spočteme zvlášť do tří jednotlivých pomocných sloupců, a z nich pak vypočteme novou míru - korelační koeficient.

Takto zapíšeme (nebo odsud nakopírujeme) vzorec do jednotlivých sloupců:

  • Green = (Table1[x values]-average(Table1[x values]))*(Table1[y values]-average(Table1[y values]))
  • Blue = (Table1[x values]-average(Table1[x values]))^2
  • Red = (Table1[y values]-average(Table1[y values]))^2

Pak zapíšeme míru, která z nich spočítá korelační koeficient:

Correl = sum(Table1[Green])/(sqrt(sum(Table1[Blue]))*(sqrt(sum(Table1[Red]))))

Hodnoty této míry pak můžeme zobrazovat ve vizuálech a třeba i porovnávat obě skupiny. V našem případě je skupina A více zkorelovaná než B.

 

 

 

 

Napsat komentář

Vaše emailová adresa nebude publikována.

*

smazat formulářOdeslat komentář