Tento článok je o základnom hľadaní korelačnej závislosti v Exceli. Koreláciu použijem, keď chcem posúdiť, či dve veličiny majú medzi sebou vzťah. Chcem napríklad zistiť, či:

  • Čerpanie lepšieho paliva ovplyvňuje spotrebu auta
  • Počet predavačov v predajni ovplyvňuje tržby
  • Počet zjedených tort ovplyvňuje objem pása

V našom prípade chcem zistiť, či inzercia v rádiu ovplyvňuje tržby mojej predajne. A ak,  tak v ktorom rádiu z dvoch skúmaných je táto závislosť väčšia. Mám za jednotlivé mesiace informácie o tom, koľko som zaplatil za reklamu v dvoch rádiách a o tom, koľko som (možno aj vďaka reklame) utŕžil.

 
Ako na to.

Spočítam takzvaný korelačný koeficient. Koeficient sa počíta pre dve skupiny dát a dostáva hodnoty od -1 do 1.

  • Ak je korelačný koeficient okolo -1, znamená to, že závislosť je silná, ale nepriama. Napríklad vzťah výkonnosti počítača a času, za ktorý počítač spracuje úlohu. Teda čím vyšší výkon, tým kratší čas.
  • Ak je korelačný koeficient okolo 0, znamená to, že závislosť nie je skoro žiadna. Napríklad výkon počítača a jeho farba.
  • Ak je korelačný koeficient okolo 1, znamená to, že závislosť je silná a priama. Napríklad vzťah výkonu počítača a počtu úloh, ktoré vyrieši za hodinu. Čím vyšší výkon, tým viac úloh.

Je ale potrebné si uvedomiť, že korelácia nehovorí, že jeden skúmaný parameter musí nutne ovplyvňovať druhý. Môžu byť oba ovplyvnené niečím iným.

Napríklad predaj zmrzliny sa vzájomne neovplyvňuje s predajom slnečníkov – obidva  sú vyvolané teplým počasím – ale korelácia by sa pravdepodobne objavila. V našom prípade, sledovanie reklamy, použijem funkciu CORREL. Do tej stačí iba zadať dve oblasti s dátami, u ktorých chcem zistiť vzájomné závislosti. Výsledkom je korelačný koeficient.

V mojom prípade vyšiel korelačný koeficient pre jedno rádio 0,783914584 a pre druhé 0,397223044.

Čo to znamená?

Reklama v prvom rádiu zlepšuje moje predaje viac. Možno toto rádio počúva vhodná cieľová skupina zákazníkov a je pre mňa pravdepodobne výhodnejšie inzerovať v ňom.

Avšak pozitívne sa na predajoch prejavuje aj rádio číslo dva – preto sa možno oplatí inzerovať v oboch.

Kritické medze korelačného koeficientu

Keď posudzujem, či medzi premennými existuje závislosť alebo nie, musím zohľadniť to, či mám dostatok dát. To je možné spočítať alebo  nájsť v tabuľke.

Ak chcem pracovať s deväťdesiatpäťpercentnou pravdepodobnosťou a mám 31 hodnôt, potrebujem korelačný koeficient okolo 36%. Obe moje rádia tento limit prekročili (aj keď druhé len tak tak). Preto si môžem byť na 95% istý tým, že obe rádiá pozitívne ovplyvňujú predaje v mojej predajni.

Pridaj komentár

Your email address will not be published.

*

clear formPost comment