Data mining při analýze nákupního košíku
S tímto tématem se setkáte na našich kurzech ExcelTown.
Aktuálně: kurzy můžete absolvovat jak online, tak prezenčně.
Když si kupujete něco v eshopu, často se Vám stane, že e-shop nabídne ještě další zboží, které by se Vám mohlo hodit.
Když si například chcete koupit notebook, nabídne Vám e-shop ještě tašku na notebook, klávesnici, myš... Často je to zboží, které se Vám hodí a vy si jej často koupíte - což je samozřejmě to, čeho chce e-shop dosáhnout.
Systém e-shopu totiž dobře pozná, které zboží by Vás mohlo zajímat, a to na základě toho, co si kupovali lidé před Vámi. Tedy když si lidé před vámi kupovali k notebooku tašku na notebook, nabídne to systém i Vám.
Takové nabídky zboží jsou velmi efektivní - protože pravděpodobnost, že si takto nabídnuté zboží koupíte, je mnohokrát větší než při náhodném výběru.
Pojďme si takovýto odhad udělat v Excelu. Je to překvapivě jednoduché - systém po uživateli nechce, aby znal logiku výpočtu, stačí zadat data a pochopit výsledky.
Pro výpočet je třeba dataminingový doplněk v Excelu.
V příkladu použiji demodata dodávaná s doplňkem DMAddins_SampleData
Jedná se o tabulku s objednávkami zákazníků (pokud byste pracovali s daty neuloženými v tabulce, je třeba nejprve tabulku vložit). V prvním sloupci je číslo objednávky, ve třetím nakoupené zboží.
Všimneme si, že hodnoty v prvním sloupci (čísla objednávky) se opakují - je to logické, protože v rámci jedné objednávky zákazníci nakoupili více druhů zboží, a právě to, že se více položek vyskytuje na jedné objednávce, je informací, ze které usuzujeme, že tyto položky zákazníci nakupují často společně.
Kliknu do tabulky a nahoře se mi objeví ikonka "Shopping Basket Analysis", na kterou kliknu.
V dalším dialogu pak vybírám z tabulky správné sloupce k analýze. Tedy v Transaction ID vybírám údaj, který definuje skupinu, do které položka patří (Order Number), a v Item vyberu to, co vlastně chci analyzovat (Product). Mohu vyplnit i cenu.
Kliknu na Run. Tím se spustí výpočet, který de facto probíhá ne v Excelu, ale na SQL Serveru (což nám ale může být jedno).
Výsledek se uloží do dvou listů - Shopping Basket Bundled Item a Shopping Basket Recommendation.
Shopping Basket Bundled Item
- Bundle Items - Výpis všech zjištěných skupin
- Bundle size - Velikost skupiny
- Number of sales - Počet kusů prodaných v této skupině
- Average Value Per Sale - Průměrná cena kusů prodaných v této skupině
- Overall value of Bundle - Celková cena skupiny
- Selected Item - Výpis položek
- Recommendation - Doporučení položky, kterou má smysl nabízet dohromady se "Selected Item". Toto je nejdůležitější informace z analýzy nákupního košíku.
- Sales of Selected Items - Počet prodejů u položky
- Linked Sales - Počet situací, kdy se prodala původní i doporučená položka společně
- % of linked Sales - Podíl předchozích dvou
- Average value of recommendation - Průměrná hodnota jedné doporučené položky
- Overall value of linked sales - Celková hodnota téhož
S tímto tématem se setkáte na našich kurzech ExcelTown.
Aktuálně: kurzy můžete absolvovat jak online, tak prezenčně.
Máme tedy doplněk, o kterém nevíme, co dělá, co nám vrací a… je to in, proč ne? Jirko…
Pokud z textu není poznat, co ten doplněk dělá a co nám vrací, pak jsem to asi napsal nesrozumitelně. Určitě jsem ale neuváděl, že je in.