VertiPaq – ukládání dat v Power BI – Kurzy, konzultace, návody

VertiPaq – ukládání dat v Power BI

S tímto tématem se setkáte na našich kurzech ExcelTown.
Aktuálně: kurzy můžete absolvovat jak online, tak prezenčně.

Jazyk M a jeho používání v Power Query – zápis, logika, zajímavé příklady, 1 den (27. 11. 2024, 05. 02. 2025)
Kurz Mistrovství v jazyce DAX (Power BI), 1 den (04. 02. 2025)
Kurz Středně pokročilé Power BI, 2 dny (16. 01. 2025, 25. 02. 2025, 26. 03. 2025)
Kurz Power BI – expertní úroveň, 2 dny (25. 11. 2024, 06. 02. 2025, 04. 03. 2025)

Autor: Štěpán Rešl

Článek je převzatý z webu jaknapowerbi.cz.

Jak to, že když nahraji svá data do Power BI, tak je výsledný soubor tak malý? Neměl by být stejně velký nebo větší než nahraná data?

To rozhodně ne. Kdyby tomu tak bylo, pak by byly všechny modely velmi velké a patrně bychom se jen velmi obtížně vešli do limitací na velikost datové sady pro Power BI Service. Naštěstí tu existuje něco, čemu se říká VertiPaq.

Představení VertiPaq(u)

Jde o ukládací nástroj, který je na pomezí Power BI a Power Query. Když v Power Query dochází k aplikování postupu a následnému nahrání dat do modelu, tak ve stejnou chvíli dochází ke zpracování dat právě pomocí tohoto nástroje. To, co vám toto okno pak oznamuje, je průběh, kdy se daná velikost tabulky převádí pomocí VertiPaqu do kompaktnější formy.

To jsme si řekli, co a kdy VertiPaq dělá. Ne však úplně přesně co, že je zač a jak to dělá.

Co je to VertiPaq?

Jde o sloupcovou databázi, která se ukládá do paměti RAM. Dochází zde k její optimalizaci a uložení na disk, aby ji například Power BI mohlo využívat. Za databázovou tabulku můžeme považovat seznam řádků, kde je každý řádek rozdělen do sloupců. Například tabulka produktů:

Co je to “sloupcová databáze”?

Databáze, kdy jsou data organizována tak, aby byla optimalizována pro vertikální skenování. Toho lze docílit například rozdělením řádků na samostatné sloupce.

Při uložení dat ve sloupcové databázi má tedy každý sloupec svou vlastní datovou strukturu a ukládá se odděleně od ostatních sloupců. Hodnoty jednoho sloupce tak tedy přímo “nesousedí” s hodnotami ostatních sloupců.

Při takovéto struktuře dat je výpočet součtu hodnot v jednotlivých sloupcích mnohem snazší. Dochází totiž k načtení celé tabulky sloupce a získání všech dat která jsou potřebná pro výpočet. Není tedy třeba číst hodnoty ostatních sloupců a ignorovat je, jak by tomu bylo, kdyby se jednalo o řádkovou databázi, kde jsou data uložená po řádcích.

Příkladem takového záznamu v řádkové databázi pro nás mohl být například první řádek [1,“Jablko“,6,40]. V takovém případě bychom museli načíst celý řádek, procházet ho a ignorovat nepotřebné hodnoty jiných sloupců. Při jediném skenování sloupcové databáze získáte pouze užitečná čísla (za celý sloupec) a můžete je rychle agregovat bez nutnosti načítání a ignorování dat z ostatních sloupců.

Příklad získání výsledků ze sloupcové databáze

Kdybychom tedy chtěli znát počet položek na skladě, pak tedy snadno zjistíme, že výsledek je 326. Jak se tento algoritmus ale zachová, když řekneme, že chceme Počet položek na skladě, kde je Cena rovna číslu 10? Počítače takovou úlohu zpravidla řeší tak, že nejprve prohledají sloupec Cena. Tam, kde bude podmínka x = 10 splněna, tam si poznamenají čísla řádků, poté, co získají všechna čísla řádků, tak teprve prohledají sloupec Počet na skladě a sčítají pouze řádky, které si v předchozím kroku identifikovali.

Z toho vyplývá, že čím více omezení na výsledek je z pohledu ostatních sloupců, tím náročnější je získat výsledek. Avšak bez omezení je dosažení výsledku značně jednoduché.

Co krom rychlého čtení hodnot ve sloupci nám tato databáze poskytuje?

Sloupcové databáze mohou být velmi často pomocí komprese smrštěny, čímž dochází ke snížení množství času potřebného pro skenováním dat. A cílem algoritmů komprese VertiPaqu je zmenšit paměťovou stopu vašeho datového modelu.

Jak Vertipaq ukládá hodnoty sloupců do paměti?

Na to není jen jedna odpověď ale hned 3 (aby jich nebylo málo):

Kódování hodnot
Kódování slovníku
RLE kódování.

Každý sloupec pak lze kódovat pomocí jedné z těchto technik.

Kódování hodnot

Kódování hodnot si můžeme ukázat na této tabulce. Je jen velmi mírně upravena oproti tabulce ze začátku. Vezmu-li si sloupec Cena, tak každé číslo ve sloupci představuje hodnotu, kterou je třeba uložit. Engine VertiPaq je velmi sofistikovaný a hledá matematické vztahy mezi hodnotami sloupce.

V tomto případě je matematický vztah velmi jednoduchý. Můžete si všimnout, že všechny hodnoty jsou dělitelné číslem 5. Z toho důvodu VertiPaq celý sloupec vydělí tímto číslem, aby získal jednodušší hodnoty pro zakódování. Na malém počtu dat se takováto úprava může zdát nepatrná, ale na čím bude větší vzorek dat, tím větší bude i výsledné ušetření.

Takovéto kódování nám ale může zajistil optimálnější velikost pouze u sloupců obsahujících číselné hodnoty.

Kódování slovníku (hash)

Kódování slovníku je další technikou používanou VertiPaq ke snížení počtu bitů potřebných k uložení sloupce. Vzniká slovník odlišných hodnot sloupce a poté nahradí hodnoty sloupců indexy do slovníku.

Pro vysvětlení na příkladu jsem rozšířil naši vstupní tabulku u Původ produktu. Při tomto kódování dojde tedy k vytvoření nové pomocné tabulky, která bude naším slovníkem a nahrazením původních hodnot pomocí indexu.

Takovéto zakódování s sebou přináší určité výhody. Tou na první pohled zřejmou je ta, že textová hodnota, která vyžaduje větší počet bitů na zakódování se zbaví duplicit a je nahrazena indexem, který zabírá velmi malé množství bitů (v aktuálním případě stačí 2 bity). Dále pak sloupce obsahují pouze celé hodnoty, což usnadňuje optimalizaci, a navíc to v podstatě znamená, že VertiPaq je nezávislý na datovém typu.

Primárním faktorem pro určení velikosti sloupce při tomto kódování není typ dat, ale počet odlišných hodnot sloupce. Tato čísla (počet unikátních hodnot ve sloupci) označujeme jako mohutnost sloupce. Ze všech různých faktorů jednotlivého sloupce je nejdůležitějším při navrhování datového modelu jeho mohutnost. Čím nižší je mohutnost, tím menší je počet bitů potřebných k uložení jediné hodnoty, a tím menší je stopa paměti ve sloupci.

RLE kódování

RLE je bezeztrátová komprese, která kóduje vstupní data tak, že kóduje posloupnosti stejných hodnot do tří hodnot (hodnota, délka posloupnosti, index řádku, kde hodnota začíná). Účinnost komprese je silně závislá na charakteru vstupních dat, která musí obsahovat delší sekvence stejných znaků, jinak výrazně účinnost komprese klesá. K této kompresi VertiPaq přistupuje v případě, že objeví opakované výskyty těch samých hodnot ve sloupci.

Jak se VertiPaq rozhoduje?

VertiPaq je velmi chytrý nástroj, a ne vždy využije jen jednu ze zmíněných variant. Jeho primárním účelem je snížení datového objemu. Může tedy dojít i k tomu, že již zakódovaný sloupec pomocí slovníkového kódování bude ještě překódován kódováním RLE. Zároveň, pokud by z nějakého důvodu mělo kvůli průběhu kódování dojít ke zvýšení datového objemu, pak VertiPaq ponechá sloupec bez zakódování.

Kódují se tedy tabulky, které přicházejí do Power Query. Kóduje se ještě něco?

Ano, aby došlo k optimalizaci celkového výkonu, tak dochází i na kódování vazeb/vztahů, mezi tabulkami. Když probíhá načítání dat, tak se provádí tvorba vazeb v modelu. Přemýšleli jste někdy nad tím, jak jsou tyto vazby realizovány na pozadí, abyste dostali tak rychlou odpověď? Odpovědí je opět VertiPaq…

Při vytvoření vztahu buďto vámi nebo automaticky VertiPaq obdrží informaci, že tuto vazbu budete pravděpodobně používat často, a pro zlepšení výkonu dotazů uloží vztahy jako dvojici ID (z jedné tabulky) a Čísla řádků (druhé tabulky) [vztah 1: n]. Výsledné vztahové tabulky jsou uloženy jako jakákoliv jiná datová struktura. Výsledný vztah nemusí aplikace dopočítávat při vyvolání podobně jako Measure ale má vazbu pevně uloženou v datovém modelu.

S tímto tématem se setkáte na našich kurzech ExcelTown.
Aktuálně: kurzy můžete absolvovat jak online, tak prezenčně.

Elearning

Děláme i elearning, takže se Excel nebo Power Appky můžete naučit prostě teď hned.

Třeba úvodní Excel,

středně pokročilý Excel (nejpopulárnější),

Power Query a Pivot,

nebo Power Apps.

Vše jde i online

Aktuálně nabízíme všechny kurzy i v online variantě

Našimi kurzy prošlo více než 10 000+ účastníků

2 392 ověřených referencí účastníků našich kurzů. Přesvědčte se sami

Reference ze školení Úvod do Power BI (09/2024)

Líbilo se mi málo teorie, hodně praktických příkladů.
Struktura přednášky >> perfektní úvod do kurzu
Příjemné vystupování přednášející.
Srozumitelné, názorné příklady
Poměr teorie a příkladů byl přesně vyvážený
Tempo bylo ideální

Kurz:

Úvod do Power BI

Reference ze školení Excel pro začátečníky (09/2024)

Přístup lektorky - ochotná a příjemná
Okamžitá reakce na dotazy
Dobře připravené materiály - tabulky
Dostatek času na procvičování a otázky.
Vysvětlení lektorky bylo lehce pochopitelné.

Kurz:

Excel pro začátečníky

Reference ze školení Power Query a Power Pivot (08/2024)

Velmi srozumitelný výklad, velmi zajímavé
Lektor uměl odpovědět na všechny dotazy
Výborné zkušební příklady
Zaujala mě práce s úpravou tabulek a propojování

Kurz:

Kurz Power Query a Power Pivot

Reference ze školení Úvod do Power BI (06/2024)

Lektorka vysvětlila základy i pokročilejší funkce
Tento kurz mi otevřel dveře do světa vizualizace dat.
Jednoduché vysvětlení, praktické příklady
Přátelská a přívětivá atmosféra

Kurz:

Úvod do Power BI

Reference ze školení SQL (05/2024)

SQL školení předčilo mé očekávání.
Naučil jsem se spoustu nových technik a postupů, které mi výrazně zefektivní práci.
Lektorka vše skvěle vysvětlila a byl vždy připraven odpovědět na naše otázky.
Výuka byla velmi profesionální a přátelská.

Kurz:

Úvod do SQL

Pokročilé SQL

Reference ze školení Středně pokročilý Excel (03/2024)

Excel kurz byl přesně to, co jsem potřeboval
Perfektní průvodce pokročilejšími funkcemi, které mi chyběly.
Výuka byla dynamická, plná praktických příkladů.
Určitě doporučuji všem, kdo se chtějí v Excelu posunout na další úroveň!

Kurz:

Středně pokročilý Excel

Reference ze školení Středně pokročilý Excel (11/2023)

Hezky a jednoduše podané příklady
Přístup paní lektorky byl skvělý
Zodpovězené dodatečné dotazy
Skvělý a empatický přístup paní lektorky, naprostá spokojenost

Kurz:

Středně pokročilý Excel

Reference ze školení SQL (10/2023)

Možnost sama si vše naklikat na PC
Nezatěžování teorií
Skvělé vedení kurzu i obsah
Praktické zkoušení dotazů je super, odbočka k Power Query také

Kurz:

Úvod do SQL

Pokročilé SQL

Reference ze školení PYTHON (09/2023)

Byla jsem s pokojena s lektorem i organizací
Seznámení a postupné ponoření do problematiky bylo skvělé
Bavila mě především celá hlavní část kurzu
Konkrétní příklady byly moc užitečné
Ideální tempo, srozumitelnosti, praktické příklady

Kurz:

Naše kurzy

Reference ze školení Středně pokročilý Excel (09/2023)

Super jsou příklady a cvičení
Cokoliv nešlo, lektorka pomohla a poradila
Výklad mentorky byl výborný
Mnoho praktických příkladů

Kurz:

https://exceltown.com/kurzy/dvoudenni-stredne-pokrocily-kurz-excelu/

Reference ze školení Úvod do Power BI (09/2023)

Způsob vykládání, hodně příkladů, vše jsem si mohla vyzkoušet - vše velmi srozumitelné
Vyhovovalo mi, že se vše dělalo na příkladech
Jednoduché vysvětlení, možnost prakticky vyzkoušet

Kurz:

Úvod do Power BI

Reference ze školení Středně pokročilý Excel (08/2023)

Rychlost výkladu akorát
Dostatek příkladů a procvičování i opakování
Super tempo
Flexibilní pojetí výuky

Kurz:

https://exceltown.com/kurzy/dvoudenni-stredne-pokrocily-kurz-excelu/

Reference ze školení Středně pokročilý Excel (05/2023)

Výborná lektorka
Tempo přizpůsobené všem
Člověk se nebál zeptat

Kurz:

https://exceltown.com/kurzy/dvoudenni-stredne-pokrocily-kurz-excelu/

Reference ze školení Úvod do Power BI (05/2023)

Kurz je dobře strukturovaný, moc mi to vyhovovalo
Přístup lektora byl nápomocný, vše dobře vysvětlil
Vhodné tempo, proaktivní přístup

Kurz:

Úvod do Power BI

Reference ze školení Středně pokročilý Excel (03/2023)

Lektorka byla velmi ochotná
Vše vysvětlovala v klidu, a když bylo potřeba, cokoliv zopakovala
Velmi srozumitelné a dobře vysvětleno

Kurz:

https://exceltown.com/kurzy/dvoudenni-stredne-pokrocily-kurz-excelu/

Reference ze školení Úvod do Power BI (02/2023)

Vše bylo vyzkoušeno od úvodu
Příjemné tempo práce
Příjemný lektor ochotný vše vysvětlit
Tempo tak akorát, perfektní přístup, vynikající znalosti

Kurz:

Úvod do Power BI

Reference ze školení Excelu pro labužníky (11/2022)

Oceňuji - nachystané podklady, příklady využitelné v praxi
Skvělé vychytávky, vyhovující tempo
Skvělý lektor - profesionální, sympatický

Kurz:

Excel pro labužníky

Reference ze školení Úvod do Power BI (11/2022)

Vše zkoušíme, méně teorie
Každý zádrhel se vysvětlí :-)
Praktické příklady, možnost si vše vyzkoušet, tempo lektora - vše super!
Rychlost je odpovídající náročnosti a zkušenosti školených
Interaktivita, ukázky chyb (na co si dát pozor), výklad byl jasný a přehledný
Výborné tempo, skvělý přístup, vynikající znalosti

Kurz:

Úvod do Power BI

Reference ze školení Power Query a Power Pivot (10/2022)

Srozumitelnost přednosu
Hodně praxe tj.super
Výborné zkušební příklady
Tipy v Power Pivot

Kurz:

Kurz Power Query a Power Pivot

Reference ze školení Středně pokročilý Excel (10/2022)

Pro mě velmi obohacující.
Spoustu typů a vychytávek. Příjemná lektorka.
Dostatek času procvičit příklady

Kurz:

https://exceltown.com/kurzy/dvoudenni-stredne-pokrocily-kurz-excelu/

Reference ze školení Excelu pro BENU Lékárna (09/2022)

Lektor byl velmi komunikativní a nápomocný. Kdykoli někdo potřeboval, aby lektor zpomalil, tak ochotně cely usek zopakoval.
Získal jsem základní přehled o Excelu, Zatím jsem byl samouk.
Vše super

Reference ze školení SQL (02/2022)

Výborný a zrozumiteľný spôsob podania
Paní Šperková velice pěkně vysvětluje a vše je pochopitelné i pro začínající.
Líbilo se mi podání kurzu ve smyslu příkladů, ukázek různých přístupů a návodů, jak v souvislosti s jazykem SQL přemýšlet. Dobré byly ukázky příkazů pro práci s čísly a textovými řetězci. Výklad byl velmi srozumitelný.

Kurz:

Úvod do SQL

Pokročilé SQL

Reference ze školení Excelu (01/2022)

Oceňuji, že lektor souběžně komentuje, co dělá a promítá to na sdílenou obrazovku, rovněž oceňuji tempo celého procesu
Jsem začátečník, moc se mi to líbilo.
Praktické příklady jsou vždy lepší než teorie, takže super.

Kurz:

https://exceltown.com/kurzy/dvoudenni-stredne-pokrocily-kurz-excelu/

Reference ze školení Úvod do Power BI (11/2021)

Za mě dobře vyvážený obsah a vše dobře vysvětleno, dost prostoru na dotazy, dobře připravené příklady.
Oceňuji, že lektor po krátkém teoretickém úvodu hned přešel k praktickým cvičením, na kterých si člověk mohl lépe uvědomit možnosti programu a principy na kterých pracuje.
Nemám, co vytknout, je to super :)

Kurz:

Úvod do Power BI

Reference ze školení Excelu (11/2021)

Moje první celodenní školení on line, byla jsem spokojená
Kurz byl skvělý (není co vytknout, tak alespoň maličkosti :) ), moc děkuji.
Pan lektor problematiku zná, pracuje s ní v praxi, umí bezvadně podat, nemám jedinou výhradu. Obávám se že není moc prostoru pro další zlepšení.
Školení mi přineslo to, co jsem očekávala - rozšíření znalostí z excelu, poznání nových funkcí a návod, jak ty stávající používat lépe. Ukázka z Power Pivot mě nalákala na další školení :-)

Kurz:

https://exceltown.com/kurzy/dvoudenni-stredne-pokrocily-kurz-excelu/

Reference ze školení Excelu (10/2021)

Jednotlivé funkce Excelu byly prezentovány názorně a zároveň srozumitelně. Lektorka volila tempo dle potřeb účastníků kurzu, byla velmi příjemná, ochotná pomoci a dovysvětlit.
Skvěle zvolená struktura kurzu. Výklad jasný a pochopitelný. Velmi milá lektorka.
Líbilo se mi že jsem si mohla vyzkoušet vše na PC. Pokud jsem měla problém, řešil se hned.

Kurz:

https://exceltown.com/kurzy/dvoudenni-stredne-pokrocily-kurz-excelu/

Reference ze školení Excelu (12/2020)

Není co vytknout - naprosto srozumitelný výklad.
Líbil se mi přístup k jednotlivcům a rady k našim individuálním požadavkům.
Líbil jsem mi výklad po obsahové stránce i způsob, jakým byl podán.

Kurz:

https://exceltown.com/kurzy/dvoudenni-stredne-pokrocily-kurz-excelu/

Reference ze školení Úvod do Power BI (9/2020)

Kurz se mi celkově velmi líbil. Přišla mi dobrá struktura, posloupnost i množství informací
Dobrý výklad látky, skvělé praktické příklady a ukázky, tipy a triky
Jasná struktura kurzu - Vizuály / Datový model / Power Query
Bylo to praktické. Pomůže mi to optimalizovat už vytvořené dotazy

Kurz:

https://exceltown.com/kurzy/power-bi-prakticky/

Reference ze školení Excel pro začátečníky (6/2020)

Vše v nejlepším pořádku.
Výborný výklad, příklady, odpovědi na otázky...
Skvělá školitelka, vše bylo srozumitelné.
Super výuka, nic bych neměnila.
Základy vysvětleny jednoduše a pochopitelně, dostatek času na procvičování a otázky.
Vysvětlení lektorky bylo dobré, lehce pochopitelné.

Reference ze školení Power BI - Expertní úroveň (6/2020)

Skvěle vysvětleno jak a proč něco funguje. Na tom se dá stavět.
Líbilo se mi teoretické vysvětlení Power BI, spousta tipů na zefektivnění modelů.
Dobrý a vyvážený mix DAXu, M a teorie.
Vysoký skill přednášejícího, ochota odpovídat na individuální dotazy.
Líbily se mi věci kolem Power Query, které člověk na webu běžně nenajde.

Reference ze školení Excel pro labužníky (3/2020)

Velmi praktické a jasné vysvětlení Power Query
Výborné
Líbily se mi praktické příklady, ochota lektora, řešení skutečných problémů, diskuse

Reference ze školení Power BI prakticky (2/2020)

Skvělé vysvětlení od základů, srozumitelně, ukázané na příkladech.
Líbilo se mi vysvětlování dotazů ihned a odbornost kurzu.
Líbila se mi názornost.

Reference z kurzu Excel pro začátečníky (1/2020)

Velmi dobrá, ochotná a příjemná lektorka.
Srozumitelný výklad lektorky, tempo vyhovovalo všem, stihlo se toho hodně oproti původnímu očekávání.
Naprosto geniální a úžasný kurz. Lektorka je skvělá ve vysvětlování a po dlouhém trápení, co jsem kdy s Excelem měla, jsem pochopila vše, co na kurzu bylo. Velmi děkuji ExcelTown za úžasný kurz.

Reference z kurzu pro Metalimex (11/2019)

Bylo to super, dobrá komunikace
Kurz byl perfektně připraven a celá výuka byla podána pro mě naprosto srozumitelným způsobem. Děkuji.
Každý jsme si řekli, co se potřebujeme naučit, a podle toho se vyučovalo.

Reference ze školení pro ČEZ (1/2020)

Líbily se mi praktické ukázky.
Získal jsem celkový přehled o Power BI!
Líbilo se mi vše.

Potřebujete se na něco zeptat?

Jsme tu pro vás každý den

+420 602 274 999

info@exceltown.com

Pište kdykoliv. Odpovíme do 24h

ExcelTown na LinkedInu

Sledujte nás

Návody