Power Query – jednoduché stahování hyperlinků z webové stránky
S tímto tématem se setkáte na našich kurzech ExcelTown.
Aktuálně: kurzy můžete absolvovat jak online, tak prezenčně.
Tento článek popisuje, jak z webové stránky stáhnout nejen textový obsah, ale i samotné hyperlinky - které uživatel nevidí.
Vyjdeme z tabulky na této stránce (linky jsou jen ukázkové a nevedou na reálné stránky:
Klasicky se připojíme na web a při připojování vybereme požadovanou tabulku:
a načteme.
V Power Query se ukáže tabulka, ale zatím bez hyperlinků.
Jdeme na druhý krok postupu, kde je zapsaná funkce Html.Table, a kde se specifikují sloupce, kterése z tabulky extrahují.
Do kódu přidáme nový sloupec, který vytahuje hyperlinky.
- {"SomeColumn", "a", each [Attributes][href]},
Takže to bude třeba takhle:
- = Html.Table(Source, {{"SomeColumn", "a", each [Attributes][href]}, {"Column1", "TABLE > * > TR > :nth-child(1)"}, {"Column2", "TABLE > * > TR > :nth-child(2)"}, {"Column3", "TABLE > * > TR > :nth-child(3)"}}, [RowSelector="TABLE > * > TR"])
A hyperlinky jsou tady.
Pokud jim ještě nastavíte správnou kategorii dat:
Můžete je pak v reportech rozklikávat:
S tímto tématem se setkáte na našich kurzech ExcelTown.
Aktuálně: kurzy můžete absolvovat jak online, tak prezenčně.