Tento článek popisuje, jak z webové stránky stáhnout nejen textový obsah, ale i samotné hyperlinky - které uživatel nevidí.

Vyjdeme z tabulky na této stránce (linky jsou jen ukázkové a nevedou na reálné stránky:

Klasicky se připojíme na web a při připojování vybereme požadovanou tabulku:

a načteme.

V Power Query se ukáže tabulka, ale zatím bez hyperlinků.

Jdeme na druhý krok postupu, kde je zapsaná funkce Html.Table, a kde se specifikují sloupce, kterése z tabulky extrahují.

Do kódu přidáme nový sloupec, který vytahuje hyperlinky.

  • {"SomeColumn", "a", each [Attributes][href]},

Takže to bude třeba takhle:

  • = Html.Table(Source, {{"SomeColumn", "a", each [Attributes][href]}, {"Column1", "TABLE > * > TR > :nth-child(1)"}, {"Column2", "TABLE > * > TR > :nth-child(2)"}, {"Column3", "TABLE > * > TR > :nth-child(3)"}}, [RowSelector="TABLE > * > TR"])

A hyperlinky jsou tady.

Pokud jim ještě nastavíte správnou kategorii dat:

Můžete je pak v reportech rozklikávat:

 

Napsat komentář

Vaše emailová adresa nebude publikována.

*

smazat formulářOdeslat komentář