Power Query is een bijzonder handig hulpmiddel om webtabellen uit hun pagina te halen, de structuur ervan op te schonen en de datatypes van de gegevens in orde te brengen.
DOE Maak een dashboard voor de Olympische medailles
In deze pagina zie je een overzichtstabel van welk land tot eind 2020 hoeveel olympische medailles won, in totaal en apart op de zomer- en winterspelen.
Kopieer de URL, bv. via rechtsklikken op het webadres en Kopiëren kiezen in het snelmenu.
Open Power BI Desktop en kies op het lint Gegevens Ophalen – Web. Plak de URL in het gelijknamige vak. OK. Even geduld.
Klik in de navigator op de 'tabellen' in de linkerkolom en je ziet rechts een voorbeeld. Zet een vinkje aan de echte tabel, Medailleklassement.
Klik op Gegevens Transformeren om de Power Query-editor te activeren.
Onder de veldnamen staan subtitels; dat mag niet: de hele titel moet in de veldnaam zitten. Pas de veldnamen aan (1-3 blijven) tot
Goudzomer - Zilverzomer - Bronszomer - Zomertotaal - Goudwinter - Zilverwinter - Bronswinter - Wintertotaal - Goudtotaal - Zilvertotaal - Bronstotaal - Eindtotaal.
Op het einde staat nog een overbodige Column16. Klik op het lint op Kolommen Kiezen en schakel het vinkje uit aan Column16.
De eerste rij 'gegevens' (= de subtitels) mogen nu weg: knop Rijen Verwijderen – Bovenste Rijen Verwijderen: 1.
Kijk ook eens naar de onderste rij, dat zijn totalen; weg ermee: Rijen Verwijderen – Onderste Rijen Verwijderen: 1.
Vervolgens moeten we de gegevenstypes controleren en voor correcte inhoud zorgen.
Rang: dat zijn nummers. Klik op ABC en kies Geheel Getal als datatype.
Doe hetzelfde voor alle kolommen met aantallen medailles: klik op de 4e veldnaam, houd Shift in en klik op de laatste veldnaam: alle kolommen zijn geselecteerd.
Kies vervolgens op het lint bij Transformeren – Gegevenstype: geheel getal.
Na vele landnamen staan verwijzingen tussen vierkante haken. Weg ermee. Selecteer veldnaam Land en kies op het lint bij Start – Kolom Splitsen – Op Scheidingsteken:
Aangepast, [, het meest linkse scheidingsteken, OK.
Verwijder kolom Land.2 en hernoem Land.1 naar Land.
Het is mogelijk dat er nu nog (onzichtbare) spaties na de landnamen staan. Rechtsklik op Land en kies Transformeren – Omloopspaties Wissen.
Klik op de knop Sluiten & Toepassen om de gegevens in de desktop te laden.
Sla het bestand op.
Een kenmerk van webtabellen is dat ze snel veranderen, dus zouden je gegevens al vlug niet meer actueel zijn.
Geen probleem: Power Query onthoudt niet alleen de verbinding (de URL), maar ook de stappen die je uitvoerde om de tabel in orde te brengen.
De volgende keer dat je het bestand opent, worden de gegevens terug bij de bron opgehaald en aangepast.
De stappen die je uitvoerde staan trouwens in de rechter kolom van de Power Query-editor.
Even bekijken: klik in de Desktop op de knop Gegevens Transformeren en je bent terug in de Query Editor.
DOE Maak geschikte visualisaties om volgende vragen te beantwoorden
Hoeveel gouden, zilveren en bronzen medailles behaalden de Belgen op de zomerspelen?
Hoeveel gouden, zilveren en bronzen medailles behaalden de Belgen op de winterspelen?
Toon de vijf landen die de meeste gouden medailles behaalden op de zomer-, resp. winterspelen.
Hoeveel gouden medailles werden er in totaal uitgereikt op de Olympische spelen?
Hoe is de verdeling van de medailles over de landen?