Het principe ETL

ETL betekent Extract – Transform – Load: verzamel de data en zet ze in een gestructureerde format die in de BI-tool geladen kan worden.

toe open

Soms is het bronbestand al geldig gestructureerd, meestal moet je de data nog transformeren (veldnamen aanpassen, kolommen/rijen wissen, gegevenstype aanpassen, ...) en dat laatste doe je best ofwel in het bronbestand ofwel in Power Query vooraleer de tabel(len) in de Desktop geladen worden.

DOE Normaliseer tabel Graan.xlsx in Excel.

We illustreren het probleem van een geldige tabelstructuur in Excel met Graan.xlsx. Download dit bestand en open in Excel.
Begin met de huidige tabel aan te vullen.

  1. Verkopen: als het product "graan" is, vermenigvuldig je met de prijs van graan, anders zuivel. In E9: =ALS(C9="graan";D$3;D$4)*D9 en kopieer naar beneden.
  2. Premie: bij een verkoop van meer dan 5 000 eenheden graan of zuivel krijgen de vertegenwoordigers 25 eurocent per stuk meerverkoop (d.w.z. boven de 5 000).
  3. Uitbetaald loon = nettoloon + premie.
  4. Maak een zoektabel van de namen en nettolonen: selecteer F3:G5, klik in het naamvak linksboven (waar F3 staat), typ als naam lonen en druk Enter.
  5. In G9 komt als formule: =VERT.ZOEKEN(B9;lonen;2;ONWAAR)+F9 en kopieer naar beneden.

Je krijgt verscheidene keren #N/B. In G10 bv. is dat omdat er geen naam staat in B10.
Conclusie: lege cellen kunnen voor fouten zorgen.
Oplossing: vermijd lege cellen. In casu: kopieer telkens de namen naar beneden.

Bij Peters blijft #N/B staan. Reden: de naam in de zoektabel bevat twee e's.
Conclusie: verschillende schrijfwijzen van benamingen zorgen voor fouten.
Oplossing: contacteer Pe(e)ters en controleer de correcte schrijfwijze. De correcte vorm is met 1 e.

Nu is alles in orde. Of niet? Janssens krijgt bv. in maart 3x een maandloon uitbetaald! Reden: de gegevens van Janssens in maart staan over 3 regels verspreid.
Conclusie: De gegevens van één item moeten op één regel staan.
Oplossing: maak een tabel waarbij per maand de gegevens van elke vertegenwoordiger op één regel samen staan.

Mogelijke uitwerking (gekopieerd waar mogelijk, dan opmaak gewist, veldnamen met terugloop):

graan

Zo zie je dadelijk wie wat wanneer verkocht, gewoon door de tabelstructuur. Nog even de formules aanvullen (in het voorbeeld op rij 26):

  1. Verkopen graan, in G26, wordt =C26*E26. Kopieer naar beneden en naar rechts.
  2. Premie graan, in I26, wordt =ALS(C26>5000; (C26-5000)*0,25; 0). Kopieer naar beneden en naar rechts.
  3. Uitbetaald loon, in L26, wordt =I26+J26+K26 en kopieer naar beneden. Nu krijgt iedere vertegenwoordiger het correcte loon uitbetaald.
graan