Nieuwe blog-site

Het is al een tijdje stil op deze blog. Dat heeft allerlei redenen :). Het goede nieuws is dat ik niet helemaal gestopt ben. Zo kunt mijn blogs tegenwoordig lezen op de website van Infotopics: http://www.infotopics.nl/infotopics-tableau-blog/blogger/listings/daan

Ook Twitter ik tegenwoordig, weliswaar met mate.

Top 2000! Maar dan op geheel nieuwe wijze!

Johan de Groot van de firma Antichaos heeft op leuke wijze de top 2000 in beeld gebracht. Ik ben zo vrij geweest de – wat mij betreft – interessantste visualisatie ietwat te finetunen en ‘uit te kleden’. Zie hieronder het resultaat.
Tips:
  • Klik op een artiest/nummer
  • Klik vervolgens (in de popup) op Spotify en het nummer wordt direct opgezocht zodat het afgespeeld kan worden.


Het volledige verhaal van Johan met alle ins en outs van de top 2000 vind je hier.

Krachtige visualisaties met eigen polygonen

voedingsgebied per wijk

Afgelopen week was ik met drie collega’s aanwezig bij de Europese Tableau Conferentie te Barcelona (jaja, er zijn vervelendere locaties voor een conferentie).

 

Tijdens een workshop over het gebruik van geografische informatie werd aandacht besteed aan het nieuwe type visualisatie in tableau 7.0; Filled Maps, in het Nederlands ook wel bekend onder naam Polygonen.Daling leerlingaantal per provincie schooljaar 2011-2012

 

Zoals jullie misschien weten zijn de provincies-polygonen standaard beschikbaar in Tableau 7.0. In een handomdraai kun je (zonder vergaande technologische kennis van geografie of van Tableau) de figuur rechts maken. Inhoudelijk wordt daar trouwens een interessante plaat getoond, namelijk het feit dat het leerlingaantal van alle provincies gedaald is in schooljaar 2011-2012 t.o.v. het jaar ervoor. 

 

Helaas zijn er echter standaard geen polygonen van lagere niveaus (gemeenten, wijken, buurten, postcodegebieden) beschikbaar. Tijdens de workshop in Barcelona werd echter verteld over een manier om je eigen polygonen te integreren in Tableau.

 

Hieronder laat ik  een toepassing hiervan zien; van een school laat ik het voedingsgebied per wijk en per buurt zien (waar wonen mijn leerlingen?). Je ziet direct dat bij deze school een groot deel van de leerlingen in slechts 2 wijken wonen (namelijk 174 en 124 leerlingen).

Voedingsgebied per wijk en buurt



In onderstaande figuur selecteer ik links een wijk (stadsdeel Zuideramstel met 174 leerlingen), en vervolgens zie je hoe de leerlingen over de buurten verdeeld zijn (rechts).

Voedingsgebied per wijk en buurt

 

Wil je zelf ook met de provincie-polygonen aan de slag? Het enige dat je nodig hebt is tableau 7.0 en een dataset!

 

Wil je zelf ook wijken, buurten, gemeentes, postcodegebieden of zelfs je eigen gedefinieerde gebieden gebruiken in je visualisaties? Je hebt dan het volgende nodig:


  • Tableau 7.0 (of hoger);
  • shape-files; 
  • een instructie zodat je de shape-files in tableau beschikbaar krijgt.

 

Kom je er niet uit of beschik je niet over de shape-files, neem dan contact op a.u.b.

Gebruik geen taartdiagrammen!

Taartdiagrammen, wie gebruikt ze niet? Ik niet! In deze blog post zet ik uiteen waarom niet.

Veel mensen gebruiken taartdiagrammen wel; naar de reden moet ik gokken, maar ik denk vooral omdat men vindt dat ze er wel leuk uitzien (rond is goed is vaak de gedachte). Een andere reden (en dat vind ik een betere reden) is dat de lezer weet dat alle taartpunten samen 100% zijn.

Voor degene die niet weten wat een taartdiagram is, hierbij een voorbeeld: De jongerenvereniging van de PvdA heeft een onderzoek uitgevoerd onder haar leden, met als doel alvast te onderzoeken welke van de kandidaten het populairst is. Ik heb de cijfers overgenomen van nu.nl en ze gepresenteerd in een taartdiagram.

image

Redenen waarom ik geen fan ben van taartdiagrammen:
  • Indien er  meer dan 3 taartpunten zijn, dan is het vaak lastig om te zien welke taartpunt het grootste is, welke nr 2 is, etc. (welke taartpunt is groter, de rode of toch de paarse?)
  • om te zien wat een taartpunt voorstelt, heb je vaak een legenda nodig; je zult een stuk van de taart eerst in de legenda op moet zoeken. (paars, dat is Plasterk)
  • kleurenblinden (8% van de mannen!) vinden het opzoeken van kleuren in een legenda niet fijn :)
  • de exacte cijfers zie je niet (Samson heeft iets minder dan de helft, maar hoeveel precies?)
  • een taartdiagram met legenda heeft een lage data-inkt ratio (de ver­houd­ing tussen de hoeveelheid inkt welke nodig is om data te tonen en de totale hoeveelheid inkt die gebruikt is om de grafiek te maken)

Alternatief voor een taartdiagram
Wat mij betreft is het staafdiagram een veel betere keuze. Wederom het voorbeeld van de PvdA:

image


waarom vind ik dit staafdiagram beter dan het taartdiagram?
  • ik zie direct welke van de kandidaten de grootste is, wie nr 2 is, etc. (Plasterk heeft toch meer aanhangers dan Albayrak)
  • ik hoef niet te switchen van diagram naar legenda (want legenda is niet nodig!)
  • kleurenblinden zijn blij, want geen kleuren
  • je ziet direct de exacte cijfers (Samson heeft 47%)
  • hogere data-inkt ratio—> dus minder afleiding; de boodschap komt beter over.

tot slot heb ik nog 1 voorbeeld gevonden van een taartdiagram die ik wel passend vind :)

image

Tableau introductie cursus @ Pré Pain & Smithuis

imageVandaag heb ik onze Tableau introductie cursus verzorgd bij Pré Pain & Smithuis;  “marktleider in hoogwaardige verse en krokante Bake off broodproducten”.



De training is bedoeld voor gebruikers die weinig tot geen ervaring hebben met Tableau, maar (uiteraard) wel geïnteresseerd zijn in datavisualisatie. Datavisualisatie gaat over het visualiseren van data, en data hebben ze daar genoeg! Elk gemaakt broodje levert 1 regel op; en ze maken daar heel veel broodjes. Per broodje is bekend wanneer hij geproduceerd is, wat de afmetingen zijn, en of hij de kwaliteitseisen overleefd heeft. Zo kun je bijvoorbeeld heel mooi inzichtelijk maken wat het percentage uitval per uur geweest is. Grappig is dat je heel mooi ziet dat aan het begin en eind van een shift de uitval het hoogste is (i.v.m. temperatuur van de oven worden de broodjes te donker).

Wat mooi is aan Tableau is dat je het snel leert en snel mooie resultaten boekt. Dit werkt in deze training extra goed, doordat de cursisten zelf aan de slag kunnen (per cursist een eigen laptop). Hoe ziet een dergelijke training eruit?:
  • inleiding Tableau (positionering producten desktop, server, reader, public)
  • Introductiefilm
  • uitleg over de case
  • met tableau reader aan de slag (hands-on)
  • zelf sheets, dashboard aan de slag (hands-on)
  • uitleg over visualisatieprincipes
  • the next level
  • belang van juiste datastructuur en toepassing unpivot tool (zie eerdere blogpost)
  • aan de slag met eigen gegevens
Kortom, leuke dag, leuke organisatie….. en een lekkere lunch!  

Hans Rosling (TED): nooit meer saaie data

Datavisualisatie gaat over de kunst van storytelling. Immers, de boodschap komt pas over als je doelgroep de gepresenteerde informatie onthoudt; dat werkt goed middels het vertellen van een goed verhaal!

De koning van de datavisualisatie is wat mij betreft Hans Rosling, in onderstaande video wordt snel duidelijk waarom. De 1e 25 seconden kun je overslaan, maar daarna wordt het snel leuk.

Unpivot add-in excel

Je kent het vast wel, je hebt een mooi verhaal bedacht en een Excel dataset gevonden die de juiste gegevens lijkt te bevatten. Je sluit tableau aan op het Excel bestand en vervolgens gebeurt er niet wat je verwacht…..
Mogelijke oorzaak: je dataset heeft een verkeerde structuur.
Voorbeeld van een verkeerde datastructuur: Voorbeeld van een goede datastructuur:
clip_image002 clip_image004
kortom: de verkeerde datastructuur moet omgezet worden in de goede.

Je kunt deze omzetting ‘met de hand uitvoeren’, of je kunt er een macro voor schrijven. Wat je ook kunt doen is een Excel add-in gebruiken die speciaal voor dit doeleinde gemaakt is. Dat werkt als volgt:
- Download de tool
- Installeren
- Vervolgens de tool activeren in excel; dat werkt bij een Nederlandstalige Excel wat lastig. Het gaat als volgt:
o Opties --> invoegtoepassing --> en dan knop start (zie rechtsonder in printscreen):
clip_image006
o knop Bladeren
o i.v.m. de NL-versie naar ‘C:\Users\<gebruikersnaam>\AppData\Roaming\Microsoft\AddIns’ gaan (afhankelijk van je versie kan het ook 'invoegtoepassingen' zijn ipv addIns).
o Klik het bestandje ‘tableau.xla’aan:
clip_image008
o (eventueel Excel opnieuw opstarten en dan krijg je een extra tab 'invoegtoepassingen')
clip_image010
- Ok. Nu de tool geïnstalleerd is kun je hem gebruiken. Klik op de juiste plek:
clip_image012
- En klik op de knop ‘reshape data’ en op ok. Je krijgt dan een extra tabblad in excel met de data op de juiste manier gestructureerd. Super handig; en de tool doet het erg goed, ook bij complexe en grote bestanden.
1 probleem met deze tool: zolang je de tool geactiveerd hebt, kun je problemen ervaren bij het opstarten van excel bestanden. Meer uitleg hierover vind je bijvoorbeeld op de volgende plek. De oplossing die voor mij werkt: de invoegtoepassing weer uitschakelen als je hem niet gebruikt:
clip_image014
Op het moment dat je hem nodig hebt schakel je hem weer in.
Succes!

Kosten van pensioen


Onderstaande visualisatie is een weergave van de (verwachte) kostprijs van pensioenen; het is bedoeld om te laten zien dat de kostprijs van pensioen onevenredig hard gestegen is.
 

Degene met wie ik dit dashboard ontworpen heb is een pensioenexpert. Zij legde het als volgt uit:
De blauwe lijn zijn de kosten van arbeid door de jaren heen (van prijsindexcijfer 100 in 2002 naar 125 in 2016).
De rode lijn geeft de kostprijs van Pensioenen weer; die is dus een stuk harder gestegen dan de kosten van arbeid!
De verwachte kostprijs hangt van allerlei variabelen af. De belangrijkste zijn:
  • De rente
  • De levensverwachting
Door aan de rechterkant de variabelen anders in te stellen kun je precies zien wat er gebeurt. Bij een rentestijging van 1% (niet ondenkbaar) ziet het plaatje er al heel anders uit. De visualisatie maakt het mogelijk om de invloed van de variabelen te onderzoeken, reuze handig!

Verzuim is een keuze!

Verzuim is een keuze…   Een gesprek met o.a. een consultant van Falke & Verbaan (van de Verbaannorm) heeft er toe geleid dat we bij Infotopics op een andere manier naar (ziekte)verzuim zijn gaan kijken. Zodoende hebben we onze verzuimdashboards opnieuw ontworpen. Belangrijkste uitgangspunten;
  • verzuim is een keuze; als je je ziek voelt kun je een week thuis blijven, je kunt ook een aspirine nemen en wel gaan werken;
  • verzuim gaat over gedrag;
  • verzuim gaat over medewerkers, niet over fte’s;
  • 12-maands voortschrijdend gemiddelden laten zien i.p.v. maandcijfers; je wilt immers een trend zien en geen seizoensinvloeden meten;
  • gebruik meerdere verzuimmaten; verzuimpercentage, ziekmeldingsfrequentie, gemiddelde verzuimduur en % nulverzuim.
Eigenrisicodrager
Deze materie is extra actueel nu grote onderwijsbesturen vanaf heden (1-8-2011) eigenrisicodrager zijn geworden (zie het nieuwe Reglement Vervangingsfonds voor het Primair Onderwijs); kortom, het loont tegenwoordig ook financieel om er voor te zorgen dat het verzuim binnen de perken blijft (een bestuur met 400 fte bespaart 2 ton aan directe kosten indien het verzuim van 5% naar 4% wordt verlaagd).

M.b.v. de nieuwe dashboards is voor de HRM-afdeling en de schooldirecteur extra goed te signaleren waar een opvallende verzuimsituatie aan de orde is, en op welke manier deze situatie beïnvloed kan worden.

Enkele voorbeelden:


Deze interactieve dashboards zijn gemaakt met de tool Tableau. Hiermee kun je in relatief korte tijd erg mooie dashboards realiseren die precies het verhaal van de organisatie vertellen. 

De data is afkomstig uit de registratiesystemen van o.a. Raet, Edukaat, PSOD en Magma. Daarboven op gebruiken we ons Personeels model; zodoende is het dashboard supersnel en creëren we ‘doorlopende lijnen’ indien een klant bijvoorbeeld van Edukaat is overgestapt naar Raet.

Geïnteresseerd in het onderwerp Verzuimanalyse? Op 21 maart organiseert Infotopics samen met Falke & Verbaan een middagsessie over dit onderwerp. Meer info volgt....