business intelligence

Ai...Ai...Ai...

Een praktische demonstratie van data naar inzichten: Ontdek hoe ChatGPT snel data transformeert tot waardevolle informatie.



Had ik voor ieder bericht dat ik sinds januari van dit jaar over AI heb gezien of gehoord een euro gekregen dan hoefde ik de komende periode niet meer te werken. En toch waag ook ik me nu aan een stuk over die ontwikkeling die onze wereld op zijn kop zal zetten en onze banen overbodig gaat maken. Maar vrees niet, het wordt geen onheilspellende boodschap maar een praktische demonstratie van wat er nu al mogelijk is. En dan specifiek over het analyseren van data.

Mocht je geen idee hebben wat AI precies is, dan kan ik dat het beste op de volgende manier omschrijving:

"AI, ofwel Artificial Intelligence, betekent dat computers slim gemaakt worden zodat ze dingen kunnen doen die normaal gesproken menselijke intelligentie nodig hebben. Bijvoorbeeld: dingen leren, problemen oplossen, beslissingen nemen en zelfs met mensen praten. AI is dus eigenlijk een soort slimme computer die ons kan helpen met verschillende taken en problemen."

Demo-data en gereedschap

In onze dagelijks business zijn we voornamelijk bezig met data van klanten; het aantal verkopen, geregistreerde uren, voorraadposities, financiële transacties, etc, maar die kan ik voor de demonstratie niet gebruiken. Daarom heb ik een bestand gedownload van Statline, de databank van het CBS en om specifiek te zijn de kerncijfers van de bevolking van Nederland. Verder maak ik gebruik van (de betaalde versie) van ChatGPT.

De eerste stap

Om ervoor te zorgen dat ChatGPT de data kan analyseren, heb ik het CSV-bestand dat ik van Statline heb gedownload ongewijzigd geüpload in de chat en de volgende tekst toegevoegd:

"In bijgevoegd bestand vind je de bevolkingsgroei in Nederland vanaf 1950. Laten we beginnen met een lijndiagram met daarin de totale bevolkingsgroei vanaf de start."

Het formaat van het CSV-bestand is niet direct optimaal. Had ik er zelf in bijvoorbeeld Excel iets mee willen doen dan had ik de nodige aanpassingen moeten doorvoeren. ChatGPT analyseert het bestand, constateert dat er wat vreemde dingen in zitten en schoont het bestand op.


Vervolgens wordt keurig een lijndiagram gemaakt van de bevolkingsgroei vanaf 1950. Heel mooi (al kun je best over de kleur en weergave van de jaren discussiëren).

lijndiagram bevolkingsgroei Nederland

Stijging of daling?

Leuk die grafiek, maar ik ben benieuwd of de bevolking nu groeit of afneemt. Op basis van de grafiek heb ik wel een idee, maar ik wil het graag zien dus vraag ik het volgende:

"Heel fraai! Ik wil nu graag de absolute aantallen zien maar ook de procentuele stijging of daling ten opzichte van het jaar ervoor. Het lijkt me aardig om de absolute aantallen dan in een staafdiagram te plaatsen en de stijging/daling in een lijndiagram. De staven mogen in het groen, de lijn in het rood.

ChatGPT snapt de vraag, geeft vervolgens duidelijk aan welke stappen worden doorlopen en in een paar seconden wordt het resultaat gepresenteerd. En het fraaie is dat je de stappen ook kunt zien wat er bij ieder stap is uitgevoerd.

procentuele verandering tov vorig jaar

Hoe is de leeftijd verdeeld?

Afgelopen week las ik de column 'Stem als een jongere' van Mathijs Bouman. In die column stelt hij dat er bij de aankomende verkiezing meer stemgerechtigde 75-plussers zijn (1,7 miljoen) dan 25-minners (1,6 miljoen). Hoewel het data-bestand dat ik gebruik beperkt is qua leeftijdsgroepen, ben ik wel benieuwd hoe het zit met de verdeling van de leeftijden en dus vraag ik:

"In de data vind je ook de bevolking naar leeftijd verdeeld in een aantal groepen. Ik wil graag vanaf 2000 de distributie van de leeftijden per jaar zien. Doe maar in een staafdiagram en zorg ervoor dat de kleuren goed te onderscheiden zijn."

Opnieuw gaat ChatGPT aan de slag. Het databestand is zoals ik eerder al schreef niet optimaal, maar dat wordt gecorrigeerd en vervolgens krijg het volgende voorgeschoteld:

verdeling leeftijdsgroepen

Nog iets meer complexiteit

Dit is al een aardige poging, maar het lijkt me aardig om de groep onder de 20 uit te sluiten (al mogen personen vanaf 18 jaar natuurlijk wel stemmen, maar het gaat om de exercitie) en de groepen 60-80 en ouder dan 80 te combineren en dus vraag ik:

"Top dit! Nu wil ik nog een stapje verder gaan en met richten op de groepen tot 65 en boven de 65. Wil je een nieuw staafdiagram maken waarbij je de procentuele verdeling van het aantal mensen aangeeft voor de bevolkingsgroepen, waarbij je: 1. De groepen 'onder 20', '20-40' en '40-65' apart laat zien. 2. De groepen '65 tot 80' en '80 jaar of ouder' bij elkaar optelt."

Eerlijk is eerlijk; hier heeft ChatGPT op het moment dat ik het probeer nog moeite mee. Er wordt een fout gemaakt, ChatGPT snapt dat het verkeerd gaat en probeert een andere aanpak. Na een aantal pogingen heb ik dan toch het resultaat waar ik om heb gevraagd.

verdeling leeftijdsgroepen gegroepeerd

Maar we zijn er nog niet, want ik wil de groep onder 20 jaar uitsluiten en dus vraag ik:

"Super. En kun je tot slot nu de groep onder 20 uit deze grafiek uitsluiten en de verdeling van de andere groepen dan opnieuw berekenen? En vooruit, dit keer mag je de gegevens in een tabel plaatsen waarbij de jaren dik-gedrukt in de kopregel mogen komen."

En ja hoor, daar is de tabel waar ik om heb gevraagd (al moet ik na een eerste resultaat nog even om een verbetering vragen zodat ik ook echt de jaren te zien krijg en dit keer op de regels).

tabel verdeling leeftijdsgroepen

Wat doe ik er zelf mee?

Ok, de grafieken zijn nog niet zo mooi als in Qlik Sense, PowerBI of andere specifieke BI-tools, maar de eenvoud waarmee je data kunt laten analyseren en grafieken kunt laten maken is indrukwekkend. En dan is dit nog maar het begin.

Zelf gaat er inmiddels geen dag meer voorbij waarop ik ChatGPT niet gebruik. Het controleren van teksten, het maken van meta-beschrijvingen of het genereren van de dummy-data; daar waar het kan besteed ik het uit. Enerzijds om tijd te besparen die ik vervolgens aan andere (belangrijkere) dingen kan besteden anderzijds om de mogelijkheden verder te ontdekken. En als ik zie waar we in deze korte tijd al staan, dan kijk ik met grote interesse naar dat wat nog komen gaat.

Ben je benieuwd naar de volledige chat die ik met ChatGPT heb gevoerd dan kun je die hier teruglezen.

Disclaimer

Ik krijg steeds vaker de vraag of we de data die we voor een klant verzamelen niet door ChatGPT of een soortgelijke tool kunnen halen. Dat klinkt natuurlijk erg mooi, maar het is iets dat wij vooralsnog niet doen. We weten niet precies wat er met die gegevens gebeurt en het laatste dat we willen is dat gegevens van een klant aan de andere kant van de wereld opduiken als 'testgegevens'. Ik raad dat dan ook sterk af om bedrijfskritische gegevens te delen in tools als ChatGPT.