De afgelopen twee jaar stonden in het teken van Generatieve Artificial Intelligence (Gen AI). Grote namen als OpenAI, Anthropic, Meta, Databricks, Snowflake, Google wedijverden om het beste Large Language Model te maken. Deze nieuwe IT-wedloop bracht Gen AI in vrijwel elk product: van je mobiele telefoon en weegschaal tot Windows en corporate dataplatforms. De beloftes waren groot: Gen AI zou alles oplossen, je ontwikkelaars efficiënter maken, je productaanbod optimaliseren en zelfs je helpen afvallen.
Nu de hype is afgenomen en Gen AI een meer alledaagse technologie is geworden, hebben organisaties waardevolle lessen geleerd:
- Gen AI is heel krachtig en tegelijkertijd niet de oplossing voor alles. Denk goed na over waar en hoe je het inzet en welke waarde.
- Gen AI in zijn huidige vorm is het toepassen van algebra en statistiek. Zorg dat je begrijpt hoe het werkt anders blijft het een black box.
- Gen AI kan niet zonder een goed datafundament.
De cruciale rol van een goed datafundament
Dit laatste punt is wellicht niet nieuw. Veel organisaties werken al aan een sterk datafundament. Want als je beslissingen neemt op basis van een rapportage of andere dataproducten, wil jij ook zeker weten dat de gegevens kloppen. Denk bijvoorbeeld aan een klantgesprek: je wilt zeker weten dat je alle relevante informatie over hun polissen in beeld hebt. Bij Gen AI is de impact van foutieve data echter nog groter. Waar jij een fout in een rapportage kunt corrigeren, presenteert Gen AI foutieve antwoorden aan iedereen die het maar vraagt.
Met deze inzichten verschuift de aandacht voor 2025 naar een cruciaal thema: hoe maken we data begrijpbaar en betrouwbaar?
Het belang van datakwaliteit in 2025
2025 wordt het jaar waarin datakwaliteit de volle aandacht krijgt. Het uitvoeren van datakwaliteitsmetingen over alle datasets wordt de standaard, te beginnen met de belangrijkste datasets en de sets die door Gen AI worden gebruikt.
Deze datasets gaan standaard getoetst worden op
- Compleetheid
- Accuraatheid
- Consistentie
- Geldigheid
- Uniekheid
- Integriteit
Tools zoals Collibra helpen bij het vaststellen, uitvoeren en rapporteren van deze metingen. Daarnaast zijn cruciale rollen zoals datastewards, onmisbaar. Zij kennen de organisatie, de processen, de data en de systemen. Hun expertise is essentieel om hoge datakwaliteit te waarborgen en daarmee vertrouwen in Gen AI-oplossingen te garanderen.
Hoe metadata begrijpbare data mogelijk maakt
Naast data(kwaliteit) krijgt ook metadata volgend jaar de volle aandacht. Metadata beschrijft wat al die data betekent. Kortom, wat betekent die technische kolomnaam, waar komt deze data vandaan en welke keuzes zijn er gemaakt bij het samenstellen van een tabel of dataset? Dit belang groeide de afgelopen jaren al steeds verder:
- Managed rapportages: Bij het opleveren van een managed rapportage is het vooral nodig dat de beschrijving van het rapport helder is en dat duidelijk is wat de visuals betekenen;
- Self-service BI: Bij het enablen van self-service BI moet de complete datamart goed beschreven zijn zodat de rapportagebouwer weet welke tabellen en kolommen er nodig zijn;
- Gen AI: Bij het toepassen van Gen AI moet in potentie alle data voorzien zijn van goede metadata. Alleen dan kan AI de juiste data aan de juiste vraag relateren en daarmee het juiste antwoord kan genereren.
Waarom is metadata belangrijk voor Gen AI?
Vraag je dan af: “Als je business al niet begrijpt wat die technische namen betekenen, hoe moet Gen AI er dan chocola ervan maken?”.
Het klinkt als een enorme opgave om alle data te voorzien van de juiste metadata. Gelukkig kan juist Gen AI hier zelf een enorme enabler zijn. Platformen als Databricks en Snowflake bouwen Gen AI-functies in die aan de hand van het technische datamodel en de data zelf, suggesties doen voor begrijpbare omschrijvingen.
Denk terug aan de eerste les “Gen AI is heel krachtig en tegelijkertijd niet de oplossing voor alles”. Laat de suggesties dan ook altijd controleren door data-experts zoals data-engineers en datastewards voordat je ze accepteert.
De basis leggen voor Gen AI
Kortom, 2025 wordt het jaar waarin organisaties hun datafundament versterken door te investeren in
- hoge data kwaliteit
- begrijpelijke metadata
Zo creëren ze de basis om daarna de vruchten te plukken met hun Gen AI-initiatieven.
Zet de eerste stap
Wil jij ook een toekomstbestendig datafundament bouwen?
Neem contact op met onze experts en ontdek hoe wij jouw organisatie kunnen helpen met betrouwbare data en succesvolle AI-oplossingen.