Centraal documenteren van de herkomst en betekenis van data:
Thema: Data
Sub thema: Data Governance
Titel: Centraal documenteren van de herkomst en betekenis van data:
Zodra de hoeveelheid gegevens in de organisatie toeneemt, zal de inspanning om de herkomst en definities van alle databronnen goed te documenteren meer dan evenredig stijgen. Dat weerhoudt organisaties nog te vaak om niet nu al in te zetten op een adequate administratie. Toch verdient enige inspanning zichzelf al heel snel terug:
Als inzicht in herkomst en betekenis van data ontbreekt, neemt het risico op een inbreuk op veiligheid van de data toe. Dit is zeker belangrijk om te beseffen wanneer het gaat om gevoelige informatie, zoals persoonsgegevens.
Vrijwel iedere organisatie slaat contactgegevens van klanten en relaties op. Marketingafdelingen gebruiken bijvoorbeeld data voor e-mail nieuwsbrieven en personalisatie online. Centraal inzicht en toezicht op aanwezigheid en toegang tot data biedt zodoende bescherming tegen onbevoegde toegang en inbreuk op de gegevensbronnen in je organisatie.
Een centrale, volledige documentatie van gegevensbronnen zal een positieve impuls geven aan het beveiligingsbeleid van iedere organisatie die gegevensbeheer serieus neemt.
Een andere zinvolle toevoeging is het classificeren van data. Daarmee brengt de gebruiker of de data owner respectievelijk data steward, kenmerken aan voor wat betreft het type en de herkomst van data. Dit kan mede helpen bepalen welke gebruikers wel of niet toegang krijgen tot deze data of volledige gegevensbron.
Anderzijds, als gegevensbronnen niet centraal worden geadministreerd, hebben gebruikers van informatie mogelijk geen zicht op het bestaan van deze data. Denk bijvoorbeeld aan data over wanbetalers, data over verhuizingen, of data over recente aankopen, gebruik of verbruik van goederen, middelen of diensten.
Door de aanwezigheid van data centraal te administreren, bijvoorbeeld in de vorm van een catalogus, is beschikbare data voor iedereen makkelijker te vinden. In deze catalogus kan ook de definitie en context van de data worden vastgelegd. Dit draagt bij aan een breed gedeeld begrip en inzicht in de betekenis van data binnen de organisatie.
Binnen een gecentraliseerde documentatie van gegevensbronnen kunnen gebruikers de data ook voorzien van extra informatie. Naast de noodzakelijke definities gaat het dan bijvoorbeeld ook om tags. Dat zijn termen die gebruikers kunnen verbinden aan data. Aan de hand van die tags is data nog beter vindbaar in alle gegevensbronnen.
Zodra gebruikers van het bestaan van data weten, is het nog een stap om ook de juiste locatie van de data te delen. Voor sommige gebruikers is dat relevant, omdat toegang voor hen cruciaal is. Denk aan data analisten, business intelligence specialisten, data engineers en data scientists.
Een zorgvuldige data-mapping is daarbij waardevol. Waarbij de informatiebehoefte wordt verrijkt met de beschikbaarheid en locatie van de data, binnen de infrastructuur, data en dimensioneel model.
Het is belangrijk om van tevoren te bepalen wie data centraal kan administreren en documenteren. Of wie toegang heeft tot data voor gebruik. Dat vraagt om vastlegging van de juiste rollen in de data-organisatie. Zo kan een gebruiker alleen data lezen, kan een bewerker definities en kenmerken van data aanpassen, maar kan een beheerder ook tags aanvullen of classificaties toepassen.
Welke rollen een organisatie wenst in te zetten zal afhangen van de wijze waarop de organisatie rondom data is georganiseerd. Anderzijds biedt de applicatie die de centrale documentatie ondersteunt hulpmiddelen of kan beperkingen kennen in het aantal type rollen wat kan worden ingezet.
Welke tool de organisatie inzet voor het centraal documenteren van data hangt af van de ambities met data governance. Dit kan namelijk al laagdrempelig in Excel. Is er een data-infrastructuur aanwezig, bijvoorbeeld in Microsoft Azure, dan kan de administratie daarin worden gefaciliteerd. Legt de organisatie de lat iets hoger, dan kan bijvoorbeeld Microsoft Purview worden ingezet: https://azure.microsoft.com/nl-nl/products/purview.
Is de hoeveelheid en spreiding van data zeer groot en heeft de organisatie sterk behoefte aan een gestructureerde aanpak van databeheer dan zijn er platformen beschikbaar die als enig doel hebben de centrale vastlegging van data te faciliteren. Denk hierbij aan applicaties zoals: Collibra (https://www.collibra.com), Ataccama (https://www.ataccama.com/) of Alattion (https://www.alation.com/).
Onder de juiste omstandigheden en mits goed georganiseerd, zal een centrale documentatie over de herkomst van data, de definitie van de oorsprong en de locatie van opslag, het adequate gebruik van data zeker een stuk toegankelijker maken en het zorgvuldig en veilig gebruik van data stimuleren.







