BUSINESS BYTES

Data heeft geen waarde

  • Gepost 8 maanden geleden

Data heeft geen waarde

Onder het credo ‘data is the new oil’ hebben de verkopers van Big Data oplossingen de afgelopen jaren weer heel wat deuren platgelopen. Waar de aandacht voor data gedreven beslissingen en business zeer terecht is in dit digitaal tijdperk, vergeten de verkopers vaak het volledige verhaal te vertellen. Net zoals een vat ruwe olie, heeft data op zich geen waarde en moet het eerst geraffineerd worden tot informatie die nut heeft voor de ganse organisatie.

Wat is belang van data?

Het kunnen bewaren en delen van gegevens is essentieel geweest voor de evolutie van de mens. Van rotstekeningen, hiëroglyfen, tot en met het papier, hebben er telkens voor gezorgd dat de evolutie van de intellectuele mens altijd maar sneller ging. Verschillende ‘uitvindingen’ hebben de reproductie en verspreiding van gegeven ook bevorderd. Zo maakte de boekdrukkunst een oplage van enkele duizenden exemplaren mogelijk. En de introductie van achtereenvolgens de typmachine, het kopieerapparaat en de PC met printer maakte het voor iedereen mogelijk om gemakkelijk teksten op te stellen en deze in veelvoud te reproduceren. Het digitaliseren van deze gegeven naar data is volgende logische stap in deze evolutie met enorme voordelen. Data neemt bijna geen plaats in, kan door programma’s worden bewerkt en is in een fractie van een seconde gedeeld met de ganse wereld. Dus op basis van veel meer data kunnen organisaties nu sneller en beter onderbouwd beslissingen nemen.


De data raffinaderij

Voordat er een data gebaseerde beslissing kan genomen worden, moet de data nog geraffineerd worden. Grosso Modo kunnen alle data raffinageprocessen, of we het nu hebben over Big data analytics of standaard rapportage, beschreven worden volgens de DIKW Pyramide. (Data/Information/Knowledge/Wisdom)


Ruwe data moet eerst in een context worden geplaatst om op die manier betekenis te krijgen, hetgeen men dan informatie noemt: “Het verkeerslicht op de hoek van de prinsstraat en de kustlaan staat op rood”. Na interpretatie van deze informatie, “ik rij in de richting van een rood licht”, kan eenieder met kennis van zaken een wijze beslissing nemen: “ik kan beter de auto stoppen”


Met dit model in het achterhoofd, kunnen heel wat misvattingen de wereld worden uitgeholpen, en zullen toekomstige IT-investeringen in de data-economie veel efficiënter gebeuren. Zo kan enkel de omzetting van data naar informatie worden geautomatiseerd. De omzetting van informatie naar kennis en het nemen van wijze beslissingen zijn (Artificiële Intelligentie buiten beschouwing gelaten) menselijke activiteiten, onderhevig aan ervaring, intuïtie en menselijke fouten. Tevens zijn kennis en wijsheid organisatie afhankelijk. Het zijn de beslissingen die in een organisatie moeten genomen worden die bepalen welke data er nodig is. Het opstellen van de juiste bedrijfsvragen is dus cruciaal om te bepalen welke data er moet worden geraffineerd naar informatie.


Van Data naar Informatie

Waar een goed informatiebeleid als enige doel heeft om goede onderbouwde beslissingen te nemen, wordt vaak de basis van de pyramide stiefmoederlijk behandelt. Bedrijven investeren veel geld in analyses en coole visualisatie tools, maar willen geen cent uitgeven voor het omzetten van ruwe data naar kwalitatieve informatie. Nochtans geldt hier het GIGO principe (Garbage in, garbage out) en geven ze dus handvol geld uit voor een mooie grafiek van waardeloze informatie.


Vooreerst moet de juiste data uit allerlei bronnen worden verzameld en gecombineerd naar analytische data. Procesmatige data, data ter ondersteuning van één proces in de organisatie, is immers niet geschikt om analyses op te doen. De scope van procesdata beperkt zich tot één proces en is geoptimaliseerd voor de snelle seriële verwerking van één record per keer. Waar analytische data alle invalshoeken van het bedrijf moet belichten en met miljoenen records tegelijk moet kunnen worden verwerkt. Tegelijk met deze herstructurering van data wordt data ook opgekuist en verrijkt waardoor de kwaliteit van analytische data merkelijk hoger ligt dan die van operationele data.


Onontgonnen databronnen

De afgelopen jaren werden heel wat C-level mensen bewerkt met grote beloftes van wat Big Data allemaal voor hun bedrijf kan betekenen. Big Data kan weldegelijk een verschil maken, echter beschikken heel wat bedrijven nu reeds over veel onontgonnen bronnen van Small Data waar vaak veel sneller en goedkoper waardevolle informatie uit kan gedestilleerd worden.


Tot op de dag van vandaag is papier in vele bedrijven nog steeds een belangrijk (analoog) opslagmedium van gegevens. Het pure digitaliseren, inscannen en opslaan in een filesysteem, zorgt er nog niet onmiddellijk voor dat deze gegeven direct beschikbaar zijn voor analyse. Ongestructureerde data, data zonder een gespecificeerd format, is immers niet direct bruikbaar om analyses op te doen. Vandaag zijn er heel wat slimme tools op de markt die ongestructureerde data analyseert en de nodige metadata eraan toevoegt, zodanig dat ook deze digitaal bevraagbaar worden. Denk hierbij bijv. aan sentiment-analyse van sociale media, stemherkenning of beeldanalyse in de strijd tegen terrorisme, OCR en tekstanalyse van alle pdf-files die in een bedrijf circuleren, …


Conclusie

Ruwe Data heeft op zich geen waarde en moet op de juiste manier verwerkt worden zodanig dat de juiste business vragen op een gefundeerde manier kunnen worden beantwoord. Naast de nieuwe mogelijkheden met Big Data, bezit elk bedrijf reeds heel wat onontgonnen data die meestal op een goedkope manier kan worden aangeboord. Het belang van de omzetting van data naar informatie wordt vaak onderschat, maar is cruciaal om een goed informatiebeleid te voeren in de huidige data gedreven economie.




Written by Hans Tubbax - Thomas More - Mechelen Hans Tubbax is opleidingshoofd Informatiemanagement aan de Thomas More hogeschool . De opleiding Informatiemanagement is niet nieuw (bestaat al 7 jaar), maar zit nu in een stroomversnelling door evolutie van business intelligence in firma’s, hoe er moet omgegaan worden met BIG data, e-invoicing, digitalisering, etc….

Hans Tubbax