FAIR data: Wat is dat (niet)?

De kans dat je onderzoeksdata flinke impact maken, is het grootst wanneer je je data beheert volgens de FAIR-principes. Maar waar staat FAIR dan precies voor? En waarom is het juist voor dementieonderzoek belangrijk?
Werk je met data of verzamel je die in jouw dementieonderzoek? Grote kans dat je al iets van de FAIR-principes toepast. Zelfs zonder dat je je daarvan bewust bent. DEMPACT zet alle aspecten van FAIR data even voor je op een rij.
FAIR staat voor Findable, Accessible, Interoperable en Reusable. Dit betekent zo veel als dat onderzoeksdata gevonden, begrepen en gebruikt moeten kunnen worden – door zowel mensen als computerprogramma’s die data kunnen doorspitten. Maar wat betekent dat dan precies voor je data?
1-Findable: voor altijd terug te vinden
Data moeten gemakkelijk te vinden zijn, voor mensen en computerprogramma’s die data doorspitten. Om dit mogelijk te maken, moet je je onderzoeksdata twee dingen mee geven. Allereerst zogeheten rijke metadata. Ofwel: gegevens over de data die er context aan geven, waardoor die data begrijpelijk, makkelijk vindbaar en beter toepasbaar worden. Daarnaast moet je je data een zogeheten persistent identifier geven. Dit is een wereldwijd uniek en blijvend label, zoals een Digital Object Indentifier (bekend als DOI). Bovenstaande is van belang zodat data altijd vindbaar blijven, ook als de oorspronkelijke link (zoals bijvoorbeeld een URL) verandert.
Zo doe je dat
Veel data repositories (fysieke opslagplaatsen van je ruwe data) en catalogi (centrale inventarislijsten) geven je data automatisch een persistent identifier op het moment dat je je (meta)data publiceert. Maar niet allemaal. Kies voor goede vindbaarheid dus een repository of catalogus die dit wel doet.
Welke repository of catalogus is dan goed?
- Check bij je onderzoeksinstelling: de meeste hebben een Research Data Management (RDM)-pagina met advies over welke repository te gebruiken.
- Je kunt ook terecht bij data stewards/RDM-ondersteuning van je eigen onderzoeksinstelling.
- Maak gebruik van databases als FAIRsharing (zie fairsharing.org of re3data.org); daar vind je veel repositories en catalogi.
- Houd dempact.nl in de gaten: DEMPACT verzamelt de meest relevante catalogi en repositories voor dementieonderzoek in een handleiding.
2-Accessible: toegankelijke data zijn geen open data
Toegankelijke dementiedata in de context van FAIR data, zijn niet per se publieke of open data. Privacygevoelige (patiënt)gegevens moeten beschermd blijven bijvoorbeeld. Het motto is wel: zo open als mogelijk, zo gesloten als nodig.
Deze voorwaardelijke toegankelijkheid is ook iets wat de repository inricht. Dat gebeurt met een technisch protocol dat toegang tot de data regelt.
3-Interoperable: uitwisselbaar zonder problemen
Je maakt data uitwisselbaar als je die opslaat in een vorm die voor verschillende systemen bruikbaar is. Om dat te bereiken, is het belangrijk dat je gestandaardiseerde taal en terminologie gebruikt.
Dit is juist bij dementieonderzoek essentieel omdat dementiedata vaak afkomstig zijn uit verschillende bronnen. Denk bijvoorbeeld aan data van verschillende onderzoeksgroepen, ziekenhuizen of huisartsenpraktijken. Of aan verschillende typen data, zoals hersenscans, genetische informatie enzovoorts. Ook als je data van verschillende cohorten in samenhang wilt analyseren, is het gebruik van gestandaardiseerde taal en terminologie cruciaal.
Tot nu toe bestaat hier nog geen standaard voor. Dit maakt samenvoegen van data in dementieonderzoek (nu nog) lastig. Hoe dat zit en wat DEMPACT daaraan wil doen, lees je in Onderzoeksdata FAIR maken… Hoe dan?.
4-Reusable: herbruikbaar in de toekomst
Data zijn herbruikbaar als je ze zo documenteert, dat ze probleemloos inzetbaar zijn voor toekomstig onderzoek. Bijvoorbeeld voor een meta-analyse of het testen van nieuwe hypothesen.
Je moet data daarvoor vrijgeven met een duidelijke en toegankelijke licentie, die omschrijft wat je er wel en niet mee mag doen. Daarnaast zorg je dat inzichtelijk is wat de herkomst is van de data (zogeheten provenance metadata). En je metadata moeten voldoen aan zogeheten domein-specifieke standaarden; denk aan SNOMED CT voor klinische terminologie en het OMOP Common Data Model voor klinische en observationele gezondheidsgegevens.
FAIR data voordelen
Je data FAIR managen vraagt dus wel wat aandacht. En je had al genoeg te doen… Wegen de voordelen wel op tegen het extra werk? Zeker.
Vergroot jouw impact
FAIR data-beheer vergroot de wetenschappelijke impact van jouw dementieonderzoek. Goed gedocumenteerde data zijn namelijk – letterlijk – meer zichtbaar. Dit zorgt ervoor dat jouw onderzoek vaker wordt genoemd; je wordt bijvoorbeeld vaker geciteerd in publicaties. Zichtbaarheid opent vervolgens de deur naar waardevolle samenwerkingen met collega-onderzoekers.
Versnelt je dementieonderzoek
Het vergaren van onderzoeksdata is een tijdrovend proces. Sommige studies verzamelen gedurende decennia data van mensen met en zonder dementie. Als die goed gedocumenteerd en toegankelijk zijn, kunnen jij en collega-onderzoekers daarvan gebruik maken. Je hoeft dus zelf minder of geen data meer te verzamelen. Zo kom je sneller tot nieuwe inzichten. Geen dubbel werk betekent ook: veel tijdwinst voor het totale dementieonderzoek. En dat is geen luxe nu het aantal mensen dat dementie krijgt, toeneemt.
Grotere kans op doorbraken
Grote doorbraken in dementieonderzoek komen vaak uit internationale consortia. FAIR data-beheer maakt zulke doorbraken vaker praktisch mogelijk. Door FAIR data kunnen datasets van collega-onderzoekers wereldwijd gecombineerd worden; daardoor kun je kleinere statistische effecten meten. Dat is cruciaal voor bijvoorbeeld onderzoek naar sommige zeldzame oorzaken van dementie.
Obstakels? DEMPACT helpt
Het FAIR beheren van je data essentieel? Ja. Eenvoudig? Nee. Maar weet dat je niet de enige bent, én dat er handvatten zijn die je verder helpen (Onderzoeksdata FAIR maken? Hoe dan?). De methoden om onderzoeksdata FAIR te beheren, zijn ook volop in ontwikkeling.
Loop je tegen obstakels aan? Neem contact op met Didi Lamers, coördinator datamanagement bij DEMPACT, via d.lamers@dempact.nl. Zij helpt je graag verder.



