Onderzoeksdata FAIR maken…. Hoe dan?

Je data uit dementieonderzoek inrichten volgens de FAIR-principes is zó belangrijk – maar blijkt ook lastig. Waarom is dat? En hoe lukt het je toch?
Idealiter maak je je onderzoeksdata FAIR: vindbaar (Findable), toegankelijk (Accessible), uitwisselbaar (Interoperable) en herbruikbaar (Reusable). Dan maak je de meeste impact, binnen de wetenschap en daarbuiten (zie FAIR data: wat is dat (niet)?). Daarom stellen subsidieverstrekkers FAIR data vaak als voorwaarde.
Maar lukt dat ook, je data FAIR organiseren? Wisselend, blijkt uit rondvraag onder dementieonderzoekers door dr. Didi Lamers, coördinator datamanagement bij DEMPACT. Lamers inventariseerde obstakels en hoe je die overwint.
“Je onderzoeksdata vindbaar en toegankelijk maken, dát is nog te doen. Uitwisselbaar en herbruikbaar, dat is in de praktijk een stuk lastiger.”
Lamers deelt graag vier genoemde obstakels en (gelukkig ook) de routes richting oplossingen.
Obstakel 1: Complexiteit juridische afspraken
Ze zijn lastig, onvermijdelijk én nuttig: juridische afspraken die je moet maken om data uit te mogen wisselen met collega-onderzoekers van andere kennisinstellingen. Lamers hoorde hierover twee belangrijke belemmeringen.
Traag proces
Allereerst blijkt het lastig om tot juridische afspraken te komen met alle partijen, voordat je überhaupt data kunt uitwisselen met andere kennisinstellingen. Dat komt onder andere doordat juristen van verschillende kennisinstellingen verschillende ideeën hebben over wat er in die afspraken moet staan. Communicatie hierover verloopt soms ook moeizaam. Al met al duurt de afstemming lang.
Juridisch versus wetenschappelijk doel
Het doel van de afspraken is voor jou als onderzoeker om een situatie te scheppen waarin je legaal, efficiënt en met wederzijds vertrouwen data kunt uitwisselen. Maar juristen richten zich nog wel eens op het afdekken van alle (ook onwaarschijnlijke) risico’s. Binnen de uiteindelijk opgestelde afspraken blijkt het delen of publiceren van data dan bijvoorbeeld helemaal niet toegestaan. Of de afspraken zijn zo complex geworden, dat ze slecht te begrijpen zijn voor niet-juristen. Dan schieten de afspraken het doel (vertrouwen scheppen) voorbij.
Er zijn standaard overeenkomsten beschikbaar die juridisch op orde zijn en wél bijdragen aan data-uitwisseling.
Obstakel 2: Ja maar, wat nou als…?
Lamers merkte in gesprekken over FAIR data ook, dat sommige onderzoekers zich wat kwetsbaar voelen over het toegankelijk maken van hun data. Wat nou als iemand anders een her-analyse doet en tot andere conclusies komt? Wat als iemand je data verkeerd interpreteert? En wat als jouw data verkeerd worden ingezet bij andere dementieonderzoeken? Heel begrijpelijk. Het voelt wellicht alsof je de controle over je data verliest. Maar dat hoeft helemaal niet.
Je kunt je data zo organiseren, dat je de kans op negatieve gevolgen minimaliseert. Bijvoorbeeld door context mee te geven: zorg dat je rijke metadata toevoegt om collega-onderzoekers te helpen je data goed te begrijpen.
En maakt actief contact: voeg contactgegevens toe aan je datapublicatie. Zo kunnen collega-onderzoekers die gebruik willen maken van je data, met vragen bij jou terecht. Gebruik een e-mailadres dat lang in gebruik blijft. Is verkeerd gebruik van data schadelijk of ethisch onwenselijk voor je onderzoeksdeelnemers? Dan kun je de toegang tot je data beperken. Zo houd je controle. Je beoordeelt ieder verzoek tot datatoegang vóór je toegang verleent.
Obstakel 3: Onderzoekers zitten hetzelfde wiel uit te vinden
Hoe lastig het ook is om dementiedata FAIR te organiseren, voor verschillende issues bestaan al oplossingen – maar waar vind je die? Dat blijkt een probleem. Wetenschappelijke publicaties zijn beperkt geschikt om praktische kennis over FAIR data te delen. Het ontbreekt vooralsnog aan een alternatieve bron. Daarnaast willen veel dementieonderzoekers wel kennis en ervaring uitwisselen, maar weten ze de juiste collega’s niet te vinden. DEMPACT kan beide problemen helpen oplossen.
Zenodo: FAIR dementiedata community
DEMPACT gaat zorgen dat kennis en oplossingen rond FAIR data die relevant zijn voor dementieonderzoek, vindbaar zijn op één plek: het Open Science-platform Zenodo. Lamers is bezig een Nederlandse dementiedata-community in te richten. De eerste publicaties verschijnen binnenkort op zenodo.org.
Inzicht in FAIR oplossingen
DEMPACT heeft een goed overzicht van FAIR data-oplossingen binnen en buiten het Nederlandse dementieveld en de betrokken experts. Denk aan dataharmonisatie, het opzetten van gefedereerde analyse en andere expertise.
- Heb jij een vraag of loop je ergens tegenaan? Didi Lamers kan je in contact brengen met relevante experts.
- Heb je zelf een oplossing ontwikkeld (of in gebruik) die je breder wilt delen? Neem ook dan contact op.
Obstakel 4: Gebrek aan standaarden
Als je data uit meerdere bronnen wilt gebruiken voor je dementieonderzoek, is het handig als metingen op een standaardwijze zijn uitgevoerd. Denk bijvoorbeeld aan cognitietesten of het meten van biomarkers. Ook moeten data volgens een standaard worden gedocumenteerd en bewaard. Als de ene onderzoeker de code F voor vrouwen en M voor mannen gebruikt, en een ander 1 voor vrouwen en 0 voor mannen, wordt het lastig om data in samenhang te analyseren, zeker als er geen (volledig) codeboek aanwezig is.
Analyse is dan pas mogelijk als de data uit verschillende bronnen eerst geharmoniseerd worden. Dat betekent dat data op een vergelijkbare manier gepresenteerd worden.
Stap één naar standaardisatie
DEMPACT wil bijdragen aan standaardisatie. Lamers gaat kennis- en expertisesessies organiseren waarin je kunt leren van ervaringen van collega-onderzoekers rond het FAIR maken van dementiedata. Dit is stap één richting gezamenlijke afspraken binnen het Nederlandse dementieonderzoek over welke standaard we gaan gebruiken.
"Welke FAIR-kwesties vind jij belangrijk? En welke zaken moeten nodig gestandaardiseerd worden?"
“FAIR data omvat veel. Als je alles in één keer perfect wilt doen, leg je de lat waarschijnlijk te hoog”, benadrukt Lamers. “De grootste winst boek je als je je data überhaupt vindbaar maakt, via een repository of catalogus én met duidelijke metadata. Ook als je data nog niet optimaal uitwisselbaar of herbruikbaar zijn, kunnen ze al nuttig zijn voor andere onderzoekers.”



