FAIR data en software
Iedereen die met onderzoeksdata werkt, zal op een gegeven moment het acroniem FAIR tegenkomen. FAIR staat voor Findable, Accessible, Interoperable and Reusable.
FAIR verwijst naar 15 principes voor het managen van onderzoeksdata.
De regeling datamanagement van de Universiteit Leiden schrijft voor dat onderzoekers hun data FAIR maken; dit sluit aan bij het beleid van vele onderzoeksfinanciers. De manier waarop FAIR in de praktijk wordt gebracht kan per vakgebied variëren, maar er zijn wel degelijk een paar eerste stappen die iedereen kan zetten om een begin te maken met FAIR data.
Het Centre for Digital Scholarship biedt advies en ondersteuning en organiseert workshops op verzoek om datasets FAIR te maken volgens de principes van het 3-point-FAIRification framework.
Wat is FAIR?
FAIR betekent dat de data ‘Findable, Accessible, Interoperable and Reusable’ zijn voor zowel mensen als machines. Denk daarbij aan zoekmachines, die de data kunnen vinden en indexeren, maar ook aan tools die data combineren, samenvoegen en slimme zoekacties uitvoeren.
Het is ook mogelijk om software FAIR te maken.
Een ander belangrijk punt is dat FAIR niet hetzelfde betekent als open: er zijn openlijk beschikbare data, die niet FAIR zijn, maar tegelijkertijd ook FAIR data die niet openlijk gedeeld worden.
Hoe kan ik mijn data FAIR maken?
- Deponeer de data in een betrouwbaar data-archief of repositorium.
De dataset krijgt daar een DOI, waardoor deze gemakkelijk te citeren is; ook zijn de data gemakkelijker vindbaar omdat deze repositoria ruimhartig metadata toekennen aan de dataset, bijvoorbeeld trefwoorden en informatie over de herkomst.
Tip: gebruik onze Research Data Services catalogue met een handig overzicht van betrouwbare repositoria.
- Documenteer en codeer de data volgens een in het vakgebied gangbare standaardmethode.
Als iedereen een vergelijkbare werkwijze hanteert, is het gemakkelijker om elkaars data te begrijpen, te vertrouwen en te hergebruiken; dit geldt ook voor toekomstig (eigen) hergebruik in vervolgonderzoek.
Tip: op deze websites staan overzichten van standaarden voor metadata en documentatie per vakgebied: Research Data Alliance Metadata directory, FAIRsharing, BARTOC.
4TU.ResearchData heeft een set handige richtlijnen voor het schrijven van een a READ ME file.
- Gebruik duurzame en interoperabele bestandsformaten.
Hiermee blijven de data ook in toekomst toegankelijk en kan een dataset in combinatie met andere, nieuwe data worden hergebruikt.
Tip: deze data horror story vertelt over de risico’s van data die hierdoor niet meer gebruikt kunnen worden.
De data-archieven DANS en 4TUResearchData hebben praktische overzichten op hun websites met daarin hun preferred formats
- Publiceer de data met een duidelijke licentie.
Andere gebruikers weten dan wat zij wel en niet mogen doen met de data. Zonder deze informatie kan data niet hergebruikt worden.
Tip: How do I license my research data?
Handige bronnen
Welke eisen stellen onderzoeksfinanciers aan FAIR data?
- De Europese Commissie biedt een overzicht van 'Guidelines for FAIR data management'.
- ZonMW heeft een aantal zogenaamde key items gedefiniëerd, die aan het einde van een onderzoeksproject moeten worden opgeleverd om de ‘FAIRness’ van elke dataset te bepalen.
- NWO schrijft voor dat data zoveel als mogelijk open en voor hergebruik beschikbaar gesteld worden. "Om data open te maken moeten die zo veel mogelijk vindbaar, toegankelijk, interoperabel en herbruikbaar zijn, oftewel: FAIR".
Hoe FAIR zijn mijn data nu?
FAIR voor verschillende vakgebieden
- Top ten FAIR data & software things
- Sociale wetenschappen: Cessda Expert Tour guide
- Geesteswetenschappen: Parthenos project
Meer weten over FAIR
Op deze pagina's is in meer detail infomatie te vinden over het creëren van FAIR data: Force 11, GO FAIR en OpenAIRE.
'Five recommendations for FAIR software'.
De FAIR principes zijn in eerste instantie gepubliceerd in 2016: Wilkinson, M., Dumontier, M., Aalbersberg, I. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data 3, 160018 (2016).