Hoppa till huvudinnehåll

Forskningsdatahantering

Forskningsdata är uppgifter som samlats in eller skapats för att tjäna som underlag till analyser och validering av forskningsresultat. Datan kan bestå av analog eller digital information, så som laborationsrapporter eller mjukvara.

Här får du information om vad du behöver tänka på när det gäller forskningsdata som skapas och behöver hanteras under olika delar av ett projekt.

 

Spara tid och gör forskningsprocessen smidigare genom att planera din datahantering väl under projektets gång.

Krav från finansiärer

Allt fler finansiärer, både nationellt och internationellt, vill att forskare som tilldelas medel skriver en datahanteringsplan för sitt forskningsprojekt. I många fall utgår finansiärernas mallar för datahanteringsplaner från de så kallade FAIR-principerna. FAIR ska fungera som ett hjälp och stöd i projektets datahantering.

Kriterierna för FAIR på Vetenskapsrådets webbplats

FAIR-principerna på webbplatsen för GO FAIR Initiative

Skapa Datahanteringsplaner (DMP) i DMPRoadmap

En datahanteringsplan för ett forskningsprojekt ökar förutsättningarna för korrekt hantering och kvalitetssäkring av forskningsmaterialet. En datahanteringsplan beskriver hur data under forskningsprocessen samlas in, hanteras, organiseras, lagras och tillgängliggörs, samt hur bevarande och arkivering av data säkerställs efter avslutat projekt. Planen bör upprättas redan i början av forskningsprojektet och kontinuerligt uppdateras under arbetets gång.

I februari 2020 lanserades LU:s nya system för datahanteringsplaner, DMPRoadmap. Systemet stöttar forskare som får eller redan har fått projektmedel från främst Vetenskapsrådet, eller där finansiärer ställer krav på att lärosätena tar ansvar för att en datahanteringsplan upprättas.

På Medarbetarwebben kan du skapa en datahanteringsplan i DMPRoadmap

Etikprövning

Planerar du att bedriva forskning som involverar människor eller behandling av personuppgifter? Om du skall samla in data som innehåller känsliga personuppgifter så måste du eventuellt ansöka om etiskt tillstånd. Sedan 2004 är det förbjudet att påbörja viss forskning om den inte först godkänts av Etikprövningsmyndigheten.

Medarbetarwebbens sida om etikprövning

Kostnader

Kostnader för ett projekt bör beräknas och tas med i budgeten. Det går ofta att ansöka om pengar för att täcka kostnader under projektet, men tänk på att redogöra för eventuella kostnader redan när du skriver din ansökan. Kostnader kan till exempel vara:

  • Tid för själva hanteringen (för att t.ex. beskriva, organisera, tvätta och avidentifiera data)
  • Programvara (kostnader för köp eller licenser/år, startkostnader)
  • Personal för själva hanteringen (data manager för projektet, forskningsingenjör för programmering)
  • Säker förvaring av data (serverplats, säkerhetsskåp)
  • Etikprövning

På UK Data Service webbplats kan du hitta en checklista för att beräkna kostnader för forskningsdata

Återanvända data

Tänk på att om du vill återanvända data ska den citeras. Uppge bland annat upphovsrättsinnehavare, var datan är lagrad och eventuell version med hänvisning till en DOI eller annan beständig identifikator.

Under projektets gång är det viktigt att arbeta strukturerat med data, det kan underlätta både projektarbetet samt inför arkivering och ett eventuellt tillgängliggörande.

Beständiga filformat

Filer bör sparas i beständiga format som gör det enkelt att både kunna utläsa vad du gjort med datan och återanvända den. Filer som skapas eller sparas i format som genereras av specifika programvaror kan ibland bara öppnas/användas av just de programmen. Det förkortar och begränsar användningen av data och annat forskningsmaterial.

Informationssäkerhet

Tänk över eventuella konsekvenser av informationssäkerhet. Informationssäkerhet är ett komplext och viktigt ämne. Informationssäkerhetsfrågor kan avse digitalt bevarande, systemsäkerhet och exponering för externa/interna hot. Även insamlingssäkerhet såsom skydd av innehåll från förlust/förändring, säker tillgång till materialet, lagringsprocesser samt juridiska och reglerande aspekter såsom GDPR-frågor med personlig eller konfidentiell information i det digitala materialet.

Organisera data

Strukturera dina data för att lättare kunna hitta och använda dem, under och efter projektet. Ett väl organiserat material kan spara mycket tid och möda under projektets gång. För att vara välorganiserat behöver det inte vara avancerat, det går förstås bra att använda enklare lösningar. Se vidare för olika sätt att tänka inför projektstarten.

Mappstruktur och filnamn

Ge dina filer namn enligt en struktur som är intuitiv och/eller väl beskriven och som gärna får utgöras av uppgifter om tid, plats eller annat som är relevant för materialet. Tänk på samma sätt när du organiserar filerna i mappar så att du enkelt vet vad de innehåller utan att behöva öppna dem. Det är också bra att fundera ut ett enkelt sätt att hålla koll på olika versioner av dina filer.

Metadata

Beskriv dina data på ett strukturerat sätt. Det kan vara en read me-fil, en beskrivning kopplad till dokument etc. När du laddar upp filer i ett arkiv eller i en liknande tjänst, beskriver du i ett formulär vad de innehåller. Detta genererar metadata som förklarar vad datamängden omfattar, hur den skapats och hur den analyserats. Metadata behövs också för maskinell hantering av data, för att återfinna och kunna återanvända information och uppgifter.

Versionering och säkerhetskopiering

Ett sätt att hålla koll på förändringar är att skapa tydliga versioner av datafiler. Alla relevanta filer bör också säkerhetskopieras regelbundet. Detta är särskilt viktigt när det gäller datafiler som är under uppbyggnad, för att förhindra att data går förlorade eller behöver matas in på nytt. Ta reda på vad som gäller för datamiljöer inom din institution och se vilket stöd du har för säkerhetskopiering och lagring av data. Tänk även på förvara säkerhetskopior av data på annan plats, i händelse av en nödsituation eller katastrof.

En viktig anledning till versionering är proveniens (dokumentationen av ett dataobjekts ursprung och historia). Om du redogör för vad som har gjorts med materialet och någon senare ifrågasätter projektets slutsatser och data kan du påvisa versioneringen och gå tillbaka och visa hur allt har gått till.

UK Data Services webbsida om att dokumentera data (på engelska)

När projektet går mot sitt slut behöver du ta ställning i några viktiga frågor. Du behöver bestämma vad som ska hända med din data framöver och på vilket sätt. Undersök även om det finns specifika krav från till exempel finansiärer om hur data skall tillgängliggöras eller arkiveras.

Arkivering

Enligt svensk lag måste forskningsdata arkiveras.

Medarbetarwebbens sida om arkivering av forskningsdata

Tillgänglighet, återanvändning och delning

Om tänker göra din data tillgänglig finns det flera olika sätt att göra detta på.  Om din data innehåller personuppgifter måste den avidentifieras innan den görs tillgänglig.

Publicera och dela dina data

Öppna forskningsdata kan sökas, beroende på var det laddats upp, i ett datarepositorium, i speciella datatidskrifter eller som supplement till en tidskriftsartikel. 

Licenser

Använd gärna standardiserade licenser, till exempel CC-licenser, för att tydliggöra hur dina data får användas.

Creative Commons licenser

Sidansvarig: bib@lth.lu.se | 2022-04-08