Delning av forskningsdata med personuppgifter är ett högaktuellt ämne inte minst genom regeringens målsättning att alla forskningsdata ska göras tillgängliga ”så öppet som möjligt och så begränsat som nödvändigt” senast 2026. En lösning är nu på plats som gör det möjligt för svenska forskare att dela med sig av sina data, även sådana som innehåller personuppgifter eller andra uppgifter som behöver skyddas.
– Forskarna ställs ju mer och mer inför krav, både från finansiärer och förlag att även bakomliggande data ska tillgängliggöras. Problemet har tidigare varit att forskarna inte haft möjlighet att publicera känsliga data varvid andra forskare haft svårt att hitta dem. Nu är det möjligt att även data med personuppgifter kan bli synliga och sökbara, säger Johan Fihn Marberg, sektionschef för it på Svensk nationell datatjänst, SND.
Det är en lösning som bygger på att data hanteras i två steg. Sunet har byggt upp en molnlagringstjänst där svenska lärosäten och andra forskningsinstitutioner kan lagra forskningsmaterial. Varje lärosäte kan beställa ett eget utrymme i molnet där informationen är krypterad. Servern som informationen ligger på är placerad i Sverige. Data finns alltså under lärosätets kontroll och inom landets gränser. Det gör att filerna i molnet får innehålla personuppgifter.
Två tillgänglighetsnivåer
Men för att data ska bli återanvändbara ska de också vara möjliga att dela. Det sker genom en integration mellan molnlagringen hos Sunet och SND:s forskningsdatakatalog. Datamaterialet finns inte hos SND utan på Sunets servrar, i forskningsdatakatalogen finns bara metadata.
SND har två olika tillgänglighetsnivåer på data.
– Den ena är data som inte innehåller någon skyddsvärd information. Det är alltså öppet tillgängliga forskningsdata som man kan ladda hem via vår forskningsdatakatalog, säger Johan Fihn Marberg.
Den andra nivån är svårare att hantera, där är det mer komplicerat att tillgängliggöra data.
– Det är data som innehåller skyddsvärd information. Det kan vara personuppgifter eller information som på något annat sätt behöver skyddas. Där finns lagliga begränsningar vad man får göra med dessa data, säger Johan Fihn Marberg.
Etikprövning kan behövas
Men SND tillgängliggör inte direkt data som innehåller känslig information.
Systemet låter data ligga kvar under lärosätets kontroll, på lärosätets egen lagring, till exempel i Sunets lagringsmoln.
– Forskaren kan genom SND beskriva och publicera metadata om forskningsdata, med tillhörande information om hur man får tillgång till bakomliggande data, säger Johan Fihn Marberg.
Då kan andra forskare via SND på förfrågan få tillgång till datan.
– Det blir som ett normalt utlämnandeförfarande från lärosätet, enligt gällande lagar som offentlighets- och sekretesslagen och dataskyddsförordningen.
Beroende på karaktären på data kan det exempelvis behövas etikprövning av den forskning som man vill fortsätta att göra på dem, säger Johan Fihn Marberg.
Central datakatalog
SND:s forskningsdatakatalog är tänkt att vara den centrala katalogen för forskningsdata i Sverige, men inte den enda. Den ska kopplas samman med och hämta metadata från andra databaser.
– Tanken är att även data som ligger utanför SND:s system ska kunna ”skördas” på metadata av SND så att den blir sökbar i forskningsdatakatalogen. Det kan vara ett lärosäte som driver en egen tjänst för lagring av forskningsdata. Vi interagerar också med ett antal olika infrastrukturer som hanterar data på ett bra sätt för ett specifikt forskningsämne.
De tekniska lösningarna har varit på plats sedan årsskiftet.
– Själva integrationen mellan SND:s forskningsdatakatalog och Sunets molntjänst är fortfarande i sin linda. I dagsläget är det en aktör, Polarforskningssekretariatet, som använder den aktivt men flera är i startgroparna. Lärosätena har ännu inte kommit i gång med tillgängliggörandet, säger Johan Fihn Marberg.