Adatmenedzsment

A tudományos kutatás számára egyre fontosabb kérdéssé válik a kutatási adatok (tudományos adatok) kezelése. Az adatmenedzsment, adatkezelési terv a kutatásból származott adatok létrehozására, tárolására, hozzáférésére, megosztására, újrahasznosításának biztosítására és megőrzésére vonatkozik.

Az adatkezelés során az alábbi szempontokat érdemes ellenőrizni:

  • Az engedélyek és jogok
    • Rendelkezik-e az adatok elérhetővé tételéhez szükséges jogokkal vagy más jogtulajdonosok vagy projektmunkatársak engedélyével? Anonimizálták-e az adatait eléggé, vagy kifejezett beleegyezést kapott-e olyan adatalanyoktól, akiknek személyazonossága kiderülhet az adatokból (például az audio-vizuális formában megkérdezett személyek)?
  • Letisztult adatok
    • Az adatoknak egy koherens csomagot kell alkotniuk, amely egy adott projekthez vagy kutatáshoz kapcsolódik. Segíthet más kutatóknak navigálni és megérteni az adatokat, ha több fájl strukturált mappákba van csoportosítva.

Az adatok egyértelmű és következetes fájlelnevezési rendszerrel rendelkezzenek.

  • Fájlformátumok
    • Ellenőrizni kell mely formátumok biztosítják a mások számára a lehető legszélesebb hozzáférést, mind a jelenben  és a jövőben. Annak érdekében, hogy az adat minél tovább elérhető legyen, érdemes több formátumot elhelyezni a repozitóriumban.
  • Dokumentált adatok
    • Jó gyakorlat az adatok megosztásánál, hogy tartalmazzon néhány magyarázó információt a kutatás módszereiről, leírni  hogyan, mikor és miért hozták létre az adatokat (beleértve, hogy a fájlok létrehozásához, szerkesztéséhez vagy feldolgozásához bármilyen speciális szoftvert használtak-e). Fel kell tüntetni az alkalmazott betűszavakat, és meg kell magyarázni minden változó és érték címkéjét.
  • Adatkezelési felelős
    • Javasoljuk adatkezelő kinevezését  aki a  kutatási projekten kívüli  személy (például az intézet vagy a tanszék vezetője ).   Ez biztosítja, hogy az egyetem egyik tagja felelősséget vállal az Ön adataiért a projekt élettartamán túl.
  • Adatok korlátozása
    • Lehetséges, hogy az embargó időtartama (adatok korlátozása) a kiadóval tl vagy a finanszírozó szervezettel  való megállapodástól függ, de  előfordulhat az is, hogy az adatok nyílt közzétételére nemzetbiztonsági, jogi, etikai vagy kereskedelmi korlátozások vannak érvényben.

Ha egy adatot a repozitóriumban embargóval helyeznek  el, akkor a kapcsolódó rekord és fájlnevek általában láthatóak, de a fájl tartalmát nem lehet megtekinteni vagy letölteni. Szükség esetén mind az adatfájlok, mind a leíró rekord elrejthető a nyilvános nézetből.

Adatmenedzsment ábra (forrás: http://ec.europa.eu/research/participants/docs/h2020-funding-guide/cross...)

A jó adatkezelési terv  a következő ellenőrzési pontok betartásával készíthető:

Kutató adatai (neve, beosztása, elérhetősége) ORCID azonosító használata ajánlott. (http://orcid.org);
Kutató csoport / projekt neve  
A kutatás bemutatása Kutatás rövid összefoglalása, ami a kutatás során használt / keletkezett adatok körére is kiterjed.
Finanszírozó szerv; kutatás száma  
Partnerszervezetek, konzorciumi partnerek, ehyéb a kutatásban részt vevő intézmények  
Projekt kezdet és vége Start:
End:
Első változat dátuma  
A legutolsó frissítés dátuma  
Jelenlegi verziószám Minden olyan esetben új verziót kell menteni, ha a project adatkészletében fontos változások következnek be, ill. a project szakaszában fontos változások történtek.
Az adatokért és az adattárolásért felelős személy megnevezése a jogköreik pontos leírásával. Ez különösen fontos olyan projektek esetében, ahol több kutató és intézmény is adatokkal dolgozik.

Számos kutatásfinanszírozó előírja az adatok elérhetőségét, megosztását az alábbi alapelvvel: „as open as possible, as closed as necessary”.

 

Adatkészlet összeírása

  1. Hogyan gyűjtik az adatokat?
  2. Milyen típusú adatokat gyűjtenek? (mérések, megfigyelések, modellek, szoftverek stb....)
  3. Milyen fájlformátumokban?
  4. Reprodukálható-e?
  5. Mekkora i az adatok becsült mérete, és milyen ütemű a növekedés?
  6. Milyen eszközökre vagy szoftverekre van szükség az adatok létrehozásához / feldolgozásához / megjelenítéséhez?
  7. Új adatokat hoznak-e létre, vagy már meglévő adatokat is használnak? Amennyiben meglévő adatokat használnak, azt honnan veszik?
  8. Van-e engedélye az a meglévő adatok újrafelhasználására?

Adatok dokumentálása

  1. Milyen szabványokat, adatokat fognak használni az adatok dokumentálására?(t Tudományterületi szabványok vagy saját adatkészlet?
  2. Hogyan fogják a dokumentálni az adatokat ait a kutatás és a hosszú távú tárolás során?
  3. Milyen könyvtár- és fájlnevezési egyezményt használnak a mappák, a dokumentumok és a nyilvántartások következetes és logikus módon történő titkosítására?
  4. Hogyan követik ei a változásokat?
  5. Milyen projekteket (szóköz nem kell) és / vagy adatazonosítókat rendelnek hozzá?

Adatmentés és adattárolás

  1. Hogyan biztosítják a, hogy a kutatás során minden kutatási adat biztonságosan tárolódjon, és rendszeresen biztonsági másolatot készüljön?
  2. Hogyan kezelik a mesterfájlt és a verziókezelést az összes adatváltozás fenntartásához?
  3. Hogyan tárolják a kutatás során keletkezett nyers adatokat?
  4. Hogyan fogják tárolni, és milyen biztonsági mentést készítenek a kutatás során feldogozott adatokról?
  5. Milyen tárhelyet fognak használni ? Hálózati tárolás; személyes adathordozók (CD-k, DVD-k, USB-k, hordozható merevlemezek); felhő- tárolás
  6. Biztosítva van-e a megfelelő gyakoriságú biztonsági mentés, egy esetleges adatvesztés esetén?
  7. Hogyan biztosítják a a kutatás alatt és a projekt lejárta után a hozzáférést és a biztonságot?
  8. Hogyan kezelik a szerzői jogokat és a szellemi tulajdonjogokat? Pl. Ki az adat tulajdonosa?
  9. Vannak-e korlátozások az adatokhoz való hozzáféréssel kapcsolatban?
  10. Ki felel az adatok eléréséért? (főkutató, hallgató, laboratórium, egyetem, finanszírozó)?
  11. Hogyan akadályozzák a meg az adatokhoz való illetéktelen hozzáférést?
  12. Hogyan osztják a meg és cserélik az adatokat az együttműködők között?
  13. Hogyan biztosíthatják a az (adatvédelmi) érzékeny adatok titkosságát?

Archiválás és megőrzés

  1. Mely adatokat kell megőrizni  (nem kell szóköz) és/vagy megosztani?
  2. Milyen kritériumokat fognak használni annak eldöntésére, hogy mely adatokat kell archiválni a megőrzés és a hosszú távú hozzáférés érdekében. Mely adatokat kell megsemmisíteni?
  3. Meddig tartható fenn (xx év, tartósan)?
  4. Milyen fájlformátumokat használnak?
  5. Milyen dokumentációt és egyéb támogató fájlokat tárolnak a (nyers) adatokkal?
  6. Melyik adatraktár megfelelő az adatok archiválásához?
  7. Milyen költségei vannak (ha van ilyen) a választott tárhely díjának, és miből, hogyan fedezik azt?
  8. Hogyan biztosítható az adatintegritás az egész megőrzési időszak alatt?

Hogyan oszthatók meg az adatok?

  1. Ha az adatkészletet nem lehet megosztani, meg kell említeni ennek okait (például etikai, személyes adatok szabályai, szellemi tulajdon, kereskedelmi, adatvédelmi, biztonsági vonatkozású).
  2. Milyen az adatok hozzáférési feltétele (nyitott / korlátozott hozzáférés, embargó idő stb.)?
  3. Minden megosztási követelmény teljesül-e? (például a finanszírozó adatmegosztási irányelve)?
  4. Hogyan kerülnek újrafelhasználásra az adatok?
  5. Mikor és hol fogjáka közzétenni az adatokat?
  6. Hogyan fogjáka regisztrálni a kiadvány és a mögöttes adatok közötti kapcsolatot?
  7. Milyen eszközökre / szoftverre van szükség az adatok megtekintéséhez / megjelenítéséhez / elemzéséhez?

További források