Datové sady, ať už jde o měření z experimentů, fotografie z mikroskopu, geografické mapové vrstvy, genomická data, záznamy chování zvířat, klinická data apod., můžou vědci a výzkumné instituce nově vykazovat jako samostatný výsledek druhu T – digitální kolekce dat do RIV. Tento krok představuje zásadní posun v uznání vědeckých dat jako plnohodnotného výsledku vědecké práce a podporuje principy otevřené vědy a FAIR dat.
Co je to ta digitální kolekce dat?
Výsledek „digitální kolekce dat“ zahrnuje jakékoli datové sady v digitální formě jako výsledek výzkumu vzniklé netriviálním procesem nebo jejich kombinací v rámci realizovaného výzkumu, které přinášejí novou užitnou hodnotu pro následný výzkum, vývoj nebo inovace. Digitální kolekce dat jako výsledek realizovaného výzkumu musí splňovat tyto vlastnosti:
– být opatřena strojově zpracovatelnými a veřejně dostupnými metadaty podle principů FAIR.
– mít přiřazen jednoznačný, strojově zpracovatelný persistentní digitální identifikátor (např. systémem „handle“, který zahrnuje i DOI a další typy persistentních identifikátorů, nebo obdobnou dlouhodobě spravovanou PID službou),
– mít přiřazenu závaznou licenci nebo podmínky dalšího užití a distribuce, včetně popisu nových užitných hodnot pro následný výzkum, vývoje nebo inovace,
– být uložena včetně metadat ve veřejně dostupném důvěryhodném nebo oborově certifikovaném digitálním repozitáři, například v repozitářích velkých výzkumných infrastruktur, či v Národní repozitářové platformě EOSC CZ,
– mít alespoň jednoho autora, který se podílel na realizovaném výzkumu.
Můžou nebo musejí?
Sloveso můžou je trochu eufemismem. Ve skutečnosti jde podle § 31 odst. 3 zákona č. 130/2002 Sb. o povinnost vykazovat digitální kolekce dat. Úplně stejně se na to dívá zákon č. 328/2025 Sb. o výzkumu, vývoji, inovacích a transferu znalostí, který jej od 1. ledna 2026 nahrazuje. S tím rozdílem, že tato povinnost je elementárně zakotvena § 88.
Zákony taxativně nestanovují, co je výsledkem výzkumu. To je však upřesněno v Příloze č. 1 Metodiky hodnocení výzkumných organizací 2025+ . Ta s určitými specifiky Akademie věd tvoří závazný rámec i pro hodnocení Biologického centra.
A jak to tedy udělám?
Není to tak hrozné, jak to vypadá. Výhody sdílení výzkumných dat jsme si popsali. Pokud dodržuješ FAIR principy, zbytek je již poměrně jednoduchý.
1. Většinou se digitální kolekce dat váže ke konkrétní publikaci (především odbornému článku, konferenční stati apod.). Jakmile článek publikuješ, potřebuješ jej zveřejnit i v institucionálním repozitáři ASEP. V závislosti na povinných postupech projektu jako bibliografický záznam, nebo dokonce s plným textem. Podklady prostě předáš kolegovi nebo kolegyni na sekretariátu ústavu, jak jsi zvyklý podle Směrnice k nakládání s duševním vlastnictvím. A ten/ta ho nahraje do ASEPu. Následující rok se vše exportuje do RIV.
2a. Pokud jsi již kolekci dat ke článku zveřejnil(a) v důvěryhodném repozitáři, např. na Zenodo, Figshare atd. (koneckonců TOP vydavatele to již sami vyžadují), stačí předat tento odkaz (DOI) institucionálnímu Data Stewardovi. Ten vytvoří datový záznam s existujícím odkazem. Odkaz na data (DOI) předej i „asepářce“ na ústavu. Prolinkuje záznam článku s daty.
2b. No, a jestli jsi data ještě nezveřejnil(a) nově prostě předáš kolekci dat data stewardovi (samozřejmě v elektronické podobě), spolu se jmény autorů a afiliacemi, klíčovými slovy, abstraktem, licencí (většinou CC-BY nebo CCO), projekty, ke kterým se sada váže, příp. i DOI článku a ideálně zpracovaný tzv. READme file s metadaty (informacemi o datech – jak byla získána, kým, kde, jak byla zpracována, upravena apod.). Nebo se s data stewardem dohodneš, kde a jakým způsobem data zveřejníte. Můžeš totiž samozřejmě využít oborově specializovaný repozitář.
3. A když nebudeš vědět, kudy kam, požádáš projektového data stewarda (určitě s data stewardem v projektu počítáš!) nebo institucionálního data stewarda o konzultaci.