Projekty RCIN i OZwRCIN

Polityka ochrony i archiwizacji

Repozytorium Cyfrowe Instytutów Naukowych stosuje politykę  ochrony i długoterminowej archiwizacji zasobów cyfrowych w nim posadowionych. Efektywne zarządzanie publikowaniem i archiwizacją zasobów cyfrowych odbywa się przy wykorzystaniu dedykowanego dla Repozytorium systemu publikacji i długoterminowej archiwizacji cyfrowej DInGO / dArceo, zarządzanego dodatkowo przez system obsługi digitalizacji pod nazwą dLab – RCIN (http://rcin.org.pl/dlab/login). Aktualnie system akceptuje następujące rodzaje plików:

  • Audio:
    • BWF, WAVE, MP3
  • Tekst
    • PDF/A, Plik tekstowy kodowany UTF-8
  • Obrazy
    • TIFF,   JPEG2000, DNG, CR2
  • Wideo
    • AVI, MPEG-4
  • Dane
    • XLS, XSLX

System zlokalizowany jest i obsługiwany przez Poznańskie Centrum Superkomputerowo-Sieciowe, które jest znanym w skali międzynarodowej węzłem europejskiej przestrzeni badawczej w zakresie infrastruktury informatycznej nauki oraz ważnym centrum badawczo-rozwojowym w zakresie technologii informacyjno-komunikacyjnych (ang. ICT – Information and Communication Technologies). Jako centrum rozwojowe e-Infrastruktury, PCSS zaprojektował i zbudował Sieć Metropolitalną POZMAN, Centrum Komputerów Dużej Mocy, oraz krajową sieć szerokopasmową PIONIER, utrzymywaną i nadal rozbudowywaną przez PCSS.


W przypadku zasobów RCIN  ochrona i długoterminowa ich cyfrowa arhiwizacja odbywa się poprzez pakiet archiwalny dArceo, w którym dane są przechowywane w niezależnych przestrzeniach dyskowych.  Każdy obiekt składowany w systemie dArceo jest zapisywany w systemie składowania danych w ustandaryzowany sposób w postaci tzw. pakietu archiwalnego, wykorzystującego format METS, służący do przechowywania pełnych informacji na temat składowanych obiektów cyfrowych. Pakiet ten jest efektem mechanizmów analizy danych wbudowanych w dArceo i zawiera pliki treści, metadane techniczne, opisowe oraz administracyjne, czyli wszystkie niezbędne informacje do tego, by w przyszłości taki obiekt łatwo odczytać i zinterpretować. Domyślnie wspierane rodzaje to obiekty master (oryginalne pliki reprezentujące obiekt), obiekty produkcyjne (pliki master po obróbce graficznej / modyfikacjach, które ułatwiają korzystanie z zasobu) oraz obiekty prezentacyjne (opracowane z myślą o użytkownikach końcowych). Rozwój systemu dArceo oraz jego funkcjonalność jest zgodna z międzynarodowym, uznanym na świecie standardem OAIS (Open Archival Information System). dArceo wykorzystuje podejście migracji danych w zakresie długoterminowej archiwizacji oraz stosuje odpowiednie pakiety archiwalne (ang. Archival Information Package - AIP) do przechowywania danych w systemie.


Z punktu widzenia wieczystej archiwizacji cyfrowej zasobów niezwykle istotne jest, że system dArceo pozwala na uruchamianie funkcji migracji lub konwersji danych (dostęp do danych odbywa się poprzez API). To dzięki tym mechanizmom możliwe będzie migrowanie starego formatu do nowego bez utraty informacji lub konwersja danych, która może być wykorzystana np. do tworzenia wersji prezentacyjnych obiektów, udostępnianych w ramach repozytorium. Istotne jest również, że dArceo posiada wbudowane mechanizmy monitorowania / kontrolowania danych zapisanych w systemie. Mechanizmy te sprawdzają, czy obiekty zapisane w systemie składowania danych nie zostały uszkodzone lub zmodyfikowane. W tym celu wykorzystywane są sumy kontrolne SHA-512.


Ważne jest również, że obiekty cyfrowe zapisywane w systemie dArceo mogą mieć różne formaty danych. Jest on również przygotowany do obsługi dużych obiektów, których zajętość dyskowa liczona jest w TB. W kontekście analizy danych, wykonywanej przez system dArceo przy składowaniu obiektu, wspierane są domyślnie dokumenty tekstowe, graficzne oraz audiowizualne. Ponadto metadane mogą być zarówno dostarczone przez użytkownika (wraz z plikami master) jak i wyekstrahowane przez wbudowane w dArceo mechanizmy, które wykorzystują takie narzędzia do ekstrakcji metadanych jak FITS, FFMpeg czy DROID.


Powyższe rozwiązania, przy zapewnieniu całodobowego monitorowania bezpieczeństwa systemu, decydują o skuteczności ochrony i długoterminowej archiwizacji zdeponowanych w RCIN zasobów.

Ta strona wykorzystuje pliki 'cookies'. Więcej informacji