ArchOSx – jak działa system do zarządzania cyfrowymi archiwami
Opasłe segregatory z dokumentami, albumy ze zdjęciami, uginające się od ksiąg półki – czy w taki oto sposób zostawimy potomnym wiedzę o nas, o świecie, który minął? Owszem, można i tak. Jednak w czasach, kiedy musimy dbać o środowisko naturalne, jest to bardzo nieekologiczny sposób przechowywania „naszej historii”. Nie jest on również długoterminowy, bo wraz z upływającym czasem istnieje duże ryzyko całkowitej utraty tych informacji. Z pomocą przychodzi nam cyfryzacja! Bezpieczeństwo i gwarancję dostępności danych w przyszłości zapewnia autorski system do zarządzania cyfrowymi archiwami – ArchOSx, opracowany i wdrożony przez firmę SoftCream.
Starzenie się dokumentów i innych materiałów o dużej wartości i znaczeniu historycznym spędza sen z powiek archiwistów. Wykorzystując wiedzę naukowców, robią wszystko, aby je zachować dla potomnych. To należy do ich największych wyzwań. Tradycyjne surowce archiwalne, takie jak papier, tkaniny, skóry zwierzęce, są pochodzenia organicznego i podlegają ciągłemu oraz nieuniknionemu procesowi starzenia się. Wprawdzie żyjemy w dobie danych cyfrowych, jednak problem nadal istnieje. Przechowywanie nowoczesnych nośników informacji, takich jak mikrofilmy, fotografie i materiały audiowizualne czy nośniki danych, także niesie ze sobą wielorakie problemy. Z takimi materiałami należy również odpowiednio się obchodzić, by nie uległy przedwczesnemu zniszczeniu.
Główną barierą do pokonania w przypadku długoterminowego przechowywania danych cyfrowych jest proces fizycznego starzenia się nośników. Czy będziemy w stanie odczytać oraz odszyfrować zgromadzone dane za kilkadziesiąt lat? Czy będą istniały urządzenia, za pomocą których uda nam się je ponownie odczytać? Czy przechowywane informacje nie zostaną zmienione? Z tymi pytaniami i wątpliwościami postanowił zmierzyć się zespół specjalistów z firmy SoftCream. W realizacji celu bardzo pomogły fundusze europejskie.
– Pomysł pojawił się wiele lat temu, podczas naszej współpracy z nadawcami telewizyjnymi i radiowymi. Mają oni ogromne archiwa, w zdecydowanej większości na tradycyjnych nośnikach, które z czasem stają się nieczytelne, a poza tym są mało użyteczne w tej formie. Dodatkowo należy pamiętać, że tego typu zasoby nie mają określonego okresu przechowywania. Powinny być jako dziedzictwo kulturowe zachowane „na zawsze” – tłumaczy Jerzy Zamoyski, kierownik projektu ArchOSx w firmie SoftCream.
W 2017 r. zespół opracował szczegółową koncepcję systemu archiwizacji danych ARCHIMED dla Centrum Systemów Informacyjnych Ochrony Zdrowia. Od roku 2018 pomysł jest rozwijany w ramach przedsięwzięć dofinansowanych z Regionalnego Programu Operacyjnego Województwa Mazowieckiego. Najpierw były to: „Prace badawcze nad prototypem ArchOS”, które zakończyły się w połowie ubiegłego roku. I zaraz potem, czyli w połowie 2020 r., SoftCream rozpoczął kolejny projekt finansowany z tego samego źródła: „Prace badawcze nad prototypem LeSzifr Try”. Jest on logiczną kontynuacją pierwszego przedsięwzięcia, a jego celem jest wprowadzenie nowych, innowacyjnych metod zabezpieczenia dokumentu elektronicznego przed procesami „starzenia się danych”. – Dzięki dofinansowaniu mogliśmy przejść z fazy pomysłów i koncepcji do konkretnych badań i rozwoju produktu – podkreśla Jerzy Zamoyski.
Jak działa ArchOSx?
Jest to system do rzeczywistego zarządzania długoterminowym archiwum danych. Wchodzi on w skład struktury sieci danych, co pozytywnie wpływa m.in. na jego bezpieczeństwo, ergonomię czy elastyczność. Brzmi dość skomplikowanie. Co to znaczy?
Codziennie korzystamy z urządzeń komputerowych, z których niemal wszystkie połączone są różnego rodzajami sieciami. Każdego dnia w naszym najbliższym otoczeniu wymieniamy się informacjami, wysyłamy wiadomości tekstowe, fotografie, obrazy, filmy. Tworzą one strukturę, którą można nazwać siecią danych, a w jej skład wchodzą nasze telefony, tablety, komputery. Wymieniane informacje utrwalane są na każdym urządzeniu, np. fotografia zapisana jest na naszym smartfonie, ale gdy ją prześlemy do członków rodziny, zostanie zachowana na wielu urządzeniach. W ten sposób tworzymy własną, małą, ręcznie sterowaną sieć danych. Na podobnej zasadzie działa system operacyjny sieci ArchOSx, który zapewnia organizację, przechowywanie i udostępnianie danych w wybranej sieci w sposób bezpieczny i efektywny przez długi czas.
Autorski system operacyjny sieci posiada wbudowany automatyczny mechanizm opieki nad fizycznym stanem zapisu informacji. Opatentowana automatyczna regeneracja zapisu danych zastępuje kosztowną, często niewykonalną migrację.
Wiele zastosowań
System stworzony przez specjalistów z SoftCream jest dla wszystkich, a dokładniej – dla przetwarzających dane, dla których istotne jest bezpieczeństwo, spójność i dostępność przez długi czas. Głównym odbiorcą tego rozwiązania jest branża medyczna (obowiązuje w niej ustawowy obowiązek zachowania dokumentacji medycznej przez co najmniej 20 lat), notarialna (wieczyste przechowywanie) i sektor kultury.
Długo…
Niestety, nie wszyscy zdają sobie sprawę, że sposoby przechowywania czegoś przez 30 lat różnią się od tych zaplanowanych na rok. W związku z tym często wykorzystywane są takie same rozwiązania jak dla kopii podręcznych, a problem, co będziemy robić z danymi, jest odkładany na później.
– W większości przypadków, gdy mówimy o długich okresach przechowywania, zwykle mamy na myśli kilkadziesiąt lat. Wieczyste przechowywanie to raczej ładna konstrukcja językowa, nie techniczna. Procesy fizyczne są nieubłagane i nie pokonamy ich. Z praktycznego punktu widzenia nie za bardzo ma sens zastanawianie się nad tym, co zrobimy z danymi za np. sto lat. Z dużym prawdopodobieństwem możemy stwierdzić, że będą wtedy zupełnie inne metody, narzędzia, nośniki. Naszym celem jest przechowanie danych jak najdłużej, tak aby w przyszłości ktoś mógł je przeczytać i przenieść do zupełnie nowych systemów, o których dziś nie mamy żadnego pojęcia – podkreśla Jerzy Zamoyski.
… i bezpiecznie
Dane obsługiwane przez ArchOSx są wyjątkowo bezpieczne, m.in. poprzez zastosowanie różnych metod zabezpieczeń, regeneracji, procedury dostępu itp. W systemie zaimplementowane są autorskie algorytmy kryptograficzne chroniące transmisję strumieniową danych w zakresach „poufny” oraz „tajny”.
Warszawscy specjaliści pracują obecnie nad algorytmem LeSzifr, znacznie bardziej funkcjonalnym niż typowe techniki kryptograficzne. LeSzifr wprowadza nowe innowacyjne metody zabezpieczenia dokumentu elektronicznego przed procesami „starzenia się danych”. Przeprowadzona zostanie analiza cechowania dokumentu, konserwacji pieczątek i podpisów elektronicznych, zapobiegania szkodliwym zmianom zapisu wywołanym przez procesy naturalne. W efekcie rozwiąże to problem związany z cechowaniem danych przeznaczonych do długoterminowego przechowywania.
– Cechowanie jest zabiegiem, który ma uodpornić plik przed intencjonalnym wprowadzeniem zmian. Obecnie w celu cechowania danych zazwyczaj stosuje się zewnętrzne techniki podpisu elektronicznego, haszowania (hash = skrót) i znaczników czasu, które wystarczają przy krótkich okresach przechowywania, np. transportu danych, wymiany plików między podmiotami / systemami przetwarzania danych. Nie są jednak wystarczające w przypadku konieczności przechowywania dokumentów w długim czasie – zaznacza Jerzy Zamoyski.
Czy możemy mówić o stuprocentowym bezpieczeństwie? – W każdym tego typu systemie zawsze może wystąpić nieszczęśliwy zbieg okoliczności. Zawsze mówimy o tym, z jakim prawdopodobieństwem dane zostaną zachowane. U nas jest to prawie 100 procent – podkreśla Jerzy Zamoyski.
Andrzej Szoszkiewicz