Шта радити са зилијардама бајтова астрономских података? Где их сместити и како их најлакше пренети?
Текст: Марија Николић
Постоји неколико начина да измеримо тежину, односно величину овог текста. Један начин, који ће вам свакако рећи нешто више о самом тексту јесте да је он тежак читавих 50 килобајта. Другим речима, колико год информација да се нађе у истом, и даље ће, према некој квантитативној процени, он бити најмање шест пута лакши од маленог перцета, у информатичком смислу речи. Према истој квантитативној процени, могло би се рећи да је величина једног дугометражног филма високе резолуције једнака тежини туча.
Међутим, и даље је то све јако мало у односу, на пример, на архиву информација које за једно вече Хаблов телескоп пошаље микроталасној антени великој 18 метара у пречнику, лоцираној у Вајт Сендсу, у Новом Тексасу. За то једно вече Хаблов телескоп скупи око 15 гигабајта информација. Прошла је читава 51 година (2007) пре него што је хард-диск достигао величину од 1 терабајта (што је хиљаду гигабајта). Међутим, произвођачима хард-диска је требало само две године (2009) да развију технологију којом би се на једном месту чувало 2 терабајта информација.
Истраживачи у Фуџи филму у Јапану и у ИБМ-у у Цириху, већ су направили прототипе који могу да сачувају 35 терабајта – што је у информацијама око 35 милиона књига – на кертриџу величине 10x10x2 центиметра. Ово су постигли коришћењем магнетске траке обложене честицама баријум-фертита и на добром су путу да форму касете поново учине популарном.
За научнике, имати огромну количину података представља божији дар. Mеђутим, просто складиштење, сортирање и пренос истих им задају велику главобољу. Развој овог сегмента технологије игра врло важну улогу посебно код астрономских истраживања.
МУНГОС ТЕЛЕСКОП
Прави деби за ову врсту технологије ће бити скупљање података са највећег радио-телескопа тзв. Строја квадратног километра(Square Kilometre Array). Наредних 12 година, хиљаде антена ће бити постављено на 5000 километара дуж јужне земљине хемисфере. Многобројни сателитски тањири ће истачкати удаљене саване Јужне Африке и Аустралије чинећи тако највећи радио-телескоп досад направљен. Укупна сакупљачка моћ сигнала хиљде ових тањира ће бити једнака једном тањиру величине квадратног километра.
Овај амбициозни пројекат ће спојити 67 научних тимова из преко 20 земаља и представља наредну велику глобалну научну колаборацију. Као и ЦЕРН-ов Велики сударач хадрона (LHC), СКА је вишегодишњи, мултимилионски пројекат са циљем откривања најдубљих тајни настанка и ширења свемира.
Ослушкујући све сигнале наше галаксије, али и оних мало даљих, СКА ће помоћи научницима чак и у потрази за ван-земаљским цивилизацијама. Овај радио-телексоп ће бити толико осетљив да ће моћи да региструје, на пример, сигнале телевизије која се емитује са планете из суседне галаксије. Према речима Роналда Луијтена, менаџера у ИБМ–а истраживачкој лабораторији у Цириху, СКА је врло сличан пројекат као и ЦЕРН, у смислу комплексности самог пројекта, величине научне заједнице и генерално природе читаве операције.
Упркос структурним и културним сличностима, СКА представља корак напред у погледу управљања подацима и комплексности координације пројекта. Инструмент ће свакодневно генерисати хексабајт података – што је око 1.000.000.000.000.000.000 бајта – дупло више информација у односу на количину која се на дневној бази пошаље путем интернета и 100 пута више информација него што LHC произведе.
Једном када антене буду постављене и пуштене у рад, 2024. године, очекује се да СКА избаци 1 петабајт (милион гигабајта) компресованих података дневно. Годишња архива ће прећи ниво очекиване деценијске архиве података. У тренутку када се телескоп повеже на интернет, људи из ИБМ-а очекују да ће моћи да сакупе 100 терабајта на један малени кертриџ.
„Данашња технологија није сразмерна густини и енергији која је неопходна за прављење СКА“, истиче Луијтен описујући недостатак квантног скока у техници складиштења података, „а добро поређење може бити разлика између оптичког и електронског микроскопа“, скок који је отворио читав нови свет могућности за нанотехнологе и биологе.
ДЕЛОВИ ПОДАТАКА
Конвенционална компресија података тренутно ради по принципу налажења редундантности у информацијама односно отпуштања сувишних информација. Делови података који се понављају као и подаци који нису битни за коначан производ се уклањају. Друга врста технологије компресије ради по принципу уклањања података који могу да се предвиде.
Сабијање података је суштински важно за дигиталне комуникације и информационо складиштење. Проналажење бољег начина компресије видео, аудио и других форми података ће свакако унапредити и ефикасност преноса података путем интернета, али и увећати капацитет самих рачунара.
Од Фејсбук статуса које поставља преко милијарду корисника до многобројних медицинских података које здравствене организације размењују и пораста високодефинисаних видео-стриминга, потреба за нечим што ће чувати огромну количину података је већа него икада. Чак и технологија производње класичних хард-дискова је добила конкуренцију, и рекло би се да ће ускоро нов талас ултрасабијачке траке комплетно да их замени. Колико год дугачке биле те нове траке, колико год сабијачку снагу имале, тешко ће се тракмичити са уређајем званим човечји мозак: и даље убедљиво најефикаснијим уређајем сакупљања, преношења и чувања информација.