Šta raditi sa zilijardama bajtova astronomskih podataka? Gde ih smestiti i kako ih najlakše preneti?
Tekst: Marija Nikolić
Postoji nekoliko načina da izmerimo težinu, odnosno veličinu ovog teksta. Jedan način, koji će vam svakako reći nešto više o samom tekstu jeste da je on težak čitavih 50 kilobajta. Drugim rečima, koliko god informacija da se nađe u istom, i dalje će, prema nekoj kvantitativnoj proceni, on biti najmanje šest puta lakši od malenog perceta, u informatičkom smislu reči. Prema istoj kvantitativnoj proceni, moglo bi se reći da je veličina jednog dugometražnog filma visoke rezolucije jednaka težini tuča.
Međutim, i dalje je to sve jako malo u odnosu, na primer, na arhivu informacija koje za jedno veče Hablov teleskop pošalje mikrotalasnoj anteni velikoj 18 metara u prečniku, lociranoj u Vajt Sendsu, u Novom Teksasu. Za to jedno veče Hablov teleskop skupi oko 15 gigabajta informacija. Prošla je čitava 51 godina (2007) pre nego što je hard-disk dostigao veličinu od 1 terabajta (što je hiljadu gigabajta). Međutim, proizvođačima hard-diska je trebalo samo dve godine (2009) da razviju tehnologiju kojom bi se na jednom mestu čuvalo 2 terabajta informacija.
Istraživači u Fudži filmu u Japanu i u IBM-u u Cirihu, već su napravili prototipe koji mogu da sačuvaju 35 terabajta – što je u informacijama oko 35 miliona knjiga – na kertridžu veličine 10x10x2 centimetra. Ovo su postigli korišćenjem magnetske trake obložene česticama barijum-fertita i na dobrom su putu da formu kasete ponovo učine popularnom.
Za naučnike, imati ogromnu količinu podataka predstavlja božiji dar. Međutim, prosto skladištenje, sortiranje i prenos istih im zadaju veliku glavobolju. Razvoj ovog segmenta tehnologije igra vrlo važnu ulogu posebno kod astronomskih istraživanja.
MUNGOS TELESKOP
Pravi debi za ovu vrstu tehnologije će biti skupljanje podataka sa najvećeg radio-teleskopa tzv. Stroja kvadratnog kilometra(Square Kilometre Array). Narednih 12 godina, hiljade antena će biti postavljeno na 5000 kilometara duž južne zemljine hemisfere. Mnogobrojni satelitski tanjiri će istačkati udaljene savane Južne Afrike i Australije čineći tako najveći radio-teleskop dosad napravljen. Ukupna sakupljačka moć signala hiljde ovih tanjira će biti jednaka jednom tanjiru veličine kvadratnog kilometra.
Ovaj ambiciozni projekat će spojiti 67 naučnih timova iz preko 20 zemalja i predstavlja narednu veliku globalnu naučnu kolaboraciju. Kao i CERN-ov Veliki sudarač hadrona (LHC), SKA je višegodišnji, multimilionski projekat sa ciljem otkrivanja najdubljih tajni nastanka i širenja svemira.
Osluškujući sve signale naše galaksije, ali i onih malo daljih, SKA će pomoći naučnicima čak i u potrazi za van-zemaljskim civilizacijama. Ovaj radio-teleksop će biti toliko osetljiv da će moći da registruje, na primer, signale televizije koja se emituje sa planete iz susedne galaksije. Prema rečima Ronalda Luijtena, menadžera u IBM–a istraživačkoj laboratoriji u Cirihu, SKA je vrlo sličan projekat kao i CERN, u smislu kompleksnosti samog projekta, veličine naučne zajednice i generalno prirode čitave operacije.
Uprkos strukturnim i kulturnim sličnostima, SKA predstavlja korak napred u pogledu upravljanja podacima i kompleksnosti koordinacije projekta. Instrument će svakodnevno generisati heksabajt podataka – što je oko 1.000.000.000.000.000.000 bajta – duplo više informacija u odnosu na količinu koja se na dnevnoj bazi pošalje putem interneta i 100 puta više informacija nego što LHC proizvede.
Jednom kada antene budu postavljene i puštene u rad, 2024. godine, očekuje se da SKA izbaci 1 petabajt (milion gigabajta) kompresovanih podataka dnevno. Godišnja arhiva će preći nivo očekivane decenijske arhive podataka. U trenutku kada se teleskop poveže na internet, ljudi iz IBM-a očekuju da će moći da sakupe 100 terabajta na jedan maleni kertridž.
„Današnja tehnologija nije srazmerna gustini i energiji koja je neophodna za pravljenje SKA“, ističe Luijten opisujući nedostatak kvantnog skoka u tehnici skladištenja podataka, „a dobro poređenje može biti razlika između optičkog i elektronskog mikroskopa“, skok koji je otvorio čitav novi svet mogućnosti za nanotehnologe i biologe.
DELOVI PODATAKA
Konvencionalna kompresija podataka trenutno radi po principu nalaženja redundantnosti u informacijama odnosno otpuštanja suvišnih informacija. Delovi podataka koji se ponavljaju kao i podaci koji nisu bitni za konačan proizvod se uklanjaju. Druga vrsta tehnologije kompresije radi po principu uklanjanja podataka koji mogu da se predvide.
Sabijanje podataka je suštinski važno za digitalne komunikacije i informaciono skladištenje. Pronalaženje boljeg načina kompresije video, audio i drugih formi podataka će svakako unaprediti i efikasnost prenosa podataka putem interneta, ali i uvećati kapacitet samih računara.
Od Fejsbuk statusa koje postavlja preko milijardu korisnika do mnogobrojnih medicinskih podataka koje zdravstvene organizacije razmenjuju i porasta visokodefinisanih video-striminga, potreba za nečim što će čuvati ogromnu količinu podataka je veća nego ikada. Čak i tehnologija proizvodnje klasičnih hard-diskova je dobila konkurenciju, i reklo bi se da će uskoro nov talas ultrasabijačke trake kompletno da ih zameni. Koliko god dugačke bile te nove trake, koliko god sabijačku snagu imale, teško će se trakmičiti sa uređajem zvanim čovečji mozak: i dalje ubedljivo najefikasnijim uređajem sakupljanja, prenošenja i čuvanja informacija.