Esminiai didžiųjų duomenų (angl. Big Data) principai

Autorė: Maria Silvia Martinson, RestMark METIDA teisininkė

shutterstock_331429310.jpg2017 m. sausio 10 d. Europos Komisija paskelbė komunikatą „Europos duomenų ekonomikos kūrimas“, kuriame aiškinamas laisvo duomenų judėjimo poreikis, atskleidžiamos kliūtys ir galimybės jas įveikti siekiant sukurti bendrą skaitmeninę duomenų rinką. Kalbant apie naująjį Bendrąjį duomenų apsaugos reglamentą, kuris bus taikomas nuo 2018 m. gegužės 25 d. ir ateityje vyksiančias papildomas duomenų apsaugos reformas, didžiųjų duomenų (angl. Big Data) nauda ir sudėtingumas – dominuojanti daugelio diskusijų tema. Taigi, į kokius esminius šio reiškinio principus turi atsižvelgti kiekvienas?

Įdomu tai, kad nėra vieno bendrai sutarto ir įtvirtinto didžiųjų duomenų (angl. Big data) apibrėžimo, todėl skirtinguose kontekstuose terminas gali būti suprantamas įvairiai. Šiame straipsnyje terminas „didieji duomenys“  (angl. Big Data) suprantamas taip, kaip Europos Komisijos paaiškinime: „Didieji duomenys – dideli įvairių rūšių duomenų kiekiai, kuriuos sukuria įvairūs šaltiniai, pavyzdžiui, žmonės, mašinos ar jutikliai“. Kituose apibrėžimuose teigiama, kad duomenų rinkiniai, kurie yra laikomi didžiaisiais duomenimis (angl. Big Data), yra arba tokie sudėtingi, arba tiesiog tokie dideli, kad tradicinės duomenų apdorojimo programos jų netenkina ir reikalauja novatoriškos duomenų valdymo programinės įrangos. Tačiau standartu laikoma, kad didieji duomenys (angl. Big Data) apibūdinami remiantis šiomis trimis savybėmis: apimtimi, sparta ir įvairove.

„Apimtis“ nurodo labai didelius duomenų kiekius, gaunamus iš skirtingų šaltinių. 2002 m., prasidedant vadinamajam „skaitmeniniam amžiui“ visuotinės informacijos saugojimo srityje, surinktų ir saugomų duomenų mastas staigiai išaugo. Tiksliau, Martino Hilberto ir Priscila López atliktas tyrimas atskleidė, kad 2002-ieji buvo lūžio taškas, kai vis daugiau duomenų pradėta saugoti skaitmeniniu formatu, o ne analoginiu duomenų formatu, pavyzdžiui, popieriuje ir juostelėse. Iki 2007 m. 94 % visų duomenų buvo saugomi skaitmeniniu formatu, o duomenų kiekis išaugo kelis kartus. Ir tai buvo dar prieš atsirandant debesijai (angl. Cloud Computing), informacijos saugojimo ir prieigos prie jos per nuotolinius interneto serverius, siūlančius išskirtinius saugojimo pajėgumus, veikla įgavo pagreitį dar 2009 m. ir paplito 2013 m.

„Sparta“ ir „įvairovė“ atitinkamai apibūdina precedento neturinčią duomenų srautų spartą ir skirtingus formatus, kuriais gaunami duomenys. Dėl pažangaus telemetrijos sprendimo M2M (angl. machine-to-machine) ir augančio objektų, kurie pasižymi daiktų interneto savybėmis (pavyzdžiui, įmontuoti jutikliai), skaičiaus vis daugiau ir daugiau mažyčių duomenų bitų perduodama per sekundę. Be to, per dieną žmonės sukuria didžiulius duomenų kiekius, pavyzdžiui, teigiama, kad kasdien „Facebook“ vartotojai įkelia daugiau nei 900 milijonų nuotraukų. Duomenys atkeliauja iš  daugybės šaltinių – tai gali būti laiškai, skaitiniai duomenys, vaizdai ar kažkas kito. Be to, nors kai kurie duomenys gali būti struktūrizuoti, tačiau dauguma jų – nestruktūrizuoti, todėl juos valdyti ir analizuoti sunkiau.

Atsižvelgiant į tai, kas jau paminėta, galima neabejotinai sutikti, kad duomenų surenkama, saugoma ir tvarkoma daugiau nei bet kada anksčiau. Nors kyla klausimų, susijusių su papildomais saugojimo pajėgumais, tačiau tai nėra labiausiai aktualus didžiųjų duomenų (angl. Big Data) klausimas. Daugumos diskusijų ir pokyčių tikslas – rasti geriausią būdą, kaip išgauti informaciją iš didžiųjų duomenų (angl. Big Data) ir juos panaudoti siekiant paspartinti naujoves. Prieiga prie didelių duomenų kiekių – tik pusė pergalės, nes ne visi duomenys yra naudingi ir rasti tas dalis, kurios gali būti naudingos, yra taip pat sunku, kaip rasti adatą šieno kupetoje. Tačiau suradus adatą, atsiveria neribotos galimybės.

Norint išgauti vertingą informaciją iš didžiųjų duomenų (angl. Big Data), reikia labai pažangios programinės įrangos paketo, kuris galėtų atlikti išsamios paieškos operacijas siekiant gauti norimų rezultatų. Po to gauti rezultatai turi būti analizuojami siekiant nustatyti tendencijas, gana dažnai, taip greitai, kaip būtų galima reaguoti realiuoju laiku. Šis procesas dažniausiai yra ir turėtų būti automatizuotas, priešingu atveju, reikėtų įdėti labai daug darbo. Savo 2016 m. straipsnyje, patalpintame JAV naujienų portale „Huffington Post“, verslininkas Jamesas Cantonas pareiškė, kad savarankiškas sprendimų priėmimas tampa norma. Be to,  pabrėžė, kad nors nustatyti tendencijas yra naudinga, tačiau išgavimas, kurio tikslas – informuoti ir greičiau nustatyti geresnius rezultatus, gali būti įmanomas derinant didžiuosius duomenis (angl. Big Data) ir dirbtinį intelektą.

Didžiųjų duomenų (angl. Big Data) nauda yra plačiai paplitusi. Išgauta informacija gali būti naudojama versle siekiant geriau pritraukti klientus (individualizuoti skelbimai), optimizuoti tiekimo planavimą ir produkto kokybę, arba padėti sveikatos priežiūros specialistams optimizuoti pacientų gydymą ar net užkirsti kelią ligoms ir rasti naujų vaistų. Didieji duomenys (angl. Big Data) gali padėti valdyti eismo srautus ir atnaujinti namus. Viešasis sektorius taip pat naudoja didžiuosius duomenis (angl. Big Data) siekiant išvengti kibernetinių atakų, kovoti su terorizmu ir išvengti įvairių rūšių nusikalstamos veiklos.

Kitaip tariant, „didieji duomenys“ (angl. Big Data) yra labai vertingi ne tik dėl jų teikiamos naudos. Pasak Europos Komisijos, iki 2020 m. Europos piliečių asmens duomenų vertė turi potencialą augti iki 643 bilijonų eurų, kurie atitiktų 3,17 % iš visos Europos Sąjungos BVP. Daugelis įmonių gali ir jau pateikia didžiuosius duomenis (angl. Big Data) pinigine išraiška, nes turi prieigą prie didelio duomenų (tiek asmeninių, tiek neasmeninių) kiekio. Tačiau dėl to kyla duomenų apsaugos ir privatumo klausimas. Šiuo atveju, skaidrumas ir pasitikėjimas yra raktiniai žodžiai, nes, atsižvelgiant į 2015 m. Eurobarometro atlikto tyrimo rezultatus, 81% europiečių mano, kad negali visiškai kontroliuoti savo asmens duomenų internete.

Dalis minėtų klausimų buvo išnagrinėti Bendrajame duomenų apsaugos reglamente, kuris buvo priimtas 2016 m. balandžio 27 d. ir bus taikomas nuo 2018 m. gegužės 25 d. Tiksliau tariant, Bendrasis duomenų apsaugos reglamentas pateikia bendrą taisyklių rinkinį visai Europos Sąjungai, kuris reglamentuoja asmens duomenų tvarkymą. Tai taip pat apima automatiškai sukurtus duomenis, kurių pakanka siekiant identifikuoti fizinį asmenį. Vienas didžiausių pokyčių, kuriuos pateikia Bendrasis duomenų apsaugos reglamentas – išplėstas teritorinis pasiekiamumas: net įmonėms, esančioms už Europos Sąjungos ribų, bet turinčioms tikslinius vartotojus Europos Sąjungoje, bus taikomos šio reglamento nuostatos. Tačiau, kaip nurodyta anksčiau, Bendrasis duomenų apsaugos reglamentas neišsprendžia visų su šiuo klausimu susijusių problemų, neatveria galimybių optimaliai „duomenų ekonomikai“. Todėl Europos Komisija, pradėdama plataus masto dialogą klausimais, iškeltais minėtame 2017 m. sausio 10 d. komunikate, rengs viešąsias konsultacijas.

Daugiau autorės tinklaraščio įrašų:

Advertisements
Šis įrašas paskelbtas kategorijoje Uncategorized. Išsaugokite jo nuorodą.

Parašykite komentarą

Įveskite savo duomenis žemiau arba prisijunkite per socialinį tinklą:

WordPress.com Logo

Jūs komentuojate naudodamiesi savo WordPress.com paskyra. Atsijungti / Keisti )

Twitter picture

Jūs komentuojate naudodamiesi savo Twitter paskyra. Atsijungti / Keisti )

Facebook photo

Jūs komentuojate naudodamiesi savo Facebook paskyra. Atsijungti / Keisti )

Google+ photo

Jūs komentuojate naudodamiesi savo Google+ paskyra. Atsijungti / Keisti )

Connecting to %s