Res potrebujemo Big Data?

Področje IT je umeščeno neposredno pod upravo, tako da aktivno soustvarja strategije.

Res potrebujemo Big Data?
1. 6. 2016 InfoSRC

Res potrebujemo Big Data?

Ob pogovorih z raznimi slovenskimi IT- in drugimi strokovnjaki o trendu Big Data je večina podobnega mnenja: »ne potrebujemo, nimamo dovolj podatkov.« ob vprašanju, čemu takšna miselnost, je večinoma odgovor podoben: »To je za velika podjetja, za peta-, celo zetabajte podatkov. Mi operiramo z giga-, v skrajnih primerih terabajti podatkov.«

ni proStorA zA bigdAtA v SlovenSkih podjetjih?

Strokovna de nicija izraza Big Data vedno omenja »3V’s«:
Velocity (hitrost, s katero prihajajo podatki),
Volume (velikosti zbranih podatkov),
Variety (raznolikost podatkov, strukturirani in nestrukturirani).

big-data-revija-83-stevilka

SlIkA: hTTP://www.DATASCIenCeCenTRAl.CoM/foRUM/ToPICS/The-3VS-ThAT- DefIne-BIg-DATA

zAkAj zAčeti?

Dobimo boljše poznavanje strank, nove poslovne priložnosti, ponavljajoče se vzorce, možnost avtomatizacije procesov, manj tvegano in hitrejše odločanje.

To pa so ključne stvari, ki lahko privedejo tudi manjša podjetja do konkurenčne prednosti in ne nazadnje rasti podjetja. Do teh podatkov je/bo treba priti, ne glede nato, ali je podjetje šteto kot veliko, srednje ali manjše. Dandanes pravi podatki pripeljejo podjetje do konkurenčne prednosti, v prihodnjih letih bodo nuja za obstoj podjetja na trgu. Je res pomembno, kako poimenujemo način, na katerega smo prišli do podatkov in izluščili koristne informacije? DataMinning, Big Data, FastData, SmartData … »buzz-words« se spreminjajo, problematika ostaja.

kje zAčeti?

Če je vaše podjetje prisotno v poslovnem svetu že vsaj nekaj časa, je velika verjetnost, da obstaja na stotine dokumentov, baz podatkov, raznih raziskav z vašega področja dela, če ustanavljate novo podjetje, pa je dobro v tej smeri razmišljati že od vsega začetka. Prvotno je treba pregledati, kaj oziroma katere podatke imamo, jih locirati in razmisliti, kateri podatki so za nas še zanimivi.

Prilagoditi moramo pogled na samo shranjevanje podatkov in razširiti mišljenje. Ne shranjujemo več le podatkov, nujnih za podporo poslovnemu procesu. Ti podatki izhajajo iz že naučenih vzorcev, so kreirani v podporo in delovanje poslovnemu procesu, mi pa govorimo o podatkih, iz katerih se bomo nekaj naučili oziroma nekaj novega ugotovili/odkrili.

Z nižanjem cene strojne opreme in pojavom »Cloud ponudnikov« (Amazon, Microsoft, Google …) lahko, za zmerno ceno, začnemo shranjevati tudi podatke, ki niso direktno vezani na naše poslovanje, ampak sumimo, da nam bodo v prihodnosti prinesli dodano vrednost. Večina orodij, s katerimi lahko začnemo raziskovanje, je odprtokodnih, npr. projekti Apache, podatkovne baze NoSql, orodja za analitiko itd., zato začetni vložki ne bi smeli biti preveliki. Da imamo okvirno predstavo, je v vsej zgodbi, vsaj na začetku, najdražji čas vpletenih ljudi v sam razvoj.

Dandanes je velika verjetnost, da rezultate sistema Big Data že uporabljate – Google Analytics vam daje vpogled v statistike vaših spletnih strani, od kod prihajajo zahteve, kako dolgo so stranke na strani, kaj na vaši strani jih pritegne. S pomočjo teh rezultatov lahko zelo izboljšamo uporabniško izkušnjo spletne strani in učinkoviteje predstavimo podjetje na svetovnem spletu.

Torej, da lahko govorimo o Big Data, morajo podatki prihajati v sistem izjemno hitro, mora jih biti veliko in morajo biti raznoliki. Že v teh predpostavkah je stvar zelo nede nirana, danes je morda petabajt veliko, ampak včasih je bil tudi gigabajt ogromno. Zavračanje Big Data na podlagi, kaj si predstavljamo kot veliko podatkov, me ne prepriča.

Poglejmo na stvar iz drugega zornega kota, iz dobljenih rezultatov končne analize zbranih podatkov. Kaj dejansko lahko pridobimo iz povezovanja naših podatkov z drugimi podatkovnimi viri, z analiziranjem, vizualiziranjem, iskanjem zakonitosti in vzorcev znotraj podatkov?

kAko zAčeti?

Večina strokovnjakov predlaga znanstveni pristop: razvijte svojo hipotezo in jo s podatki poskušajte zavreči oziroma potrditi.

Začeti je treba razmišljati v smeri povezovanja več podatkovnih virov, iskanja njihovih korelacij in odkrivanja novih zakonitosti med zbranimi podatki. Vse več in več ustanov, podjetij se bo odpiralo, ponujalo podatke, kako to izkoristiti?

Če nimate idej, je iskalnik Google cela zakladnica. Preverite kreativnosti rešitev drugih podjetij in domišljija bo podivjala. Posvetite nekoliko časa študiji primerov z interneta in zagotovo dobite idejo, primerno za vaše podjetje.

kAm uSmeriti pozornoSt?

V naše pomanjkljivosti, seveda. Želimo si optimizirati/ avtomatizirati poslovne procese, bolje razumeti stranke, ciljno oglaševati, dobiti boljši pregled nad učinkovitostjo poslovnega procesa.

Bolj jasen, kot je cilj, kaj želimo doseči, kaj bomo zbirali, kako bomo to povezovali z zunanjimi viri, kakšno analitično tehniko bomo izbrali ter kaj nam lahko prinesejo izluščene informacije, večja je možnost uspeha.
V nekaterih primerih nam šele vpogled v podatke razkrije pomanjkljivosti oziroma slabosti. Dober primer tega bi bilo logistično podjetje – kje in kdaj izgubijo največ časa. Kako optimizirati prevoze, kje se izgubi največ časa in kje bi ga lahko pridobili?

Bistvenega pomena bo prehod iz segmentiranja strank v skupine, na poznavanje navad in vzorcev posameznika, le tako mu lahko v ključnem trenutku in na ključnem mestu ponudimo želeni produkt.

Seveda pa ne shranjujemo podatkov, da bi bili sami sebi namen. Potrebna je zdrava pamet. Hitro boste ugotovili, da bi bilo najbolj primerno shraniti vse. Ampak kam? To stane. Ne bomo investirali v podatkovni center za shranjevanje vseh podatkov, za katere še ne vemo, kaj bomo z njimi.

kAkŠni kAdri So vpleteni v tAk proceS?

Strokovna literatura za osnovni nabor znanj, potrebnih za takšen pristop k delu s podatki, omenja strokovnjake za domensko področje, računalniške inženirje za samo realizacijo in matematike za apliciranje analitike.
V praksi je potrebna angažiranost celotnega podjetja. Sodelovanje inženirjev, podatkovnih znanstvenikov, marketinškega oddelka in vodstva je nujno za jasno določitev želenih ciljev, pregled realnosti izvedbe zamišljenega ter določitev problema, ki bi ga lahko naslovili z zbiranjem dodatnih podatkov.

je reS prehitro, dA bi Se SlovenSkA podjetjA zAčelA obrAčAti zA prijemi big dAtA?

Pridobijo lahko ogromno, potrebna pa bosta seveda začetni vložek in malo zaupanja novemu načinu iskanja priložnosti.

Če uživate v člankih, jih delite s prijatelji. Lepe stvari je lepo deliti.