Kazalo:
- Vse poslovne odseke vključite v veliko pobudo za podatke
- Ocenite vse infrastrukturne modele za izvajanje velikih podatkov
- Upoštevajte tradicionalne vire podatkov pri načrtovanju velikih podatkov
- Upoštevajte skladen niz podatkov
- Razdelite podatke
- Nikoli se ne zanašajte na en sam pristop k analitiki velikih podatkov
- Ne začnite velike pobude za velike podatke, preden boste pripravljeni
- Ne uporabljajte podatkov izolirano
- Ne prezrite varnosti podatkov
- Ne prezrite dela uspešnosti analitike velikih podatkov
Veliki podatki prinašajo veliko obljub za vse vrste panog. Če se bodo ti veliki podatki učinkovito in učinkovito uporabljali, lahko to pomembno vpliva na odločanje in analitiko. Korist od velikih podatkov pa je mogoče doseči le, če se z njimi upravlja strukturirano. Postopoma se vzpostavljajo najboljše prakse velikih podatkov, vendar je pri izvajanju že nekaj jasnih nalog in napak.
Naslednja navodila temeljijo na praktičnih izkušnjah in znanju, pridobljenih iz resničnih projektov. Tukaj so moji najboljši podatki in ne.
Vse poslovne odseke vključite v veliko pobudo za podatke
Pobuda za obsežne podatke ni izolirana in neodvisna dejavnost, za dosego resnične vrednosti in vpogleda pa je potrebno sodelovanje vseh poslovnih enot. Veliki podatki lahko pomagajo organizacijam, da pridobijo velike količine podatkov in dobijo vpogled v vedenje strank, dogodke, trende, napovedi itd. To ni mogoče s snemanjem podatkov, ki zajame samo del celotne količine podatkov, obdelanih v velikih podatkih. Posledično se podjetja vse bolj osredotočajo na vse vrste podatkov, ki prihajajo iz vseh možnih načinov / poslovnih enot, da bi razumeli pravilen vzorec.Ocenite vse infrastrukturne modele za izvajanje velikih podatkov
Obseg podatkov in njegovo upravljanje je glavna skrb za vsako veliko podatkovno pobudo. Ker se veliki podatki ukvarjajo s petabajti podatkov, je edina rešitev za upravljanje z uporabo podatkovnih centrov. Hkrati je treba pred izbiro in dokončanjem katerega koli skladišča upoštevati stroškovno komponento. Storitve v oblaku so pogosto najboljša izbira, vendar je treba storitve različnih oblakov ovrednotiti za določitev ustreznega. Ker je shranjevanje eden najpomembnejših sestavnih delov pri vsaki veliki uporabi podatkov, je to dejavnik, ki ga je treba zelo natančno oceniti v kateri koli pobudi za velike podatke. (Poiščite drugo perspektivo pri današnjih velikih podatkovnih izzivih, ki izhajajo iz raznolikosti, ne obsega ali hitrosti.)Upoštevajte tradicionalne vire podatkov pri načrtovanju velikih podatkov
Obstajajo različni viri velikih podatkov in število virov se iz dneva v dan tudi povečuje. Ta ogromna količina podatkov se uporablja kot vložek v veliko obdelavo podatkov. Zato nekatera podjetja menijo, da tradicionalni viri podatkov niso koristni. To ne drži, saj so ti tradicionalni podatki kritična sestavina za uspeh katere koli zgodbe o velikih podatkih. Tradicionalni podatki vsebujejo dragocene podatke, zato jih je treba uporabljati v povezavi z drugimi velikimi viri podatkov. Resnično vrednost velikih podatkov je mogoče pridobiti le, če se upoštevajo vsi viri podatkov (tradicionalni in netradicionalni). (Več o tem lahko vzemite v velikih podatkih! Zakaj lahko majhni podatki spakirajo večji kup.)Upoštevajte skladen niz podatkov
V velikem podatkovnem okolju podatki prihajajo iz različnih virov. Oblika, struktura in vrste podatkov se med posameznimi viri razlikujejo. Najpomembnejši del je, da se podatki ne čistijo, ko gre za vaše veliko podatkovno okolje. Preden zaupate dohodnim podatkom, morate doslednost preveriti s ponavljajočim se opazovanjem in analizo. Ko je skladnost podatkov potrjena, jih je mogoče obravnavati kot dosleden niz metapodatkov. Iskanje skrbnega nabora metapodatkov s skrbnim opazovanjem vzorca je ključnega pomena pri načrtovanju velikih podatkov.Razdelite podatke
Količina podatkov je glavna skrb, če upoštevamo procesno okolje. Zaradi ogromne količine podatkov, s katerimi se ukvarjajo veliki podatki, obdelava na enem strežniku ni mogoča. Rešitev je okolje Hadoop, ki je distribuirano računalniško okolje, ki deluje na blagovni strojni opremi. Daje moč hitrejše obdelave na več vozliščih. (Več o 7 stvareh, ki jih morate vedeti o Hadoopu.)Nikoli se ne zanašajte na en sam pristop k analitiki velikih podatkov
Na trgu so na voljo različne tehnologije za obdelavo velikih podatkov. Temelj vseh velikih podatkovnih tehnologij sta Apache Hadoop in MapReduce. Zato je pomembno, da pravilno ocenite pravilno tehnologijo. Nekateri pomembni analitični pristopi so napovedna analitika, predpisovalna analitika, besedilna analitika, pretočna analiza podatkov itd. Za dosego želenega cilja je pomembna izbira ustrezne metode / pristopa. Najbolje je, da se ne zanašate na en sam pristop, ampak da raziščete različne pristope in izberete popolno ujemanje za svojo rešitev.Ne začnite velike pobude za velike podatke, preden boste pripravljeni
Za vsako pobudo za velike podatke je vedno priporočljivo začeti z majhnimi koraki. Torej, začnite s pilotnimi projekti, da pridobite strokovno znanje in nato pojdite na dejansko izvedbo. Potencial velikih podatkov je zelo impresiven, vendar je resnično vrednost mogoče doseči šele, ko zmanjšamo svoje napake in pridobimo več strokovnega znanja.Ne uporabljajte podatkov izolirano
Veliki viri podatkov so razpršeni okoli nas in se iz dneva v dan povečujejo. Pomembno je, da se vsi ti podatki vključijo, da dobite pravilen rezultat analitike. Na trgu so na voljo različna orodja za integracijo podatkov, vendar jih je treba pred uporabo pravilno oceniti. Vključevanje velikih podatkov je zapletena naloga, saj so podatki iz različnih virov različnega formata, vendar je zelo potreben, da dobite dober rezultat analitike.Ne prezrite varnosti podatkov
Varnost podatkov je pomemben dejavnik pri načrtovanju velikih podatkov. Sprva (pred kakršno koli obdelavo) so podatki v petabajtih, zato varnost ni dosledno izvedena. Toda po nekaj obdelavi boste dobili podmnožico podatkov, ki omogoča nekaj vpogleda. Na tej točki postaja varnost podatkov bistvenega pomena. Bolj ko so podatki obdelani in natančno nastavljeni, bolj dragoceni so za organizacijo. Ti natančno nastavljeni izhodni podatki so intelektualna lastnina in jih je treba zavarovati. Varnost podatkov mora biti uvedena kot del življenjskega cikla velikih podatkov.Ne prezrite dela uspešnosti analitike velikih podatkov
Rezultat velike analitike podatkov je uporaben le, če daje dobre rezultate. Veliki podatki ponujajo več vpogleda na podlagi hitrejše obdelave ogromne količine podatkov. Zato je nujno, da se z njim učinkovito in učinkovito upravlja. Če se z velikimi podatki ne bo skrbno upravljalo, bo to povzročilo težave in celoten trud nesmiselno.
V naši razpravi smo se osredotočili na naloge in pomanjkljivosti pobud za velike podatke. Veliki podatki so nastajajoče območje, in ko gre za izvajanje, je veliko podjetij še v fazi načrtovanja. Za zmanjšanje tveganja in napak je ključnega pomena razumevanje najboljših praks velikih podatkov. Točke razprave so izhajale iz izkušenj s projektom v živo, zato bodo podane nekatere smernice za uspešnost strategije velikih podatkov.
