Domov Poslovno Kako negovati podatkovnega znanstvenika

Kako negovati podatkovnega znanstvenika

Anonim

Med tehnološkimi zagoni je podatkovni znanstvenik vse pogostejši izraz, ki se uporablja za označevanje podatkovnih geekov, ki so sposobni premostiti tradicionalno ločena funkcionalna področja podatkovne inteligence. Podatkovni znanstvenik je nekdo, ki lahko izvaja več (če ne vseh) vidikov projektov podatkovne obveščanja:

  1. Pridobitev podatkov: To bi lahko pomenilo pisanje razčlenjevalcev po meri in spletnih pajkov ali skriptov, ki so usmerjeni na posebne spletne storitve ali API-je za netradicionalne vire podatkov.
  2. Upravljanje podatkov: ETL, manipuliranje, poizvedovanje in vzdrževanje podatkov v bazah podatkov, trgovinah s ključnimi vrednostmi ali Hadoop.
  3. Vizualizacija informacij: Odkrivanje vzorcev z uporabo statičnih orodij za vizualizacijo in / ali interaktivnih platform na osnovi Flash, JavaScript ali obdelave.
  4. Analitika: To lahko obsega od preprostih do zapletenih tehnik v multivariatni statistiki, strojnem učenju in NLP-ju.
  5. Vpogled: Izvleči, povzeti in predstaviti ključne ugotovitve širokemu občinstvu.

Obstaja veliko orodij, veščin in tehničnih podrobnosti, poleg tega pa lahko leta obvladamo vsakega od zgoraj naštetih predmetov. Medtem ko podatkovni znanstvenik morda nima pravega strokovnega znanja na nobenem od področij, lahko udobno preskakuje naprej in nazaj in opravlja vsa osnovna opravila na vseh njih. Rezultat je izbirčen podatkov, ki je dovolj spreten, da hitro razišče podatkovni projekt in pripravi odgovore na (visoka) vprašanja vodstva. (o podatkovnih znanstvenikih v Data Scientist: Nove rock zvezde sveta tehnikov.)

Za negovanje podatkovnih znanstvenikov se morajo podjetja bolj osredotočiti na kulturo in organizacijsko strukturo. Številni podatkovni delavci imajo dovolj znanj in usposabljanja, da hitro postanejo produktivni na več področjih podatkovne inteligence. Težava je v tem, da večina ne deluje v okoljih, ki jih spodbujajo, da postanejo znanstveniki. Zataknjeni so v silosih in omejeni na eno ali dve področji podatkovne inteligence. Pogosto so omejena na uporabo orodij, ki jih "so odobrili" njihovi vodje.

Kako negovati podatkovnega znanstvenika