Domov Zvok Povsod vdelajte analitiko: omogočite strokovnjaku s podatki o državljanih

Povsod vdelajte analitiko: omogočite strokovnjaku s podatki o državljanih

Anonim

Avtor osebja Techopedia, 25. avgusta 2016

Odvzem: Voditeljica Rebecca Jozwiak govori o pojavu vgrajene analitike in znanstvenikov s podatki o državljanih z dr. Robin Bloor, Dez Blanchfield in Davidom Sweenorjem.

Za ogled videoposnetka se morate registrirati za ta dogodek. Za ogled videoposnetka se registrirajte.

Rebecca Jozwiak: Dame in gospodje, pozdravljeni in dobrodošli v Hot Technologies. "Vdelajte povsod: omogočanje državljanskih podatkov znanstvenika" je naša današnja tema. Jaz vnašam vašega običajnega gostitelja, to je Rebecca Jozwiak, ki polni Eric Kavanagh. Ja, letos je vroče. Zlasti izraz "data scientist" dobiva veliko pozornosti, čeprav smo jih včasih imenovali dolgočasna imena, kot sta "statistik" ali "strokovnjak za analitiko", v veliki meri se ukvarjajo z isto vrsto dejavnosti, vendar ima novo seksi ime in zbrala veliko pozornosti. Zelo zaželeno je, da imajo na delovnem mestu, koristno za organizacijo, in vsi si ga želijo. So pa: 1) dragi, 2) težko najti. Veste, vse več je bilo novic o pomanjkanju spretnosti znanstvenika, vendar kljub temu ponujajo ogromno vrednost za organizacijo in ljudje se nekako trudijo, da bi ugotovili, kako pridobiti to vrednost, ne da bi spustili niti denarja, tako da govoriti.

Dobra novica pa je, da vidimo, da se pojavljajo orodja in programska oprema, ki nekako nadomeščajo to pomanjkanje. Imamo avtomatizacijo, strojno učenje, vgrajeno analitiko, o čemer se bomo danes učili, in to je nekako povod za nov izraz, "državljan s podatki o državljanih", in kaj to pomeni? Ne, to ni vaš usposobljeni podatkovni znanstvenik, lahko je vaš poslovni uporabnik, vaš strokovnjak za BI, nekdo iz IT-ja, nekdo, ki ima svoje znanje, morda pa ne nujno tudi strokovno znanje. Toda to orodja in programska oprema omogoča, da več ljudi dostopa do teh pametnih rešitev, čeprav globoko kodiranje morda ne pozna. A le pomaga izboljšati uspešnost na splošno, ko vsem omogočite malo več dostopa do te analitične misli. Izobraževanja vam ni treba nujno imeti, da bi imeli radovednost, ki lahko privede do dobrih spoznanj za vaše podjetje.

Če danes govorimo, da je z nami naš lastni Robin Bloor, glavni analitik v skupini Bloor, sam eden od neuglednih podatkov, znanstvenik Dez Blanchfield, se je danes udeležil David Sweenor iz podjetja Dell Statistica. In s tem ga bom posredoval Robin Bloorju.

Robin Boor: V redu, hvala za uvod. O tem sem nekako razmišljal v zgodovinskem kontekstu. Tisto, kar dejansko gledamo tukaj, je ena od zamisli Leonarda da Vincija za nekakšno jadralno letalo, ki bi ga človek lahko postavil na hrbet. Pojma nimam, ali bi dejansko delovalo. Ne bi se zapletel, moram reči. Vendar da Vinci, kadar pomislim na da Vincija, o njem pomislim kot o enem najbolj radovednih in analitičnih ljudi, kar jih je kdaj bilo. In povsem jasno je, če samo pogledate na to jadralno letalo, da je zasnovan na podlagi ptičjega krila in je tako ali drugače preučil letenja ptic, da bi ga zgradil.

Če vzamemo zgodovinsko perspektivo - to sem dejansko pogledal - analitika je morda najstarejša uporaba matematike. Obstajajo popisi, ki segajo vsaj v babilonske čase. Za to vemo, ker je v bistvu nekaj klinopisnih tablic, ki imajo na sebi takšne podatke. Ni znano, ali se je kaj prej vrnilo. Toda očitno je, da si priskrbiš civilizacijo z veliko populacijo ljudi, pravzaprav to zahteva načrtovanje in vredno je vedeti, kaj načrtuješ in kakšne so zahteve teh ljudi.

In tako se je začelo in tudi tam se je začelo računanje, ker so bili pravzaprav zgodnji računalniki, zgodnji mehanski računalniki, mislim, da je bil prvi popis, ki ga je ustvaril Hollerith, ki je postal IBM, verjamem. Vse to se je premaknilo naprej. Med 70. leti in današnjim dnem je prišlo do neke vrste vmesne povezave, kjer je ogromno drugih aplikacij in analitike, lahko bi rekli, sedelo nazaj. Da, dogajala se je analitika - dogajalo se je v velikih organizacijah, zlasti bankah in zavarovalnicah, pravzaprav General Electric in telco in podobne stvari -, vendar se v splošnem niso uporabljali v poslu in zdaj se na splošno navadijo posel. In to je spremenilo igro, res. Prva stvar, na katero sem mislil, da bom opozoril, je podatkovna piramida, ki mi je še posebej všeč. To sem, mislim, narisal sem eno od teh pred 20 leti - vsaj 20 let nazaj -, da sem poskusil in razumel, resnično, takrat sem poskušal razumeti BI in nekatere zgodnje pridobivanje podatkov, ki se izvajajo. Tu sem definiral pojem podatkov in primeri so signali, meritve, posnetki, dogodki, transakcije, izračuni, seštevanja, posamezne informacije. Lahko si jih predstavljate kot molekule informacij, vendar so to posamezne točke. Informacije postanejo takoj, ko dobijo kontekst. Povezani podatki, strukturirani podatki, baze podatkov, vizualizacija podatkov, ploterji, spletkarji in ontologije - vsi se po mojem mnenju uvrščajo med informacije, saj to, kar ste storili, skupaj zbere veliko raznolikosti in ustvari nekaj več kot točka podatkov, nekaj, kar dejansko ima obliko, matematično obliko.

Zgoraj imamo znanje. Z raziskovanjem informacij se lahko naučimo, da obstajajo različni vzorci in da lahko te vzorce izkoristimo s formuliranjem pravil, politik, smernic, postopkov, nato pa dobi obliko znanja. In skoraj vsi računalniški programi, kar koli delajo, so neke vrste znanje, saj delujejo proti podatkom in zanje uporabljajo pravila. Te tri plasti imamo, čedalje večja je izboljšava med sloji. Na levi strani tega diagrama so prikazani novi podatki, zato je veliko teh stvari statičnih. Podatki se nabirajo, informacije se nabirajo in znanje potencialno raste. Na vrhu imamo "Razumevanje" in trdila bi, čeprav gre za filozofski argument, da razumevanje obstaja samo pri ljudeh. Če se motim zaradi tega, nas bodo v nekem trenutku vsi zamenjali računalniki. A namesto da bi razpravljal, bom šel na naslednji diapozitiv.

Ko sem pogledal to, zanimivo, to je nekaj novega, zanimivo je bilo poskusiti in ugotoviti, kaj analitika pravzaprav je. In sčasoma sem z risanjem različnih diagramov in na koncu z enim, ki je bil videti tako, prišel do zaključka, da je pravzaprav razvoj analitike res samo razvoj programske opreme z ogromno količino matematičnih formul. Analitično raziskovanje se nekoliko razlikuje od razvoja programske opreme v smislu, da bi dejansko uporabili veliko, veliko različnih modelov in jih raziskali, da bi ustvarili novo znanje o podatkih. Ko pa ga ustvarite, se uresniči bodisi v tem, kar se mi zdi kot podpiranje pasivne odločitve, to je informacija, ki se uporabniku šele poda; podpora za interaktivno odločanje, ki je na primer OLAP, kjer uporabnik dobi strukturiran nabor podatkov, ki jih lahko razišče in sklepa zase z uporabo različnih orodij, ki so na voljo. Veliko vizualizacije je tako. In potem imamo avtomatizacijo, če lahko samo nekaj analitičnega vpogleda, ki ste ga zbrali, spremenite v nabor pravil, ki jih je mogoče implementirati, ni nujno, da človek sodeluje. Tako sem na to gledal, ko sem vse to počel. In razne stvari so se mi začele dogajati. Ko bomo nekoč območje dejavnosti, recimo, nekoč domena podatkov dejansko minirali, temeljito minirali, temeljito raziskali v vseh možnih smereh, sčasoma le postanejo kristalizirani BI. Izmišljeno znanje začne postati znanje, ki različne uporabnike obvešča na različne načine in povečuje njihovo sposobnost, da upajo, da dejansko opravijo svoje delo.

Ena izmed stvari, ki sem jo opazil in sem na prediktivno analitiko gledal približno pet let, vendar prediktivna analitika postaja BI, v smislu, da se samo spreminja v koristne informacije, ki jih lahko hranimo ljudem in kot sem že poudaril, obstaja avtomatizirano poročanje o BI, BI explorative, BI, zelo različne ocene in napovedna analitika dejansko potekajo v vseh treh smereh. In analitični postopek, kot sem poudaril, ni tako različen kot razvoj programske opreme, saj ga izvajajo le različni ljudje z nekoliko drugačnimi znanji. Predpostavljam, da moram poudariti, da so za pridobitev resnično dobrega podatkovnega znanstvenika potrebne veščine, ki jih potrebujejo leta. Niso jih zlahka pridobiti in veliko ljudi ne zmore, vendar je to zato, ker vključuje razumevanje matematike na zelo sofisticirani ravni, da bi vedeli, kaj velja in kaj ni veljavno. Razvoj analitike, odkrivanje novega znanja, implantacija analitike, gre za to, da znanje postane operativno. To je takšno ozadje, ki ga vidim celotna analitika. Gre za ogromno območje in zanj je veliko, veliko razsežnosti, vendar mislim, da posploševanje velja za vse.

Potem je tu poslovna motnja, kot sem omenil, obstaja več organizacij, farmacevtska podjetja so še ena, ki imajo v svojem DNK analitiko. Vendar pa obstaja veliko organizacij, ki tega res nimajo v svojem DNK, in zdaj imajo to sposobnost, zdaj sta programska oprema in strojna oprema veliko bolj poceni kot nekoč, zdaj pa jo lahko izkoriščajo. Rekel bi številne stvari. Prva stvar je, da je analitika v mnogih primerih raziskava in razvoj. Morda preprosto uporabljate analitiko na določenem področju organizacije in zdi se nam, da na tak ali drugačen način znova analizirate naročila strank z različnih vidikov in jih povezujete z drugimi podatki. Toda analitika pravzaprav ustvarja možnost, da si ogledujemo organizacijo kot celoto in v veliki meri analiziramo posamezne dejavnosti, ki se dogajajo znotraj organizacije in celotnih verig dejavnosti. Ko pa se dejansko preselite na to področje, bi trdila, da gre za raziskave in razvoj. In obstaja vprašanje, ki so mi ga postavili že nekajkrat, in sicer: "Koliko bi moralo podjetje porabiti za analitiko?" In mislim, da je najboljši način za rešitev odgovora razmišljati o analitiki kot raziskavah in razvoju. in samo vprašajte: "Pa koliko bi porabili za raziskave in razvoj na področju učinkovitosti poslovanja?"

In podjetja, ki niso analitična, obstaja veliko stvari, ki jih ne poznajo. Najprej ne vedo, kako to storiti. Običajno, če bodo dejansko tako ali drugače sprejeli analitiko v organizaciji - v resnici nimajo druge možnosti, kot da bi se posvetovali s svetovanjem, ki jim lahko pri tem pomaga, ker bi bilo večini nemogoče ali res zelo težko. podjetja dejansko zaposlijo podatkovnega znanstvenika, ki ga najdejo, ga plačajo in jim dejansko zaupajo, da bodo počeli tisto, kar želite. Zelo težko. Večina podjetij ne ve, kako zaposliti ali izobraževati osebje, da to dejansko opravi, in razlog je v tem, da ga še ni v DNK, zato to ni del njihovih naravnih poslovnih procesov. To vodi v naslednjo točko. Ne vedo, kako naj to postanejo poslovni procesi. Najboljši način je, da mimogrede kopirate tisto, kar farmacevtske družbe in zavarovalnice, samo poglejte, nekatera podjetja v zdravstvenem domu pa samo pogledajo, kako uporabljajo analitiko in ga kopirajo. Ker gre za poslovni proces. Ne vem, kako bi ga policija ali presojala. To je res, še posebej zdaj, ko je ogromno programskih podjetij ustvarilo izdelke, ki avtomatizirajo ogromno analitike. Pomembno je vprašanje revizije, ko imate na mestu svetovalca ali nekoga, ki mu je mogoče zaupati, da bo razumel, kakšni so rezultati kakršnega koli analitičnega izračuna, to je neke vrste izbira, vendar če vstavite res močna analitična orodja v roke ljudi, ki analitike ne razumejo pravilno, bodo verjetno skočile na zaključke, ki morda niso pravilni. In kot sem že rekel, podjetja ne vedo, kako naj zanjo izračunajo proračun.

To so okusi analitike, samo prešel jih bom skozi. Statistična analitika in statistično modeliranje se bistveno razlikujeta od napovedne analitike, večina pa je mimogrede prilegajoča krivulji. Strojno učenje se razlikuje od tistih stvari, analitika poti in časovne vrste, kar v bistvu poteka v statusnih tokovih, so spet drugačni. Grafična analitika je spet drugačna, besedilna in pomenska analitika pa sta spet različna. To samo kaže, da gre za zelo več žanrsko stvar. Ne gre, ne začnete z analitiko, začnete gledati na težave, ki jih imate, in iščete različna orodja in različne okuse analitike, ki jim bodo ustrezali. In končno, neto mreža. Menim, da je zaradi razvoja strojne in programske opreme analitika v povojih. Pred nami je še veliko, veliko več in videli bomo, da se bo razvilo v prihodnjih letih. Mislim, da lahko zdaj žogo dam Dezu.

Dez Blanchfield: Ja, spregovori o težkem dejanju, Robin. Na kratko bom obiskal to temo iz enega mojih najljubših zornih kotov, ki je človeški kot. V našem vsakdanjem življenju se dogaja toliko sprememb. Ena največjih motenj v našem vsakodnevnem življenju, ki je trenutno po mojem mnenju, je prav vsakdanje delo. Če se vrnete v službo in poskušate opravljati delo, ki ste ga najeli, in vedno večje pričakovanje, da boste prešli od vsakdanjega človeka do superjunaka, in količine informacij, ki se pretakajo po organizacijah in oddajajo zelo, zelo hitro, to je velik izziv in vedno več moramo ljudem nuditi boljša in boljša orodja, s katerimi se bodo lahko preizkusili v pretoku znanja in informacij, zato sem mislil, da bom poskusil in prišel do tega iz malo zabavnega zornega kota . Ampak vedno me preseneti, kako imamo to visoko miselnost ali bliskovne mobe in podobno, ki nas nekako vodijo k temu, o čemer govorimo kot o analitiki, toda v resnici to, o čemer govorimo, daje ljudem informacije na voljo in omogoči jim, da medsebojno komunicirajo z njim in to počnejo tako, da je naravno in da se počutijo normalno.

In pravzaprav me spominja na YouTube video posnetek majhnega otroka, majhnega otroka, ki sedi na tleh in sedi tam, se igra z iPadom in se vrti okoli ter ščipa in stisne ter premika slike in se igra z zaslonom, podatki tam. In potem starš vzame iPad in na otrokovo naročje postavi revijo, tiskano revijo. In ta otrok verjetno ni star več kot dve leti. Otrok začne poskusiti in mahati z zaslonom revije ter ščipa in stiska in revija se ne odziva. Otrok dvigne prst navzgor in ga pogleda ter si misli: "Hmm, mislim, da prst ne deluje, " in se potakne v roko in si misli: "Ah ne, moj prst deluje, čutim svojo roko in to izgleda dobro, "in pomiri prst, prst pa se vihti in se odzove. Da. Nato znova poskuša komunicirati z revijo in nizko in glej, da ne ščipa in stiska in ne pomika. Nato odvzamejo revijo in dajo iPad nazaj v naročje, in kar naenkrat, stvar deluje. In tukaj je dojenček, ki je zraven in usposobljen za uporabo analitičnega orodja ali orodja za pretakanje v živo za zabavo in ne more razbrati, kako naj revija deluje in kako prelista strani.

In to je sam po sebi zanimiv koncept. Ko pa razmišljam o znanju, ki se giblje po organizacijah, in o načinu pretoka podatkov ter o tem, kako se ljudje obnašajo, pogosto pomislim na ta koncept tega, kar so se ljudje naučili biti flash mob, ki je dogodek, kamor in kateri družbeni mediji naredijo to je še lažje narediti, ideja kot taka, da se ob tem času in datumu in akciji odpravite na to mesto ali posnamete videoposnetke in se naučite teh plesov ali pa nosite to barvno kapo in ob eni uri pokažite proti severu. In to potisneš skozi svojo mrežo in nenehno se cel kup ljudi, na stotine njih, istočasno pojavi na istem mestu in stori isto, in tu je ta čudovit dejavnik, kot je: "Sveta krava, to je bilo resnično impresivno! "Ampak v resnici gre za res preprosto idejo in preprost koncept, ki ga zgolj potisnemo skozi naša omrežja in dosežemo ta izid, ki je vizualno osupljiva in zvočno impresivna stvar. In ko razmišljate o organizaciji, načinu, kako želimo, da se ljudje obnašajo, in o tem, kako želimo, da se ukvarjajo z informacijskimi sistemi in strankami, je pogosto to preprosto, je ideja ali koncept ali kulturna ali vedenjska lastnost, ki jo poskušamo prenesti s pomočjo orodij in informacij ter njihovo krepitev možnosti

In podpiram vse to, kar je ta mantra, ki jo imam že dve desetletji in pol, in to je, če vaši uslužbenci ne bodo našli tega, kar potrebujejo za svoje delo, pa naj bodo to orodja ali informacije, vedno bodo izumili kolo. In to je zdaj vse večji izziv, kjer imamo veliko znanja, veliko informacij in stvari, ki se zelo hitro premikajo, da želimo ustaviti, da bi ljudje ponovno izumili kolo. In ko smo razmišljali o svojem delovnem okolju, ko smo se vrnili k ljudem, ki je eden mojih najljubših, sem bil presenečen, ko smo bili presenečeni, da kabine niso ugodno okolje za dobre rezultate, ali smo stvari postavili tako grozno slike tukaj, in to se ni veliko spremenilo, samo spustilo stene in jih poimenovalo odprti delovni prostori. Toda na sredini z rumeno zanko okoli njih izmenjata znanje dva človeka. In vendar, če pogledate preostali del sobe, vsi tam sedijo in tam poskušajo zmetati, dajejo podatke v zaslon. Pogosteje ne gre za izmenjavo znanja in podatkov in za to obstaja vrsta razlogov. Ampak interakcija na sredini tal na levi v rumenem krogu, tam dva klepetata tam, izmenjujeta znanje in verjetno poskušata najti nekaj, poskušata reči: "Ali veste, kje je to poročilo, kje sem lahko najdem te podatke, kakšno orodje uporabim za to? "In verjetno ni delovalo, tako da nimajo ničesar, in se sprehodil po tleh, prekršil pravilo pisarniškega prostora in to storil osebno.

Okoli pisarne smo imeli podobna okolja, v katerih se šalimo, a resničnost je, da so precej močni in učinkoviti. In ena izmed mojih najljubših je mobilna ali fiksna analitična platforma, imenovana vodni hladilnik, kjer ljudje vstanejo tam in tam klepetajo in si izmenjujejo znanje ter primerjajo ideje in izvajajo analitiko, medtem ko stojijo pri hladilniku vode in menjajo ideje. So zelo močni koncepti, ko pomisliš na njih. In če jih lahko prevedete v svoje sisteme in orodja, dobite neverjeten rezultat. In imamo najljubšega najljubšega, to je v bistvu najmočnejše pisarniško središče za distribucijo podatkov, sicer znano kot sprejemnica. In če nečesa ne najdeš, kam greš? Torej, greš pred pisarno in greš na recepcijo in rečeš: »Ali veš, kje je x, y, z?« In upam si, da mi bo kdo rekel, da tega niso storili vsaj enkrat v novem službo ali v nekem trenutku, ko nečesa ne najdejo. In vprašati se morate, zakaj je tako? Nekje mora biti na intranetu ali kakšnem orodju ali kar koli drugega. Najti ga je treba enostavno.

Torej, ko gre za podatke in analitiko ter orodja, ki smo jim zagotovili naše osebje, da opravljajo svoje delo in način, kako ljudje komunicirajo z delovnimi mesti, sem videl, da sem pred nedavnim pojavom orodij za analitiko in velikimi podatkovnimi platformami ali "obdelava podatkov", kot jo imenujejo v stari šoli, poročanje in izmenjava znanja še zdaleč ni bila dinamična ali skupna ali odprta, in ko pomislite na vrsto sistemov, s katerimi pričakujemo, da bodo ljudje opravljali svoje delo, smo imeli klasično, kaj ljudje zdaj kličejo zapuščino, toda v resnici je, da je tu le zapuščina in je še danes tu, zato v resnici ni zapuščina. Toda tradicionalni sistemi HR in ERP - upravljanje s človeškimi viri, načrtovanje podjetniških virov, upravljanje podatkov v podjetju in sistemi, ki jih uporabljamo za upravljanje informacij za vodenje podjetja. Neprekinjeno se odstrani. In od zgoraj, preproste platforme, kot so oddelčni intraneti, ki poskušajo sporočiti, kje so stvari in kako jih doseči ter kako komunicirati z znanjem okoli kraja. To poiščemo na našem intranetu. Dober je le kot ljudje, ki si vložijo čas in trud, da to postavijo tam zgoraj, sicer ti to le ostane v glavi. Ali imate podatke, ki sedijo vse na dnu prehranjevalne verige, v podjetjih SAN in vse vmes, zato so omrežja skladiščnih prostorov polna datotek in podatkov, toda kdo ve, kje jih najti.

Pogosteje kot ne, smo zgradili te zaprte podatkovne platforme ali zaprte sisteme in tako so se ljudje obrnili na všečke preglednic in PowerPointov, da bi prenašali informacije po kraju. Toda v mojem umu se je pred kratkim zgodilo zanimivo, in to je, da mobilne naprave in internet na splošno delujejo tako, da so stvari dejansko boljše. In pretežno v potrošniškem prostoru. Zanimivo je, da smo v vsakdanjem življenju začeli imeti stvari, kot je internetno bančništvo. Za interakcijo z njimi nam ni bilo treba fizično obiskati banke, to smo lahko storili po telefonu. Prvotno je bilo to nerodno, potem pa je prišel internet in imeli smo spletno stran. Veste, in kolikokrat ste bili v zadnjem času na svoji banki? Pravzaprav ne morem, o tem sem se pogovarjal drugi dan in se pravzaprav ne spomnim, kdaj sem zadnjič šel na svojo banko, kar sem bil precej šokiran, mislil sem, da se tega moram spomniti, vendar je bilo tako dolgo pred tem se pravzaprav ne spomnim, kdaj sem šel tja. In tako imamo zdaj te pripomočke v roki v obliki mobilnih telefonov, telefonov, tablic in prenosnih računalnikov, imamo omrežja in dostop do orodij in sistemov ter potrošniškega prostora, ki smo se naučili, da so stvari lahko boljše, ampak zato hitre spremembe v potrošniškem prostoru, ki je bila bolj letargična in ledeniške spremembe v podjetju in okolju, te spremembe nismo vedno sprejeli v vsakdanje delovno življenje.

Rad se zabavam ob dejstvu, da ne morete v živo prenašati podatkov na papir. Na tej sliki je oseba, ki sedi in gleda analitiko, ki je bila opravljena, in tam je čudovit graf, ki ga je izdelal nekdo, ki mu je verjetno plačal veliko denarja kot statistik ali aktuar, in tam sedi in poskuša narediti analitika na papirju in pokukanje nanjo. Ampak tukaj je zastrašujoča stvar: Na primer ti ljudje v tej sobi za sestanke in to bom uporabil kot primer, saj komunicirajo s podatki, ki so zdaj že zgodovinski. In stara je že od takrat, ko je bila ta stvar izdelana in nato natisnjena, zato je morda to poročilo, ki je staro teden dni. Zdaj sprejemajo odločitve o ne toliko slabih podatkih, temveč o starih podatkih, ki so vedno lahko tudi slabi podatki. Danes sprejemajo odločitev na podlagi nečesa zgodovinskega, kar je resnično slabo mesto. Uspeli smo nadomestiti tiskano kopijo s tablicami in telefoni, ker smo v potrošniškem prostoru zelo hitro delali, zdaj pa smo to razvili v podjetniškem prostoru, da je realni čas vpogled v realno časovno vrednost.

In pri tem smo vedno boljši. In pripeljem me do tega, da se je Robin postavil že prej, to je bil koncept znanstvenika o državljanskih podatkih in gonilo tega koncepta. Zame je, da je državljan s podatki o državljanih le redni ljudje s pravimi orodji in informacijami o podobnosti iPada. Ni jim treba opraviti matematike, ne potrebujejo algoritmov, ne smejo vedeti, kako uporabiti algoritme in upravljati podatke, le vedeti morajo, kako uporabljati vmesnik. In to me vrne k mojemu uvodu in konceptu malčka, ki sedi tam z iPadom proti reviji in proti iPadu. Otroček se lahko zelo hitro, intuitivno nauči, kako uporabljati vmesnik iPada, da se poglobi v informacije in z njimi komunicira, čeprav morda igra ali pretakanje medijev ali videoposnetka. Toda od revijske vrstice in utripajoče strani za stranjo ni bilo mogoče dobiti enakega odziva ali interakcije, kar ni zelo zanimivo, še posebej, če ste malček, ki je odrasel z iPadi. Neizogibno lahko človeka zelo hitro pogledajo in se naučijo, kako voziti orodja in stvari, če jih le zagotovimo in če jim zagotovimo vmesnik, kot so mobilne naprave in zlasti tablični računalniki in pametni telefoni z dovolj velikimi zasloni, še posebej, če lahko komunicirate ti na dotik, s premiki prstov, kar naenkrat dobiš ta pojem državljana podatkov.

Nekdo, ki zna uporabiti podatkovne znanosti s pravimi orodji, vendar dejansko ne ve, kako to storiti. In v mojih mislih je veliko tega, kot sem rekel, gnalo vpliv potrošnikov, ki se je preselilo in spremenilo v povpraševanje in podjetje. Nekaj ​​res hitrih primerov. Mnogi od nas bi začeli s svojimi spletnimi dnevniki in spletnimi mesti, na primer z majhnimi oglasi ali gledanjem sledenja in gibanja, uporabljali smo orodja, kot je Google Analytics, in prebudili so nas dejstva, da v naših blogih in na majhnih spletnih mestih, lahko vanj vstavimo majhne koščke kode in Google nam bo v realnem času omogočil vpogled v to, kdo obišče spletno stran, kdaj in kje ter kako. In v resničnem času smo lahko videli, kako ljudje posegajo po spletnem mestu, gredo po straneh in potem izginjajo. In to je bilo precej presenetljivo. Še vedno rad to počnem, ko poskušam razložiti analitiko v realnem času ljudem, da to samo prikažem, da jim pokažem spletno mesto z vklopljenim Google Analyticsom in dejansko vidim interakcijo v živo z ljudmi, ki posegajo po spletnih mestih, in jih vprašam: "Zamislite, če imeli ste takšne vpoglede v svoje podjetje v realnem času. "

Vzemite primer trgovine na drobno in morda farmacevtskega proizvoda, mislim, da ga v Ameriki imenujete trgovina z drogami, lekarno, v katero hodite in kupujete vse, od tablet za glavobol do sončne kreme in klobukov. Poskus vodenja te organizacije brez informacij v realnem času je strašljiv koncept, zdaj vemo, kaj vemo. Na primer, lahko merite promet z nogami, naprave lahko okoli trgovine postavite z nasmejanim obrazom na eni strani zaslona, ​​ker ste srečni, in nesrečno rdečo na skrajni desni in nekaj različnih odtenkov na sredini. In danes obstaja platforma z imenom »Veseli ali ne«, na kateri se sprehodite v trgovino in lahko pocrkljate vesel ali žalosten obraz, odvisno od povratnih informacij o občutkih strank. In to je lahko v realnem času interaktivno. Dobite lahko ceno, ki temelji na povpraševanju. Če je tam veliko ljudi, lahko cene nekoliko povišate, lahko pa naredite razpoložljivost zalog in ljudem recimo sporočite, na primer letalske družbe bodo ljudem povedale, koliko sedežev je na voljo na spletnem mestu, ko če rezervirate let, ne le naključno pokličete in upate, da se lahko prijavite in dobite let. Podatki o HR-jevih v živo lahko razberete, kdaj se ljudje začenjajo in izhajajo. Nabava, če imate naročila in imate podatke v živo, lahko počnete stvari, kot so počakajte eno uro, in zaščitite pred ceno ameriškega dolarja, da kupite svoj naslednji tovor in natovorite stvari.

Ko ljudem pokažem Google Analytics in prenašam tovrstno anekdoto, ta trenutek eureke, ta trenutek "a-ha!", Se v njihovi glavi ugasne ta žarnica, kot je: "Hmm, vidim veliko krajev, kjer bi to lahko storil . Ko bi le imel orodja in če bi le imel dostop do tega znanja. "In to zdaj opažamo na družbenih medijih. Vsak, ki je uporabnik družabnih medijev, ki ne ve samo, da prikazuje fotografije svojega zajtrka, ponavadi pogleda, koliko všečkov dobi in koliko prometa dobi in koliko prijateljev dobi, in to stori z všeč, recimo, Twitter kot orodje za analitiko. Pojdite na Twitter.com in uporabite orodje, vendar vtipkate v piko na i. Google Twitter Analytics ali kliknete zgornji desni gumb in spustite meni in naredite, dobite te lepe, žive grafe, ki vam povejo, koliko tweeta, ki ga opravljate sami, in koliko interakcij z njimi. In analitika v realnem času samo na vaših osebnih socialnih medijih. Predstavljajte si, če bi imeli všeč Google Analytics in Facebook ter LinkedIn in Twitter, statistika eBaya prihaja na vas, vendar v vašem delovnem okolju.

Zdaj imamo spletno in mobilno mrežo v živo na dosegu roke in postaja koncept moči. In tako me pripelje do mojega zaključka in to je, da sem vedno ugotovil, da organizacije, ki zgodaj uporabljajo orodje in tehnologijo, pridobijo tako pomembno prednost pred svojimi konkurenti, da konkurenti dejansko nikoli ne bodo dohiteli. In to zdaj opažamo s konfliktom podatkov o državljanih. Če lahko vzamemo ljudi s spretnostmi, znanjem, za katerega smo jih najeli, in jim lahko ponudimo prava orodja, zlasti možnost, da vidijo podatke v realnem času in odkrijejo podatke ter vedo, kje je, ne da bi se sprehajali po kabinah in postavljajte vprašanja na glas, da bi morali iti in stati pri hladilniku vode, da bi naredili primerjalno analitiko z ljudmi ali pojdite in vprašajte sprejem, kje je indeks. Če to lahko storijo na dosegu roke in jih lahko sprejmejo na sestanke s seboj in sedijo v sejni sobi, ki v realnem času brska po zaslonih in ne v papirnati kopiji, kar naenkrat smo usposobili naše osebje, ki jim ni treba biti dejanski podatkovnih znanstvenikov, ampak za dejansko uporabo podatkovnih znanosti in doseganje neverjetnih rezultatov za organizacije. In mislim, da je ta prelomna točka, ki smo jo dejansko prenesli zdaj, ko je potrošnik vpeljan v podjetje, izziv, kako to podjetje zagotoviti, in to je tema, ki jo mislim v današnji razpravi. In s tem bom zavil svoj kos in predal, da bom slišal, kako bi to lahko rešili. David, k tebi.

David Sweenor: V redu, veliko hvala, fantje, in hvala Robin. Veste, Robin, strinjam se z vašo prvotno oceno. Analitični proces, pravzaprav ni nič drugega kot razvoj programske opreme. Mislim, da je izziv znotraj organizacije resnično res, veste, morda stvari niso tako natančno opredeljene, morda je v njej raziskovalna komponenta in ustvarjalna komponenta. In Dez, veš, strinjam se s tabo, veliko je na novo izumiti kolo, in veš, da danes ni organizacije, v katero bi šel, se sprašujete, no, zakaj to počnete tako? Zakaj posel teče tako? Preprosto je dvomiti in velikokrat, ko si znotraj organizacije, je težko spremeniti. Obožujem analogijo, potrošništvo stvari. In tako ne več, ko grem na letališče in si želim zamenjati sedež - to počnem na svojem mobilnem telefonu. Ni mi treba iti do agenta na stojnici in 15 minut opazovati, kako to vtipka na enobarvni monitor, da spremenim svoj sedež. Raje to počnem po telefonu in tako je zanimiv razvoj dogodkov.

Danes se bomo malo pogovarjali o kolektivni inteligenci. Za tiste, ki se ne zavedajo, je Statistica vrhunska analitična platforma, ki jo že več kot 30 let. Če pogledate katero od publikacij v analitični industriji, se vedno izkaže kot ena najbolj intuitivnih in enostavnih za uporabo naprednega programskega paketa za analitiko. Tako smo zadnjih nekaj let delali na konceptu, imenovanem kolektivna inteligenca, in ga prenašamo na naslednjo raven. Ta pogovor sem želel začeti z: kako delo poteka v vaši organizaciji?

In tu sta dve sliki. Tista na levi je slika iz šestdesetih, kariere pa nisem začel v šestdesetih, ampak slika na desni je - to je tovarna polprevodnikov, kjer sem začel delati. In jaz sem delal v tisti črni zgradbi, zgoraj v zgornjem levem kotu. Vendar so izdelovali polprevodniške stvari. To je zadnja slika iz Google Images. Ko pa se vrnete na sliko iz šestdesetih let na levi, je zelo zanimiva. Ti ljudje sedijo v vrsti in izdelujejo, veste, integrirana vezja in polprevodnike. Ampak obstaja standardizacija, obstaja standarden način, kako narediti stvari, in bil je dobro opredeljen postopek. Veste, morda, ker vsi ti ljudje sedijo v odprtem okolju, je bilo morda nekaj sodelovanja. Mislim, da smo to izgubili v okviru delovne sile.

Ko sem sedel v tisti stavbi v zgornjem levem kotu, če bi hotel sodelovati z nekom, ni bilo odprto. Bili so ti uradi, morda je bila kakšna ekipa oddaljena ali pa sem moral hoditi čez ta kampus; bilo je 25 minut hoje in moral bi se pogovoriti z nekom v stavbi na skrajni desni strani. Mislim, da smo na poti nekaj izgubili. In tako, veste, imel sem isto misel, zakaj ljudje - koliko ljudi vnovič izumlja kolo v vaši organizaciji? Mislim, da veste, organizacije kot celote so v 90. in 2000 letih dobro sodelovale s CRM in shranjevanjem podatkov ter do neke mere z BI. Iz neznanega razloga analitika nekoliko zaostaja. Bilo je veliko vlaganj v shranjevanje podatkov in standardizacijo ter normalizacijo vaših podatkov in vse to ter CRM, vendar analitika iz nekega razloga zaostaja. In sprašujem se, zakaj. Mogoče obstaja kreativa - morda vaš postopek ni dobro opredeljen, morda ne veste, na katero odločitev ali vzvod, ki ga želite v svojem podjetju spremeniti, spremenite stvari. Ko danes gremo v organizacije, je veliko ljudi, ki delajo ročno v preglednicah.

In veste, danes sem zjutraj pogledal statistiko, mislim, da je pisalo, da ima 80, 90 odstotkov preglednic napake in nekatere od teh so lahko zelo pomembne. Tako kot tista v kitu, kjer je JPMorgan Chase zaradi napak v preglednici izgubil milijarde in milijarde dolarjev. Tako mislim, da mislim, da mora biti boljši način, da se stvari uredijo. In kot smo omenili, imamo te znanstvenike. Ti fantje so dragi in jih je težko najti. In včasih so nekoliko čudne račke. Ampak mislim, da veste, če bi moral povzeti, kaj je podatkovni znanstvenik, verjetno kdo razume podatke. Mislim, da nekdo razume matematiko, nekdo, ki razume problem. In res nekdo, ki zna sporočiti rezultate. In če ste podatkovni znanstvenik, ste danes zelo srečni, saj se je vaša plača v zadnjih letih verjetno podvojila.

Resnici na ljubo, veliko organizacij nima teh znanstvenikov, toda vaša organizacija ima pametne ljudi. Imate organizacijo, imate veliko pametnih ljudi in uporabljajo preglednice. Veste, statistika in matematika nista njuni osnovni nalogi, vendar pa podatke uporabljata za napredek podjetja. Resnično, izziv, ki ga obravnavamo, je, kako sprejeti, če imaš srečo, da imaš podatkovnega znanstvenika ali statistika ali dva, kako jih lahko sprejmeš in kako lahko izboljšaš sodelovanje med temi ljudmi in drugi posamezniki v vaši organizaciji? Če si ogledamo, kako je strukturirana naša organizacija, bom začel, in šel bom od desne proti levi. In vem, da je to za nazaj, vendar imamo to poslovno uporabnico.

To je večina vaše populacije, ki dela na znanju, in za te ljudi morate vdelati analitiko v svojo poslovno aplikacijo. Morda vidijo analitični izhod na zaslonu klicnega centra ali kaj podobnega, kar jim sporoča, da bodo lahko kupcu ponudili naslednjo najboljšo ponudbo. Mogoče je potrošnik ali dobavitelj na spletnem portalu in jim to takoj da kredit, ali podobne stvari. Toda ideja je, da porabljajo analitiko. Če gremo na sredino, so to ti delavci z znanjem. To so ljudje, ki danes delajo s preglednicami, vendar so preglednice nagnjene k napakam in v nekem trenutku jim zmanjka goriva. Ti znanstveniki s podatki o državljanih, kot jih imenujemo, veste, kar poskušamo storiti zanje, je resnično povečati stopnjo avtomatizacije.

In s pomočjo analitike slišite, da je od 80 do 90 odstotkov dela v predpripravi za podatke, in ne gre za dejansko matematiko, ampak za pripravo podatkov. To poskušamo avtomatizirati, ne glede na to, ali imamo čarovnike, predloge in stvari za večkratno uporabo, in v resnici vam ni treba imeti znanja o osnovni infrastrukturi v vašem okolju. In če pogledamo skrajno levo, imamo te znanstvenike. In kot sem omenil, jih primanjkuje. In kar poskušamo narediti, da bi bili bolj produktivni, je, da jim omogočimo, da ustvarijo stvari, ki jih lahko delajo ti znanstveniki s podatki o državljanih. Mislite na to kot na blok Lego, tako da lahko ti znanstveniki s podatki ustvarijo sredstvo za večkratno uporabo, ki ga lahko uporabi državljan s področja podatkov. Zgradite ga enkrat, tako da nam ni treba še naprej izumljati kolesa.

In potem lahko tudi ti fantje skrbijo, če lahko počnemo stvari v bazi podatkov in izkoristimo obstoječe naložbe v tehnologijo, ki jih je izvedlo vaše podjetje. Veste, v tem dnevu in starosti ni smiselno premeščati podatkov po vsem svetu. Če torej pogledamo Statistico, kot sem že omenil, gre za platformo, ki je že precej dolgo. In je zelo inovativen izdelek. Mešanje podatkov, ni bilo podatkovnega vira, do katerega ne bi mogli dostopati. Imamo vse stvari odkrivanja in vizualizacije podatkov, ki bi jih pričakovali; lahko to storimo v realnem času. In verjetno je - mislim, da je v programskem orodju več kot 16.000 analitičnih funkcij, tako da je to več matematike, kot sem jo kdaj lahko uporabil ali razumel, vendar je tam, če jo potrebujete.

Imamo možnost kombiniranja poslovnih pravil in analitičnih delovnih procesov, da se resnično poslovno odločimo. Če presegate samo, tukaj je algoritem, tukaj je potek dela, vendar imate poslovna pravila, s katerimi se morate vedno spoprijeti. Pri upravljanju smo zelo varni. V veliko farmacevtskih strank smo vajeni, saj nam FDA zaupa. Veste, samo dokaz v pudingu, da imamo možnost nadzora in revizije, da jih sprejmemo. In nazadnje, veste, da smo odprti, prilagodljivi in ​​razširljivi, zato morate ustvariti platformo, ki je taka, želite, da so vaši podatki znanstveniki produktivni, želite, da bodo vaši državljani podatkovni znanstveniki produktivni, želite imeti možnost za razporeditev teh analitičnih rezultatov delavcem v vaši organizaciji.

Če si ga ogledamo, je tukaj primer nekaterih vizualizacij. Ker lahko svoj analitični rezultat distribuirate med poslovne uporabnike, zato je prvi primer na levi strani mrežni analitični diagram. In morda ste preiskovalec goljufij in ne veste, kako nastanejo te povezave, in to so lahko ljudje, to so lahko entitete, to so lahko pogodbe, resnično karkoli. Toda lahko to manipulirate z miško in z njo komunicirate, da resnično razumete - če ste preiskovalec goljufij, da razumete prednostni seznam, kdo gre v preiskavo, kajne, ker se ne morete pogovarjati z vsemi, torej imate dajati prednost.

Če pogledamo sliko na desni strani tam, za nadzorno armaturno ploščo je to resnično zanimiva težava. Morda ste lastnik letališča in imate te skenerje telesa tam. Če se odpravite na letališče, imajo te skenerje telesa približno devet mesecev roka trajanja. In te stvari so res, res drage. Če imam na svojem letališču več vstopnih točk, več skenerjev, številka ena, se želim prepričati, da sem na vseh vratih ustrezno usposobljen, za dele, ki so v optičnih bralnikih, pa jih tudi ne želim naročiti zgodaj in si jih želim, preden se pokvari. Imamo zmogljivosti, morda če imate letališče, da lahko predvidimo, kdaj se bodo te stvari zlomile, in napovemo število osebja.

Če pogledamo spodnji desni del, je to, če ste v proizvodnem okolju, je to le grafični prikaz proizvodnega toka. In to je nekoliko težko razbrati, toda na teh različnih sektorjih procesov obstajajo rdeči in zeleni semaforji, tako da, če sem inženir, gre tam zelo prefinjena matematika, vendar se lahko v tem posebnem sektorju podrobneje seznanim in pogledam parametre in vnos, ki morda povzroči, da to ne bo pod nadzorom. Če pogledamo našega znanstvenika za podatke o državljanih, je naš cilj resnično olajšati podatke, ki jo imajo državljani. Imamo čarovnike in predloge in ena stvar, ki se mi zdi res zanimiva, je, ali imamo to samodejno vozlišče za preverjanje zdravja podatkov. In res, kaj to počne, ima vgrajene pametnice.

Omenil sem pripravo podatkov - traja veliko časa, tako pri zbiranju podatkov kot pri pripravi. Predpostavimo pa, da imam svoje podatke, lahko jih vodim skozi to vozlišče za preverjanje podatkov o zdravju in preverja invariance, redkost in odmike, in vse te stvari napolni manjkajoče vrednosti in naredi veliko matematike, ki je ne Ne razumem, zato lahko sprejmem privzete nastavitve ali če sem malo bolj pameten, jih lahko spremenim. Bistvo pa je, da želimo postopek avtomatizirati. Ta stvar ima približno 15 različnih pregledov in rezultatov v očiščenem naboru podatkov. To, kar počnemo, ljudem olajšamo ustvarjanje teh delovnih procesov.

Tukaj govorimo o sodelovanju med znanstveniki podatkov in državljani. Če pogledamo te slike na desni, opazimo ta potek dela za pripravo podatkov. In morda je to zelo prefinjeno, morda je to skrivna omaka vašega podjetja, ne vem, toda vemo, da lahko nekdo v vaši organizaciji dostopa do enega ali več teh podatkovnih silosov, ki jih imamo. Potrebujemo pot, številka ena, jih pograbimo in zlepimo skupaj, in številka dve, morda obstaja posebna obdelava, ki jo želimo izvesti, da je to zunaj našega zdravstvenega pregleda, in to je skrivna omaka vašega podjetja. Ta delovni potek lahko ustvarim v naši organizaciji in se strni kot vozlišče. Vidite puščico, ki kaže navzdol, je samo vozlišče, in v organizaciji imamo lahko sto teh stvari. Ideja je, da imamo ljudi, ki nekaj vedo o določenem prostoru, lahko ustvarijo potek dela in nekdo drug lahko to ponovno uporabi. Poskušamo čim bolj zmanjšati ponovno postavitev kolesa.

Enako lahko storimo tudi z delom v analitičnem modeliranju. V tem primeru na desni strani, ta potek dela, morda obstaja 15 različnih algoritmov in želim izbrati najboljšega za nalogo. In kot študentu podatkov o državljanih mi ni treba razumeti, kaj se dogaja v tistem neredu pajkove mreže, ampak se le strne v vozlišče in morda to vozlišče preprosto reče: "izračunaj oceno kreditnega tveganja." "Izračunaj priložnost kirurške okužbe na mestu, "kaj imate. »Izračunajte verjetnost, da bo šlo za goljufivo transakcijo.« Kot znanstvenik s podatki o državljanih lahko uporabim to zelo prefinjeno matematiko, ki jo je zgradil nekdo drug, morda je kdo od teh znanstvenikov vgradil v mojo organizacijo.

Z vidika podatkovne znanosti veste, pogovarjal sem se s podatkovnimi znanstveniki, ki radi pišejo kodo, in govoril sem s podatki, ki sovražijo pisanje kode. In to je v redu, zato imamo zelo vizualni, grafični uporabniški vmesnik. Zgrabimo lahko svoje podatke, lahko opravimo avtomatizirano zdravstveno preverjanje podatkov in morda želim napisati kodo. Všeč mi je Python, všeč mi je R, ampak ideja je, da so ti znanstveniki, ki jih primanjkuje, jim primanjkuje kode v določenem jeziku. Nimamo posebej želje, v kateri jezik želite vnesti kodo, tako da, če želite narediti R, naredite R; če želite narediti Python, naredite Python. To je super. Če želite analitiko razširiti na Azure, jo razstavite v oblak. In zato je cilj tukaj resnično ponuditi fleksibilnost in možnosti, da bodo vaši podatki znanstveniki čim bolj produktivni.

Zdaj podatkovni znanstveniki, so precej pametni ljudje, vendar morda niso strokovnjaki za vse in morda je nekaj vrzeli v tem, kar lahko storijo. In če pogledate znotraj panoge, obstaja veliko različnih analitičnih trgov. To je primer, morda moram narediti prepoznavanje slike in nimam te veščine, morda pa grem v Algoritmijo in dobim algoritem za prepoznavanje slike. Mogoče grem ven na Apervita in dobim čisto poseben algoritem zdravstvenega varstva. Mogoče bi rad uporabil nekaj v knjižnici strojnega učenja Azure. Mogoče bi rad uporabil kaj v domači platformi Statistica.

Ponovno je ideja, da želimo podpirati globalno analitično skupnost. Ker v štirih stenah ne boste imeli vseh znanj, kako lahko ustvarimo programsko opremo - in to tudi počnemo -, ki omogoča, da vaši podatkovni strokovnjaki uporabljajo algoritme z različnih trgov. To počnemo že dolgo z R in Python, vendar to razširja na te trge aplikacij, ki obstajajo tam. In enako kot vidite tukaj na vrhu tega, mi uporabljamo H2O za Spark, tako da je tam veliko analitičnih algoritmov. Ni treba, da se osredotočite na njihovo ustvarjanje iz nič, ponovno jih uporabimo, ki živijo v odprtokodni skupnosti, in želimo, da bodo ti ljudje čim bolj produktivni.

Naslednji korak, ko imamo državljane in državljane podatkov, je, kako spodbujate in razširjate te najboljše prakse? Znotraj naše programske opreme imamo tehnologijo, ki vam omogoča distribucijo analitike kamor koli. In to je bolj pogled na upravljanje modela, vendar me več ne vežejo štirje zidovi ali posebna instalacija znotraj Tulse, Tajvana ali Kalifornije, ali kaj imate vi. To je globalna platforma in imamo veliko, veliko strank, ki jih uporablja pri uporabi na več mestih.

In resnično, ključne stvari so, če nekaj delaš na Tajvanu in hočeš ponoviti v Braziliji, je to super. Pojdite tja, zgrabite predloge za večkratno uporabo in zgrabite delovne tokove, ki jih želite. To poskuša ustvariti te standarde in skupni način, zato povsod ne počnemo popolnoma drugače. In druga ključna sestavina tega je, da resnično želimo, da matematiko odnesemo tam, kjer podatki živijo. Ni vam treba premeščati podatkov med, veste, Kalifornijo in Tulso ter Tajvanom in Brazilijo. Imamo tehnologijo, ki nam omogoča, da matematiko upoštevamo podatke, na to temo pa bomo imeli še eno spletno oddajo Hot Technology.

Ampak temu rečemo ta arhitektura, in tu je nenavaden pogled, Native Distributed Analytics Architecture. Ključna ideja tega je, da imamo platformo, Statistica, in analitični potek dela lahko izvozim kot atom. Lahko bi naredil model ali celoten potek dela, tako da to ni pomembno. To pa lahko ustvarim in izvozim v jeziku, ki ustreza ciljni platformi. Na levi strani tega počne veliko ljudi, vendar v izvornem sistemu točkojejo. To je v redu, lahko naredimo točkovanje in zgradimo model v bazi podatkov, tako da je zanimivo.

In potem na desni strani imamo Boomi. To je spremljevalna tehnologija, pri vsem tem sodelujemo. Lahko pa prevzamemo tudi te delovne procese in jih v bistvu prevažamo kamor koli po svetu. Vse, kar ima IP naslov. In ni mi treba namestiti statistike v javni ali zasebni oblak. Vse, kar lahko poganja JVM, lahko te analitične delovne tokove, predpripravljanje podatkovnih delovnih procesov ali samo modele izvajamo na kateri koli od teh ciljnih platform. Ne glede na to, ali gre v mojem javnem ali zasebnem oblaku, pa naj bo to v mojem traktorju, avtomobilu, domu, žarnici, mojem internetu stvari, imamo tehnologijo, ki vam omogoča, da te delovne tokove prepeljete kamor koli po svetu.

Preglejmo. Veste, imamo poslovne uporabnike, zato ti ljudje, ki jih imamo, nam tehnologija omogoča, da porabijo proizvod v obliki, ki jim ustreza. Imamo znanstvenike s podatki o državljanih in to, kar poskušamo, je izboljšati sodelovanje, jih narediti del ekipe, kajne? In zato želimo, da ljudje nehajo znova izumljati kolesa. In imamo te znanstvenike, tam lahko pride do vrzeli v spretnostih, vendar lahko kodirajo v jeziku, ki ga želijo, lahko gredo na analitične trge in tam uporabljajo algoritme. In s tem, kako si ne bi mogli misliti, da je s tem vse super? To je popolno, to počnemo. Gradimo delovne tokove za večkratno uporabo, dajemo navodila ljudem, dajemo jim Lego bloke, da lahko gradijo te mogočne gradove in karkoli že želijo. Če povzamemo, imamo platformo, ki opolnomoči poslovne uporabnike, znanstvenike s podatki o državljanih, strokovnjake za podatke programerjev - lahko se lotimo kakršnih koli primerov uporabe IoT edge analitike in omogočimo ta pojem kolektivne inteligence. S tem mislim, da ga bomo verjetno odprli za vprašanja.

Robin Bloor: No v redu. Mislim, da prvo - mislim, če sem iskren, mislim, da me je Dell Statistica že prej seznanil, in če sem iskren, sem pravzaprav precej presenečen nad stvarmi, za katere nisem vedel, da ste jih predstavili na predstavitvi . In moram reči, da je ena stvar, to je nekaj, kar je zame hrošč med sprejetjem analitike, ali je to, da dobite orodje, kajne? Zunaj je ogromno orodij, orodja z odprto kodo in podobno in tako naprej, poleg tega pa obstajajo različne, polovične platforme. Mislim pa, da je razlika, ki jo imaš, še posebej navdušila nad nekim delom.

Razlika je v tem, da se zdi, da zagotavljate konec do konca. Kot da je analitika prefinjen poslovni postopek, ki se začne s pridobivanjem podatkov, nato pa preide celo vrsto korakov, odvisno od tega, kako lahki so podatki, nato pa se lahko razveja v celo vrsto različnih matematičnih napadov na podatkov. In potem se pojavijo rezultati na tak ali drugačen način in to je treba ukrepati. Naletela sem na ogromno analitike, kjer je bilo narejenega veliko dela, vendar ni treba ukrepati. In zdi se vam, da imate ogromno tega, kar se zahteva. Ne vem, kako obsežen je, vendar je bolj obsežen, kot sem pričakoval. Nad tem sem neverjetno navdušen.

Rada bi komentirala preglednice. Nekaj ​​ste že povedali, toda ena od stvari, ki sem jo opazil in sem tekom let opazil, pa je vse bolj očitno, je, da je ogromno preglednic, ki so senčni sistemi in res mislim, Razpredelnica, mislim, bilo je čudovito orodje ob uvedbi in je bilo čudovito od nekdaj na veliko različnih načinov, vendar je posplošeno orodje, v resnici ni primerno svojemu namenu. Vsekakor ni zelo dobro v kontekstu BI in mislim, da je v analitičnem kontekstu grozno. In spraševal sem se, ali imate pripombe glede, recimo, primerov, kjer je, če veste, Statistica izpuhtela, prekomerna uporaba preglednice ali kakšen komentar, ki bi ga radi o tem dali?

David Sweenor: Ja, mislim, da lahko veste, da lahko najdete znane napake v preglednici. Google ali drug iskalnik, ki ga uporabljate, se bo vrnil z obilico rezultatov. Mislim, da ne vemo, da bomo kdaj nadomestili preglednice. To ni naš namen, toda veliko organizacij, v katere obiskujem, obstaja nekaj teh čarovnikov za preglednice ali nindže ali karkoli želiš, da jih pokličete, vendar imajo te zelo zapletene preglednice in morate razmišljati, kaj se zgodi ljudje zmagajo v loto in se ne vrnejo? Torej, kar poskušamo narediti, je, da vemo, da bodo preglednice obstajale, da jih lahko zaužijemo, toda mislim, da je tisto, kar poskušamo narediti, razviti vizualno predstavitev vašega delovnega toka, da bo mogoče razumeti in deliti z drugimi ljudmi . Preglednice so precej težke in jih je težko deliti. In takoj, ko mi pošljete preglednico, sem jo spremenil, zdaj pa se ne moremo sinhronizirati in dobivamo različne odgovore. To, kar poskušamo, je, da postavimo nekaj varoval in da bodo stvari nekoliko učinkovitejše. In preglednice so resnično grozne, če združite več podatkovnih nizov, veste? Tam padejo. Ampak ne bomo jih nadomestili, jih zaužijemo in imamo ljudi, ki se začnejo premikati, ker če imamo vozlišče, ki pravi "izračunaj tveganje", to poskuša narediti oseba, ki uporablja preglednico. Torej teh ni več.

Robin Bloor: Ja, mislim, rekel bi, da, veste, z enega vidika, na katerega gledam stvari, bi rekel, da so preglednice odlične za ustvarjanje informacij. Odlični so celo za ustvarjanje otokov znanja, vendar so resnično slabi za izmenjavo znanja. Nimajo mehanizma za to, in če nekomu posredujete preglednico, ni tako, kot bi jo lahko prebrali, kot da je članek, ki natančno razloži, kaj počnejo. Enostavno ni tam. Menim, da veste, da je stvar, ki me je najbolj navdušila pri predstavitvi in ​​o zmogljivostih Statistice, videti neverjetno agnostična. Toda ta nit teče skozi tok dela. Ali imam prav, če domnevam, da si lahko ogledate pretok delovnega toka vse od zajema podatkov do vdelave rezultatov v določene BI-programe ali celo zagnane aplikacije?

David Sweenor: Ja, absolutno. In ima to sposobnost do konca in nekatere organizacije to uporabljajo v celoti, in nobenega nobenega podjetja nobeno podjetje danes ne kupuje od enega prodajalca. Imamo miks. Nekateri uporabljajo Statistico za vse, nekateri pa jo uporabljajo za modeliranje delovnih tokov, nekateri pa jo uporabljajo za pripravo podatkovnih procesov. Nekateri ga uporabljajo za distribucijo sto inženirskih poročil inženirjem. In tako imamo vse vmes. In res je od konca do konca in je, veste, agnostistična platforma, saj če obstajajo algoritmi, ki jih želite uporabiti v R ali Python, Azure, Apervita, ne glede na to, kar veste, jih uporabite. To je čudovito, bodite produktivni, uporabljajte, kar veste, uporabljajte tisto, kar vam je všeč, in imamo mehanizme, s katerimi bomo zagotovili, da so ti nadzorovani in pregledni in vse take stvari.

Robin Bloor: Ta vidik tega mi je še posebej všeč. Mislim, ne vem, ali lahko govoriš več kot to, kar si rekel bogastvu tistega, kar je tam zunaj. Mislim, gledal sem na to, vendar si tega nisem ogledal izčrpno in zagotovo je v naših knjižnicah ogromno Python knjižnic, vendar lahko k tej sliki dodate še kaj? Ker menim, da je zelo zanimiva stvar, saj veste, da bi imeli komponente, ki so vredne zaupanja, saj ste poznali različne ljudi, ki so jih ustvarili, in različne ljudi, ki so jih uporabljali, ki bi jih lahko prenesli. Veste, ali lahko obogatite, kar ste že povedali o tem?

David Sweenor: Ja, mislim, da so nekatere tržnice aplikacij, saj veste, trge algoritmov tam zunaj. Na primer, dr. John Cromwell z univerze v Iowi, je razvil model, ki bo napovedoval, ki se uporablja v realnem času, medtem ko se bomo operirali, vam bo dal oceno, če boste želeli dobiti kirurška okužba na mestu. In če je rezultat dovolj visok, bodo posredovali v operacijski sobi. To je zelo zanimivo. Morda obstaja še ena bolnišnica, ki ni tako velika. No, Apervita je tržnica zdravstvenih aplikacij za analitiko. Lahko ga najdete na veliko teh trgov z aplikacijami, najdete ga in ga znova uporabite, transakcija pa je med vami in kdorkoli je lastnik, lahko pa jo najdete ali pa rečete: "Tukaj je kaj potrebujem. "Mislim, da to izkorišča to globalno skupnost, ker so danes vsi strokovnjaki in ne morete vedeti vsega. Mislim, da sta R in Python ena stvar, vendar ta ideja o: "Želim opraviti to funkcijo, postaviti spekcijo na eno od teh trgov z aplikacijami in naj nekdo razvije za vas." In to lahko zaslužijo, mislim, da to je zelo zanimivo in zelo drugače kot čisto odprtokodni model.

Robin Bloor: V redu. Kakorkoli, žogo bom poslal Dezu. Bi se rad potapljal, Dez?

Dez Blanchfield: Absolutno in rad bi ostal za trenutek na preglednici, ker mislim, da je ujel pravo vsebino tega, o čemer govorimo tukaj. In Robin si komentiral, kar zadeva prehod s starih preglednic v njihovi fizični v elektronsko obliko. Zanimiva stvar se je zgodila tam, kjer veste, ko so bile prvotno preglednice stvar, so bile le listi papirja z vrsticami in stolpci in ste ročno zapisali stvari, nato pa jih prenesli in izračunali, bodisi tako, da naredite to z vrha glave ali s kakšno drugo napravo. Vendar imamo še vedno priložnost, da napake zdrsnejo z napakami pri rokopisu ali disleksijo in zdaj smo to nadomestili s tipkami. Tveganje je, da je s preglednicami profil tveganja hitrejši in večji, vendar menim, da orodja, kot je Statistica, obrnejo piramido tveganja.

To sliko pogosto narišem na belo tablo človeškega bitja na vrhu, kot ena oseba, nato pa zbirko le-teh na dnu, recimo, predstavljamo jih deset na dnu te deske in narišem piramida, kjer je točka piramide pri posamezni osebi in vznožje piramide zbirka ljudi. In to uporabljam za vizualizacijo ideje, da če ena oseba na vrhu dela preglednico, naredi napako in jo deli z desetimi ljudmi, zdaj pa imamo deset izvodov napake. Bodite zelo previdni pri svojih makronih in bodite zelo previdni pri svojem Visual Basic, če se boste premaknili k temu. Ker pri izdelavi elektronskih orodij, kot so preglednice, je zelo močan, hkrati pa močan tudi na dober in slab način.

Mislim, da orodja, kot je Statistica, prinašajo možnost, da obrnejo ta profil tveganja, in to je, da lahko zdaj pridete do točke, ko imate veliko orodij, ki so na voljo posamezni osebi in ko gre iz številnih orodij na vrhu piramide in nato do samega dna, kjer je točka piramide zdaj obrnjena, dejansko orodje, če imamo ekipo ljudi, ki gradijo ta orodja in te algoritme. In podatkovnemu znanstveniku ni treba, da bi bil strokovnjak za regresijsko analitiko svojih podatkov. Morda bodo lahko uporabljali orodje, vendar boste morda imeli pet ali šest statistikov in aktuarja ter podatkovnega strokovnjaka in nekaj matematikov, ki delajo na tem orodju, ta modul, algoritem, ta vtičnik in tako v jeziku preglednice, torej predstavljajte si, da so vsaka objavljena preglednica, ki jo lahko uporabite, dejansko napisani s strani strokovnjakov, ki so preizkusili makrone, preizkusili Visual Basic, poskrbeli, da algoritmi delujejo, tako da ko jih dobite, lahko samo vnesete podatke vanj, vendar jih dejansko niste mogli zlomiti in zato je boljši nadzor.

Mislim, da to počne veliko analitičnih orodij. Predvidevam, da je to bistvo, ali to zdaj vidite na terenu, ali vidite prehod iz preglednic, ki bi lahko povzročil napake in napake in tveganje, do točke, ko orodja, ki jih gradite s svojim zdaj, če je odkrivanje podatkov natančno v realnem času in ljudje, ki gradijo module in algoritme, odstranjujejo ali zmanjšujejo ta profil tveganja? Ali služba za stranke to vidi v resničnem smislu ali menite, da se to šele dogaja in tega ne zavedajo?

David Sweenor: Veste, mislim, da obstaja nekaj načinov za odgovor na to. Toda to, kar vidimo, je v kateri koli organizaciji, in omenil sem, da je analitika, za katero mislim, da je zaostajala z vidika korporativnih naložb, kar smo počeli s shranjevanjem podatkov in CRM. Kar vidimo, torej je potrebno veliko spremeniti organizacijo in prevladati nad organizacijsko inercijo. Toda to, kar vidimo, so ljudje, ki si jih jemljejo v preglednice, sestavljajo svoje delovne tokove, in omenil sem varnost in upravljanje: "No, morda imam preglednico, " "No, to lahko zaklenem in lahko nadziram različico." In vidimo veliko organizacij, morda se tam šele začnejo. In če je spremenjeno, je tu potek dela, in na koncu grem, čeprav številka ena, kdo ga je spremenil? Zakaj so ga spremenili Ko so jo spremenili. Prav tako lahko delovni tok nastavim tako, da te nove preglednice ne bom dal v proizvodnjo, razen če je potrjena in preverjena s strani ene, dve, tri, ne glede na to, koliko strani želite določiti v svojem delovnem toku. Mislim, da ljudje začenjajo jemati, organizacije pa tam že začnejo korakati do otroškega koraka, vendar bi verjetno predlagal, da imamo še dolgo pot.

Dez Blanchfield: Dejansko in mislim, da glede na to, da gradite na varnostnih kontrolah in upravljanju tam, lahko delovna obremenitev to samodejno preslika v in vse do glavnega direktorja za tveganje, kar je zdaj stvar. Začnete lahko nadzirati, kako dostopate do teh orodij in sistemov in kdo počne, kaj je z njimi, zato je to zelo zmogljivo. Mislim, da gre pri drugih stvareh za to, da vrste orodij, ki jih ponujate, posojajo človeško vedenje bolj kot tradicionalnim preglednicam, o katerih govorimo, češ da imam sobo polno ljudi z isto nadzorno ploščo in dostopom do istih podatkov, da lahko dejansko dobijo drugačen pogled in posledično dobijo nekoliko drugačne vpoglede iz istih informacij, ki ustrezajo njihovim potrebam, tako da lahko sodelujejo. Nato imamo bolj človeški pogled in interakcijo s podjetjem in postopkom sprejemanja odločitev, v nasprotju s tem, da gremo na isti sestanek z isto PowerPoint in izpisane iste preglednice, vsi isti fiksni podatki.

Ali opazite prehod v vedenju in kulturi v organizacijah, ki nekako prevzamejo vaše orodje zdaj tam, kjer vidijo, da se dogaja, kjer ni pet ljudi v sobi, ki gledajo v isto preglednico in jo poskušajo samo verbalizirati in si zapisati zapiske zdaj pa dejansko sodelujejo z nadzornimi ploščami in orodji v realnem času, z vizualizacijo in analitiko na dosegu roke ter dobijo povsem drugačen tok pogovora in interakcije, ne le na sestankih, ampak zgolj na splošno sodelovanje okoli organizacije? Ker to zmorejo v realnem času, ker lahko postavijo vprašanja in dobijo pravi odgovor. Je to trend, ki ga trenutno opažate ali se to še ni zgodilo?

David Sweenor: Ne, mislim, da se je vsekakor začelo po tej poti in mislim, da je zelo zanimiva stvar, če veste, če vzamemo za primer primer tovarne. Mogoče želi nekdo, ki je lastnik določenega sektorja procesov znotraj te tovarne, videti in nanje na določen način vpogleda v te podatke. In morda jaz, spregledam vse procese, morda ta na dnu, morda si želim pogledati čez vse. Mislim, da je to, kar vidimo, številka ena, ljudje začnejo uporabljati skupni niz vizualizacij ali standardnih vizualizacij v svojih organizacijah, vendar je tudi prilagojeno vlogi, v kateri so. Če sem procesni inženir, morda To je zelo drugačen pogled kot nekdo, ki na to gleda z vidika dobavne verige, in mislim, da je to super, ker mora biti prilagojen in ga je treba gledati skozi objektiv, ki ga morate opraviti.

Dez Blanchfield: Predvidevam, da se postopek odločanja izkaže časovno in hitro, da se tudi pametne in natančne odločitve hitro povečajo, kajne? Ker če imate analitiko v realnem času, nadzorne plošče v realnem času, če imate orodja Statistica na dosegu roke, vam ni treba teči po tleh, da bi šli in koga povprašali o nečem, v tiskani obliki. Lahko nekako sodelujete, komunicirate in dejansko sprejemate odločitve na poti in ta rezultat dobite takoj. Mislim, da nekatera podjetja res še niso dojela, a ko to storijo, bo to ta trenutek eureka, da ja, še vedno lahko ostanemo v svojih kabinah in delamo doma, lahko pa sodelujemo in sodelujemo in te odločitve ko sodelujemo, se takoj pretvorimo v rezultate. Poglej, mislim, da je bilo fantastično slišati, kar imaš do zdaj povedati, in zelo se veselim, kam gre. In vem, da imamo veliko vprašanj v vprašanjih in vprašanjih, zato bom šel nazaj v Rebeko, da bom prebral nekaj teh, da bomo do njih prišli čim hitreje. Najlepša hvala.

Rebecca Jozwiak: Hvala Dez, in ja, Dave, imamo občinstvo kar nekaj vprašanj. In hvala tudi Dez in Robin za vpogled. Vem, da se je morala ta udeleženka odpraviti na vrh ure, vendar se nekako sprašuje, ali menite, da oddelki za informacijske sisteme dajejo večjo prednost sofisticiranim nadzorom podatkov, namesto da bi bili udobni pri zagotavljanju orodij za znanje delavcev? Mislim, je to - pojdi naprej.

David Sweenor: Ja, mislim, da je to odvisno od organizacije. Mislim, da ima banka, zavarovalnica, morda imajo drugačne prioritete in načine, kako ravnati, nasproti marketinški organizaciji. Mislim, da bi moral reči, da je samo odvisno od industrije in funkcije, ki jo iščete. Različne panoge imajo različne usmeritve in poudarke.

Rebecca Jozwiak: V redu, to je smiselno. In potem je še en udeleženec želel vedeti, kaj je motor za Statistico? Je to C ++ ali vaše lastne stvari?

David Sweenor: No, ne vem, če bom lahko s tem dosegel tako specifično, ker je bilo to že 30 let in je bilo razvito pred mojim časom, vendar obstaja osnovna knjižnica analitičnih algoritmov, ki se izvajajo algoritmi Statistica. And you saw here that we also can run R, we can run Python, we can burst to Azure, we can run on Spark at H2O, so I guess I would have to answer that question in terms of, it's a variety of engines. And depending on which algorithm you pick, if it's a Statistica one it runs like this, if you pick one on H2O and Spark, it uses that, and so it's a variety of them.

Rebecca Jozwiak: Okay good. Another attendee kind of asked specifically pointing to this slide, wanting to know, kind of, how does the citizen data scientist know which reusable templates to use? And I guess I'll kind of make a broader question out of that. That, what are you seeing when line-of-business users or business analysts come in and they want to use these tools, how easy is it for them to pick up and go running?

David Sweenor: I guess I would answer that and if you can use, if you're familiar with Windows, this is a Windows-based platform, so I cut off the top of these screenshots, but it's got the Windows ribbon. But how do they know what workflow to use? It looks like the Windows Explorer, so there's a tree structure and you can configure it and set it up however your organization wants to set it up. But it could be, you would just have these folders and you'd put these reusable templates within these folders. And I think there's probably a nomenclature your company could adopt, say here's the “calculate risk profile, ” here's the “get data from these sources” and you name them whatever you want. It's just a free folder, you just drag the notes right out onto your canvas. So, pretty easy.

Rebecca Jozwiak: Okay good. Maybe a demo next time. Then another attendee kind of brings up, and it's what you and Robin and Dez were talking about as far as the inaccuracies, especially on a spreadsheet, but the garbage in/garbage out, and he sees it as being even more critical when it comes to analytics. Kind of mentioning that, you know, misuse of data can really lead to some unfortunate decisions. And he's wondering what your views are on the development of more failsafe algorithms, I guess for the, he uses the word, “overzealous” use of analytics. You know, somebody comes in, they get really excited, they want to do these advanced analytics, they want to run these advanced algorithms, but maybe they're not quite sure. So what do you do to kind of safeguard against that?

David Sweenor: Yeah, so I guess I'll answer this as best I can, but I think everything comes down to people, process and technology. We have technology that helps enable people and helps enable whatever process you want to put in within your organization. In the example of sending a coupon to somebody, maybe that's not as critical, and if it's digital it's really no cost, maybe there's one level of security controls and maybe we don't care. If I am predicting surgical site infections, maybe I want to be a little more careful about that. Or if I am predicting drug quality and safety and things like that, maybe I want to be a little more careful about that. You're right, garbage in/garbage out, so what we try to do is provide a platform that allows you to tailor it to whatever process your organization wants to adopt.

Rebecca Jozwiak: Okay good. I do have a few more questions, but I know we've gone quite a bit past the hour and I just want to tell our presenters, that was awesome. And we want to thank so much Dave Sweenor from Dell Statistica. Of course, Dr. Robin Bloor and Dez Blanchfield, thank you for being the analysts today. We are going to have another webcast next month with Dell Statistica. I know Dave kind of hinted about the topic. It will be about analytics at the edge, another fascinating topic, and I know that some very compelling use cases are going to be discussed on that webcast. If you liked what you saw today, come back for more next month. And with that, folks, I bid you farewell. Najlepša hvala. Adijo.

Povsod vdelajte analitiko: omogočite strokovnjaku s podatki o državljanih