Avtor osebja Techopedia, 28. septembra 2016
Odvzem: Voditeljica Rebecca Jozwiak razpravlja o rešitvah podatkovne arhitekture z Ericom Littleom iz OSTHUS-a, Malcolmom Chisholmom iz First San Francisco Partners in Ronom Huizengo iz IDERA.
Trenutno niste prijavljeni. Če si želite ogledati video, se prijavite ali prijavite.
Rebecca Jozwiak: Dame in gospodje, pozdravljeni in dobrodošli v podjetju Hot Technologies 2016. Danes razpravljamo o „Izdelavi poslovne arhitekture podatkov“, vsekakor vroči temi. Moje ime je Rebecca Jozwiak, jaz bom vaša gostiteljica današnje spletne oddaje. Tweetiramo s hashtagom # HotTech16, tako da če ste že na Twitterju, se lahko tudi vi pridružite temu. Če imate vprašanja kadar koli, jih pošljite v podokno Q&A v spodnjem desnem kotu zaslona in poskrbeli bomo, da bodo nanje odgovorili. Če ne, bomo poskrbeli, da jih bodo naši gostje dobili za vas.
Tako imamo danes resnično očarljivo postavo. Danes je z nami veliko težkih napadalcev. Imamo Eric Little, podpredsednik znanosti o podatkih iz podjetja OSTHUS. Malcolm Chisholm, glavni direktor za inovacije, ki je res kul naslov, za prvo podjetje San Francisco Partners. Imamo Ron Huizenga, starejšega vodjo izdelkov iz IDERA. In, veste, IDERA ima resnično popoln nabor rešitev za upravljanje podatkov in modeliranje. Danes nam bo predstavil, kako deluje njegova rešitev. Toda preden pridemo do tega, Eric Little, ti bom dal žogo.
Eric Little: V redu, hvala lepa. Torej bom preučil nekaj tem, za katere mislim, da se bodo nekoliko nanašale na Ronine razgovore in upam, da bodo postavile tudi oder za nekatere od teh tem, nekaj vprašanj in odgovorov.
Torej, kar me je zanimalo, kaj počne IDERA, je, da mislim, da pravilno opozarjajo, da zapletena okolja v današnjem času dejansko vodijo veliko poslovnih vrednosti. Pod kompleksnimi okolji mislimo na kompleksna podatkovna okolja. In tehnologija se resnično hitro giblje in je težko ohraniti korak v današnjem poslovnem okolju. Tako bodo tisti, ki delajo v tehnoloških prostorih, pogosto videli, da imate stranke, ki delajo težave z: »Kako uporabljam velike podatke? Kako vključim semantiko? Kako povežem nekaj teh novih stvari s svojimi starejšimi podatki? "In tako naprej, in ta vrsta nas danes vodi v te štiri velike podatke, ki jih veliko ljudi že pozna, in vem, da jih je lahko več kot štiri včasih - videl sem jih že osem ali devet - vendar običajno, ko ljudje govorijo o stvareh, kot so veliki podatki ali če govorite o velikih podatkih, potem običajno gledate na nekaj, kar je v podjetju. In tako bodo ljudje rekli, v redu, no, razmislite o obsegu vaših podatkov, ki je običajno fokus - to je samo toliko, ki ga imate. Hitrost podatkov je povezana bodisi s tem, kako hitro jih lahko premikam, bodisi s hitrostjo, ki jo lahko poizvem ali dobim odgovore in podobno. In osebno mislim, da je leva stran tega nekaj, kar se rešuje in se z njim hitro rešuje z veliko različnimi pristopi. Toda na desni strani vidim veliko možnosti za izboljšave in veliko novih tehnologij, ki resnično prihajajo v ospredje. In to je res povezano s tretjim stolpcem, raznolikostjo podatkov.
Z drugimi besedami, večina podjetij danes gleda na strukturirane, polstrukturirane in nestrukturirane podatke. Podatki o slikah začenjajo postati vroča tema, zato lahko z računalniškim vidom, gledanjem pik, s striženjem besedila, NLP-jem, črpanjem entitete, imate grafične podatke, ki izhajajo bodisi iz statističnih modelov bodisi izhajajo iz semantičnih modele, imate relacijske podatke, ki obstajajo v tabelah ipd. In tako združevanje vseh teh podatkov in vseh teh različnih vrst resnično predstavlja velik izziv in to boste videli v Gartnerju in drugih ljudeh, ki nekako sledijo trendom v industriji.
In končna stvar, o kateri ljudje govorijo v velikih podatkih, je pogosto ta pojem besednosti, ki je res negotovost vaših podatkov, nejasnost le-teh. Kako dobro veste, v čem se nanašajo vaši podatki, kako dobro razumete, kaj je tam in, veste? Možnost uporabe statističnih podatkov in zmožnost uporabe neke vrste informacij v zvezi s tem, kar morda poznate, ali uporabo nekega konteksta, je lahko koristna tam. In tako sposobnost pogledati podatke na ta način glede na to, koliko jih imate, kako hitro jih morate premikati ali dobiti, vseh vrst podatkov, ki jih imate v vašem podjetju, in glede tega, kako natančno veste, kje je, kakšen je, kakšne kakovosti ima in podobno. Za to so resnično potrebna velika, usklajena prizadevanja med številnimi posamezniki za učinkovito upravljanje njihovih podatkov. Zato je v današnjem svetu modeliranje podatkov vse bolj pomembno. Tako dobri modeli podatkov resnično prinašajo veliko uspeha v podjetniških aplikacijah.
Viri podatkov imate iz različnih virov, kot smo rekli, kar resnično zahteva veliko različnih vrst integracije. Zato je združevanje vsega skupaj zelo koristno, če želite na primer pognati poizvedbe v številnih vrstah podatkov in povleči informacije nazaj. Če pa želite to narediti, potrebujete dobre strategije preslikave, zato je preslikava teh vrst podatkov in spremljanje teh map lahko pravi izziv. In potem imate to vprašanje, kako naj povežem svoje zapuščene podatke z vsemi temi novimi viri? Recimo, da imam graf, ali vzamem vse svoje relacijske podatke in jih vstavim v graf? Običajno to ni dobra ideja. Kako torej ljudje upravljajo vse te vrste podatkovnih modelov, ki se dogajajo? Analiza je treba resnično opraviti na številnih različnih virih podatkov in kombinacijah. Torej so odgovori, ki izhajajo iz tega, odgovori, ki jih ljudje potrebujejo za resnično dobre poslovne odločitve, kritični.
Torej ne gre samo za gradnjo tehnologije zaradi tehnologije, ampak res, kaj bom storil, kaj lahko naredim z njo, kakšno analizo lahko izvajam in sposobnost, torej, kot sem že Govorili smo o tem, da bi to stvar združili, da bi ga integrirali, resnično zelo pomembno. In ena od teh vrst analiz nato deluje na stvari, kot so združeno iskanje in poizvedbe. To resnično mora postati. Poizvedbe morajo biti običajno navezane v več vrst virov in informacije zanesljivo povleči nazaj.
Ključni element, ki si pogosto, zlasti ljudje, ogledujejo ključne stvari, kot so semantične tehnologije - in to je nekaj, za kar upam, da se bo Ron v pristopu IDERA malo pogovoril - je, kako ločite ali upravljate modelni sloj vaših podatkov iz same podatkovne plasti, iz teh surovih podatkov? Torej navzdol na podatkovni plasti imate morda podatkovne baze, morda podatke o dokumentih, morda preglednice, morda slikovne podatke. Če ste na področjih, kot je farmacevtska industrija, imate ogromno znanstvenih podatkov. In potem poleg tega ljudje običajno iščejo način, kako zgraditi model, ki jim omogoča hitro vključitev teh podatkov in res, ko iščete podatke, zdaj ne želite potegniti vseh podatkov v svojo plast modela, to, kar iščete v sloju modela, je, da vam lepo predstavi, kaj so stvari, skupne besedne zaloge, skupne vrste subjektov in odnosov ter sposobnost, da resnično pridete do podatkov, kjer so. Torej mora povedati, kaj je, in povedati mora, kje je, in povedati, kako to prinesti in vrniti nazaj.
To je bil pristop, ki je bil zelo uspešen pri poganjanju semantičnih tehnologij naprej, kar je področje, na katerem veliko delam. Torej, vprašanje, ki sem ga želel postaviti Ronu in ki bo po mojem mnenju koristen v oddelku Q&A, je videti, kako to doseže platforma IDERA? Je torej sloj modela dejansko ločen od podatkovne plasti? So bolj integrirani? Kako to deluje in kakšni so rezultati in koristi, ki jih vidijo pri svojem pristopu? Zato referenčni podatki res postajajo tudi kritični. Če boste imeli tovrstne modele podatkov, če se boste lahko združili in iskali po stvareh, morate imeti res dobre referenčne podatke. Toda težava je v tem, da je referenčne podatke res težko vzdrževati. Zato je pogosto imenovanje standardov samo po sebi težaven izziv. Ena skupina bo poklicala nekaj X in ena skupina bo poklicala nekaj Y in zdaj imate problem, kako nekdo najde X in Y, ko išče to vrsto informacij? Ker jim ne želite dati le del podatkov, jim želite dati vse povezano. Hkrati se pogoji spreminjajo, postaja programska oprema zastarela in tako naprej, kako sproti spremljate in vzdržujete te referenčne podatke?
In spet, semantične tehnologije, zlasti z uporabo taksonomij in besednjakov, slovarjev podatkov, so omogočile običajen prostorski način tega, ki je resnično močan, uporablja nekatere vrste standardov, vendar je skupnost baz podatkov to storila za dolgo tudi, samo na različne načine. Mislim, da je eden izmed ključnih vprašanj razmišljanje o tem, kako uporabiti morda modele razmerja med subjekti, kako uporabiti morda modele grafov ali kakšen pristop, ki vam bo resnično omogočil standardni način razdalje s svojimi referenčnimi podatki. In potem seveda, ko imate referenčne podatke, morajo strategije preslikave upravljati najrazličnejša imena in entitete. Tako strokovnjaki za zadeve pogosto radi uporabljajo lastne izraze.
Torej je izziv pri tem vedno, kako nekomu dati informacije, vendar jih narediti pomembne za način, kako o njem govorijo? Torej lahko ena skupina gleda na nekaj, na primer, lahko ste kemik, ki dela drogo, in ste strukturni biolog, ki deluje na isti drogi, in morda imate različna imena za iste vrste subjektov ki se nanašajo na vaše polje. Ugotoviti morate načine, kako združiti te prilagojene terminologije, ker je drugi pristop, da morate ljudi prisiliti, da opustijo svoj izraz in uporabijo nekoga drugega, česar pogosto ne marajo. Poleg tega je težava z velikim številom sinonimov težka, zato je v podatkih mnogih ljudi veliko različnih besed, ki se lahko nanašajo na isto stvar. Tam imate težave s sklicevanjem z uporabo številnih odnosov do enega. Specializirani izrazi se razlikujejo od industrije do industrije, tako da, če se boste lotili splošne rešitve za tovrstno upravljanje podatkov, kako enostavno je prenosljiv iz enega projekta ali ene aplikacije v drugo? To je lahko še en izziv.
Avtomatizacija je pomembna in je tudi izziv. Ročno rokovanje z referenčnimi podatki je drago. Dolgo je ročno preslikavati in drago je, da strokovnjaki za zadeve nehajo vsakodnevno opravljati vsakodnevna opravila in morajo vnesti in nenehno popravljati slovarje s podatki in ponovno posodabljati definicije in tako naprej. Repabilni besednjaki resnično prinašajo veliko vrednost. To so besedišča, ki jih lahko najdete zunaj organizacije. Če na primer delate s surovo nafto, bodo nekatere vrste besednih zvez, ki si jih lahko izposodite iz odprtokodnih prostorov, enako s farmacevtskimi izdelki, enako z bančno industrijo in finančnimi, enako kot na mnogih tovrstnih področjih. Ljudje nameščajo besednike, ki jih je mogoče večkrat uporabiti, in jih je mogoče ponoviti za uporabo.
In spet, ko pogledam orodje IDERA, me zanima, kako ravnajo s tem v smislu uporabe različnih standardov. V svetu semantike pogosto vidite stvari, kot so SKOS modeli, ki zagotavljajo standarde za vsaj širše / ožje od odnosov, in to je pri modelih ER težko narediti, toda, veste, ni nemogoče, odvisno je, koliko tega strojev in povezav, ki jih lahko upravljate v teh vrstah sistemov.
Nazadnje sem želel samo primerjati nekaj semantičnih motorjev, ki jih vidim v industriji, in nekako vprašati Rona in ga malce predstaviti, da bi lahko spregovoril o tem, kako se sistem IDERA uporablja v povezavi s kakršnimi koli semantičnimi tehnologijami. Ali ga je mogoče integrirati s trojnimi prodajalnami, bazami grafov? Kako enostavno je uporabljati zunanje vire, saj si lahko te vrste stvari v semantičnem svetu pogosto izposodimo s SPARQL končnimi točkami? Modele RDF ali OWL lahko uvozite neposredno v svoj model - poglejte jih nazaj - tako lahko na primer gen za ontologijo ali proteinsko ontologijo, ki lahko živi nekje v svojem prostoru s svojo upravljavsko strukturo in lahko preprosto uvozim vse oz. del tega, kot ga potrebujem v svoje modele. Zanima me, kako se IDERA loteva tega vprašanja. Ali morate vse vzdrževati v notranjosti ali obstajajo načini, kako uporabiti druge vrste standardiziranih modelov in jih potegniti noter ter kako to deluje? In zadnja stvar, ki sem jo tukaj omenil, je, koliko ročnega dela je resnično vpleteno v izdelavo glosarjev in repozitorij metapodatkov?
Torej vem, da nam bo Ron pokazal nekaj predstavitev o takšnih stvareh, ki bodo res zanimive. Toda težave, s katerimi se pogosto srečujem pri posvetovanju s strankami, so, da pride do veliko napak, če ljudje pišejo v lastnih definicijah ali svojih metapodatkih. Torej imate napačno črkovanje, napake v debelih prstih, to je ena stvar. Dobite tudi ljudi, ki vam lahko vzamejo nekaj, veste, samo Wikipedija ali vir, ki ni nujno takšen, kot bi si želeli v svoji definiciji, ali pa je vaša opredelitev samo z vidika ene osebe, tako da ni popolna in potem ni jasno. kako deluje postopek upravljanja. Gotovo je upravljanje zelo veliko vprašanje, kadar koli govorite o referenčnih podatkih in kadar koli govorite o tem, kako se to lahko ujema z glavnimi podatki nekoga, kako bodo uporabljali svoje metapodatke in tako naprej.
Zato sem želel samo nekaj teh tem postaviti tam. To so predmeti, ki jih v poslovnem prostoru opažam v številnih različnih posvetovalnih poslih in v številnih različnih prostorih, in zelo me zanima, kaj nam bo Ron pokazal z IDERA, da bi izpostavil nekatere od teh tem . Zato najlepša hvala.
Rebecca Jozwiak: Hvala lepa, Eric, in zelo mi je všeč vaš komentar, da se lahko zgodi veliko napak, če ljudje pišejo svoje definicije ali metapodatke. Vem, da v svetu novinarstva obstaja mantra, da "veliko oči naredi malo napak", toda ko gre za praktične aplikacije, preveč rok v kozarcu s piškoti te pušča z veliko pokvarjenih piškotkov, kajne?
Eric Little: Ja, in kalčki.
Rebecca Jozwiak: Ja. S tem bom šel naprej in ga prenesel Malcolmu Chisholmu. Malcolm, tla so tvoja.
Malcolm Chisholm: Najlepša hvala, Rebecca. Želel bi malo pogledati, o čemer je Eric govoril, in dodati nekakšna opažanja, na katera, kot veste, Ron želi odgovoriti tudi, ko govori o "Na poti do poslovno vodene podatkovne arhitekture". "- kaj pomeni voditi poslovanje in zakaj je to pomembno? Ali pa je to le neka oblika hype? Mislim, da ni.
Če pogledamo, kaj se dogaja, odkar veste, da so računalniki z glavnimi okviri res postali na voljo podjetjem - recimo, okoli leta 1964 - do danes, lahko vidimo, da se je veliko spremenilo. In te spremembe bi povzel kot premik od procesnocentričnosti do podatkovne osredotočenosti. In to je tisto, zaradi česar so poslovne arhitekture podatkov tako pomembne in danes tako pomembne. In mislim, da veste, to ni samo buzzword, ampak nekaj povsem resničnega.
Lahko pa cenimo nekoliko več, če se potopimo v zgodovino, tako da gremo nazaj v čas, vse do šestdesetih let prejšnjega stoletja in nekaj časa zatem prevladujejo mainframes. Ti so nato popustili osebnim računalnikom, kjer ste se dejansko uprli uporabnikom, ko so prišli osebni računalniki. Upor proti centralizirani IT, za katerega so menili, da ne izpolnjuje njihovih potreb, ni bil dovolj okreten. To je hitro povzročilo porazdeljeno računalništvo, ko so bili računalniki povezani. In potem se je začel dogajati internet, ki je zameglil meje podjetja - zdaj je lahko sodeloval s strankami zunaj sebe v smislu izmenjave podatkov, kar se prej ni dogajalo. In zdaj smo šli v obdobje oblakov in velikih podatkov, kjer je oblak platforme, ki resnično komoditizirajo infrastrukturo, in tako odhajamo, kot da bi bilo treba, voditi velike podatkovne centre, ker veste, Na voljo nam je zmogljivost oblaka in sočasno s temi velikimi podatki, o katerih je Eric tako zgovorno razpravljal. In na splošno, kot vidimo, ko je prišlo do premika tehnologije, je postalo bolj osredotočeno na podatke, bolj skrbimo za podatke. Tako kot pri internetu, kako se izmenjujejo podatki. Pri velikih podatkih so štirje ali več v samih podatkov.
Hkrati in morda še pomembneje so se primeri poslovne uporabe preusmerili. Ko so bili računalniki prvič predstavljeni, so jih uporabljali za avtomatizacijo stvari, kot so knjige in zapisi. In vse, kar je bil ročni postopek, ki je vključeval knjige ali podobno, je bilo v bistvu programirano po hiši. To se je v 80. letih preusmerilo v razpoložljivost operativnih paketov. Ni vam bilo treba več zapisovati lastnih plačil, lahko kupite nekaj, kar je storilo. To je povzročilo veliko upadanje ali prestrukturiranje številnih oddelkov za IT. Toda takrat se je pojavila poslovna inteligenca s takimi, kot so skladišča podatkov, večinoma v 90. letih. Sledili so poslovni modeli dotcom, ki so bili seveda velika blaznost. Nato MDM. Z MDM začnete opažati, da ne razmišljamo o avtomatizaciji; pravzaprav se osredotočamo na kuriranje podatkov kot podatkov. In nato analitika, ki predstavlja vrednost, ki jo lahko dobite iz podatkov. In znotraj analitike vidite podjetja, ki so zelo uspešna, katerih osnovni poslovni model se vrti okoli podatkov. Google, Twitter, Facebook bi bili del tega, vendar lahko trdite tudi, da je Walmart.
In tako podjetje zdaj resnično razmišlja o podatkih. Kako lahko iz podatkov pridobimo vrednost? Kako lahko podatki vodijo posel, strategijo in smo v zlati dobi podatkov. Glede na to, kaj se dogaja z našo arhitekturo podatkov, če se podatki ne obravnavajo več kot zgolj izpušni plini, ki prihajajo iz zadnjega dela aplikacij, ampak so resnično osrednji za naše poslovne modele? Del težave, ki jo imamo pri doseganju IT-ja, se je resnično zataknil v preteklosti z življenjskim ciklom razvoja sistemov, ki je bil posledica tega, da smo se morali v zgodnji IT tehnologiji hitro spoprijeti s to fazo avtomatizacije procesov in sodelovati v projekti so podobna stvar. Za IT - in to je malce karikatura - toda to, kar poskušam povedati, je, da so nekatere ovire pri pridobivanju poslovne podatkovne arhitekture, ker smo nekako nekritično sprejeli kulturo IT ki izhaja iz pretekle dobe.
Torej vse je projekt. Podrobno mi povejte svoje zahteve. Če stvari ne delujejo, je to zato, ker mi niste povedali svojih zahtev. No, to danes ne deluje s podatki, saj ne začnemo z neavtomatskimi ročnimi procesi ali s tehnično pretvorbo poslovnih procesov, zelo pogosto začnemo z že obstoječimi proizvodnimi podatki, ki jih poskušamo da bi dobili vrednost. Toda nihče, ki sponzorira projekt, osredotočen na podatke, teh podatkov resnično ne razume. Odkriti moramo podatke, analizirati moramo izvorne podatke. In to se v resnici ne ujema z razvojem sistemov, veste - slap, življenjski cikel SDLC - od katerih bi Agile, po mojem mnenju, predstavljal boljšo različico tega.
In v kar se osredotočamo tehnologija in funkcionalnost, ne podatki. Na primer, ko testiramo v fazi testiranja, bo ponavadi delovanje moje funkcionalnosti, recimo moj ETL, vendar podatkov ne testiramo. Ne preizkušamo svojih predpostavk o izvornih podatkih, ki prihajajo. Če bi to storili, bi bili morda v boljši formi in kot nekdo, ki je delal projekte skladišča podatkov in trpel zaradi sprememb, ki so se pojavile na koncu, se mi zdijo močne ETL, bi to cenil. In pravzaprav je tisto, kar želimo videti, testiranje kot predhodni korak k stalnemu spremljanju kakovosti proizvodnih podatkov. Tako imamo tukaj veliko stališč, kjer je težko doseči poslovno usmerjeno arhitekturo podatkov, ker smo pogojeni z erom osredotočenosti na procese. Prehoditi moramo na osredotočenost na podatke. In to ni popoln prehod, saj veste, da je treba opraviti še veliko procesnega dela, vendar v resnici ne razmišljamo v podatkovnem smislu, ko to moramo, in okoliščinah, ki se zgodijo, ko smo res dolžan to storiti.
Zdaj podjetje spozna vrednost podatkov, podatke želijo odkleniti, kako bomo to storili? Kako torej opravimo prehod? No, v središče razvojnih procesov postavljamo podatke. In pustili smo, da podjetje vodi z zahtevami po informacijah. In razumemo, da nihče ne razume obstoječih izvornih podatkov na začetku projekta. Lahko bi trdili, da sta struktura podatkov in podatki sami prišli tja prek IT in operacij, tako da bi to morali vedeti, ampak res ne. To je razvojno usmerjen razvoj. Torej moramo pri razmišljanju o tem, kje in kako izvajamo modeliranje podatkov v svetu, ki je usmerjen na podatke, uporabnikom zagotoviti povratne povratne zanke v smislu izboljšanja njihovih informacijskih zahtev, kot to počnemo pri odkrivanju in profiliranju podatkov., predvidevamo analizo izvornih podatkov, in ko postopoma pridobivamo vedno več gotovosti glede svojih podatkov. In zdaj govorim o bolj tradicionalnem projektu, kot je središče MDM ali podatkovno skladišče, ne nujno velikih projektov s podatki, čeprav to še vedno mislim, dokaj blizu temu. In zato te povratne zanke vključujejo oblikovalce podatkov, saj veste, da postopoma napredujejo svoj podatkovni model in sodelujejo z uporabniki, da se izboljšajo zahteve po informacijah glede na to, kaj je mogoče, kaj je na voljo, iz izvornih podatkov, ko jih bolje razumejo, torej ne gre več za to, da je podatkovni model v takšnem stanju, ki ga še ni, ali je popolnoma dokončan, je postopno usmerjanje tega v ospredje.
Podobno je tudi bolj nizko od tega zagotavljanje kakovosti, kjer razvijamo pravila za preskušanje kakovosti podatkov, da zagotovimo, da so podatki v okviru parametrov, o katerih dajemo predpostavke. Eric se je skliceval na spremembe referenčnih podatkov, ki se lahko zgodijo. Nočete biti žrtev nadaljnjih, neurejenih sprememb na tem področju, tako da lahko pravila za zagotavljanje kakovosti preidejo v post-produkcijo, stalno spremljanje kakovosti podatkov. Tako lahko začnete opažati, ali bomo osredotočeni na podatke, kako se razvoj podatkov, osredotočen na podatke, precej razlikuje od funkcionalnih SDLC in Agile, ki temeljijo na funkcionalnosti. Potem moramo biti pozorni tudi na poslovne poglede. Imamo - in to spet odmeva to, kar je govoril Eric - imamo podatkovni model, ki določa osnovo podatkovne zgodbe za našo bazo podatkov, hkrati pa potrebujemo tiste konceptualne modele, tiste poslovne poglede na podatke, ki jih tradicionalno še niso storili preteklost. Mislimo, da smo včasih pomislili, da lahko podatkovni model vse stori, vendar moramo imeti konceptualni pogled, semantiko in pogledati v podatke, jih upodobiti skozi abstrakcijsko plast, ki model shranjevanja prevede v posel pogled. In spet, vse stvari, o katerih je Eric govoril v smislu semantike, postanejo pomembne za to, zato imamo pravzaprav dodatne naloge modeliranja. Mislim, da je to, saj veste, zanimivo, če ste se znašli kot vodja podatkov, kot sem jaz, in spet nekaj novega.
In na koncu bi rad povedal, da mora tudi večja arhitektura odražati to novo resničnost. Na primer, tradicionalni MDM za stranke je nekakšen, v redu, dajmo podatke o naših kupcih v središče, kjer bomo lahko, saj veste, smiselni v smislu res samo kakovosti podatkov za zaledne aplikacije. Kar je s stališča poslovne strategije nekakšno zehanje. Danes pa si ogledamo vozlišča MDM za stranke, ki imajo v njih dodatne podatke o profilu stranke, ne le statične podatke, ki imajo v resnici dvosmerni vmesnik s transakcijskimi aplikacijami stranke. Da, še vedno podpirajo zaledno pisarno, zdaj pa vemo tudi za to vedenje naših strank. To je dražje graditi. To je bolj zapleteno graditi. Vendar je to poslovno usmerjeno na način, na katerega tradicionalni MDM za stranke ni. Odpravljate usmerjenost k podjetju proti enostavnejšim modelom, ki jih je lažje implementirati, toda za podjetja to želijo videti. Res smo v novi dobi in mislim, da se moramo številni nivoji odzvati na poslovno arhitekturo podatkov in mislim, da je zelo početje, da počnemo stvari.
Torej, hvala, nazaj vam Rebeka.
Rebecca Jozwiak: Hvala Malcolm, in zelo sem užival, kar ste povedali o podatkovnih modelih, mora podpirati poslovni pogled, kajti drugače kot to, kar ste govorili, kjer je IT tako dolgo držala vajeti in nekako ni več tako in da se kultura mora preusmeriti. In precej sem prepričan, da je bil v ozadju pes, ki se je 100% strinjal s tabo. In s tem bom žogo poslal Ronu. Zelo sem navdušena, ko vidim vaš demo. Ron, tla so tvoja.
Ron Huizenga: Najlepša hvala in preden bomo skočili v to, bom šel skozi nekaj diapozitivov in nato še malo predstavitve, ker sta, kot sta poudarila Eric in Malcolm, to zelo široka in globoka tema, in s tem, o čemer danes govorimo, smo samo strgali površino, ker je toliko vidikov in toliko stvari, ki jih moramo resnično upoštevati in pogledati iz poslovno usmerjene arhitekture. Naš pristop je, da iz modelov resnično naredimo ta model in pridobimo resnično vrednost, saj jih lahko uporabite kot komunikacijsko vozilo in tudi plast, ki omogoča drugim sistemom. Ne glede na to, ali delate arhitekturo, usmerjeno v storitve, ali druge stvari, model resnično postane življenjska podoba dogajanja z vsemi metapodatki okoli njega in podatki, ki jih imate v svojem poslu.
To, o čemer bi rad govoril, je že skoraj korak nazaj, saj se je Malcolm dotaknil neke zgodovine poti razvoja rešitev in takšnih stvari. Eden od načinov, kako resnično poudariti, kako pomembno je imeti dobro arhitekturo podatkov, je primer uporabe, s katerim sem se srečeval zelo pogosto, ko sem se posvetoval, preden sem prišel v vlogo upravljanja izdelka, in to je, da bi šel v organizacije ali so delali poslovno preobrazbo ali samo nadomeščali nekatere obstoječe sisteme in tovrstne stvari, in zelo hitro se je pokazalo, kako slabo organizacije razumejo lastne podatke. Če vzamete tak primer uporabe, kot je ta, ne glede na to, ali grete za svetovalca ali je morda to oseba, ki je pravkar začela z organizacijo, ali je bila vaša organizacija z leti pridobljena iz različnih podjetij, kaj končate zelo hitro je zelo kompleksno okolje, ki vključuje številne nove tehnologije in starejše tehnologije, ERP rešitve in vse ostalo.
Ena od stvari, ki jo s svojim pristopom modeliranja resnično lahko naredimo, je odgovor na vprašanje, kako vse to smiselno? Informacije lahko resnično začnemo deliti skupaj, tako da lahko podjetje vzame informacije, ki jih imamo pravilno. In izhaja, kaj imamo v tistih okoljih? Kako lahko s pomočjo modelov izpišem potrebne informacije in jih bolje razumem? In potem imamo tradicionalne vrste metapodatkov za vse različne stvari, kot so relacijski modeli podatkov, in navajeni smo videti stvari, kot so definicije in slovarji podatkov, saj veste, tipi podatkov in ta vrsta stvari. Kaj pa dodatni metapodatki, ki jih želite zajeti, da bi jim res dali še več pomena? Na primer, kateri subjekti so resnično kandidati, ki bi morali biti referenčni podatkovni objekti, ki bi morali biti glavni objekti za upravljanje podatkov in te vrste stvari in jih povezati. In kako informacije tečejo skozi organizacijo? Podatki tečejo, kako jih porabimo tako s procesnega vidika, kot tudi s podatkovno linijo v smislu pretoka informacij skozi naša podjetja in kako se poda skozi različne sisteme ali skozi shranjevanje podatkov, tako da vemo ko gradimo I-rešitve ali te vrste stvari, dejansko porabimo pravilne podatke za nalogo.
In potem je zelo pomembno, kako lahko dosežemo sodelovanje vseh teh zainteresiranih strani, zlasti poslovnih deležnikov, ker ti resnično pomenijo, kakšni so ti podatki. Podjetje na koncu dneva ima v lasti podatke. Vsebujejo opredelitve besednih zvez in stvari, o katerih je govoril Eric, zato potrebujemo kraj, da vse to povežemo skupaj. In to počnemo s pomočjo našega modeliranja podatkov in arhitektur repozitorij podatkov.
Dotaknil se bom nekaj stvari. Govoril bom o ER / Studio Enterprise Team Edition. V glavnem bom govoril o izdelku za arhitekturo podatkov, kjer izvajamo modeliranje podatkov in tovrstne stvari, vendar obstaja še veliko drugih komponent paketa, ki se jih bom zelo na kratko dotaknil. Videli boste en delček Poslovnega arhitekta, kjer lahko naredimo konceptualne modele, lahko pa tudi modele poslovnih procesov in te modele procesov lahko povežemo, da povežemo dejanske podatke, ki jih imamo v naših podatkovnih modelih. Resnično nam pomaga, da povežemo to vez. Programski arhitekt nam omogoča, da naredimo dodatne konstrukcije, kot je nekaj modeliranja UML in tiste vrste stvari, da damo podporno logiko nekaterim drugim sistemom in procesom, o katerih govorimo. Kar pa je zelo pomembno, ko se premikamo navzdol, imamo strežnik skladišča in ekipe in o tem bom govoril kot o dveh polovicah iste stvari. Repozitorij shranjujemo vse modelirane metapodatke in vse poslovne metapodatke v smislu poslovnih glosarjev in izrazov. In ker imamo to okolje, ki temelji na skladišču, lahko vse te različne stvari skupaj zlepimo v isto okolje in nato dejansko omogočimo, da so na voljo za uživanje, ne samo za tehnične ljudi, temveč tudi za poslovneže. In tako resnično začnemo voziti sodelovanje.
In potem je zadnji del, o katerem bom na kratko spregovoril, ko se sprehodiš v ta okolja, tam niso samo baze podatkov. Imeli boste več baz podatkov, shrambe podatkov, imeli boste tudi veliko, kot bi rekel, zapuščenih umetnin. Mogoče so ljudje uporabili Visio ali druge diagrame, da so določili nekaj stvari. Mogoče so imeli druga orodja za modeliranje in takšne stvari. Torej, kar lahko naredimo s programom MetaWizard, je dejansko nekaj teh informacij pridobiti in jih vnesti v naše modele, narediti aktualne in jih lahko ponovno uporabljati, porabiti, ne pa le tam sedeti zunaj. Zdaj postane aktiven del naših delovnih modelov, kar je zelo pomembno.
Ko vstopite v neko organizacijo, kot sem že rekel, je veliko različnih sistemov, veliko ERP rešitev, neusklajene oddelčne rešitve. Mnoge organizacije uporabljajo tudi rešitve SaaS, ki so tudi zunanje nadzorovane in upravljane, tako da ne nadzorujemo podatkovnih baz in tistih vrst stvari v gostiteljih na njih, vendar moramo še vedno vedeti, kako izgledajo ti podatki in seveda, metapodatki okoli tega. Prav tako najdemo veliko zastarelih zapuščenih sistemov, ki niso bili očiščeni zaradi pristopa, ki temelji na projektu, o katerem je govoril Malcolm. Neverjetno je, kako bodo organizacije v zadnjih letih vrtele projekte, zamenjale sistem ali rešitev, vendar pogosto ne ostane dovolj projektnega proračuna za razgradnjo zastarelih rešitev, tako da so zdaj le na poti. Ugotoviti moramo, česa se dejansko lahko rešimo v našem okolju, pa tudi, kaj je koristno za naprej. In to je povezano s slabo strategijo razgradnje. To je del iste stvari.
Ugotovimo tudi, ker je bilo iz vseh teh različnih rešitev zgrajenih ogromno organizacij, da vidimo veliko vmesnikov od točke do točke, kjer se na več mestih giblje veliko podatkov. To moramo biti sposobni racionalizirati in ugotoviti, da so podatki, ki sem jih prej na kratko omenil, lahko imeli bolj kohezivno strategijo, kot je uporaba storitveno usmerjene arhitekture, podjetniških avtobusov in teh vrst stvari, da bi zagotovili pravilne informacije na vrsto modela za objavo in naročanje, ki ga pravilno uporabljamo v svojem poslu. In seveda moramo še vedno opraviti neke vrste analitike, bodisi uporabljamo skladišča podatkov, podatkovne zbirke s tradicionalnimi ETL ali uporabljamo nekaj novih podatkovnih jezer. Vse se spušča na isto stvar. Vse podatke, ne glede na to, ali gre za velike podatke, ne glede na to, ali gre za tradicionalne podatke v relacijskih bazah podatkov, moramo vse te podatke združiti, da bomo lahko upravljali z njimi in vedeli, s čim imamo opravka v naših modelih.
Spet je zapletenost, da bomo naredili številne korake, ki jih želimo narediti. Najprej vstopite in morda nimate teh načinov, kako izgleda ta informacijska pokrajina. V orodju za modeliranje podatkov, kot je ER / Studio Data Architect, boste najprej delali veliko obratnega inženiringa v smislu, da pokažemo na vire podatkov, ki so tam zunaj, jih vnesete in nato dejansko združite v bolj reprezentativne modele, ki predstavljajo celotno podjetje. Pomembno je, ali želimo te modele razgraditi tudi po poslovnih linijah, da jih bomo lahko povezali v manjših delih, na katere se lahko nanašajo tudi naši poslovni ljudje, in naše poslovne analitike in druge zainteresirane strani, ki delajo na njem.
Standardi za poimenovanje so izredno pomembni in tu govorim o nekaj različnih načinih. Imenovanje standardov glede na to, kako poimenujemo stvari v svojih modelih. To je dokaj enostavno narediti v logičnih modelih, kjer imamo dobro konvencijo o poimenovanju in dober slovar podatkov za naše modele, potem pa opazimo tudi različne konvencije o poimenovanju za veliko teh fizičnih modelov, ki jih vnašamo. Ko smo vzvratni inženir, precej pogosto vidimo skrajšana imena in to vrsto stvari, o kateri bom govoril. In to moramo prevesti nazaj v pomembna angleška imena, ki so pomembna za posel, da bomo lahko razumeli, kakšni so vsi ti podatki, ki jih imamo v okolju. In potem je univerzalno preslikavo to, kako jih zlepimo skupaj.
Poleg tega bomo nato dokumentirali in opredelili naprej in tu lahko svoje podatke dodatno razvrščamo z nečim, imenovanim Priloge, da vam pokažem nekaj diapozitivov. In potem, ko zaključimo zanko, želimo uporabiti poslovni pomen, ki ga povezujemo v poslovnih glosarjih in jih lahko povežemo z našimi različnimi umetninami, tako da vemo, ko govorimo o določenem poslovnem izrazu, kjer je to implementirano v naše podatke po vsej organizaciji. In nazadnje, že sem govoril o tem, da potrebujemo vse to, da bi bilo to shramba, ki temelji na številnih zmožnostih sodelovanja in objavljanja, da lahko naše zainteresirane strani to izkoristijo. Dokaj hitro bom govoril o obratnem inženiringu. Že kar nekako sem vam poudaril to. To vam bom pokazal v dejanskem demonstracijskem slogu samo zato, da vam pokažem nekaj stvari, ki jih lahko tja prinesemo.
Rad bi govoril o nekaterih različnih vrstah in diagramih modelov, ki bi jih izdelali v tej vrsti scenarija. Očitno bomo konceptualne modele naredili v veliko primerih; Za to ne bom porabil veliko časa. Resnično želim govoriti o logičnih modelih, fizičnih modelih in specializiranih vrstah modelov, ki jih lahko ustvarimo. In pomembno je, da lahko vse to ustvarimo na isti platformi za modeliranje, da jih lahko zlepimo skupaj. To vključuje dimenzijske modele in tudi modele, ki uporabljajo nekatere nove vire podatkov, na primer NoSQL, ki vam ga bom pokazal. In potem, kako izgleda model podatkovne linije? Kako bomo te podatke vtisnili v model poslovnega procesa, je tisto, o čemer bomo govorili v nadaljevanju.
Tu bom prešel na modelirno okolje samo zato, da vam omogočim zelo visok in hiter pregled. In verjamem, da bi zdaj lahko videli moj zaslon. Najprej želim govoriti o samo tradicionalnem tipu podatkovnih modelov. In način, kako želimo organizirati modele, ko jih vnesemo, je, da jih želimo razstaviti. Torej, kar vidite tukaj na levi strani, je, da imamo v tej datoteki modela logične in fizične modele. Naslednja stvar je, ali jo lahko razčlenimo med poslovnimi razpadi, zato vidite mape. Svetlo modri so logični modeli, zeleni pa fizični modeli. Prav tako lahko razberemo, zato lahko v ER / Studio, če se razkrojite v podjetju, greste na toliko nivojev ali pod-modelov, kolikor želite, in spremembe, ki jih naredite na nižjih nivojih, se samodejno odražajo na višjih stopnje. Tako zelo hitro postane zelo močno modelirno okolje.
Nekaj, kar želim tudi poudariti, je zelo pomembno, da začnemo združevati te informacije skupaj, da lahko imamo več fizičnih modelov, ki ustrezajo tudi enemu logičnemu modelu. Pogosto imate morda logičen model, vendar imate fizične modele na različnih platformah in takšne stvari. Mogoče je eden primerek SQL Server, morda je drug primerek Oracle. Vse to lahko povežemo v istem modelnem okolju. In tu imam spet dejanski model skladišča podatkov, ki je lahko tudi v istem modelnem okolju ali pa ga imamo v skladišču in ga povezujemo tudi v različne stvari.
Kar sem vam resnično želel pokazati na tem mestu, so nekatere druge stvari in druge različice modelov, v katere se zapletamo. Ko torej zaidemo v tradicionalni model podatkov, kot je ta, smo navajeni videti tipične entitete s stolpci in metapodatki in to vrsto stvari, vendar se to gledišče zelo hitro spreminja, ko se začnemo ukvarjati z nekaterimi temi novejšimi tehnologijami NoSQL ali, kot jih nekateri še vedno radi imenujejo, tehnologije velikih podatkov.
Torej, recimo, da imamo tudi Hive v našem okolju. Če inženirja obrnemo iz okolja Hive - in lahko inženirja Hive posredujemo naprej in nazaj s tem povsem istim orodjem za modeliranje - vidimo nekaj, kar je nekoliko drugače. Vse podatke še vedno vidimo kot konstrukte, vendar so naši TDL-ji drugačni. Tisti, ki ste vajeni, da vidite SQL, zdaj bi videli Hive QL, ki je zelo podoben SQL, vendar iz istega orodja zdaj lahko začnete delati z različnimi skriptnimi jeziki. Torej lahko v tem okolju modelirate, ustvarjate v okolju panj, a kar je še pomembneje, v scenariju, ki sem ga opisal, lahko vse skupaj predelate v inženirju in ga smiselno zaženete ter začnete zlepljati skupaj .
Vzemimo še eno, ki je malo drugačna. MongoDB je še ena platforma, ki jo lokalno podpiramo. In ko začnete vtirati v JSON-ove vrste okolij, kjer imate shranjevanje dokumentov, je JSON drugačna žival in v njej so konstrukti, ki ne ustrezajo relacijskim modelom. Kmalu se začnete ukvarjati s pojmi, kot so vgrajeni predmeti in vgrajeni nizi predmetov, ko začnete zasliševati JSON in ti koncepti ne obstajajo v tradicionalni relacijski oznaki. Kar smo storili tukaj, je, da smo dejansko razširili notacijo in naš katalog, da bomo lahko ravnali v istem okolju.
Če tukaj pogledate levo, namesto da bi videli stvari, kot so entitete in tabele, jim pravimo predmeti. In vidite različne opombe. Tu še vedno vidite tipične vrste referenčnih zapisov, vendar so te modre enote, ki jih prikazujem v tem posebnem diagramu, dejansko vgrajeni predmeti. In pokažemo različne kardinalnosti. Diamantna kardinalnost pomeni, da gre za predmet na enem koncu, vendar kardinalnost enega pomeni, da imamo znotraj založnika, če sledimo temu razmerju, predmet vdelanega naslova. Pri zasliševanju JSON smo ugotovili, da je popolnoma enaka struktura predmetov, ki je vdelana v pokrovitelja, vendar je dejansko vgrajena kot niz predmetov. To vidimo ne samo prek samih priključkov, ampak če pogledate dejanske entitete, boste videli, da vidite naslove pod pokroviteljem, ki so tudi razvrščeni kot niz predmetov. Dobite zelo opisno stališče, kako lahko to vnesete.
In spet, to, kar smo do zdaj videli v samo nekaj sekundah, so tradicionalni relacijski modeli, ki so na več ravneh, isto lahko storimo s Hivem, lahko storimo isto z MongoDB in drugimi velikimi viri podatkov kot dobro. Kar lahko tudi storimo, in to vam bom zelo hitro pokazal, govoril sem o dejstvu, da stvari prinesemo z drugih različnih področij. Predvideval bom, da bom model uvozil iz baze podatkov ali ga obrnil, vendar ga bom vnesel iz zunanjih metapodatkov. Samo, da vam zelo hitro ogledamo različne vrste stvari, ki jih lahko začnemo uvajati.
Kot vidite, imamo ogromno stvari, s katerimi lahko metapodatke dejansko vnesemo v svoje modelirno okolje. Začenši s stvarmi, kot so celo Amazon Redshift, Cassandra, veliko drugih velikih podatkovnih platform, tako da vidite veliko teh naštetih. To je po abecednem redu. Opažamo veliko velikih virov podatkov in takšnih stvari. Opažamo tudi veliko tradicionalnih ali starejših okolj za modeliranje, ki dejansko lahko prenesemo te metapodatke. Če grem sem - in ne bom porabil časa za vsakega od njih - vidimo veliko različnih stvari, ki jih lahko prinesemo iz njih, kar zadeva modeliranje platform in podatkovnih platform. In to je zelo pomembno, da se tukaj zavedamo, je še en del, ki ga lahko naredimo, ko začnemo govoriti o liniji podatkov, v Enterprise Team Edition lahko tudi zaslišimo vire ETL, pa naj gre za stvari, kot so preslikave podatkovnih storitev Talend ali SQL Server, lahko to dejansko pripeljemo tudi v zagon naših diagramov linijskih podatkov in narišemo sliko dogajanja v teh transformacijah. Skupno imamo več kot 130 teh različnih mostov, ki so dejansko del izdelka Enterprise Team Edition, zato nam resnično pomaga, da vse artefakte zelo hitro potegnemo v eno modelirno okolje.
Nenazadnje bi rad govoril tudi o tem, da ne moremo pozabiti na to, da potrebujemo druge vrste konstrukcij, če delamo s shranjevanjem podatkov ali kakršno koli analizo. Še vedno želimo imeti možnost delati stvari, kot so dimenzijski modeli, kjer imamo tabele dejstev in imamo dimenzije in te vrste stvari. Želim vam tudi pokazati, da lahko imamo tudi razširitve svojih metapodatkov, ki nam pomagajo pri kategorizaciji, kakšne so vrste razsežnosti in vse ostalo. Če torej tukaj pogledam zavihek dimenzijskih podatkov, na primer enega od teh, bo dejansko samodejno zaznal na podlagi vzorca modela, ki ga vidi, in vam dal izhodišče, ali meni, da gre za dimenzijo ali tabela dejstev. Toda poleg tega je tisto, kar lahko naredimo, znotraj dimenzij in take vrste stvari, imamo celo različne vrste dimenzij, ki jih lahko uporabimo za razvrščanje podatkov tudi v okolje za shranjevanje podatkov. Tako zelo zmogljive zmogljivosti, s katerimi to v celoti šivamo.
Skočil bom v to, saj sem trenutno v demo okolju in vam bom pokazal še nekaj drugih stvari, preden skočim nazaj na diapozitive. Ena izmed stvari, ki smo jo nedavno dodali ER / Studio Data Architect, je, da naletimo na situacije - in to je zelo pogost primer uporabe, ko delate na projektih - razvijalci razmišljajo glede predmetov, medtem ko naši podatki Modelarji ponavadi razmišljajo v smislu tabel in entitet ter te vrste stvari. To je zelo poenostavljen podatkovni model, vendar predstavlja nekaj osnovnih konceptov, kjer bi razvijalci ali celo poslovni analitiki ali poslovni uporabniki lahko o njih razmišljali kot o različnih objektih ali poslovnih konceptih. Do zdaj jih je bilo zelo težko razvrstiti, toda to, kar smo dejansko storili v izdaji ER / Studio Enterprise Team Edition, v izdaji 2016, ali zdaj imamo koncept, imenovan Poslovni podatki. In to, kar nam omogoča, je, da nam omogoča, da skupine entitet ali tabel vgradimo v prave poslovne objekte.
Na primer, v tem novem pogledu smo dobili glavo naročila in vrstico naročila, ki sta zdaj združeni, vgrajeni kot predmet, o njih bi razmišljali kot o enoti dela, ko bomo obdržali podatke, in jih združimo, tako da je zdaj zelo enostavno povezati to z različnimi ciljnimi skupinami. Ponovno jih je mogoče uporabiti v celotnem okolju modeliranja. So resničen objekt, ne le risbna konstrukcija, ampak imamo tudi dodatno korist, da ko dejansko komuniciramo z vidika modeliranja, jih lahko selektivno strnemo ali razširimo, da bomo lahko ustvarili povzeti pogled za dialoge z določenimi deležniki, in seveda lahko ohranimo podrobnejši pogled, kot da ga vidimo več tehnične publike. Resnično nam daje res dobro vozilo komunikacije. Zdaj vidimo, da združujemo več različnih tipov modelov, jih dopolnjujemo s konceptom poslovnih podatkovnih predmetov, zdaj pa bom govoril o tem, kako dejansko uporabimo nekaj več pomena za te vrste stvari in kako jih skupaj zlepimo v naše celotna okolja.
Samo poskušam najti svoj WebEx tukaj, da bom to lahko storil. In tam gremo, nazaj k diapozitivom Hot Tech. Tukaj grem le nekaj diapozitivov, ker ste jih že videli v predstavitvi samega modela. Rad bi govoril o poimenovanju standardov zelo hitro. Želimo uporabiti in uveljaviti različne standarde poimenovanja. To, kar želimo storiti, je to, da lahko dejansko shranimo predloge poimenovanja standardnih šablon v naše shrambe, da v bistvu zgradimo ta pomen s pomočjo besed ali stavkov ali celo okrajšav in jih povežemo s pomensko angleško besedo. Uporabljali bomo poslovne izraze, kratice za vsakega in lahko določimo vrstni red, primere in dodali predpone in pripone. Tipičen primer uporabe je običajno takrat, ko ljudje gradijo logični model in nato dejansko ustvarjajo fizični model, kjer bi morda uporabljali kratice in vse drugo.
Lepa stvar je, da je ravno tako zmogljiv, še bolj močan v vzvratni smeri, če lahko samo povemo, kakšni so bili tisti tisti standardi poimenovanja v nekaterih tistih fizičnih bazah podatkov, ki smo jih izdelali nazaj, lahko uporabimo te okrajšave in jih spremenimo v daljše besed in jih vrnite nazaj v angleške stavke. Zdaj pravzaprav lahko dobimo ustrezna imena za to, kako izgledajo naši podatki. Kot rečem, tipičen primer uporabe je, da se premaknemo naprej, logično do fizičnega in preslikamo shranjevanje podatkov in tovrstne stvari. Če pogledate posnetek zaslona na desni strani, boste videli, da iz izvornih imen obstajajo okrajšana imena in ko smo uporabili predlogo standardov poimenovanja, imamo dejansko več polnih imen. In lahko vstavimo presledke in vse podobno, če to želimo, odvisno od predloge standardov poimenovanja, ki smo jo uporabili. Lahko pa je videti, vendar želimo, da je videti tudi v naših modelih. Šele ko vemo, kaj se imenuje, lahko dejansko začnemo pripisovati definicije, saj če ne vemo, kaj je, kako lahko nanjo uporabimo pomen?
Lepa stvar je, ali se na to lahko dejansko sklicujemo, ko počnemo vse vrste stvari. Govoril sem o obratnem inženiringu, dejansko se lahko hkrati sklicujemo na predloge za poimenovanje standardov, ko delamo obratno inženirstvo. Torej, v enem koraku skozi čarovnika lahko naredimo, če vemo, kakšne so konvencije, lahko inženirstvo spremenimo v fizično bazo podatkov, vrne jo kot fizične modele v modelirno okolje in uporabljati tudi te konvencije o poimenovanju. Tako bomo videli, kakšna so angleško predstavljena imena v ustreznem logičnem modelu v okolju. To lahko tudi naredimo in kombiniramo z generiranjem XML sheme, tako da lahko vzamemo model in ga celo potisnemo z našimi okrajšavami, ne glede na to, ali delamo okvire SOA ali to vrsto stvari, tako da lahko nato izstavimo tudi različne konvencije o poimenovanju ki smo jih dejansko shranili v samem modelu. Daje nam veliko zelo močnih zmogljivosti.
Še enkrat, tukaj je primer, kako bi bilo videti, če bi imel predlogo. Ta pravzaprav kaže, da sem imel EMP za „zaposlenega“, SAL za „plačo“, PLN za „načrt“ v konvenciji o poimenovanju. Lahko jih uporabim tudi za interaktivno delovanje med gradnjo modelov in vnašanjem stvari. Če bi uporabil to kratico in v ime entitete vpisal »Načrt plače zaposlenim«, bi deloval s predlogo o poimenovanju standardov Tu sem definiral, pri ustvarjanju entitet bi mi dal EMP_SAL_PLN in mi takoj dal ustrezna fizična imena.
Spet zelo dobro za načrtovanje in posredovanje inženiringa. Imamo zelo edinstven koncept in tu res začnemo združevati ta okolja. In imenuje se Universal Mappings. Ko smo vse te modele vnesli v svoje okolje, kar smo lahko naredili, ob predpostavki, da smo zdaj uporabili te konvencije o poimenovanju in jih je enostavno najti, lahko v ER zdaj uporabimo konstrukt, imenovan Universal Mappings / Studio. Entitete lahko povežemo med modeli. Kjer koli bomo videli »kupca« - verjetno bomo imeli »kupca« v številnih različnih sistemih in veliko različnih zbirkah podatkov - lahko začnemo vse to povezati skupaj, tako da ko delam z njim v enem modelu, lahko vidite, kje so manifestacije kupcev v drugih modelih. In ker imamo sloj modela, ki to predstavlja, ga lahko celo povežemo z viri podatkov in ga spustimo v naša poizvedovanja, v katerih baze podatkov vsebujejo tudi te baze podatkov. Resnično nam daje možnost, da vse to povežemo zelo kohezivno.
Pokazal sem vam poslovne podatke. Prav tako želim zelo hitro spregovoriti o razširitvah metapodatkov, ki jim pravimo Priloge. To je tisto, kar nam omogoča ustvarjanje dodatnih metapodatkov za naše modele. Precej pogosto bi nastavil te vrste lastnosti, da bi iz perspektive upravljanja podatkov in kakovosti podatkov izpeljali veliko različnih stvari, pa tudi, da bi nam pomagal pri vodenju glavnega upravljanja in shranjevanja podatkov. Osnovna ideja je, da ustvarite te klasifikacije in jih lahko pritrdite, kamor koli želite, na ravni tabele, stolpca, tiste vrste stvari. Seveda je najpogostejši primer uporabe ta, da so entitete tabele in potem lahko določim: kaj so moji glavni podatki, kakšne so moje referenčne tabele, kakšne so moje transakcijske tabele? Z vidika kakovosti podatkov lahko razvrstim po pomembnosti za podjetje, tako da lahko prednostno posvetim čiščenju podatkov in tej vrsti stvari.
Nekaj, kar se pogosto spregleda, je, kakšna je politika hrambe za različne vrste podatkov v naši organizaciji? Te lahko nastavimo in jih lahko dejansko pritrdimo na različne vrste artefaktov informacij v našem modelnem okolju in seveda tudi v naše skladišče. Lepota je v tem, da te priponke živijo v našem podatkovnem slovarju, zato jih lahko, ko uporabljamo slovarje podatkov podjetja v okolju, pripnemo na več modelov. Določiti jih moramo samo enkrat in jih lahko vedno znova in večkrat usmerjamo med različne modele v našem okolju. To je samo hitri posnetek zaslona, ki pokaže, da lahko dejansko določite, ko priložite, kakšni so vsi deli, ki jih želite priložiti. In ta primer tukaj je pravzaprav seznam vrednosti, tako da, ko se bodo udeležili, lahko izbirate s seznama vrednosti, imate v okolju modeliranja veliko nadzora nad tem, kaj se izbere, in lahko celo nastavite, kaj je privzeto vrednost je, če vrednost ni izbrana. Tako veliko moči tam. Živijo v podatkovnem slovarju.
Nekaj, kar bi vam rad pokazal malo naprej na tem zaslonu, poleg tega pa vidite priloge, ki se prikazujejo v zgornjem delu, pod njim pa vidite varnostne podatke. Politike varnosti podatkov lahko dejansko uporabimo tudi za različne podatke v okolju. Za različne preslikave skladnosti, varnostne klasifikacije podatkov jih pošljemo iz polja, ki jih lahko šele ustvarite in začnete uporabljati, lahko pa določite tudi svoje lastne preslikave skladnosti in standarde. Ali izvajate HIPAA ali katero koli drugo pobudo tam. In resnično lahko začnete sestavljati ta zelo bogat nabor metapodatkov v vašem okolju.
In potem sta Glosar in izrazi - tu se veže poslovni pomen. Pogosto imamo na voljo slovarje s podatki, ki jih organizacija pogosto uporablja kot izhodišče za začetek izločanja slovarjev, vendar je terminologija in besedno besedilo pogosto zelo tehnična. Torej, kar lahko storimo, je, da jih lahko, če želimo, uporabimo za izhodišče, da izženemo glosarje, vendar si resnično želimo, da jih podjetje ima v lasti. Kar smo storili v okolju skupinskega strežnika, smo ljudem dali možnost, da ustvarijo poslovne definicije, nato pa jih lahko povežemo z različnimi umetniškimi predmeti, ki jim ustrezajo tudi v modelnem okolju. Zaznavamo tudi točko, o kateri smo razpravljali prej, in sicer: več ljudi kot tipkate, več možnosti je za človeške napake. Kar počnemo tudi v naši glosarski strukturi, je, eno, podpiramo hierarhijo slovarja, tako da lahko imamo v organizaciji različne tipe glosarja ali različne vrste stvari, kar pa je še pomembneje, če že imate nekatere od teh virov tam s pogoji in vsem, kar je definirano, lahko dejansko naredimo uvoz CSV, da jih potegnemo v svoje modelirno okolje, pa tudi naš timski strežnik ali slovarček, nato pa se začnemo povezati od tam. Vsakič, ko se nekaj spremeni, pride do popolne revizijske sledi tega, kakšne so bile slike pred in pozneje, v smislu definicij in vsega drugega, in to, kar boste videli v bližnji prihodnosti, je tudi večji postopek odobritve tako lahko resnično nadziramo, kdo je odgovoren za to, odobritve odborov ali posameznikov in takšne stvari, da bomo naredili postopek upravljanja še bolj okreten, ko gremo naprej.
To tudi za nas pomeni, da imamo v slovarju za timski strežnik te izraze, to je primer urejanja subjekta v samem modelu, ki sem ga tu predstavil. Morda imajo povezane izraze, toda tudi to, kar počnemo, je, če obstajajo besede v tem glosarju, ki se pojavijo v opombah ali opisih tega, kar imamo tukaj v naših entitetah, se samodejno prikažejo v svetlejši hiperpovezani barvi in če z miško nad njimi, definicijo lahko vidimo tudi iz poslovnega glosarja. Daje nam celo bogatejše informacije, kadar jih sam porabimo, z vsemi izrazi glosarja, ki so tam zunaj. Resnično pomaga obogatiti izkušnjo in uporabiti pomen na vse, s čim sodelujemo.
Torej, spet, to je bil zelo hiter prelet. Očitno bi lahko na tem preživeli dneve, ko smo se poglobili v različne dele, vendar je to zelo hitro letenje po površini. V resnici si prizadevamo, da bi razumeli, kako izgledajo ta zapletena podatkovna okolja. Želimo izboljšati prepoznavnost vseh teh artefaktov podatkov in sodelovati z njimi, da jih izženemo z ER / Studio. Želimo omogočiti učinkovitejše in avtomatizirano modeliranje podatkov. In to so vse vrste podatkov, o katerih govorimo, pa naj gre za velike podatke, tradicionalne relacijske podatke, zaloge dokumentov ali kaj drugega. In spet smo to dosegli, ker imamo močne inženirske zmogljivosti za naprej in nazaj za različne platforme in druga orodja, ki jih morda imate tam. Vse skupaj je v deljenju in komunikaciji po vsej organizaciji z vsemi zainteresiranimi stranmi. Tukaj uporabljamo pomen s poimenovanjem standardov. Nato uporabljamo definicije prek naših poslovnih glosarjev. Nato lahko naredimo dodatne klasifikacije za vse naše druge zmožnosti upravljanja z razširitvami metapodatkov, kot so razširitve kakovosti podatkov, klasifikacije za upravljanje glavnih podatkov ali kakršne koli druge vrste klasifikacij, ki jih želite uporabiti za te podatke. Nato lahko še bolj povzamemo in še bolj izboljšamo komunikacijo s predmeti poslovnih podatkov, z različnimi ciljnimi skupinami, zlasti med modeli in razvijalci.
In spet, kar je pri tem zelo pomembno, je za vsem tem integrirano skladišče z zelo robustnimi zmožnostmi upravljanja sprememb. Danes ga nisem imel časa pokazati, ker je dokaj zapleten, vendar ima skladišče zelo močne zmožnosti upravljanja sprememb in revizijske sledi. Izvajate lahko poimenovane različice, lahko poimenujete različice in tudi tisti, ki izvajate upravljanje sprememb, lahko to povežemo s svojimi nalogami. Danes lahko naloge in spremembe vašega modela povežemo z nalogami, tako kot razvijalci svoje spremembe kode povežejo z nalogami ali uporabniškimi zgodbami, s katerimi sodelujejo.
Spet je bil to zelo hiter pregled. Upam, da je dovolj, da vzbudimo svoj apetit, da bomo lahko v pogovorih o tem, kako bomo razdelili nekatere od teh tem, nadaljevali veliko globlje pogovore v prihodnosti. Hvala za vaš čas in nazaj, Rebecca.
Rebecca Jozwiak: Hvala, Ron, to je bilo fantastično in imam kar nekaj vprašanj iz publike, vendar želim našim analitikom dati priložnost, da potopijo zobe v to, kar ste morali povedati. Eric, grem naprej in morda, če želiš obravnavati ta diapozitiv ali drug, zakaj ne greš najprej naprej? Ali kakšno drugo vprašanje.
Eric Little: Seveda. Oprosti, kaj je bilo vprašanje, Rebecca? Bi rad vprašal kaj konkretnega ali …?
Rebecca Jozwiak: Vem, da ste imeli za Rona sprva nekaj vprašanj. Če želite zdaj vprašati, da se bo obrnil na katerega koli od teh ali na nekatere izmed njih z diapozitiva ali na kaj drugega, kar je vzbudilo vaše zanimanje, o katerem želite vprašati? O funkciji modeliranja IDERA
Eric Little: Ja, ena izmed stvari, Ron, kako pa vi, izgleda, da so diagrami, ki ste jih prikazovali, splošni načini diagramov odnosov z entitetami, kot bi jih običajno uporabljali pri gradnji baz podatkov, kajne?
Ron Huizenga: Ja, na splošno gledano, seveda pa imamo razširjene vrste za shranjevanje dokumentov in takšno vrsto stvari. Pravzaprav smo se razlikovali od zgolj čistih relacijskih zapisov, dodali smo tudi dodatne oznake tudi za druge trgovine.
Eric Little: Ali lahko uporabite modele, ki temeljijo na grafih, torej obstaja način, kako na primer vključiti, recimo, da imam nekaj takega kot zgornji kvadrant, skladateljsko orodje TopBraid ali sem naredil nekaj v Protégéju ali, kot veste, kot finančni fantje v FIBO, veliko delajo na področju semantike, RDF stvari - ali obstaja način, da v to orodje vključimo to modeliranje grafov razmerja med subjektom in uporabimo to?
Ron Huizenga: Pravzaprav gledamo, kako lahko ravnamo z grafi. Danes podatkovnih baz grafov in take vrste ne obravnavamo izrecno, ampak iščemo načine, kako lahko to storimo za razširitev svojih metapodatkov. Mislim, lahko stvari vnesemo prek XML-ja in tovrstne stvari takoj, če lahko vsaj naredimo neke vrste izročitev XML-ja, da se začne kot izhodišče. Ampak preučujemo bolj elegantne načine, kako to doseči.
Pokazal sem vam tudi seznam mostov obrnjenega inženiringa, ki jih imamo tudi mi, zato vedno gledamo na razširitev teh mostov tudi za določene platforme. Če je to smiselno, si nenehno prizadeva zagnati veliko teh novih konstrukcij in različnih platform. Lahko pa rečem, da smo vsekakor v ospredju tega. Vsebine, ki sem jih na primer pokazal na MongoDB in podobnih stvareh, smo prvi prodajalec podatkovnih modelov, ki to dejansko počnemo v lastnem izdelku.
Eric Little: V redu, ja. Torej, drugo vprašanje, ki sem ga imel za vas, je bilo torej v zvezi z vodenjem in vzdrževanjem podobnega primera, ko ste uporabili primer, ko ste pokazali primer osebe, ki je "zaposleni", verjamem, da je bilo to " plačo "in potem imate" načrt ", ali obstaja način, kako upravljate na primer z različnimi vrstami ljudi - recimo, da imate veliko arhitekturo, kajne, predpostavimo, da imate veliko podjetje in ljudje začnejo v tem orodju potegniti stvari in tu imate eno skupino, ki ima besedo "zaposleni", in eno skupino, ki ima besedo "delavec". In ena oseba tukaj reče "plača", druga oseba pa pravi "plača."
Kako fantje uskladite in upravljate ter urejate takšne razlike? Ker vem, kako bi to storili v svetu grafov, bi uporabili sinonimne sezname ali pa bi rekli, da obstaja en koncept in ima več atributov, ali bi lahko v modelu SKOS rekli, da imam prednostno oznako in imam številne nadomestne nalepke, ki jih lahko uporabim. Kako to počnete?
Ron Huizenga: To počnemo na nekaj različnih načinov, predvsem pa se najprej pogovorimo o terminologiji. Ena od stvari, ki jih počnemo, je seveda, da želimo imeti določene ali sankcionirane pogoje in v poslovnem glosarju je očitno tam, kjer jih želimo. Dovoljujemo tudi povezave na sinonime v poslovnem glosarju, tako da lahko storite, kar lahko rečete, tukaj je moj izraz, lahko pa tudi določite, kakšni so vsi sinonimi za te.
Zanimivost je seveda ta, da ko začnete iskati to obsežno podatkovno pokrajino z vsemi temi različnimi sistemi, ki jih imate tam, ne morete preprosto iti tja in spremeniti ustreznih tabel in teh vrst v ustrezajo temu standardu poimenovanja, ker gre morda za paket, ki ste ga kupili, tako da nimate nadzora nad spreminjanjem baze podatkov ali kaj drugega.
Tisto, kar bi lahko storili tam, poleg tega, da bi lahko povezali glosarske definicije, je s temi univerzalnimi preslikavami, o katerih sem govoril, kaj bi naredili, in z nekaterim priporočenim pristopom, da imamo splošen logični model, ki določa, kaj ti različni poslovni koncepti so tisti, o katerih govorite. Povežite izraze poslovnega glosarja v lepe stvari in lepo je, da ste dobili ta konstrukt, ki predstavlja tako logično entiteto, da lahko začnete povezati to logično entiteto z vsemi izvedbami te logične entitete v različne sisteme.
Potem lahko kje v tem sistemu vidite, o, "oseba" se v tem sistemu imenuje "zaposleni". Tu se v tem drugem sistemu "plača" imenuje "plača". Ker boste to videli, boste videli vse različne manifestacije tistih, ker ste jih povezali.
Eric Little: V redu, ja, razumem. Ali je v tem smislu mogoče reči, da je to podobno kot nekateri objektno usmerjeni pristopi?
Ron Huizenga: Nekoliko. To je nekoliko bolj intenzivno kot, verjetno bi lahko rekli. Mislim, lahko bi uporabili pristop ročnega povezovanja in preiskovanja ter vpogleda v vse njih. Ena stvar, o kateri v resnici nisem imel možnosti govoriti - ker imamo spet veliko zmogljivosti - imamo tudi celoten vmesnik za avtomatizacijo v samem orodju Data Architect. In makro zmožnost, ki je resnično programski jezik v orodju. Torej lahko dejansko počnemo stvari, kot je pisanje makrov, ga odpravimo in zaslišimo ter ustvarimo povezave za vas. Uporabljamo ga za uvoz in izvoz informacij, lahko ga uporabljamo za spreminjanje stvari ali dodajanje atributov, dogodkov, ki temeljijo na samem modelu, ali pa ga lahko uporabljamo za izvajanje v serijah, da dejansko izstopimo in zaslišimo stvari ter dejansko naseljujemo različne konstrukte v model. Torej obstaja popoln vmesnik za avtomatizacijo, ki ga lahko izkoristijo tudi ljudje. In uporaba univerzalnih preslikav s temi bi bil zelo močan način za to.
Rebecca Jozwiak: V redu, hvala Ron, in hvala Ericu. To so bila odlična vprašanja. Vem, da tečemo malo čez vrh ure, toda Malcolmu bi rad dal priložnost, da odvrne nekaj vprašanj o Ronovi poti. Malcolm?
Malcolm Chisholm: Hvala, Rebecca. Torej, Ron, zelo zanimivo je, vidim, da je tu veliko zmogljivosti. Eno od področij, ki me zelo zanima, je recimo, če imamo razvojni projekt, kako vidite, da oblikovalec podatkov uporablja te zmožnosti in morda sodelujete bolj s poslovnimi analitiki, s profilom podatkov in analitikom za kakovost podatkov. in s poslovnimi sponzorji, ki bodo na koncu odgovorni za dejanske zahteve po informacijah v projektu. Kako zares modelar podatkov v resnici naredi projekt učinkovitejši in uspešnejši z zmogljivostmi, ki jih gledamo?
Ron Huizenga: Mislim, da je ena prvih stvari, ki jo morate storiti, kot podatkovni oblikovalec - in ne mislim izbirati nekaterih modelarjev, ampak vseeno bom - nekateri ljudje še vedno imajo vtis, da Oblikovalec podatkov je resnično takšna vloga vratarja, določamo, kako deluje, mi smo pazniki, ki poskrbimo, da je vse pravilno.
Zdaj je vidik tega, da morate zagotoviti, da definirate zvočno arhitekturo podatkov in vse ostalo. Pomembnejša stvar pa je, da je oblikovalec podatkov - in to sem očitno ugotovil, ko sem se posvetoval -, ali moraš postati pooblaščenec, zato moraš te ljudi potegniti skupaj.
To ne bo več načrtovanje, ustvarjanje, gradnja baz podatkov več - kar morate biti sposobni narediti je, da morate biti sposobni sodelovati z vsemi temi različnimi skupinami zainteresiranih strani, početi stvari, kot so obratni inženiring, uvažati podatke, imeti drugi ljudje sodelujejo, najsi bo to v slovarjih ali dokumentaciji, vse podobno - in bodite spodbujevalnik, da to potegnete v repozitorij in povežete koncepte v skladišču ter sodelujete s temi ljudmi.
V resnici gre za veliko bolj sodelovalno vrsto okolja, kjer ljudje tudi skozi opredelitev nalog ali celo razpravljanja ali takšne vrste stvari, ki jo imamo v timskem strežniku, dejansko lahko sodelujejo, postavljajo vprašanja in pridejo do končnih izdelkov, ki jih potrebe po njihovi arhitekturi podatkov in njihovi organizaciji. Je to odgovoril?
Malcolm Chisholm: Ja, se strinjam. Veste, mislim, da je spretnost olajševanja pri modelarjih podatkov resnično zelo zaželena. Strinjam se, da tega vedno ne vidimo, vendar menim, da je to potrebno in bi predlagal, da je včasih nagnjenost, da se zadržite v svojem kotu, ko delate svoje podatke, vendar morate resnično sodelovati z drugimi skupinami zainteresiranih strani ali preprosto ne razumete podatkovnega okolja, s katerim imate opravka, in mislim, da zaradi tega trpi model. Ampak to je samo moje mnenje.
Ron Huizenga: In zanimivo je, ker ste že prej v svojem diapozitivu omenili zgodovino o tem, kako se podjetja nekako odvrnejo od IT-ja, ker rešitev niso pravočasno posredovala in takšnih stvari.
Zelo zanimivo je, da je bilo pri mojih poznejših posvetovalnih poslih, preden sem postal vodja izdelkov, večina projektov, ki sem jih delal v zadnjih dveh letih pred tem, sponzorirana podjetja, kjer je bil resnično tisto podjetje, ki ga je vodilo, in podatkovni arhitekti in oblikovalci niso bili del IT-ja. Bili smo del skupine, ki jo sponzorirajo podjetja, in smo bili tam kot spodbujevalci, ki smo sodelovali z ostalimi projektnimi skupinami.
Malcolm Chisholm: Zato mislim, da je to zelo zanimiva točka. Mislim, da začnemo opažati premik v poslovnem svetu, kjer se podjetje sprašuje, ali razmišljam morda, ne toliko kot to, kar delam, kot je postopek, ampak tudi oni začnejo razmišljati, kakšni so podatki s katerim delam, kakšne so moje potrebe po podatkih, kakšni so podatki, s katerimi se ukvarjam kot podatki, in v kolikšni meri lahko pridobimo izdelke in zmogljivosti IDERA, da podpirajo to stališče, in mislim, da potrebe podjetja, tudi čeprav je nekako še vedno nekoliko nastal.
Ron Huizenga: Strinjam se s tabo in mislim, da bomo vedno bolj iskali to pot. Videli smo prebujenje in se ga dotaknili že prej glede na pomembnost podatkov. Pomembnost podatkov smo videli že zgodaj v IT ali v razvoju podatkovnih baz, potem pa, kot pravite, smo nekako vstopili v celoten cikel upravljanja procesov - in postopek je izredno pomemben, ne razumite me narobe - zdaj pa se je zgodilo, ko se je to zgodilo, so podatki nekako izgubili fokus.
In zdaj organizacije spoznavajo, da so podatki resnično glavna točka. Podatki predstavljajo vse, kar počnemo v svojem poslu, zato moramo poskrbeti za točne podatke, da bomo lahko našli prave podatke, ki jih potrebujemo za sprejemanje svojih odločitev. Ker vse ne izhaja iz definiranega procesa. Nekatere informacije so stranski produkt drugih stvari in še vedno jih moramo znati poiskati, vedeti, kaj pomeni in biti sposobni podatke, ki jih vidimo, prevesti v znanje, ki ga lahko uporabimo za boljše delovanje našega podjetja.
Malcolm Chisholm: Prav, zdaj pa imam še eno področje, s katerim se spopadam, to bi poimenoval življenjski cikel podatkov, kar je, veste, če pogledamo vrsto verige preskrbe s podatki, ki poteka skozi podjetje, bi začeli z zajemanje podatkov ali zajem podatkov, ki je lahko vnos podatkov, lahko pa je tudi to, da podatke izven podjetja dobim od kakšnega prodajalca podatkov.
Potem pa iz zajema podatkov gremo na vzdrževanje podatkov, kjer razmišljam o standardizaciji teh podatkov in pošiljanju naokoli, kjer so potrebni. In potem uporabite podatke, dejanske točke, kjer so podatki, iz njih pridobite vrednost.
V starih časih je to vse narejeno v enem individualnem slogu, danes pa je to, na primer, analitično okolje, na primer, potem pa še arhiv, trgovina, kamor podatke damo, ko ne bomo več ga potrebujejo in končno postopek čiščenja. Kako se vam zdi, da modeliranje podatkov ustreza upravljanju celotnega življenjskega cikla podatkov?
Ron Huizenga: To je zelo dobro vprašanje in eno stvar, o kateri danes danes sploh nisem imel časa, da bi se podrobneje poglobil, je tisto, o čemer v resnici začnemo govoriti, je podatkovna ločitev. Torej, kar v resnici lahko naredimo, je, da imamo v svojih orodjih zmogljivosti podatkovne rodovine in, kot rečem, lahko del tega dejansko izvlečemo iz orodij ETL, lahko pa ga tudi preslikate tako, da tudi sami narišete črto. Na kateri koli od teh podatkovnih modelov ali baz podatkov, ki smo jih zajeli in vnesli v modele, bi lahko konstrukte iz tega sklicevali v našem diagramu vrstice podatkov.
Kar lahko naredimo, je, da na primer narišemo pretok podatkov od vira do cilja in skozi celoten življenjski cikel, kako ti podatki prehajajo skozi različne sisteme in kaj boste našli, vzemimo zaposlene 'podatki - eden mojih najljubših, ki temelji na projektu, ki sem ga naredil pred leti. Sodeloval sem z organizacijo, ki je imela podatke o zaposlenih v 30 različnih sistemih. Na koncu smo tam delali - in Rebecca je posnela diapozitiv podatkovne vrstice - to je dokaj poenostavljen diapozitiv podatkovne vrstice, toda tisto, kar smo lahko storili, je bilo, da vnesemo vse podatkovne strukture, jih navedemo v diagramu in nato lahko dejansko začnemo gledati, kakšni so tokovi med njimi in kako so ti različni podatkovni subjekti povezani v toku? In lahko presežemo tudi to. To je del diagrama pretoka podatkov ali vrstnega reda, ki ga vidimo tukaj. Če želite preseči to, imamo del tega apartmaja tudi poslovnega arhitekta in tam velja ista stvar.
Na katero koli strukturo podatkov, ki smo jo zajeli v okolju za modeliranje podatkov, jih je mogoče sklicevati v orodju za poslovno modeliranje, tako da se lahko tudi v diagramih poslovnega modela ali diagramih poslovnih procesov sklicujete na posamezne shrambe podatkov, če ne želite v okolju za modeliranje podatkov in medtem, ko jih uporabljate v mapah v modelu vašega poslovnega procesa, lahko tudi na njih določite CRUD, kako se ti podatki porabijo ali proizvedejo, nato pa lahko začnemo ustvarjati stvari, kot so poročila o vplivu in analiza, ter diagrami iz tega.
Kaj želimo doseči, in že imamo veliko zmogljivosti, vendar je ena od stvari, ki jih imamo kot nekakšna potnica, ki si jo ogledujemo, ko svoje orodje še naprej razvijamo naprej, je sposoben začrtati to organizacijsko podatkovno vrstico in celoten življenjski cikel podatkov.
Malcolm Chisholm: V redu. Rebecca, mi je dovoljena še ena?
Rebecca Jozwiak: Dovolila vam bom še enega, Malcolm, pojdite naprej.
Malcolm Chisholm: Najlepša hvala. Kako si pristopimo k uspešnemu delovanju in razumevanju medsebojnega razmišljanja o upravljanju podatkov in razmišljanju o modeliranju podatkov?
Eric Little: No, zanimivo je, mislim, da je to res odvisno od organizacije, in to sega nazaj do mojega prejšnjega koncepta: v tistih organizacijah, kjer so bile pobude usmerjene v poslovanje, smo bili vezani prav. Na primer, vodil sem podatkovno arhitekturo skupina, vendar smo bili tesno povezani s poslovnimi uporabniki in smo jim dejansko pomagali postaviti svoj program upravljanja podatkov. Spet bolj posvetovalni pristop, vendar gre bolj za poslovno funkcijo.
V resnici morate imeti možnost, da potrebujete modele podatkov in arhitekte, ki resnično razumejo poslovanje, se lahko povežejo s poslovnimi uporabniki in jim nato pomagajo pri uveljavljanju procesov upravljanja okoli njega. Posel želi to storiti, na splošno pa imamo tehnološko znanje, s katerim jim lahko pomagamo, da izstopajo iz teh vrst programov. To mora biti sodelovanje, vendar mora biti poslovno lastništvo.
Malcolm Chisholm: V redu, to je super. Hvala vam.
Dr. Eric Little: V redu.
Rebecca Jozwiak: V redu, hvala lepa. Člani občinstva, bojim se, da nismo prišli do vaših vprašanj, vendar bom poskrbel, da jih bodo posredovali ustreznemu gostu, ki smo ga imeli danes na liniji. Rad bi se vam lepo zahvalil Ericu, Malcolmu in Ronu, ker ste bili danes naši gostje. To je bilo super stvar, ljudje. In če ste uživali v današnji oddaji IDERA, bo IDERA prihodnjo sredo tudi na Hot Technologies, če se želite pridružiti, in razpravljali o izzivih indeksiranja in Oraclesa, torej še ena zanimiva tema.
Najlepša hvala, ljudje, bodite pozorni in se vidimo naslednjič. Adijo.