Avtor osebja Techopedia, 19. aprila 2017
Odvzem: Voditelj Eric Kavanagh razpravlja o napovedih z dr. Robinom Bloorjem, Rickom Shermanom in IDER-jevim Bullettom Manaleom.
Za ogled videoposnetka se morate registrirati za ta dogodek. Za ogled videoposnetka se registrirajte.
Eric Kavanagh: Dame in gospodje, še enkrat pozdravljeni in dobrodošli nazaj k spletni oddaji Hot Technologies! Moje ime je Eric Kavanagh, jaz bom vaš gostitelj današnjega spletnega seminarja, ki se imenuje "Prihranite čas, denar in težave z optimalnimi napovedmi." "Seveda sem tam spustil prvi del naslova, " Najboljši zastavljeni načrti. " vedno govorite o tem v tej oddaji. Torej, Hot Technologies je seveda naš forum za razumevanje, kakšni od najbolj kul izdelkov so danes na svetu, svet podjetniške tehnologije, kaj ljudje počnejo z njimi, kako delujejo, vse te zabavne stvari.
In tema danes, kot predlagam, se ukvarja z napovedovanjem. Resnično poskušate razumeti, kaj se bo dogajalo v vaši organizaciji. Kako boste osrečevali svoje uporabnike, ne glede na to, kaj počnejo? Če delajo analizo, če resnično delajo, se soočajo s stvarnimi strankami s transakcijskimi sistemi, ne glede na to, hočete razumeti, kako delujejo vaši sistemi in kaj se dogaja, in to smo mi " Bom govoril danes. Nekako smešno je, ker napovedovanje ni nekaj, kar rad počnem, ker sem vraževerna, kot si mislim, če preveč napovedujem, se bodo zgodile slabe stvari, ampak to sem samo jaz. Ne sledite mojemu mnenju.
Tukaj so danes naši predstavniki, resnično tvoji v zgornjem levem kotu, Rick Sherman kliče iz Bostona, naš prijatelj Bullett Manale iz IDERA in naš doktor Robin Bloor. In s tem ga bom predal Robinu in samo opomnil ljudi: Zastavite vprašanja, ne bodite sramežljivi, radi imamo dobra vprašanja, danes jih bomo predstavili našim predstavnikom in drugim. In s tem, Robin, vzemi ga.
Robin Bloor: V redu, saj kot pravijo, sem mislil, da bom danes povedal zgodbo o SQL, saj je to ozadje tega, kar se bo nadaljevalo v razpravi, in neizogibno se ne bo spopadlo s ker se Rick ne osredotoča na to in se ne bo spopadal s tem, kar ima Rick povedati. Zgodba SQL, o SQL je nekaj zanimivih stvari, ker je tako prevladujoč. Glej, to je napaka, SQL je deklarativni jezik. Ideja je bila, da lahko ustvarite jezik, v katerem boste zahtevali, kar želite. In baza podatkov bi določila, kako to pridobiti. Pravzaprav je to zelo dobro razdelano, vendar je o tem nekaj vredno reči, kar je posledica, če celotno industrijo IT temelji na deklarativnem jeziku. Uporabnik fizične organizacije podatkov ne pozna ali ne skrbi, in to je dobro v deklarativnem jeziku - loči vas od vsega tega in celo skrbi - samo vprašajte, kar želite, in bazo podatkov bo šel in ga dobil.
Vendar uporabnik nima pojma, ali bo način strukturiranja poizvedbe SQL vplival na uspešnost poizvedbe in to je nekoliko slabo. Videla sem poizvedbe v dolgih sto in sto vrstic, ki so samo ena zahteva SQL, veš, začne se z "select" in nadaljuje s podizvedbami in tako naprej. In pravzaprav se izkaže, da če želite določeno zbirko podatkov iz baze podatkov, jo lahko prosite na več različnih načinov s SQL in dobite enak odgovor, če se s kakšnimi podatki seznanite. Torej, ena poizvedba SQL ni nujno najboljši način za zaprosilo za podatke, baze podatkov pa se bodo odzvale povsem drugače glede na SQL, ki ga vstavite v njih.
In tako SQL dejansko vpliva na zmogljivost, zato ljudje, ki uporabljajo SQL, je res tako zanje, velja tudi za SQL programerje, ki uporabljajo SQL, in še manj verjetno razmišljajo o vplivu, ki ga bodo imeli, ker večinoma je njihov poudarek na manipulaciji s podatki in ne na pridobivanju, dajanju podatkov. Enako velja tudi za BI orodja, videl sem SQL, ki se po želji iztisne iz BI orodij iz različnih baz podatkov in treba je reči, da veliko tega je, no, ne bi ne piši takšnih poizvedb SQL. Nekdo je ustvaril malo motorja, da ne glede na parametre vrže nekaj SQL-a in spet, da SQL ne bo nujno učinkovit SQL.
Potem sem pomislil, da bom omenil neskladje impedance, podatki, ki jih programerji uporabljajo, so drugačni od podatkov, kot jih urejajo. Torej, naš DMS shranjuje podatke v tabele, organizirana objektno usmerjena koda je večinoma koder, danes programirajo objektno usmerjeno obliko in urejajo podatke v objektnih strukturah, tako da jih ne preslikava drug v drugega. Torej, treba je prevesti iz tega, kar programer misli, da so podatki, v tisto, v kateri baza podatkov misli, kakšni so podatki. Kar se zdi, kot da smo morali narediti nekaj narobe, da bi bilo tako. SQL ima DDL za opredelitev podatkov, ima DML - jezik za obdelavo podatkov - izberite, projektirajte in se pridružite za pridobitev teh podatkov. Zdaj je zelo malo matematike in zelo malo časovno utemeljenih stvari, zato je nepopoln jezik, čeprav je treba reči, da je razširjen in se še naprej širi.
In potem dobite težavo z oviro SQL, ki je vedno naravnejša od diagrama, vendar je veliko ljudi spraševalo vprašanja iz analitičnih razlogov, ko so dobili odgovor na pogoje s podatki o vprašanju, želijo postaviti drugo vprašanje. Torej, to postane stvar dialoga, no, SQL ni bil zgrajen za dialoge, temveč je bil zasnovan za spraševanje, kaj vse želite naenkrat. In to je nekako vredno vedeti, saj obstajajo nekateri izdelki, ki dejansko zapuščajo SQL, da bi omogočili pogovor med uporabnikom in podatki.
Glede na zmogljivost baze podatkov - in ta vrsta se širi na vse - da, obstaja CPU, pomnilnik, disk, omrežni režijski stroški in težava z zaklepanjem več oseb, ki želijo izključno uporabiti podatke na določenem točka v času. So pa tudi slabi klici SQL, ogromno je mogoče storiti, če dejansko optimizirate SQL, kar zadeva učinkovitost. Dejavniki uspešnosti baze podatkov: slaba zasnova, slabo načrtovanje programa, manjkajoča obremenitev, uravnoteženje obremenitev, struktura poizvedb, načrtovanje zmogljivosti. To je rast podatkov. Z nekaj besedami je SQL priročen, vendar se ne optimizira.
Po tem, mislim, da lahko prenesemo Ricka.
Eric Kavanagh: V redu, Rick, naj ti dam ključe avtomobila WebEx. Vzemi stran.
Rick Sherman: V redu, super. No, hvala Robin, saj smo začeli na predstavitvi, je moja grafika še vedno precej dolgočasna, vendar bomo šli z njo. Tako se strinjam z vsem, o čemer je Robin govoril na strani SQL. Toda zdaj se želim osredotočiti na povpraševanje po podatkih, ki ga bomo zelo hitro preučili, ponudbo kot orodja, ki se uporablja v tem prostoru, ali potrebo po orodjih v tem prostoru.
Najprej je v vsakem članku, ki ga berete, nekaj, kar zadeva velike podatke, veliko podatkov, nestrukturirane podatke, ki prihajajo iz oblaka, velike podatke povsod, ki si jih lahko zamislite. A rast trga baz podatkov stalno raste s SQL, relacijska baza podatkov, verjetno od leta 2015, je še vedno 95 odstotkov trga baz podatkov. Najboljši trije prodajalci relacij imajo v tem prostoru približno 88 odstotkov tržnega deleža. Torej, kot je Robin govoril, še vedno govorimo o SQL-u. In v resnici, tudi če gledamo platformo Hadoop, Hive in Spark SQL - ki jo moj sin, ki je podatkovni znanstvenik, ves čas uporablja -, je zagotovo prevladujoč način, da ljudje pridejo do podatkov.
Zdaj na strani baze podatkov obstajata dve široki kategoriji uporabe baz podatkov. Eno je namenjeno sistemom za upravljanje operativnih baz podatkov, zato je načrtovanje odnosov med podjetji, vzdrževanje odnosov s strankami, ERP-ji Salesforce, Oracles, EPIC, N4s itd. In to je v podatkovnih skladiščih in drugih sistemih, ki temeljijo na poslovni inteligenci, veliko in povečuje se količina podatkov. „Vse, ne glede na to, kje in kako je zajeto, shranjeno ali sklenjeno, se na koncu analizira, zato je pri uporabi podatkovnih baz veliko povpraševanje in povečanje, zlasti relacijskih baz podatkov na trgu.
Zdaj imamo povpraševanje, prihajajo ogromne količine podatkov. In v resnici ne govorim samo o velikih podatkih, govorim o uporabi podatkov v vseh vrstah podjetij. Če pa s strani ponudbe za ljudi, ki lahko upravljajo te vire, najprej imamo pomanjkanje DBA. Kot navajamo na uradu za statistiko dela, se bodo od leta 2014–2024 delovna mesta DBA povečala le za 11 odstotkov - zdaj so to ljudje, ki imajo delovna mesta DBA, o tem pa bomo govorili v sekundi - nasproti 40- plus odstoten letni prostor za rast podatkov. In imamo veliko DBA; v istem študiju je v povprečju govorilo o povprečni starosti precej visoko v primerjavi z drugimi poklici IT. In potem imamo veliko ljudi, ki odhajajo s terena, ne da bi se nujno upokojili, ampak preusmerili v druge vidike, prešli v upravljanje ali kaj drugega.
Sedaj je del razloga, da odhajajo, to, ker je delo DBA vedno težje in težje. Najprej imamo DBA, ki sami upravljajo številne različne baze podatkov, fizične baze podatkov, ki se nahajajo povsod, pa tudi različne vrste podatkovnih baz. Zdaj je to lahko relacijsko ali pa so morda tudi druge baze podatkov, vrste baz. Toda tudi če je relacijsko, bi lahko imeli katerega koli enega, dva, tri, štiri različne prodajalce, ki jih dejansko poskušajo upravljati. DBA-ji se običajno vključijo po oblikovanju baze podatkov ali aplikacije. Robin je govoril o tem, kako se oblikujejo baze ali aplikacije, kako se oblikuje SQL. Ko govorimo o modeliranju podatkov, ER modeliranju, razširjenem modeliranju ER, dimenzijskem modeliranju, naprednem dimenzijskem modeliranju, karkoli že, običajno programerji aplikacij in razvijalci aplikacij oblikujejo s svojim končnim ciljem - ne razmišljajo o učinkovitosti sama struktura baze podatkov. Tako imamo veliko slabe zasnove.
Zdaj ne govorim o prodajalcih aplikacij za komercialna podjetja; ponavadi imajo modele ER ali razširjene modele ER. Govorim o tem, da razvijalci aplikacij v vsakem podjetju gradijo veliko več poslovnih procesov in aplikacij - ti pa niso nujno zasnovani za učinkovitost ali uspešnost uvajanja. In DBA so prezaposleni in včasih imajo 24/7 odgovornost, nenehno dobivajo vse več baz podatkov. Mislim, da je to malo povezano s tem, da ljudje ne razumejo, kaj počnejo ali kako to počnejo. Njihova lastna majhna skupina in ljudje samo razmišljajo: "No, vsa ta orodja so tako enostavna za uporabo, zato lahko kar naprej sprožimo vse več baz podatkov o njihovi obremenitvi, " kar ni tako.
Kar nas vodi do delnih in nenamernih DBA. Imamo IT ekipe, ki so majhne in si ne morejo nujno privoščiti namenskega DBA. Zdaj to velja za mala in srednje velika podjetja, kjer se je v zadnjem desetletju razširila širitev aplikacij za baze podatkov in baz podatkov. Vendar pa gre tudi za velike korporacije, ki običajno že dolgo in dolgo opravljajo skladiščenje podatkov, analitiko poslovne inteligence. Dolgo nazaj smo za te projekte dobivali namenske akreditacijske ocene; nikoli več ne dobimo namenskega DBA. Odgovorni smo za oblikovanje baze podatkov, kar je v redu, če ima kdo izkušnje. Toda na splošno so pooblaščeni akterji razvijalskih programov razvijalci aplikacij, to vlogo pogosto prevzamejo kot del svojega dela, nimajo formalnega usposabljanja v njem in spet, načrtujejo ga za svoje končne cilje, ne načrtuje ga za učinkovitost.
In med dizajnom in razvojem je veliko razlike v primerjavi z uvajanjem in upravljanjem. Torej, imamo "peni modre, funt neumne", z majhno puščico tam, ki preskoči na pridobivanje spretnosti in virov, potrebnih za projekte. Mislim, da so vsi iz "Maščevanja živcev", moja mala slika tam. Zdaj, kar ljudje potrebujejo, zato imamo razširjeno uporabo baz podatkov in podatkov v SQL. Imamo omejeno število DBA-jev - ljudi, ki so usposobljeni in strokovni za te nastavitve, načrtovanje in upravljanje ter razmestitev. In čedalje več imamo delnih ali naključnih DBA, ljudi, ki niso bili uradno usposobljeni.
Katere so še nekatere druge stvari, ki se prav tako spopadajo s tem, da se te baze podatkov tudi ne nastavljajo ali ne upravljajo? Najprej mnogi domnevajo, da ima sam sistem baz podatkov dovolj orodij za upravljanje. Zdaj so orodja vse lažja in enostavnejša - načrtovanje in razvoj - vendar je to drugače, kot če naredite dober dizajn in dobro upravljanje, načrtovanje zmogljivosti, spremljanje itd. Najprej ljudje domnevajo, da imajo vsa orodja, ki jih potrebujejo. Drugič, če ste delni ali naključni DBA, ne veste, česa ne veste.
Mislim, da sem tam pozabil nekaj stavkov, tako da velikokrat preprosto ne razumejo, kaj sploh potrebujejo pri zasnovi ali pri upravljanju ali upravljanju podatkovnih baz. Če to ni vaš poklic, potem ne boste razumeli, kaj morate storiti. Tretjič, je, da je SQL orodje, s katerim gremo naprej, zato je Robin govoril o SQL-ju in o tem, kako slabo je SQL včasih sestavljen ali je pogosto sestavljen. In tudi eden od mojih hišnih ljubljenčkov pri shranjevanju podatkov v BI, migracija podatkov, prostor za inženiring podatkov je, da ljudje namesto z orodji napišejo SQL kodo, shranjene postopke, tudi če uporabljajo drago orodje za integracijo podatkov oz. drago BI orodje, pogosto ga resnično uporabljajo samo za zagon shranjenih postopkov. Tako da je pomembnost razumevanja oblikovanja baz podatkov, gradnje SQL, še bolj pomembna.
In končno je tu pristop silosa, v katerem si posamezniki ogledamo posamezne baze podatkov. Ne ozirajo se na delovanje aplikacij in medsebojno interakcijo. Prav tako pogosto resnično gledajo baze podatkov v primerjavi z aplikacijami, ki jih uporabljajo. Torej je delovna obremenitev, ki jo dobite v bazi podatkov, kritična pri zasnovi, kritična pri njenem uravnavanju, kritična pri poskusu, kako načrtovati zmogljivost itd. Torej, ko gledate gozd z dreves, so ljudje v plevelu, gledanje posameznih tabel in baz podatkov in ne gledanje na celotno interakcijo teh aplikacij v delovni obremenitvi.
Nazadnje morajo ljudje pogledati ključna področja, ki jih morajo pogledati. Ko načrtujejo upravljanje z bazami podatkov, morajo najprej razmišljati o tem, razviti nekaj meritev uspešnosti, osredotočenih na aplikacijo, zato ne smejo gledati samo na to, kako je ta tabela strukturirana, kako je posebej modelirana, ampak kako se uporablja? Če imate v podjetju aplikacijo, ki je dolžna pri upravljanju dobavne verige, če odstranjujete naročila prek spleta, če uporabljate BI - karkoli že počnete - morate pogledati, kdo ga uporablja, kako deluje z njim, kakšen je obseg podatkov, ko se bo to zgodilo. Kar resnično iščete, so čakalne dobe, kajti ne glede na to, vse aplikacije ocenjujejo, koliko časa traja, da se nekaj opravi, naj bo to oseba ali samo izmenjava podatkov med aplikacijami ali procesorji. In kakšna so ozka grla? Tako pogosto, ko poskušate odpravljati napake, seveda resnično poskušate pogledati, katera so prava ozka grla - ne nujno, kako prilagoditi vse, ampak kako se znebiti in premakniti uspešnost do čakalnih dob in pretok - karkoli morate pogledati.
In res morate ločiti zajem podatkov, transakcije, vidike preoblikovanja v bazi in analitiko. Vsak od njih ima različne vzorce oblikovanja, vsaka ima različne vzorce uporabe in vsakega od njih je treba prilagoditi drugače. Torej morate razmisliti, kako se ti podatki uporabljajo, kdaj se uporabljajo, za kaj se uporabljajo in ugotoviti, kakšne so metrike uspešnosti in katere so ključne stvari, ki jih želite analizirati, povezane s to uporabo. Zdaj, ko gledate spremljanje uspešnosti, si želite ogledati same operacije baze podatkov; želite pogledati obe podatkovni strukturi, tako da indeksi, razdelitve in drugi fizični vidiki baze podatkov, celo struktura baze podatkov - naj bo to model ER ali dimenzijski model, pa vendar je strukturiran - vse te stvari vplivajo na uspešnost, zlasti v različnih kontekstih analitike zajemanja podatkov in sprememb, ki se zgodijo.
In kot je Robin omenil na strani SQL, je kritično gledanje na SQL, ki ga izvajajo te različne aplikacije v teh bazah podatkov, in njegovo uravnavanje. Glede na celotno obremenitev aplikacij in infrastrukturno okolje, v katerem te baze in aplikacije tečejo. Torej, da omrežja, strežniki, oblak - ne glede na to, kaj vse izvajajo - gledajo tudi na vpliv teh aplikacij in teh baz podatkov v tem kontekstu, vse to pa se medsebojno prepleta, da lahko bazo podatkov prilagodite.
In končno, ko si ogledujete orodja, si želite ogledati tri različne vrste analitike, povezane s tem. Oglejte si opisno analizo: kaj se dogaja in kje, povezano z bazo podatkov in uspešnostjo aplikacije. Želite imeti možnost diagnostične analize, da ugotovite ne le, kaj se dogaja, ampak zakaj se to dogaja, kje so ozka grla, kje so težave, kaj deluje dobro, kaj ne deluje dobro? Ampak zmožnost analiziranja in podrobnejših pregledov na problematičnih področjih, da bi se lahko lotili teh vprašanj, bodisi za načrtovanje ali kar koli morate storiti.
In končno, najbolj agresivna ali proaktivna vrsta analize je dejansko narediti neko napovedno analizo, modeliranje prediktivne analitike, karkoli že. Vemo, da baza podatkov in aplikacij delujeta v tem kontekstu, če smo povečali zmogljivost, če pridobimo več uporabnikov, če naredimo več prepustnosti, karkoli počnemo, da lahko načrtujemo, kaj, kako in kje bo to Vpliv na bazo podatkov, aplikacije nam omogoča, da načrtujemo in določimo proaktivno, kje so ozka grla, kdaj lahko čakajo čakalne dobe in kaj moramo narediti, da popravimo stvari. Zato želimo imeti orodja, ki bodo sposobna izvajati meritve uspešnosti, spremljati uspešnost, kot pri teh treh vrstah analiz. In to je moj pregled.
Eric Kavanagh: V redu, dovolite, da ga izročim - mimogrede, to sta dve odlični predstavitvi - naj to predam Bullettu Manaleu, da ga odnese od tam. In ljudje, ne pozabite vprašati dobrih vprašanj; imamo že nekaj dobrih vsebin. Vzemi ga, Bullett.
Bullett Manale: sliši se dobro. Hvala, Eric. Torej, veliko tega, kar je rekel Rick in Robin, se očitno strinjam s 100 odstotki. Rekel bi, da sem to potisnil navzgor, ker mislim, da ustreza, ne vem za tiste med vami, ki so navijači "A-Team" v 80-ih, John Hannibal Smith je govoril, da je vedno recimo: "Všeč mi je, ko se načrt sestavi", in mislim, da ko govorimo o predvsem SQL strežniku, kamor se osredotočamo, to je izdelek, o katerem bomo govorili danes, SQL Diagnostic Manager, to je zagotovo ena izmed tistih stvari, ki jih morate imeti; moraš biti sposoben izkoristiti podatke, ki jih imaš, in biti sposoben sprejemati odločitve iz teh podatkov, v nekaterih primerih pa ne iščeš odločitve; iščete nekaj, kar bi vam povedalo, kdaj vam bo zmanjkalo virov, kdaj vam bo zmanjkalo virov, kdaj boste imeli ozko grlo in take stvari.
Ne gre samo za spremljanje določene meritve. Pri Diagnostičnem upravitelju vam bo ena izmed stvari, ki ji gre zelo dobro, v pomoč pri napovedovanju in razumevanju specifičnih delovnih obremenitev, o čemer se bomo danes pogovarjali o številnih. Orodje je namenjeno upravljalcu podatkov, DBA ali delujočemu DBA, zato je veliko stvari, o katerih je Rick omenil, igralski DBA tako resničen. Če niste pooblaščenec DBA, bo veliko vprašanj, ki jih boste imeli, ko pride čas za upravljanje okolja SQL, stvari, ki jih ne poznate. In zato iščete nekaj, kar bi vam pomagalo, vas popeljalo skozi postopek in vas tudi izobraževalo. In zato je pomembno, da boste z orodjem, ki ga uporabljate za tovrstne odločitve, dobili nekaj vpogleda v razloge, zakaj se te odločitve sprejemajo, ne samo, da vam bodo rekli: "Hej, naredite to."
Ker sem igralec DBA, bom morda na koncu celoten DBA z dejanskim strokovnim znanjem in znanjem, da podprem ta naslov. Torej, ko govorimo o skrbniku baze podatkov - ta diapozitiv vedno najprej pokažem, ker ima DBA nekaj drugačnih vlog, odvisno od organizacije, s katero ste, ti se bodo spreminjali od enega do drugega mesta, toda navadno boste vedno na nek način odgovorni za shranjevanje, načrtovanje skladišča in razumevanje predvidevanja, če naj rečem, koliko prostora boste namenili potrebujejo, ali gre za varnostne kopije ali pa za same baze podatkov. To boste morali razumeti in oceniti.
Poleg tega boste morali stvari razumeti in optimizirati po potrebi in ko boste spremljali okolje, je očitno pomembno, da spremembe spremenite tako, kot so potrebne na podlagi stvari, sprememba znotraj samega okolja. Tako, kot je število uporabnikov, kot so priljubljenost aplikacij, sezonskost baze podatkov, bi bilo treba upoštevati, ko načrtujete svoje napovedi. In potem očitno gledate na druge stvari v smislu, da lahko posredujete poročila in informacije, ki so potrebne, kar se nanaša na sprejemanje teh odločitev. V veliko primerih to pomeni primerjalno analizo; to pomeni, da si lahko ogledate določeno metriko in razumete, kakšna je vrednost te metrike v preteklosti, tako da lahko predvidevate, kam se bo premaknil naprej.
Torej, kar veliko orodja Diagnostic Manager ima te sposobnosti, in ljudje ga uporabljajo vsak dan, da lahko počnejo stvari, kot so napovedovanje, in tu sem postavil definicijo načrtovanja zmogljivosti. In to je precej široka in pravzaprav precej nejasna opredelitev, ki je samo postopek določanja proizvodnih zmogljivosti, ki jih organizacija potrebuje za izpolnjevanje spreminjajočih se potreb po svojih izdelkih, in na koncu dneva je res v resnici to: o tem, da lahko sprejemate informacije, ki jih imate na tak ali drugačen način, in sprejemate te informacije in sprejemate odločitve, ki vam bodo pomagale pri napredovanju skozi življenjski cikel podatkovnih baz. In zato so vrste stvari, ki so vzroki, da ljudje to potrebujejo, očitno najprej in predvsem v večini primerov prihranili denar. Podjetja so očitno njihov glavni cilj zaslužiti denar in prihraniti. Toda v tem procesu to pomeni tudi zmožnost, da se prepričate, da ni izpadov. In da lahko zagotovite, da omilite kakršno koli možnost izpada, zato preprečite, da se začne, z drugimi besedami, ne čakajte, da se zgodi, in nato reagirajte nanjo.
Ključnega pomena je tudi to, da lahko na splošno povečate produktivnost svojih uporabnikov, zato je njihova učinkovitost bolj učinkovita, da boste lahko več poslovali, to so vrste stvari, ki jih kot DBA ali kdo sodeluje pri napovedovanju ali zmogljivosti načrtovanje bo moralo biti zmožno prekrivati informacije, da bodo lahko sprejemale te odločitve. In na splošno bo to očitno pomagalo pri odstranjevanju odpadkov, ne le odpadkov v smislu denarja, ampak tudi časovno in v smislu na splošno virov, ki bi jih bilo mogoče uporabiti za druge stvari. Torej, če lahko odstranite te odpadke, da ne boste imeli priložnostnih stroškov, ki so vezani na same odpadke.
Torej, s tem rečeno, katere vrste vprašanj, ki jih dobimo, značilne za osebo, ki je DBA? Kdaj mi bo zmanjkalo prostora? To je veliko, ne le koliko prostora zaužijem zdaj, ampak kdaj mi bo zmanjkalo na podlagi trendov in pretekle zgodovine? Enako z dejanskimi primerki SQL, baz podatkov, katere strežnike lahko konsolidiram? Bom postavil nekaj na VM-ove, kaj je smiselno, v katerih bazah podatkov bom konsolidiral in v katerih primerih SQL bi morali prebivati? Na vse te vrste vprašanj je treba odgovoriti. Ker v večini primerov, če ste DBA ali igrate DBA, ga boste utrdili nekje v karieri. V veliko primerih to počnete sproti. Torej morate biti sposobni sprejemati te odločitve hitro, ne pa igrati ugibanja, ko gre za to.
Pogovarjali smo se o ozkih grlih in o tem, kje se bodo pojavili naslednjič, da bi lahko še enkrat predvideli, da namesto da bi čakali, da se to zgodi. Torej so očitno vse te stvari, o katerih govorimo, smiselne v smislu, da se v večini primerov zanašate na zgodovinske podatke, da lahko ustvarite ta priporočila ali v nekaterih primerih sami znate oblikovati odločitve, da bi lahko prišli do teh odgovorov. Vendar me spominja na tisto, ko slišite radijske oglase za nekoga, ki prodaja vrednostne papirje ali kaj podobnega, je vedno »pretekla uspešnost ne kaže prihodnjih rezultatov« in tovrstne stvari. In enako velja tudi tukaj. Imeli boste situacije, ko te napovedi in te analize morda niso stoodstotno prave. Če pa imate opravka s stvarmi, ki so se že dogajale v preteklosti in so znane, in boste sposobni sprejeti in narediti "kaj če" z veliko tovrstnimi vprašanji, ki jih boste naleteli, je zelo dragoceno in to vas bo pripeljalo veliko dlje kot igranje ugibanja.
Torej se bodo ta vprašanja spravila, očitno se bodo pojavila, kako bomo s Diagnostic Managerjem obravnavali veliko teh vprašanj, najprej imamo zmogljivosti za napovedovanje, če lahko to storimo tudi v bazi podatkov, za mizo kot pogon ali glasnost. Da lahko rečem samo: "Hej, polni smo prostora", ampak šest mesecev, dve leti od tega, pet let od zdaj, če namenjam proračun, koliko prostora za vožnjo grem za proračun je treba porabiti? To so vprašanja, ki si jih bom morala zastaviti, in bom morala uporabiti neko metodo tega, ne da bi ugibala in spravila prst v zrak in čakala, da vidim, kako bo pihal veter, kar je velikokrat, na žalost, način, kako se sprejemajo te odločitve.
Poleg tega je to, da sem lahko - videti, kot da se je moj diapozitiv tam malo odrezal -, vendar sem lahko zagotovil pomoč v obliki priporočil. Torej, ena stvar je, če vam lahko pokažemo nadzorno ploščo, polno meritev, in lahko rečete: "V redu, tukaj so vse meritve in kje so na voljo", potem pa jih lahko naredite ali jih razumete kaj storiti, na podlagi tega je še en preskok. V nekaterih primerih so ljudje dovolj izobraženi o vlogi DBA, da lahko sprejmejo te odločitve. In zato imamo v orodju nekaj mehanizmov, ki nam bodo pri tem pomagali, kar vam bomo pokazali v samo sekundi. Ampak biti sposoben pokazati ne samo, kaj priporočilo je, ampak tudi dati nekaj vpogleda, zakaj se priporočilo pripravlja, in potem tudi povrhu tega, da je v nekaterih primerih mogoče dejansko izdelati skript, ki avtomatizira Sanacija tega vprašanja je prav tako idealna.
Če nadaljujemo na naslednjo, ki jo bomo videli, gre samo za splošno razumevanje, kaj je normalno. Ne morem vam povedati, kaj ni normalno, če ne vem, kaj je normalno. Torej, če imate način merjenja, ki je ključen, in morate biti sposobni upoštevati več vrst področij, na primer - ali naj rečem časovni okviri - različne skupine strežnikov, če lahko to počnete dinamično, z opozorilne perspektive, z drugimi besedami, sredi noči, med oknom vzdrževanja, pričakujem, da bo moj CPU deloval 80 odstotkov glede na vso vzdrževanje, ki se dogaja. Torej, morda bi želel zvišati svoje pragove višje, v tistih časovnih okvirih v primerjavi z morda sredi dneva, ko ne opravljam toliko aktivnosti.
To so nekatere stvari, ki bodo očitno okoljske, toda stvari, ki jih lahko uporabite za tisto, kar se upravlja, da bi vam lahko pomagali učinkoviteje upravljati s tem okoljem in ga olajšali. Drugo področje je očitno sposobno le na splošno zagotoviti poročila in informacije, da bo lahko odgovoril na tiste vrste vprašanj "kaj če". Če sem pravkar spremenil svoje okolje, želim razumeti, kakšen vpliv je imel, da lahko to isto spremembo uporabim tudi za druge primerke ali druge baze podatkov v svojem okolju. Želim imeti nekaj informacij ali streliva, da bom lahko to spremenil z nekaj miru in ob zavedanju, da bo to dobra sprememba. Torej, če lahko naredim to primerjalno poročanje, da lahko razvrstim svoje primerke SQL, da lahko svoje baze podatkov razvrstim drug proti drugemu, da si rečem: »Kateri je moj največji porabnik CPU-ja?« Ali kateri najdlje je v pogoji čakanja in podobne stvari? Veliko teh informacij bo na voljo tudi z orodjem.
In ne nazadnje je le splošna sposobnost, da potrebujete orodje, s katerim se boste lahko spopadli v vsaki situaciji, ko pride na vašo pot, in kaj mislim s tem, če imate veliko okolje z V veliko primerih boste verjetno naleteli na primere, ko morate izvleči metrike, ki tradicionalno niso metrike, ki bi jih DBA v nekaterih primerih želel celo nadzirati, odvisno od tega. Torej, če imate orodje, ki ga lahko razširite, boste lahko dodali dodatne meritve in jih lahko uporabljali v enaki obliki in na način, kot bi jih uporabljali, če bi uporabljali zunanje okence metrično, na primer. Kljub temu, da lahko napovedujete in pripravljate, tako da lahko dobite odgovore, ki jih iščete, je tudi ključ do tega, da lahko pripravite poročila, opozorite, izhodiščno - vse o čemer govorimo. biti sposoben sprejemati te odločitve naprej.
Zdaj, ko to počne Diagnostic Manager, imamo centralizirano storitev, skupino storitev, ki se izvaja, zbira podatke glede na primere od 2000 do 2016. In potem to, kar počnemo, vzamemo te podatke in jih damo v osrednje skladišče in potem, kar bomo s temi podatki naredili, očitno je, da naredimo veliko, da lahko zagotovimo nadaljnji vpogled. Zdaj, poleg tega - in ena od stvari, ki je ni tukaj - je tudi, da imamo tudi storitev, ki deluje sredi noči, ki je naša storitev napovedne analize, in to nekaj krči in pomaga razumeti in pomagati vam kot pooblaščeni lastnik akcijske skupine ali kot akter DBA, da lahko pripravite te vrste priporočil, da lahko tudi zagotovite nekaj vpogleda v izhodišče.
Torej, kar bi rad storil, in to je samo hiter primer arhitekture, velik odvzem tukaj je, da ni nobenih agentov ali storitev, ki bi dejansko sedeli na primerkih, ki jih upravljate. Ampak to, kar bi rad storil, je, da vas dejansko dejansko prijavim tukaj in vam hitro predstavim. In naj tudi jaz odidem ven in to tudi naredim. Torej, povej mi, mislim, Eric, ali to vidiš?
Eric Kavanagh: Zdaj ga imam, ja.
Bullett Manale: V redu, zato vas bom popeljal skozi nekaj teh različnih delov, o katerih sem govoril. In v bistvu začnimo s takšnimi stvarmi, ki so bolj v skladu s tem, kar morate storiti, ali tukaj je nekaj, kar je pomemben čas v prihodnosti, in dali vam bomo nekaj vpogleda v to. In to lahko resnično predvidevamo - ali bi moral reči dinamično predvideti - stvari, kot se dogajajo. V primeru poročil je ena od stvari, ki jo imamo v orodju, tri različna poročila o napovedovanju. V primeru, na primer napovedi baze podatkov, kaj bi verjetno naredil v primeru, da bom lahko v določenem časovnem obdobju predvidel velikost baze podatkov, navajam vam le nekaj primerov tega . Torej, vzel bom svojo revizijsko zbirko podatkov, ki je precej intenzivna vhodno / izhodna - veliko podatkov je v njej. Imamo, poglejmo, to bomo storili tukaj, in tukaj le poberemo bazo podatkov o zdravstvu.
Toda poanta je, da ne vidim samo, kakšen je prostor na tem, lahko rečem: "Poglejte, vzemimo lansko vrednost vrednih podatkov" - in tu bom malo poiskal, V resnici nimam podatkov v letu dni, imam približno dva meseca podatkov, vendar, ker tu izbiram vzorčno stopnjo mesecev, bom v tem lahko predvideval ali napovedoval V naslednjih 36 enotah, ker je naša vzorčna stopnja nastavljena na mesece - to je enota, je mesec - in potem bi lahko naredil poročilo, ki mi bo v bistvu pokazalo, kje pričakujemo našo prihodnjo rast. tri baze podatkov. In lahko vidimo, da se med tremi različnimi zbirkami podatkov razlikujejo različne razlike ali razlike, zlasti glede na količino podatkov, ki jo v preteklosti porabijo.
Tu lahko vidimo, da podatkovne točke predstavljajo zgodovinske podatke, nato pa nam bo črta zagotovila napoved, skupaj s številkami, ki jih podkrepijo. Tako lahko to storimo na ravni tabele, to lahko storimo tudi na ravni pogona, kjer lahko predvidevam, kako veliki bodo moji pogoni, vključno s točkami pritrditve. To isto vrsto informacij bi lahko napovedali, vendar bom še enkrat, odvisno od stopnje vzorčenja, omogočil, da določim, koliko enot in kje sprejemamo, kaj želimo napovedati. Opazite tudi, da imamo različne vrste napovedi. Tako dobite veliko možnosti in prilagodljivosti, ko pride čas za napovedovanje. To bomo storili eno, in sicer vam bomo določili točno določen datum in lahko rekli: "Hej, na ta datum bomo pričakovali rast vaših podatkov." Poleg tega pa lahko vam bomo zagotovili drugačna spoznanja, ki so povezana z nekaterimi analizami, ki jih izvajamo v izven urnih urah in storitev, ko se ta izvaja. Nekatere stvari je, da poskuša predvideti stvari, ki se bodo verjetno zgodile, na podlagi zgodovine, ko so se stvari v preteklosti dogajale.
Tako lahko tukaj vidimo, da nam pravzaprav napoved daje nekaj vpogleda v verjetnost, da bomo imeli ves večer težave na podlagi stvari, ki so se spet zgodile v preteklosti. Očitno je to super, še posebej, če nisem DBA, lahko pogledam te stvari, še boljše pa je, če nisem DBA, ta zavihek za analizo. Torej, preden bi to našli tukaj v orodju, bi šli skozi in ljudem pokazali izdelek in oni bi bili "To je super, vidim vse te številke, vse vidim, ampak ne vem, kaj naj storim" (smeh) "Kot rezultat tega." In to, kar imamo tukaj, je boljši način, da lahko razumete, če bom ukrepal za pomoč pri uspešnosti, če bom ukrepal celo pomagati pri zdravju mojega okolja, imeti možnost razvrščanja teh priporočil in koristne nasvete v zvezi z informacijami, če želite izvedeti več o teh priporočilih in dejansko imeti celo zunanje povezave do nekaterih teh podatkov, ki mi bodo pokazali in vzemite me za razloge, zakaj so ta priporočila.
V mnogih primerih bi lahko zagotovili scenarij, ki bi, kot sem rekel, avtomatiziral sanacijo teh vprašanj. Zdaj je del tega, kar počnemo tukaj s to analizo - in pokazal vam bom, ko grem konfigurirati lastnosti tega primerka, in grem v razdelek za konfiguracijo analize - imamo veliko različnih kategorij, ki so Tukaj je navedeno in del tega imamo optimizacijo indeksov in optimizacijo poizvedb. Torej ocenjujemo ne samo same meritve in podobne stvari, ampak tudi stvari, kot so delovne obremenitve in indeksi. V primeru tukaj bomo dejansko naredili dodatno hipotetično analizo indeksa. Torej, to je ena tistih situacij, v katerih v mnogih primerih ne želim dodati indeksa, če mi tega ne bo treba. Toda na neki točki se zgodi nekakšna prelomna točka, kjer rečem: „No, tabela se spreminja v velikost ali vrste poizvedb, ki se izvajajo v okviru delovne obremenitve, je smiselno zdaj dodati indeks. Toda to ne bi imelo smisla morda šest tednov prej. "Torej to vam omogoča, da dinamično dobite vpogled v stvari, ki bodo verjetno, kot sem rekel, izboljšale uspešnost glede na dogajanje v okolju, kaj se dogaja znotraj delovnih obremenitev in počneš takšne stvari.
Tako dobite tukaj veliko dobrih informacij in tudi možnost samodejne optimizacije teh stvari. Torej, to je drugo področje, na katerem bi si lahko pomagali v smislu, čemur pravimo prediktivne analize. Zdaj, poleg tega, bi moral reči, imamo tudi druga področja, za katera mislim, da so na splošno le v pomoč pri odločanju. Ko se pogovarjamo o sprejemanju odločitev, lahko znova pogledamo zgodovinske podatke, da dobimo nekaj vpogleda, da nas pripelje do tega, kje moramo biti, da izboljšamo to uspešnost.
Zdaj je ena od stvari, ki jo lahko naredimo, da imamo osnovni vizualizator, ki nam omogoča selektivno izbiro katere koli metrike, ki bi jo želeli - in dovolite mi, da tu najdem spodobno - grem v SQL CPU uporabo, ampak poanta je, se lahko vrnemo čez več tednov, če želimo slikati te slike, da vidimo, kdaj so vaši odpuščaji, da na splošno vidimo, kje ta vrednost pade v obdobjih, ko smo zbirali podatke. In potem boste poleg tega opazili tudi to, da ko gremo ven na dejanski primerek, sami lahko konfiguriramo svoje osnovne postavke. In osnovne postavke so resnično pomemben del tega, da lahko stvari avtomatiziramo in da smo o njih lahko obveščeni. In izziv, kot bi vam povedala večina DBA, je, da vaše okolje ne deluje vedno enako skozi ves dan, nasproti večeru in kaj podobno, kot smo že omenili v primeru z obdobji vzdrževanja, ko smo imajo visoko raven CPU-ja ali kar koli, kar se lahko dogaja.
V primeru, da imamo tukaj s temi dejanskimi osnovnimi črtami lahko več osnovnih osnov, tako da imam na primer osnovno linijo, to je med mojimi vzdrževalnimi urami. Lahko pa bi ravno tako enostavno ustvaril izhodišče za svoje proizvodne ure. In smisel tega je, ko gremo v primerek SQL in dejansko imamo te številne izhodiščne vrednosti, potem bi lahko predvideli in lahko izvedli neko vrsto avtomatizacije, neko vrsto sanacije ali zgolj opozorila na splošno, različno specifična za tista časovna okna. Ena od stvari, ki jih boste videli tukaj, so te osnovne črte, ki jih ustvarjamo, z uporabo zgodovinskih podatkov za analizo, še pomembneje pa je, da te pragove lahko spremenim statično, lahko pa jih tudi dinamično avtomatiziram. Ko se prikaže okno vzdrževanja ali naj rečem osnovno okno vzdrževanja, bi se ti pragovi samodejno preklopili specifično na obremenitve, s katerimi se srečujem v tem časovnem oknu, v primerjavi s morda sredi dneva, ko so moje obremenitve ne toliko, ko delovne obremenitve niso tako odmevne.
To je nekaj drugega, kar je treba upoštevati glede na izhodišče. Očitno bo to za vas zelo koristno, tudi če razumete, kaj je normalno in da lahko tudi razumete, se vključite, ko vam bo zmanjkalo sredstev. Kot je že prej rekel, je druga stvar, ki jo imamo v orodju, to vam bo pomagalo pri sprejemanju odločitev, poleg tega pa se bosta osnova in možnost nastavitve opozoril okrog teh izhodišč in pragov, ki jih ustvarjate dinamično, samo da lahko pripravim ogromno poročil, ki mi pomagajo odgovoriti na vprašanja o tem, kaj se dogaja.
Kot primer, če bi imel 150 primerov, s katerimi upravljam - v mojem primeru ne, zato moramo tukaj igrati igro pretvarjanja - ampak če bi imel vse svoje proizvodne primere in bi moral razumeti, kje je področje, na katerega moram biti pozoren, z drugimi besedami, če bom imel le nekaj časa časa za izvajanje neke vrste administracije za izboljšanje učinkovitosti, se želim osredotočiti na ključna področja. In s tem bi lahko rekel: "Glede na to okolje razvrstite svoje primere drug proti drugemu in mi dodelite to razvrstitev po prepiru." Torej, ali gre za uporabo diska, uporabo pomnilnika, ali čaka, ne glede na to, ali gre za odzivni čas, lahko povežem - ali naj rečem - uvrstitev - teh primerov drug proti drugemu. Očitno je primerek, ki je na vrhu vsakega seznama, če gre za isti primerek, je to verjetno nekaj, na kar se resnično želim osredotočiti, saj je očitno spet na vrhu seznama.
Torej, v orodju imate veliko poročil, ki vam pomagajo pri razvrščanju okolja na ravni primerka; lahko to storite tudi na ravni baze podatkov, kjer lahko svoje baze podatkov uvrstim drug proti drugemu. Zlasti glede na pragove in območja, ki jih lahko nastavim, lahko tu celo postavim nadomestne znake, če se le želim, da se osredotočim samo na določene baze podatkov, toda poanta je, da lahko svoje baze podatkov primerjam na enak način. Kar se tiče drugih vrst primerjalne analize in tiste velike v tem orodju, je to osnovna analiza, ki jo imamo. Če se pomaknete navzdol do prikaza storitve, boste videli, da obstaja izhodiščno statistično poročilo. Zdaj bo to poročilo pomagalo, da bomo razumeli ne le, kaj so vrednosti metrike, ampak za določen primerek bi lahko izšel in za katero koli od teh meritev lahko dejansko pogledal izhodišča teh meritev.
Torej, ne glede na to, kakšen bi bil, ali v odstotkih bi lahko izstopil in rekel: "Poglejmo, da je izhodišče za to izšlo v zadnjih 30 dneh", v tem primeru mi bo pokazal dejanske vrednosti glede na izhodiščno in Lahko bi sprejel nekaj odločitev s temi informacijami, očitno je to ena od tistih situacij, kjer bo odvisno od vprašanja, ki ga takrat postavljate. Toda to vam bo očitno pomagalo pri številnih vprašanjih. Želim si, da bi lahko rekel, da imamo eno poročilo, ki vse to naredi, in to je nekako kot preprosto poročilo, kjer pritisnete in pritisnete na gumb in samo odgovori na vsako vprašanje "kaj če", na kar bi lahko kdaj odgovorili. V resnici pa boste imeli veliko atributov in veliko možnosti, da boste lahko v teh spustnih možnostih izbirali, da boste lahko oblikovali tista vprašanja "kaj če", ki jih iščete .
Tako je veliko teh poročil usmerjenih v odgovor na te vrste vprašanj. In tako je resnično pomembno tudi to, da so ta poročila in poleg tega tudi vse, kar smo vam že pokazali v orodju, kot sem že omenil, s prilagodljivostjo za vključitev novih meritev, ki jih je mogoče upravljati, in celo ustvarjati števci ali poizvedbe SQL, ki so vgrajene v vaše volilne intervale, da bi mi lahko pomagali odgovoriti na ta vprašanja, da lahko dodate te stvari iz škatle, ki je nismo predvidevali za spremljanje. In potem bi lahko naredili vse iste stvari, ki sem vam jih pravkar pokazal: osnovno linijo, zagon poročil in ustvarjanje poročil iz te meritve ter lahko odgovarjate in počnete veliko teh različnih vrst stvari, ki vam jih prikazujem tukaj.
Zdaj je poleg tega - in ena izmed stvari, s katero smo se očitno spopadli v zadnjem času, - najprej je bilo to, da vsi preletavajo ali prehajajo na VM. In zdaj imamo ogromno ljudi, ki se odpravljajo v oblak. In veliko vprašanj se poraja okrog teh vrst stvari. Ali je smiselno, da se premaknem v oblak? Ali bom prihranil denar s premikom v oblak? Če bi te stvari postavil na VM, na stroj z deljenimi viri, koliko denarja lahko privarčujem? Očitno se bodo pojavljala tudi taka vprašanja. Veliko teh stvari ne pozabite, z Diagnostic Managerjem lahko dodajamo in privlečemo iz virtualiziranih okolij tako VMware kot Hyper-V. Lahko dodamo tudi primere, ki so zunaj oblaka, zato lahko vaša okolja, kot je na primer Azure DB, ali celo RDS, tudi iz teh okolij potegnejo metrike.
Torej obstaja veliko prilagodljivosti in veliko možnosti, da odgovorimo na ta vprašanja, saj se nanaša na druga okolja, v katera vidimo ljudi, ki se odpravljajo. O tem se še vedno pojavlja veliko vprašanj, in ko vidimo, da se ljudje utrjujejo v teh okoljih, bodo morali biti sposobni odgovoriti tudi na ta vprašanja. Torej, to je precej dober pregled Diagnostic Managerja, ker se nanaša na to temo. Vem, da se je pojavila tema poslovne inteligence in imamo tudi orodje za poslovno inteligenco, o katerem danes nismo govorili, vendar vam bo tudi omogočilo vpogled v odgovor na tovrstna vprašanja, saj se nanaša na vaša vprašanja. kocke in vse te različne stvari, prav tako. Upajmo, da je bil to dober pregled, vsaj v smislu, kako lahko ta izdelek pomaga pri oblikovanju dobrega načrta.
Eric Kavanagh: V redu, dobre stvari. Ja, vrgel ga bom Ricku, če je še vedno tam. Rick, imaš kakšno vprašanje od tebe?
Rick Sherman: Ja, torej najprej, to je super, všeč mi je. Še posebej mi je všeč raztezanje do VM-jev in oblakov. Vidim, da veliko razvijalcev aplikacij meni, da če je v oblaku, jim tega ni treba nastavljati. Torej …
Bullett Manale: Kajne, za to moramo še plačati, kajne? Še vedno morate plačati za vse, kar ljudje postavljajo v oblak, tako da če slabo deluje ali če povzroča veliko ciklov CPU-ja, morate več denarja plačati, torej ne, še vedno je treba te stvari izmeriti, absolutno.
Rick Sherman: Ja, v oblaku sem videl veliko slabih modelov. Želel sem vprašati, ali bi bil uporabljen tudi ta izdelek - vem, da ste omenili BI izdelek in imate številne druge izdelke, ki medsebojno delujejo - ampak ali bi začeli gledati uspešnost SQL, posamezne poizvedbe v tem orodju? Ali pa bi bila za to uporabljena druga orodja?
Bullett Manale: Ne, to bi bilo, absolutno. To je ena od stvari, ki je nisem zajel in sem želel, je del poizvedb. Obstaja veliko različnih načinov za prepoznavanje uspešnosti poizvedb, ne glede na to, ali je povezana, zlasti s čakanjem, kot ga vidimo na tem pogledu tukaj, ali je povezano s porabo virov poizvedb na splošno, obstaja veliko načinov za analizo poizvedb izvedba. Ne glede na to, ali gre za trajanje, CPU, I / O, še enkrat pa si lahko sami ogledamo tudi delovne obremenitve, da jim zagotovimo nekaj vpogleda. Priporočila lahko posredujemo v razdelku za analizo in imamo tudi spletno različico, ki vsebuje informacije o samih poizvedbah. Tako lahko dobim priporočila o manjkajočih indeksih in zmožnosti ogleda načrta izvršitve in vseh teh stvari; je tudi sposobnost. Torej, absolutno, lahko v nedeljo diagnosticiramo poizvedbe na sedem načinov (smeh) in smo sposobni zagotoviti vpogled v število usmrtitev, naj bo to poraba virov, čakanje, trajanje in vse te dobre stvari.
Rick Sherman: V redu, super. In kakšna je obremenitev samih primerkov pri vsem tem spremljanju?
Bullett Manale: Dobro vprašanje. Izziv pri odgovoru na to vprašanje je, ali je odvisno, je tako kot vse drugo. Veliko tega, kar ponuja naše orodje, ponuja prilagodljivost, del te prožnosti pa je, da mu poveš, kaj naj zbira in česa ne. Tako na primer pri samih poizvedbah ni treba zbirati podatkov o čakanju ali pa jih lahko. Lahko zbiram informacije, povezane s poizvedbami, ki presegajo trajanje izvajanja. Kot primer, če bi šel v monitor za konfiguriranje poizvedb in bi moral reči: "Spremenimo to vrednost v nič, " je resničnost, da orodje v bistvu naredi, da zbere vsako poizvedbo, ki se izvaja, in to res ni duha, zakaj je to tam, na splošno pa, če bi želel zagotoviti popoln vzorec podatkov za vsa vprašanja, bi to lahko storil.
Torej je zelo sorazmerno s tem, kakšne so vaše nastavitve, na splošno gledano, zunaj okvira. Povsod je približno 1–3 odstotkov režijskih stroškov, vendar bodo veljali še drugi pogoji. Odvisno je tudi od tega, koliko poizvedb v vratih se izvaja v vašem okolju, kajne? Odvisno je tudi od načina zbiranja teh poizvedb in kakšne različice SQL je. Tako na primer SQL Server 2005 ne bomo mogli izvleči iz razširjenih dogodkov, medtem ko bi to storili iz sledi. Torej bi bilo nekoliko drugače glede na to, kako naj bi zbirali te podatke, toda to je, kot sem rekel, s tem izdelkom približno od leta 2004. To traja že dolgo, imamo na tisoče kupcev, zato je zadnja stvar, ki jo želimo narediti, orodje za spremljanje učinkovitosti, ki povzroča težave z uspešnostjo (smeh). In zato se poskušamo čim bolj izogibati temu, na splošno pa je približno 1–3 odstotkov dobro pravilo.
Rick Sherman: V redu, in to je precej nizko, tako da je to grozno.
Eric Kavanagh: Dobro. Robin, imaš kakšno vprašanje od tebe?
Robin Bloor: Oprosti, bil sem v nemi obliki. Imate več zmogljivosti baze podatkov in zanima me, kako lahko pogledate več baz podatkov in zato lahko veste, da je večja baza virov razdeljena med različne virtualne stroje in tako naprej. Zanima me, kako ljudje to dejansko uporabljajo. Zanima me, kaj počnejo kupci s tem. Ker se mi zdi, no, vsekakor, ko sem se zapletal v baze podatkov, nekaj, kar nikoli nisem imel pri roki. In kadar koli bi kdaj koli smiselno obravnaval en primer. Kako ljudje to uporabljajo?
Bullett Manale: Na splošno govorite le o orodju? Kako ga uporabljajo? Mislim, na splošno gre za to, da bi lahko imeli osrednjo točko prisotnosti okolja. Če imajo mir in vedo, da če se zazrejo v zaslon in vidijo zeleno, vedo, da je vse dobro. Ko nastopijo težave in očitno je večina primerov z vidika DBA, se velikokrat ti problemi pojavijo, ko so pred konzolo, tako da jih je mogoče obvestiti takoj, ko se težava pojavi. Poleg tega pa, da lahko razumemo, kdaj se težava zgodi, da se lahko dokopljemo do središča informacij, ki jim dajejo nek kontekst v smislu, zakaj se to dogaja. In tako je, mislim, največji del: biti aktiven glede tega, ne biti reaktiven.
Večina DBA-jev, s katerimi se pogovarjam - in ne vem, da jih je dober odstotek - žal še vedno deluje v reaktivnem okolju; čakajo, da se potrošnik obrne do njih in jim pove, da obstaja težava. In tako vidimo veliko ljudi, ki se poskušajo odmakniti od tega, in mislim, da je to velik del razloga, zakaj je ljudem všeč to orodje, da jim pomagajo biti proaktivni, hkrati pa jim omogoča tudi vpogled v dogajanje, v čem je težava, toda v veliko primerih je to, kar najdemo vsaj - in morda nam to povejo samo DBA-ji - toda DBA-ji so zaznati, da je vedno njihov problem, tudi če je razvijalca aplikacij napisal aplikacijo ki niso napisali pravilno, so oni tisti, ki bodo krivi za to, ker to aplikacijo prevzamejo v svoje sisteme ali strežnike in takrat, ko je uspešnost slaba, vsi nakažejo na DBA. "Hej, ti si kriv."
Torej bo to orodje velikokrat uporabljeno kot pomoč pri pripravi DBA za odgovor: "Hej, tu je težava in nisem jaz." (Smeh) Moramo izboljšajte to, pa naj bo to sprememba poizvedb ali karkoli že lahko. V nekaterih primerih bo to padlo v njihovo vedro glede na njihovo odgovornost, toda vsaj imeti orodje, ki jim bo pomagalo razumeti to in vedeti, in to storiti pravočasno, je očitno idealen pristop.
Robin Bloor: Ja, večina spletnih mest, ki jih poznam, vendar je minilo že nekaj časa, odkar sem tam, in gledam različna spletna mesta z več bazami podatkov, večinoma pa sem ugotovila, da bi obstajala DBA, ki so se osredotočili na nekaj baz podatkov. In to bi bile baze podatkov, da bi to, če bi kdaj padle, resnično velik problem za posel in tako naprej, in tako naprej. In ostali, bodo vsak čas zbirali statistične podatke, da bi videli, da jim ni zmanjkalo prostora in da jih sploh ne bi nikoli pogledali. Medtem ko ste delali predstavitev, sem gledal na to in sem dobro razmišljal, tako ali drugače, podaljšate, samo tako, da zagotovite kaj takega za baze podatkov, ki so bile pogosto, nikogar ni preveč zanimalo, ker imajo rast podatkov, imajo tudi rast aplikacij. Pokrivanje DBA razširjate na dokaj dramatičen način. To je tisto, kar se v resnici postavlja vprašanje, ali s takim naborom orodij na koncu lahko damo storitev DBA vsaki bazi podatkov, ki je v podjetniškem omrežju?
Bullett Manale: Seveda, izziv je, da je tako, kot si rekel precej zgovorno, kot da obstaja nekaj baz podatkov, za katere skrbijo akterji DBA, in potem je nekaj, ki jih ne skrbi toliko. In način, kako je ta izdelek, način licenciranja, odvisen od primera. Torej, verjetno bi rekli, je prag, ko se ljudje odločijo: "Hej, to ni dovolj kritičen primer, da ga želim upravljati s tem orodjem." Mislim, da jih je več, predvidevam tiste manj pomembne primere SQL. Eden od njih bi bil podoben upravitelju zalog, kjer izvajamo lahke zdravstvene preglede primerov, vendar poleg tega počnemo odkrivanje, torej ugotovimo nove primere, ki so bili posredovani na spletu in nato od takrat naprej kot DBA lahko rečem, "OK, tukaj je nov primerek SQL, zdaj je to Express? Ali gre za brezplačno različico ali za poslovno različico? "To je verjetno vprašanje, ki si ga želim zastaviti, drugič, kako pomemben mi je ta primerek? Če to ni tako pomembno, bi morda to orodje sprožilo in to naredi, splošno, kaj bi poimenoval generični zdravstveni pregledi v smislu, da gre za elementarne vrste stvari, do katerih me skrbi kot DBA: Ali se pogon polni ? Se strežnik odziva na težave? Glavne stvari, kajne?
Medtem ko je orodje Diagnostic Manager, orodje, ki sem vam ga pravkar pokazal, se spustilo na raven poizvedb, spuščalo se bo na priporočila indeksov, pogledalo načrt izvedbe in vse te dobre stvari, medtem ko je to v glavnem osredotočeno o tem, kdo je lastnik, kaj sem lastnik in kdo je odgovoren za to? Katere servisne pakete in popravke imam na voljo? In ali moji strežniki delujejo z glavnimi sestavinami tega, kar bi po mojem mnenju predstavljal kot primeren primer SQL? Torej, da odgovorim na vaše vprašanje, je malo mešanice. Ko imamo to orodje ljudi, ponavadi gledajo na bolj kritičen nabor primerkov. Kljub temu imamo nekaj ljudi, ki odkupijo vsak primer, ki ga imajo, in ga upravljajo, tako da je preprosto odvisno. Ampak povem vam, da na splošno zagotovo obstaja prag tistih, ki menijo, da je njihovo okolje dovolj pomembno, da imajo takšno orodje za upravljanje teh primerov.
Robin Bloor: V redu, še eno vprašanje, preden ga predam Ericu. Vtis, ki ga dobimo, samo če gledamo industrijo, je, da imajo baze podatkov še vedno življenje, vendar se vsi podatki prelijejo v vsa ta podatkovna jezera in tako naprej. To je hype, res, in hype nikoli ne odraža resničnosti, zato me zanima, kakšno resničnost zaznavate tam? Ali so pomembne baze podatkov v organizaciji, ali doživljajo tradicionalno rast podatkov, o kateri sem prej mislil kot 10 odstotkov na leto? Ali pa rastejo več kot to? Ali veliki podatki naredijo te baze balon? Kakšno sliko vidite?
Bullett Manale: Mislim, da veliko primerov vidimo, da se nekateri podatki premikajo v tiste druge segmente, kjer je bolj smiselno, ko so na voljo druge tehnologije. V zadnjem času je nekaj večjih podatkov. Toda te baze podatkov bi rekel, da je težko posploševati v veliko primerih, ker so vsi malo drugačni. Na splošno gledano vidim nekaj razhajanj. Vidim, kot sem rekel, ljudje se v veliko primerih gibljejo k elastičnim modelom, ker želijo povečati sredstva in ne toliko na drugih področjih. Nekateri se premikajo k velikim podatkom. Toda težko bi dobili občutek za, kot pravite, zaznavanje, ker ljudje, s katerimi govorim, običajno imajo tradicionalne baze podatkov in to uporabljajo v okolju SQL Server.
Če rečem, glede samega SQL-a, vsekakor mislim, da pridobiva tržni delež. In mislim, da je veliko ljudi, ki se še vedno vozijo proti SQL-u iz drugih krajev, kot je Oracle, ker je cenovno ugodnejši in se zdi očitno, ko različice SQL postajajo naprednejše - in to opazite pri novejših stvareh, ki nadaljujemo s SQL, in sicer v smislu šifriranja in vseh drugih zmogljivosti, zaradi katerih je okolje ali platforma baze podatkov - to je verjetno očitno zelo kritično poslanstvo. Torej, mislim, da tudi to vidimo. Kjer opazite premik, se še vedno dogaja. Mislim, dogajalo se je pred 10 leti, mislim, da se še vedno dogaja v smislu SQL Serverja, kjer okolje raste in tržni delež raste.
Robin Bloor: V redu, Eric, predvidevam, da ima občinstvo kakšno vprašanje ali dve?
Eric Kavanagh: Ja, naj vam eno hitro vrnem. Pravzaprav je precej dobro vprašanje. Eden od udeležencev se sprašuje, ali mi bo to orodje povedalo, če tabela morda potrebuje indeks za pospešitev poizvedbe? Če je tako, ali lahko pokažete primer?
Bullett Manale: Ja, tako da ne vem, če imam enega za posebej dodajanje indeksa, vendar lahko vidite tukaj, tu imamo priporočila za razdrobljenost. Prav tako verjamem, da smo ga ravnokar imeli, in to je bil del Diagnostic Managerja, ki ponuja spletno različico, kjer mi pravi, da imam manjkajoč indeks. Ta priporočila si lahko ogledamo in nam bo z indeksiranjem teh informacij povedal, kakšen potencialni dobiček lahko dobimo. Druga stvar, ki jo moram omeniti, je, da bomo, ko bomo delali priporočila, za mnoge izmed njih izdelali scenarij. To ni dober primer, vendar bi lahko videli, da, situacije, ko bi indeks - bodisi dvojnik ali dodajanje indeksa - izboljšal uspešnost, in kot sem že rekel, naredimo veliko da s hipotetično analizo indeksa. Resnično pomaga v smislu razumevanja delovne obremenitve, da lahko to uporabimo pri priporočilu.
Eric Kavanagh: To je super zadeva, zaradi česar bom dobro spoznal končne komentarje tukaj. Tudi Robin in jaz in Rick smo se slišali že več let, govorimo o samonačrtovanju baz podatkov. To je podatkovna baza za samonastavitev! Vse kar vam lahko rečem je: Ne verjemite jim.
Bullett Manale: Ne verjemite hype.
Eric Kavanagh: Morda se zgodi nekaj majhnih stvari, ki se naredijo dinamično, a tudi to bi morda želeli preveriti in se prepričati, da ne počne nekaj, česar nočete. Tako bomo kar nekaj časa potrebovali taka orodja, da bomo razumeli, kaj se dogaja na ravni baze podatkov in kot je povedal Robin, podatkovna jezera so fascinantni pojmi, vendar verjetno obstaja približno toliko možnosti, da jih prevzamejo kadar koli kmalu se pojavi Monster Loch Ness. Torej, samo še enkrat bi rekel, resnični svet ima veliko tehnologij baz podatkov, potrebujemo ljudi, DBA, da si ogledajo te stvari in jih sintetizirajo. Lahko poveš, da moraš vedeti, kaj počneš, da te stvari delujejo. Vendar potrebujete orodja, s katerimi boste dobili informacije, da boste vedeli, kaj počnete. Torej, spodnja točka je, da DBA delajo v redu.
In velika hvala Bullettu Manaleu in našim prijateljem iz IDERA. In seveda Rick Sherman in Robin Bloor. Vse te spletne oddaje arhiviramo, zato se za več informacij o vsem tem pretaknite na spletno stran insideanalysis.com ali na naše partnersko spletno mesto www.techopedia.com.
In s tem se bomo poslovili, ljudje. Hvala še enkrat, se bomo pogovorili naslednjič. Pazite. Adijo.