Avtor osebja Techopedia, 11. maja 2016
Odvzem: Voditeljica Rebecca Jozwiak razpravlja o napredku v arhitekturi in shranjevanju baz podatkov z Dez Blanchfield, Robin Bloor in Brianom Bulkowskijem.
Trenutno niste prijavljeni. Če si želite ogledati video, se prijavite ali prijavite.
Rebecca Jozwiak: Dame in gospodje, pozdravljeni in dobrodošli v podjetju Hot Technologies 2016. Danes smo, "Izpostavljamo diferenciacijo: prihaja nova doba skalabilne infrastrukture." Danes stojim za Ericom Kavanaghom. Sem Rebecca Jozwiak, vaša skromna gostiteljica skupine, medtem ko Eric odhaja na Jamajko. Dobro zanj.
Tako kot že desetletja je tudi letos vroče, čeprav se tehnologija verjetno giblje s hitrostjo, ki je večja od Moorejevega zakona, in kaj organizacije delajo, da se držijo tega? Iščejo vse, kar je hitro, in menim, da je verjetno ena najpomembnejših stvari, ko razmišljamo o bazah podatkov. Seveda imamo možnosti običajne relacijske, zdaj imamo svoj NoSQL, imamo svojo shrambo stolpcev, imamo svoje baze podatkov grafov, naše baze RDF, ampak resnično, kar iščejo podjetja, je obseg, je paralelizem in je hiter .
Zdaj so tradicionalne arhitekture nekako temeljile na tem relacijskem modelu. Če pa pogledate večino spletnih podjetij, ki so se pojavile v zadnjih treh, petih, desetih letih, to niso modeli, ki jih uporabljajo za svojo infrastrukturo. Uporabljajo drugačno, vzporedno arhitekturo, spreminjajo velikost in so hitri, in to je tisto, na kar se danes veliko ljudi obrača.
V naši postavi imamo Deza Blanchfielda, on je znanstvenik iz skupine Bloor. Imamo doktorja Robina Bloorja, našega glavnega analitika v skupini Bloor, in Briana Bulkowskega, direktorja organizacije in ustanovitelja podjetja Aerospike. Torej fantje s tem, to bom predal Dez.
Dez Blanchfield: Hvala in hvala, ker ste me imeli tukaj. Poskusil bom določiti prizorišče, kako smo zelo hitro prišli do mesta, kjer smo, in se bomo poglobili v veliko več tehničnih podrobnosti, ko bomo preiskovali današnje teme. Tukaj bom samo nadziral zaslon.
Tako večje, boljše in hitrejše. Ko pomislim, kje smo, je podoba, ki mi osebno pride na misel, prav ta podoba, ki jo imam na svojem diapozitivu, ki je širitev vesolja. Tehnologijo razvijamo in razvijamo že desetletja, pravzaprav od poznih petdesetih let, ko je mainframe postal prava stvar. Tehnologija je v mnogih primerih še naprej rasla na slabši ali večji od linearne krivulje, odvisno od dela krivulje, kolikor gre za programsko ali strojno opremo.
Lestvica je vse večja in večja, vse hitrejša in hitrejša, kar se tiče tega, kar poskušamo doseči, ter vse manjša in manjša na ravni izdelave in polprevodnikov. In na sredini so programska oprema in aplikacije ter sistemi, ki temeljijo na tej programski opremi, in naraščajo vse manjše in manjše, in videli smo stvari, kot so kontejnerske aplikacije in mikro strežniki, to je spet stvar. To smo storili v preteklosti, desetletja pred tem, toda zaradi manjših in manjših dosežkov smo vedno večji in večji v obsegu, s katerim lahko zdaj izvajamo stvari, kot so aplikacije in določene baze podatkov, in logiko te baze podatkov.
Imam ta pogled, kjer smo se pomikali zelo vodoravno, v bistvu osi X; vertikalno smo se pomikali po osi Y. Zdaj smo tam, kjer moramo iti nekam drugače, in po mojem je to miselno predvideno kot os Z, in to je, da se moramo poglobiti v tehnologijo in pogledati, kako lahko naredimo stvari se razlikujejo od tistega, kar smo storili do zdaj, da bi dosegli ta dodaten kos hitrosti. Tako si predstavljam celotno širitev vesolja, kjer je prišlo do eksplozije, in nekatere tehnologije obstajajo, in to boljša linearna rast in povpraševanje. Morali smo najti različne načine, da dosežemo večji, boljši in hitrejši rezultat.
Samo, da hitro pokrijemo vrsto tam, kjer smo trenutno v nekaj strojnih okoljih. Videli smo, da padajoči stroški gigabajta prostora na disku prinašajo nekaj dokaj velikih prehodov in tehnologije ter pristopov k večji, boljši in hitrejši težavi. To sta dva ločena grafa, ki zajemata približno desetletje na kos, nekaj več kot desetletje vsake padajoče cene enega gigabajta prostora na trdem disku.
Gre za klasično J krivuljo ali hokejsko palico, kot jo pogosto omenjamo, saj ste pred nekaj dobrimi dvema desetletjema lahko porabili dobesedno sto tisoč dolarjev za nakup gigabajta prostora na disku, danes pa je to postalo dolarjev in sčasoma sem prepričan, da bo na koncu, kar bomo dirko poimenovali na nič, bo postalo centov. To je prineslo zanimivo spremembo vrste stvari, ki jih lahko počnejo podjetja. In na to navajam motnjo predvsem zaradi podatkov ali velikih podatkov, in s tem mislim, da smo videli tehnologije, kot kako postati stvar, kjer lahko shranjujemo zelo vodoravno pri shranjevanju, in vrsto izračuna se lahko uporablja za to shranjevanje in kako odpre zanimivo tehnologijo, ker nam omogoča, da naredimo zelo hitro, odvečno vzporedno shranjevanje na najhitrejši ravni in Hadoop dele sam po sebi, saj lahko doma kopiramo podatke v zapisu, ki ga enkrat preberemo večkrat, in samo prilagodite velikost na skoraj linearno oceno.
In vsa podjetja, ki se pojavljajo v tem primeru, prihajajo do motenj z uporabo velikih podatkov. Imamo podjetja, kot je Uber, ki so največja taksi družba na svetu. Pravzaprav nimajo nobenih taksijev in tukaj je dolg seznam. Airbnb je največji ponudnik nastanitve, dejansko nima nepremičnin. Ena mojih najljubših je Facebook, na primer na tem seznamu, kjer vsebine dejansko ne ustvarijo, mi jih ustvarjamo zanje, ampak so dejansko največji lastnik medijev na planetu. Imamo zanimive, kot so najhitreje rastoče banke, dejansko nimajo denarja. To so medvrstniške posojilne platforme in banke, še posebej pa v Avstraliji raste znanost, imenovana SocietyOne. Nekatere večje banke, ki morajo imeti denar, vlagajo v to banko enakovrednih bank. In skozi ta seznam gremo celo do Netflixa; v resnici nimajo nobenih kinematografov, vendar so dejansko največja kino hiša na svetu.
Torej smo prišli do tja, kjer so bili po mojem mnenju z uporabo pametnih tehnologij na ravni podatkov, saj bi lahko zaradi manjše cene gigabajta prostora na trdem disku naredili večje in širše shranjevanje z nižjimi stroški. uporabite nekaj inteligentnega računanja in porazdelite računalniški model preko tega. Te družbe so lahko ustvarile konkurenčno prednost in motile zaradi padca stroškov diskovnega prostora.
Videli smo, da se podobna stvar dogaja v ceni spomina. Pred nekaj desetletji bi lahko, če bi šest milijonov dolarjev ležalo naokoli, lahko kupili gigabajt RAM-a in imeli smo zelo podobno J krivuljo ali hokejsko palico, ki se bo zmanjšala na stroške ali padla cena OVEN. In to je prineslo nekaj zanimivih stvari, in v mojih mislih je ena največjih motenj v tem prostoru količina pomnilnika, ki ga je mogoče vgraditi v naprave, kot so mobilne naprave, kot so telefoni in tablice, in celo prenosniki. Danes je v računalnikih količina pomnilnika, ki gre v povprečen prenosnik, v nekaterih primerih precej smešna. V nekaterih primerih ima moj trenutni prenosni računalnik več pomnilnika kot nekateri strežniki, ki so jih uporabljali ne tako dolgo nazaj.
To je samo po sebi prineslo pomembne spremembe, podobno kot RAM meni, pa nam je omogočilo hitro spreminjanje in spreminjanje. Zdaj smo se pojavili v tehnologiji, ki ji pravimo bliskavica, in to je tehnologija, ki prvotno izhaja iz nečesa, kar je bilo nameščeno na strojni opremi v obliki EEPROM-a, majhnega čipa, ki je bil zasnovan tako, da bo lahko na voljo, in piši, nato pa bi šele, ko bi se napajanje izklopilo, ohranilo vse, kar si napisal na ta čip kot obstojno shranjevanje. Počasi je bilo, okorno in v teh dneh, mislim, da je bilo to med letoma 1980–1981, je to nekako postalo stvar. Do leta 1984 je Toshiba, za katero verjamem, da je izumil tehnologijo, naredila komercialno stvar, ki bi jo lahko uporabili.
Toda že pred časom so ljudje ugotovili, da bi dejansko lahko uporabili kombinacijo komponent, ki so bile uporabljene za ustvarjanje tega koncepta EEPROM-a, spomina, ki je samo za branje, potem ko ga je izbrisal in vanj napisal in so mu lahko dejansko pisali redno in ga uporabljajte nekoliko bolj kot prostor na disku in nekoliko bolj kot RAM. Sčasoma se je razvil. Zdaj je ta tehnologija za shranjevanje bliskov spojena med tradicionalnim diskovnim pomnilnikom, ne glede na to, ali gre za predenje ali v nekaterih primerih hibridni disk pomnilnika, in pomnilnikom RAM. Ključna stvar je sistem med tem, ker lahko preberete in napišete vanj, nato izklopite napajanje in ohrani tisto, kar ste mu napisali. Torej prostor na disku, očitno mu napišete, izklopite napajanje, vrteče se vreteno in močno spremenjeno, zaradi boljšega opisa, ohranja ničle in tiste, ki ste mu jih napisali.
V prostor za pomnilnik z naključnim dostopom nekaj zapišete v pomnilnik v RAM, računalnik izklopite in vse se obriše, ker ni več elektronov, ki bi ga napolnili in shranili informacije, ki ste mu jih napisali. Poleg tega je na sredini in je izjemno hiter, hitrejši od diska, tad počasnejši od RAM-a. Lahko pa mu napišete in preberete iz njega, in ko izklopite napajanje, se bo obdržalo. To je prineslo nekaj neverjetnih tehnologij, še posebej pa smo razvili mobilne naprave in prenosnike, ki so resnično zelo hitri in zmorejo narediti veliko stvari, zdaj pa se je premaknil v infrastrukturni prostor okoli shranjevanja in računanja, kar je prineslo veliko spremembe v tem, kar lahko dosežemo v obsegu. Tako nekako verjamem, da se osi Z v mislih pojavlja zdaj.
Na mnogo načinov je že skoraj pravočasno, saj smo zdaj opazili motnje v tem, kar jaz poimenujem povpraševanje, in to je, da imajo potrošniki ne glede na dogajanje v infrastrukturi in tehnološkem prostoru ter sposobnost hitrejše vožnje hitrejši izračun in uspešnost na infrastrukturni ravni potrošniki zahtevajo to motnjo v obliki, o čemer je zdaj govoril, izkušnja slavnih. Vsi si želijo, da bi vsak sistem, vsaka aplikacija, vsako spletno mesto vedeli, kdo so in kaj jim je všeč, in da jim lahko nudijo prilagojeno izkušnjo. Ni dovolj dobro samo, da obiščem spletno stran, kjer kupujem kino vstopnice. Želim, da ve, kaj sem kupil že prej, zakaj sem ga kupil in potencialno to, kar so ljudje, kot sem jaz, kupil in stvari priporočil.
Nepomembno je, da se mi zdi to, kar mislim, stranski vrstni red družbenega, in to je, da želim izkušnjo slavnih, želim pa tudi druženje te ideje, želim jo deliti z vsemi prijatelji in jim povedati, kaj sem delam in tudi jaz želim vedeti, kaj počnejo moji prijatelji. In to je posledica eksplozivnega povpraševanja po dodatnih računih in shranjevanju ter hitrega preobrata stvari. Videli smo generacijo Fitbit, čemur pravim vedno sledenje. Vse, kar počnem, se nekje spremlja, beleži in ujame. Videli smo v realnem času vse: bančništvo, ponudbe, priporočila, da bi se lahko spopadli s stvarnimi časi, ki jih osebno počnem kot potrošnik.
In potem vidimo zelo velik vpliv, kot so varnostna tveganja okoli kibernetske varnosti. Včasih je bilo, da smo imeli posamezne hekerje, potem smo se nanje nanašale kriminalne tolpe, zdaj imamo cele države, ki se bodo bojevale po internetu, kar je resnična stvar in se dejansko zgodi. Bodite pozorni na to, sedite in si oglejte, ker je na to resnično mogoče vplivati, in nekateri naši predskupinski pasovi so govorili o tveganju, da bi prodrli lastni računalnik ali vsaj svoje omrežje.
Videli smo ta koncept pridobivanja entitet. Pridobivanje entitet je takrat, ko moramo najti zanimive stvari v zelo velikih zbirkah podatkov, zlasti v zvezi z goljufijami, nezakonitimi in hekerskimi dejavnostmi. Toda pogosteje bomo videli, da pridobivanje entitete postaja osrednja točka dobrih stvari in stvari, ki so za nas koristne, v nasprotju z iskanjem stvari, ki nas napadajo.
Opazili smo tudi eksplozijo, imenovano geoprostorski podatki. To so podatki, ki dejansko vedo, od kod izvirajo ali iz katerih drugih podatkov, kot so. Lahko si predstavljate, da stojite na ulici in želite najti najbližjo parkirno postajo ali najbližjo restavracijo, aplikacije, ki lahko uporabijo prostorsko računanje in podatke, računanje na podatke, ki ve, kje je v vesolju, je zelo pomembno, ker morate znati vedeti, kje so drugi predmeti in entitete, in to hitro.
Videli smo trajno povezan mobilni telefon. Tudi ko gremo ponoči spati, naši mobilni telefoni še vedno odtekajo, posodabljajo e-poštna sporočila, preverjajo naše koledarje, si ogledamo, kakšno je vreme in ugotavljamo, ali bo na voljo tisto, kar bi radi za zajtrk. Tam se dogaja veliko hrupa, kar ustvarja velik vpliv na to, kaj moramo storiti na zadnji strani in kako hitro to storimo.
Na splošno je čista razsežnost in vpliv tega, kar se imenuje internet stvari, ali pogosteje, povezljivost med strojem in strojem, kjer se naprave pogovarjajo z napravami in to vse do motorjev, pripetih na na strani letala, ki samemu letalu ali sistemu upravljanja letala sporoča, da ima motor pri številu štirih čezmerno obrabo in vročino, zato ga je treba zamenjati, ko pristanemo, in nato sporoči drugemu stroju, zato je treba postaviti naročila in čarobno se pojavi inženir med letom na letališču in je pripravljen, da ga med gorivom zamenja.
In obseg, ki je tako velik in tako velik, da smo se morali vnesti v to, na kar se sklicujem, z dostopom, da bi se nekako spopadli z njim. Ker je nov svet in dobrodošel v novem, nov svet vsega, kar uporabljamo, povezano; nekoč so to bili sateliti in omrežne naprave, zdaj so to mobilne naprave in naši prenosni računalniki in tablice in telefoni, celo moj čisto nov Audi ima vgrajen znak in stalno poroča o svojem zdravju, a se tudi posodablja, in ve, kje je in kateri zemljevidi so uporabni, in celo pove, kdaj naj grem po drugi poti, če je na cesti naprej promet.
Vse, kar zdaj gradimo, vse, o čemer zdaj govorimo, je zasnovano tako, da se povežemo in povežemo z drugimi stvarmi, ne samo od mene do sistema, ampak od sistema do sistema in da bi se lahko spopadli s tem na infrastrukturni plasti je treba uporabljati zelo različno razmišljanje tako v strojni kot tudi v programski opremi, zlasti v slojih baz podatkov, ki jih sistemi potrebujejo za to in v mnogih pogledih je baza podatkov postala gonilna sila, aplikacije pa res samo mali boti, ki delajo stvari.
Tu se bom hitro zavil s tem rahlo šaljivim pogledom na to, kje gremo s temi stvarmi, in temu, čemur pravim "IoT s pritiskom na gumb". Obstajal je nov pripomoček, imenovan Amazon Dash Button, in to je mali pripomoček velikosti palca. V bistvu je na isti način kot moj USB palec. Ko kupite to stvar, je približno 4, 99 ameriških dolarjev v spletu od Amazona, ko jo dobite, jo konfigurirate s svojim mobilnim telefonom in jo dobesedno samo pripnete na eno od svojih naprav, na primer hladilnik ali pralni stroj ali kar koli drugega. V primeru, da vam pralni stroj sčasoma zmanjka, lahko pritisnete ta gumb in poklical vas bo domov ter samodejno naročil več za vas, čarobno več pa vas bo poslalo prek naših dobrih prijateljev v Amazonu.
Zame to me prestraši, ker se bo zgodila eksplozija številnih stvari, ki so povezane v omrežje in poskušajo ustvariti povezljivost ter ustvariti povpraševanje. Če si lahko predstavljate, ena ali dve od teh stvari morda niso tako strašljivi, vendar sem zadnjič, ko sem pogledal, bilo več kot 110 teh stvari z blagovno znamko, tako da bo skoraj vsaka znamka na planetu poskušala dobiti svoj mali potisk - gumba IoT, da greš domov in pritisneš na gumb, na katerem piše: »Naročite mi pico.« Pritisnete še en gumb in otrokom jutri naročite vnaprej pripravljeno kosilo za šolo.
To pomeni tako veliko povpraševanje po preobrazbi na zadnji strani, na ravni aplikacije, zlasti na ravni baze podatkov, da mislim, da smo šele videli vrh ledene gore tiste vrste preobrazbe uspešnosti, ki jo moramo videti . In s tem ga bom predal doktorju Robinu Bloorju in prejel njegov vpogled v to, kje smo.
Rebecca Jozwiak: V redu Robin, jaz sem ti dal žogo.
Robin Bloor: Ali ni to dobro? Ok, tukaj gremo jaz. Videla sem Dezovo predstavitev, preden sem prišla do tega, zato bi rekla stvari, ki so brezplačne, namesto da bi samo ponavljala nekatere stvari, ki jih je Dez povedal. Mislil sem, da bom govoril o evoluciji baz podatkov glede na to, kaj se je dejansko zgodilo z arhitekturo in podobno in tako naprej, z bazami podatkov z zgodovinskega vidika.
Temeljna težava vsakega prodajalca baz podatkov je vzdrževanje prilagodljive arhitekture, ki prilagodi obsegu in sledi koraku z razvojem strojne opreme. Govoril bom takole, ampak ko se dejansko ozreš nazaj in vidiš način gradnje baz podatkov in način, kako so zdaj zgrajeni, se dejansko bistveno razlikujejo od tistega, kar bi poimenoval nivo arhitekturne zasnove . Vredno je samo pregledati, zakaj je tako ali vsaj mislim, da je tako. Strojni dejavniki in Dez nam je omogočil še posebej dober potek spodnjih plasti glede na pomnilnik in disk. Kar imamo zdaj, in to je prihodnost, Intel je naslednji, CP, ki bo imel FPGA. Kaj bodo ljudje storili s tem, nimam pojma. AMD združuje CPU in GPU in kakšna bo razlika? To so takšne spremembe, ki se bodo v bazi podatkov dejansko spremenile, in sumim, da je Aerospike med drugim, ker Aerospike poganja zmogljivost, verjetno že to pogleda in se odloči, kje misli, da bo dejansko šlo z načinom delovanja izdelka.
Imamo sistem na čipu, ki še ni vzletel. SSD diski, o katerih vemo, vendar je treba poudariti, da se dejansko povečujejo hitrost, približno približno stopnja Mooreovega zakona, faktor 10 na vsakih šest let. Toda Intel bo kmalu izdal 3D-križ, ki trdi, da lahko gre več kot stokrat hitreje kot SSD-ji, pravzaprav nekakšne kapljice v mešanico, to pa bo spremenilo hitrost, s katero lahko proizvodi, kot je Aerospike, dejansko pojdi.
Potem smo dobili vzporedne strojne arhitekture, z drugimi besedami tako, kot smo konstruirali strojno opremo v smislu - prvotno je bil to le CPU, ki je sedel nad pomnilnikom, ki je sedel nad diskom, vendar je postal način bolj zapleten kot to. Ideja sistema na čipu je, da lahko dejansko vzporedite čip, da se čip čip in da gre vse z izjemno hitrostjo, in nimamo pojma, kateri od teh izdelkov bo dejansko prevladoval.
To je samo pogled v prihodnost, toda na strojni ravni se zmogljivost pospešuje in stroški še naprej padajo, nekako tako, kot je opisal Dez. Procesorji ne pridejo nujno do cenejših, ampak hitreje in podobno.
S poslovnega vidika so v nekaterih situacijah, in to so tržne situacije, kjer je prva vrednost podjetja. Če še posebej - če ste popolnoma prepričani, da vam bo določena zaloga pocenila ceno, prva oseba, ki dobi naročilo za prodajo, dobi najboljšo ceno. Res je tako preprosto. Zato obstaja tehnološka dirka, ki se nadaljuje na avtomatizirano trgovanje v bankah, da bi dejansko poskusili in zmagali v teh situacijah. Kaj se je zgodilo po tem? Kaj se zgodi potem, ko so banke vse to storile? Kar naenkrat začnete opažati druga območja, ki se okužijo z enakimi potrebami po hitrosti.
Resnično, kaj se dogaja, so človeka odstranili iz enačbe, in to se je z internetnim oglaševanjem zgodilo zelo hitro. Toda stvar je bila, da to ni konkretna transakcija, izvedba metod, to je celoten poslovni proces, dejstvo je, da je spletna stran pravkar zavržena in sprejeti je treba odločitev, ki je lahko precej zapletena odločitev, o tem, kakšen oglas je dejansko nameščen na tej spletni strani, od tistega, ki je uporabnik brskalnika, odvisno od tega, kaj bi bil najprimernejši oglas, ki ga je dal, in tako naprej, in tako naprej. To je postala zelo zapletena stvar in to bom še enkrat omenil.
Toda poanta je v tem, da uspešnost in razširljivost poslovnega procesa nista enaka težavi kot uspešnost in razširljivost poizvedbene sposobnosti, in to je nekaj, kar dobro poznam, saj smo ga pred kratkim seznanili z Aerospikeom, da so se tudi zavedate. Druga stvar je, če dejansko delate s temi hitrostmi, lastnosti sredstev so pomembne za transakcijo, kakršno koli obdelavo dogodkov. Resnično, resnično so pomembne. Torej lahko ogromno tega, kar počnejo nekatere zbirke podatkov, to je izguba črke ali dveh iz sredstev, v kontekstu lahko deluje dobro - to bo delovalo dobro v kontekstu, o katerem govorimo. Iskreno ni sprejemljivo.
S tehnološkega vidika pravzaprav gledate - vem, da obstajata dve vrsti vzvodov, da bi ustvarili takšne arhitekture, ki so pravzaprav potrebne za hitrost, s katero lahko na primer Aerospike izvede milijon transakcij na sekundo V razvoju programske opreme morate biti zelo natančni. Ne moreš se samo hecat stran. Paziti morate na dolžino kodne poti. Izjemno morate uporabiti pomnilnik in dejansko optimizirate celotne transakcije. Potrebujete inteligentni paralelizem in potrebujete tudi varno vzporednost. Morate povečati, ne pa lestvice, ker takoj, ko omrežje vključite v karkoli, postane najverjetnejši kazalec, na katerega boste prišli do zamude, in začele bodo transakcije prepočasne.
Preden začnete dejansko meriti, morate čim več priti do vseh znanih omrežij in resnično ne želite hitro spreminjati velikosti, resnično ne želite veliko procesov. Želite mrežo, ki je ne uporablja nihče drug. In želite imeti neverjetno hitro omrežje.
Pospešeno shranjevanje SSD je nekaj - pravzaprav mislim, da večina tega velja za tisto, kar počne Aerospike. Ena zanimivih stvari je, da gre za bazo podatkov NoSQL. Nekaj let nazaj je bilo verjeti - ne vem, - nekoč je veljalo, da je relacijska baza podatkov edina baza podatkov in je prevladovala nad vsem, in to je bila le ta čudna nišna situacija, ko je ne bi potrebovali iti relacijski. Zdaj je nekako obrnjeno na glavo. Hitre baze podatkov so v teh bazah podatkov SQL, in eden od razlogov za to je glavni razlog za to, da se izogibajo združevanju podatkov, saj podatke shranjujejo precej predmetno. Ko končate s predmetom, ga preprosto shranite in nato celoten predmet potegnete nazaj, stvari se ne povezujejo skupaj, da bi jih dejansko predelali. V tem je hitrost. Te vrste tehnik, ki ustvarjajo hitrost v okviru baze podatkov.
To je sled solz, to se je zgodilo z bazo podatkov. Zgodba ali pripoved o relacijskih bazah podatkov konec podatkovne baze pravzaprav ni bila resnična. Tudi ko so začeli prevladati, je bilo to še vedno potrebno. Objektne podatkovne baze so v tistih dneh opravljale pretekle transakcije, ker jih relacijske baze podatkov dejansko niso mogle storiti, nato pa se je izkazalo, da relacijske baze podatkov, ki uporabljajo vrsticne trgovine, ne morejo opraviti niti hitrih poizvedb, potrebovali ste shrambe stolpcev. In potem smo odkrili, da če dejansko želite opraviti grafične poizvedbe na podatkih, niti shramba stolpcev niti relacijska baza podatkov ne bi koristila, in dejansko bi morali imeti posebej izdelano bazo, ki se zaveda grafikonov. Potem so prišle baze podatkov RDF in takoj, ko ste dejansko začeli razmišljati o pomenu semantike, smo dobili baze podatkov NoSQL zelo natančno za hitrost. Če jih kličete po NoSQL, je skoraj tako, kot da tržite vse te baze podatkov, kot da bi bile enake, pravzaprav se bistveno razlikujejo v tem, kar se skriva pod njimi. Edini razlog, da nosijo ime NoSQL, je, da se s SQL-om ne pretiravajo, ker je predrag. Zamude pri transakcijah, ki jih potrebujejo.
IoT - za katerega sem mislil, da bom končal na isti točki, kot ga je končal Dez - še ni konec, vse te situacije glede hitrosti in zamudnih zahtev pa še ni konec, dokler debela dama ne začne izkrivite te podatke in se še niso zares začeli. Veliko teh podatkov bo želelo imeti zamude, ki sem jih nekako nakazal, zato mislim, da je to vse, kar moram povedati. Dajmo jo Aerospikeu in Brianu Bulkowskiju.
Brian Bulkowski: Pozdravljeni, hvala, ker sem se danes pridružil skupini Bloor in meni za današnjo predstavitev. Pri razmišljanju o tem, o čem sta Dez in Robin govorila, bi rad povedal nekaj o poti, ki jo je Aerospike sprejel pri zagotavljanju nove tehnologije baz podatkov in tehnologije baz podatkov NoSQL za številne panoge. To je bila odlična pot. Aerospike smo začeli leta 2008 in videli veliko trendov, ki sta jih omenjala Dez in Robin. Zlasti o tem, da bi lahko v bazah pomnilnika izkoristili bliskovitost, pa tudi vrste oblačnih sistemov z obsegom in vrste lestvic, potrebnih za personalizacijo, analizo vedenja in vrste VIP izkušenj slavnih oseb, o katerih je bilo govora.
Ko smo pristopili k problematiki baze podatkov, ki je bila sprednja operativna baza podatkov, ki je bila sposobna zagotoviti podlage aplikacijam, ki bi jih bilo mogoče napisati za njihovo reševanje, smo začeli s težavo, kako lahko v bistvu sestavimo porazdeljeno tabelo, pomnilnik -razdeljena hash tabela, ki je bila presenetljivo hitra in sposobna stvari, kot so milijoni transakcij na sekundo, vendar po razumni ceni. Ko smo končali prototip, smo ugotovili, da bomo potem morali ugotoviti, kdo morda potrebuje to hitrost. Ker smo podjetje iz Silicijeve doline, smo hitro ugotovili, da je res oglaševalska panoga sposobna porabiti tovrstne informacije in se zanjo zanimala, zato bi rad preživel sekundo in govoril o ponudbah v realnem času in kako to trg deluje.
Robin je omenil, kako deluje finančno trgovanje, kar je prva transakcija, pogosto je zmagovalna transakcija, in v bistvu je čas za trg zamud in zakasnitve. Oglaševalska industrija je na zanimiv način nekoliko drugačna, saj je cilj oglaševanja poseben - tako imenovani vtis, sposobnost oddaje oglasa - dražba in dražba traja od deset milisekund do petdeset milisekund. Ime igre in pogosto je na stotine podjetij, ki zdaj v realnem času oddajajo ponudbe za vsak posamezen oglas, ki je bil nameščen v internetu, je, da dobijo največ količine podatkov in prinesejo najboljše algoritme, ki jih je mogoče opraviti v teh desetih do petdesetih milisekundah največja količina podatkov.
Ta sprememba in premik se je dogajal v oglaševalski industriji, v vsaki od teh nekaj milisekund se časovno omejujejo zapleti z najboljšimi algoritmi za največjo količino podatkov, in to storiš, da združiš veliko majhnih kosov podatkov. Zadnje informacije o naslovu IP, nedavne informacije o določeni kategoriji naprav, nedavne informacije o obnašanju spletnega mesta, nedavni iskalni izrazi, vse bi šlo v skrivno omako algoritmov določenega podjetja, da bi določili ceno in ponudbo.
Del tega trga je bil fascinanten trg. V Aerospikeu smo prvo uvedli leta 2010 z nekaterimi prvimi podjetji, ki resno delajo v ekonomiji ponudb v realnem času, nato pa smo dosegli, v bistvu tisto sprednjo prodajo vedenjskih podatkov, za večino podjetij v tem prostor. Od takrat smo ugotovili, da gre za posebno arhitekturo, ki jo bom podrobneje opisal skozi to predstavitev, je, da se je to dogajalo v letih 2010, 2011, 2013 in se še naprej razvija. Oglaševanje je zelo dinamičen trg.
Toda tovrstno VIP izkušnjo si lahko zamislite kot dajanje pravega oglasa, ne dajanje oglasa za otroške izdelke, kajti slučajno nimam otrok, zato ne bom imel učinkovitega oglasa, če je postavljen na to, če pa gre za hitre avtomobile, je to Brianu takšen oglas. To je res vrsta VIP izkušenj pri poslih, ali popusti ali ne, če ste na prodajnem mestu, tudi pri odkrivanju goljufij. Je to običajni vzorec določene osebe ali določena kreditna kartica? Vsa ta oblika tehnologije analitike v realnem času, vedenjskega napovedovanja, napovedne analitike zdaj izstopa iz oglaševalske industrije, ki to počne že nekaj let v zabavo in dobiček in resnično prihaja na drobno in bančništvo ter odkrivanje goljufij itd. skozi določeno arhitekturo. Tako je Aerospike v številnih teh primerih imel privilegij.
Arhitektura, za katero vidimo, da deluje in je praktična za to, je tista, kjer namesto da ustvarimo nabor poizvedb s aplikacijskega strežnika, namesto da več računanja premaknemo na sam strežnik aplikacij in nato uporabimo bazo podatkov v bistvu za shranjevanje motor za vrste predmetov, o katerih je govoril Robin. V tem primeru te arhitekture najprej ne zamenjujejo tega s svojo dejansko analitiko. Na desni strani tega diapozitiva vidite, da je tukaj še vedno analitika za ustvarjanje vpogledov. To so delovna mesta, ki pogosto delajo nad petabajti, na desetine petabajtov podatkov, celo pri nekaterih večjih kupcih, pri čemer uporabljajo različne tehnologije. Potrebujete veliko skupino s podatki, ekipo za analitiko, kvantitativno ekipo, ki bi ugotovila, kaj, recimo, geoprostorske koordinate zadevajo, kakšni modeli delujejo v smislu iskanja teh odnosov in ustvarjanja VIP izkušnje. To je celotna težava sama in ne Aerospike, ki je neposredno sodeloval, in obstaja veliko odličnih tehnologij, ko imate opravka s takšnim sistemom.
Navdušeni smo in sodelujemo z industrijo, je, ko dobite ta vpogled, kako se lotite vrste transakcij med strojem in strojem ali hitrega prenosa stroja na človeka, kjer pridobite ta vpogled in naredite so resnične za vsakega človeka, iz trenutka v trenutek? Arhitektura, ki smo jo videli, je tista, kjer je zapisan strežnik aplikacij, ki izvaja vso to matematiko in pregleduje modele, ki ste jih ustvarili, in pregleduje zadnje vedenje in to počne v bistvu ključno paradigmo oz. vsaj zelo poizvedovalnega sistema.
Ko imate opravka z vrstami podatkov, o katerih govorimo, z vrstami tokov, o katerih govorimo, z milijoni zapisov na sekundo, z milijoni prebranih na sekundo, z milijoni in sto in tisoč odločitvami na drugič, gradnja kompleksnih indeksov, večdimenzionalnih indeksov preprosto ne deluje zelo dobro, ni mogoče razširiti. Način, kako doseči takšno obliko obsega, je veliko vzporednosti. Malo se bomo pogovorili o tem, kako to storimo kasneje. Toda del tega je strežnik aplikacij brez državljanstva, napisan v vašem jeziku.
Pogosto opazimo, da je poseben projekt, ki prevzame nov okvir za prijavo, ki temelji na ljudeh, ki tam delajo, tehnologiji, ki jo uporabljajo, in težavi, ki se jim približujejo. Videli smo ljudi, ki uporabljajo Python, veliko ljudi uporablja Java, še vedno vidimo programerje C, ker je veliko tega še vedno zelo zmogljivo, morda celo uporabljajo stvari, kot so stare knjižnice MATLAB. In za učinkovito odločitev se morajo dotakniti tisoč in tisoč podatkovnih točk na sekundo.
Vprašanje, ki sem si ga zastavil, je včasih: "No, Brian, če si sposoben milijonov transakcij na sekundo, kdo to potrebuje?" Če pogledate na primer obdelavo plačil v Severni Ameriki in Aerospike sodeluje z rešitev, ki omogočajo odkrivanje goljufij v tem sistemu in podpirajo pisce aplikacij, ki delajo zelo inovativne stvari pri odkrivanju prevar, le nekaj tisoč plačilnih transakcij na sekundo teče skozi celo največje plačilne procesorje. Ko pa je prvo podjetje prišlo k nam in reklo, da gleda na uporabo NoSQL, in je želelo videti, kako bo izgledala naša rešitev, ki temelji na njihovi aplikaciji, so rekli, da se želijo dotakniti 5.000 kosov podatkov v 750 milisekundnem oknu. No, nenadoma imate v vsakem izračunu nekaj sto poslovnih transakcij in nekaj tisoč podatkov, zdaj pa ste na področju, ko potrebujete milijone transakcij na sekundo.
Primer - če za nekaj časa odložimo oglaševanje, je primer goljufije fascinanten, ker tam, kjer je denarja, obstaja goljufija in preprečevanje goljufij v realnem času, v nasprotju s poskusom analitičnega razreševanja po goljufiji, je resnično prinaša čim več podatkov na spletu, na to pa si lahko omislite odsev te VIP izkušnje. Se ta oseba obnaša tako, kot se običajno ne obnaša? Tako se možnosti, da gre za goljufiv sistem, in ne dejansko za to osebo, povečajo. Ali ta oseba običajno dostopa prek določene naprave ali sklopa naprav z določenim naborom ločljivosti zaslona? Ali ponavadi kažejo določen vedenjski način nakupovanja? Morda lahko med potekom same transakcije stisnemo goljufijo v popku. To bi vas moralo zelo spominjati na to, kar se dogaja v transakciji v oglaševalskem sistemu.
Vrste sistemov, ki jih rešujemo, so tisti, kjer ima vsak posamezni plačilni procesor veliko podatkovno skupino, imajo veliko zgodovinskih podatkov, ustvarjajo nove modele, pri Aerospikeu ne delijo vseh modelov, ker imajo res skrivna omaka. Če ste naročnik Gartnerja in ste slišali, da se Gartner pogovarja o gospodarstvu algoritmov, je to en algoritem in eno podjetje, ki se borijo, da bi zmanjšali goljufije in ustvarili število uspešnih transakcij, saj tudi vi ne ne želite blokirati transakcij. To so takšni projekti, ki jih v Aerospiku iščemo na teh nivojih.
Drug primer, s katerim smo sodelovali s podjetji za finančne storitve, je to, kar se imenuje Intraday System of Record. V tem primeru je to, kar se dogaja, takšna bogatejša izkušnja, tudi v trgovini na drobno, je tista, kjer želim pogledati svoj določen položaj in to želim narediti izjemno natančno. Ne želim imeti ulova pred svojim sistemom DB2. Namesto tega želim pogledati natančne podatke in med mobilnimi, pa tudi stvari, kot so preračunavanje tveganj, je treba preračunavanje tveganj zdaj izvajati iz minute v minuto, želite, da bi lahko preračunali tveganje vseh, pa tudi globalno tveganje, sistemsko tveganje za celotno podjetje v nekaj minutah.
In spet je isti problem. Vsak posamezen račun, ki je določen, si omislite to kot ključno iskanje vrednosti določenega predmeta, potem lahko to naredite vzporedno, in kar je najpomembneje, ta paradigma vam omogoča, da kodo in svoje algoritme pišete v jeziku na visoki ravni, kar je lažje odpravljanje napak in hitrejši čas za trženje. V tej ekonomičnosti algoritmov moram zdaj imeti svoje algoritme na spletu. To je zelo različna težava pri modeliranju in poslovnih odnosih, v čem so relacijski sistemi odlični. Če imate tabelo delov in so ti deli povezani z naročili in so ta naročila povezana z ljudmi, imate poslovni postopek, ki ga je mogoče strogo modelirati in se verjetno ne bo spremenil v času vašega podjetja. Vendar je treba nov algoritem za iskanje novega vzorca goljufij napisati natančno in hitro ter se povezati v spletu, pri čemer se poslovne odločitve vsaj v nekaj dneh, če ne kaj hitreje. Rešitev NoSQL za tovrstni sistem snemanja je za te fante res neverjeten sistem, saj jim omogoča, da zelo hitro zaužijejo podatke, pa tudi izdelajo nove algoritme, torej ne le nova izkušnja strank pri naslavljanju mobilnih, ampak res izdelava najrazličnejših novih aplikacij.
To, kar dolgotrajno vidimo pri Aerospikeu, je dejstvo, da ima vsaka vrsta baze podatkov, vsaka fizična postavitev podatkov na disku svoje komponente, pri Aerospiku pa smo res osredotočeni na to ključno vrednost ali na vloge sistem, kot je povedal Robin, z visoko skladnostjo transakcij in resnično dovoljujejo ljudem, kot so shrambe stolpcev in podatkovna jezera z veliko količino podatkov, kot tudi trdi transakcijski sistemi, ki imajo tudi omejitve poročanja. Vidimo, da se morajo vsi vključiti v različne iskalne stroje. Opažamo nekaj poizvedb na osnovi JSON-a. Vidimo stvari, kot je elastično iskanje, opazimo Spark, ki potrebujejo različne sorte v različnih obdobjih, kot so prodajalne stolpcev, pa tudi prodajalne z vrsticami, pri čemer Aerospike izstopa.
V resnici vidimo, da bodo te različne vrste in industrija prišli do točke, ko bo izbira najboljšega od vsake izmed njih nujna. Na žalost zaradi resničnosti dolgoročne analitike in paketov verzij analitike in operativnih omejitev verjetno ne bomo prišli do točke, da bi imeli eno samo eno velikost, vendar bomo prišli do tega, da bomo lahko da izberete jasno med nekaterimi osnovnimi postavitvami podatkov.
Pogovorimo se nekaj minut o inovaciji bliskavice. Še vedno se postavljam vprašanje, čeprav je, kot je bilo že prej komentirano, bliskavica že dolgo z nami. Ko smo leta 2009 začeli uporabljati Aerospike, je bilo, verjamem, 2009, morda, ja, leto 2009 je bilo to, ko je Intel izšel z X25, ki je bil res prvi bliskovni pogon s SATA na masovnem trgu, pred tem pa je bilo več sistemov bliskavice toda res je to tisto, ki je vdrlo v veliko zavest tehnologije. Fusion-io je za tem resnično prinesel bliskavico na širši podjetniški trg.
Zdaj se pojavlja sistem, imenovan NVMe. NVMe je standard, podoben SATA ali SAS ali celo SCSI, ki omogoča, da različni prodajalci kartic sodelujejo z gonilniki znotraj operacijskega sistema z visoko stopnjo učinkovitosti. Torej ustvarja večjo raven zmogljivosti, najprej zato, ker NVMe temelji na PCIE kot njegovem osnovnem prevozu, ki je veliko hitrejši od SATA, SAS ali česar koli drugega, hkrati pa omogoča tudi najboljše voznike.
Na primer, v Linuxu je ta tip Jens, Jens pa vodnik za voznike NVMe, Jens expo in opravlja boljše delo, kot bi ga lahko z vsemi sredstvi naredil posamezen voznik Intel ali Fusion-io. Ko imate moč, da je sam operacijski sistem sposoben sestaviti najboljšega gonilnika, opažamo nekaj neverjetnih stopenj delovanja. To vse podkrepi idejo, da bliskovni bliskovnik res lahko zagotovi veliko nizko zamudo RAM-a.
Zdaj je Aerospike zaradi svojega modela grozdov še vedno odlična zbirka podatkov RAM, vendar ugotovimo, da ko počnete omrežni skok, za katerega morate imeti pomično shrambo, porabite že vsaj pet do 50 mikrosekund, dodatnih 70 mikrosekund NAND ponavadi ni ovira, zato lahko uporabite bliskavico, saj NAND bliska, glede na to, da je omrežje že vključeno v to. Mnogi se potem sprašujejo, kako - to vse zveni odlično, če kupujete svojo strojno opremo, kako to počnejo javni oblaki? Mislim, da boste zdaj našli, ne glede na javni oblak, ki ga uporabljate, imajo ti javni oblaki zelo močne bliskovite ponudbe. Nekoliko se razlikuje od ponudnika oblakov do ponudnika oblakov. Amazon ima svoje primere I2, ki so bili po mojem mnenju že leto, dve leti resnično zelo kakovostni bliskovni aparati, Aerospike pa ima poleg njih tudi vzorec uvajanja.
Posebej bi rad poklical Google Compute, Google Compute Engine, Google Cloud, saj imajo po naših izkušnjah nekatere najbolj zmogljive naprave in nekaj najbolj prilagodljivega glede vzorcev uvajanja. Toda vidite tudi nove vzorce uvajanja, kot je Pivotal, ki je neke vrste javno / zasebno, zato lahko naredite prave Pivotal aplikacije na obeh mestih, ki podpirajo bliskovne in podpirajo različne pomnilniške naprave, kot tudi Dockerjeve vzorce. To je resnično zgodovina, ko bliskavica ni na voljo samo za nakupe in dajanje v vaše podatkovne centre, ampak je resnično potonila pri vseh ponudnikih infrastrukture, ker je res najboljši način, da dobite sisteme z visoko IOPS na zelo razumna zamuda.
Samo en trenutek o Aerospiku - Aerospike je zbirka podatkov, ki je razporejena v gručah, zaradi česar je zelo primerna za uvajanje v oblačnem slogu in podatkovne centre. Ugotavljamo, da je prilagodljivost, da lahko dodate več podatkov in večjo uspešnost pri tovrstnih novih novih aplikacijah, ker zaženete projekt, ne veste, ali potrebujete petdeset tisoč transakcij na sekundo, sto tisoč, milijon, dva milijona, zato si želite dodati nekaj prostora za dodajanje strežnikov. In kljub temu želite povečati obseg, tako da je vsak strežnik sposoben, da je hiter sam. Pravzaprav ne želite končati s petsto ali tisoč strežniki, ki so počasni strežniki baz podatkov. Scale out ni edina igra v mestu, njegova razsežnost in povečanje, kot je Dez že dejal, je nova Z os.
Upajmo, da vam to ponuja nekaj novih idej o tem, kako hitrost in obseg se spopada z novimi trgi in morda obstajajo projekti, na katerih delate, pri katerih boste lahko razmislili o resnično izdelavi bolj bogatih aplikacij in o uporabi aplikacijskega okvira z več ključa vrednost ali NoSQL baza podatkov pod njim. Pri Aerospikeu sem zagotovo videl veliko naših strank in veliko naših odprtokodnih uporabnikov uspe s tem vzorcem, in veselim se, da ga bo industrija v večji meri sprejela.
Rebecca Jozwiak: Hvala, Brian, in prepričana sem, da imata Dez in Robin nekaj dobrih vprašanj za vas. Taščica?
Dez Blanchfield: Vesel sem, da sem priskočil . Robin, imaš vprašanje? Sicer imam hitro, ki jo lahko začnem.
Robin Bloor: Oprosti, bil sem brez zvoka. Potopil sem se, a me nihče ni slišal. Takoj se mi je pojavilo vprašanje, saj gre za zelo prefinjen nabor tehnoloških zmogljivosti. Kakšna je stopnja stopnjevanja ali stopnja transakcije glede nekaterih uporabnikov, ki jih imate pri obstoječih kupcih? Se stopnja transakcije še naprej zvišuje? In če je tako, po kakšni stopnji?
Brian Bulkowski: Zanimivo vprašanje, Robin. Vsaka panoga ima v vsakem podjetju svojo krivuljo. Vzemimo za severnoameriško oglaševanje, recimo leta 2012 se je severnoameriško oglaševanje prikazovalo verjetno bližje 200.000 oglasom na sekundo, nekako standardno znotraj dneva, ne po mojem času, in zdaj se je stopnjevalo verjetno na približno tri do pet milijonov oglasov na sekundo. A potem se je zgodila zanimiva stvar. Oglaševalska industrija se je začela ukvarjati z nekaterimi pomisleki glede goljufij, v delih industrije, ki lahko preprečijo goljufije, pa se je v nekaterih bolj sofisticiranih kupcih, ki so bili sposobni ugotoviti prevare, nekoliko znižale cene transakcij, približno dva faktorja. Seveda so morali narediti nekaj iskanja podatkovnih baz, da bi preprečili goljufije, tako da se na koncu nekako spremenijo.
Zanimiv je primer uporabe telekoma, tega resnično nisem omenil, telekom je videl, da se transakcije povečujejo zaradi obračunavanja na podlagi vsakega posameznega paketa, ki poteka po mobilnem omrežju. V starih časih smo imeli podrobne zapise o klicih in enkrat na minuto bi klic, kaj veste, malo pinga šel po mreži in ali ima ta fant še minuto? Zdaj moramo sestaviti in celo pot na podlagi vsakega paketa na internetu. To je - žal v mobilnem omrežju, ki je nenadoma zdaj več milijonov paketov na sekundo in nekaj, kar raste vedno znova. Torej je en primer, da vsaka aplikacija pripelje lepe 2X letne vrste. V nekaterih kupcih vidimo: "Toda počakaj, imam novo aplikacijo. Svojemu tveganju želim dodati nekaj prevar. Svojo goljufijo in tveganje želim dodati še globljo izkušnjo strank. "Vsak od njih ustvari novo obremenitev osnovne baze podatkov.
Robin Bloor: Ja, mislim, to je bilo tisto, na kar sem namigoval v kratki predstavitvi, ki sem jo podal, da je to - nekoč smo mislili, da je transakcija, da nekdo nekaj naredi in morda obstaja kaskada dogodkov in vse se posname in zdaj ima veliko transakcij ogromno iskanja, v predstavitvi pa ste dali nekaj primerov. In zato transakcije dejansko ne izvajate več, pravzaprav izvajate nekakšno aplikacijo, ki ima lahko veliko, veliko elementov.
Drugo vprašanje, preden bom predal Dezu - ker na to očitno označimo skupino - drugo vprašanje, na katerega bi rad odgovoril, če ste nanj dobili razumen odgovor, je Dez in pričakujem, da bo internet Stvari ali internet vsega, kot se včasih imenuje, ustvarjajo precej dramatično količino transakcijskega prometa. Lahko govorite s tem? Ali je to vaša izkušnja, ali imate stranke s tovrstno težavo in kakšen je vaš pogled na to trenutno?
Brian Bulkowski: Seveda, mislim, da je malo zmede in, milo rečeno, glede interneta stvari. Kupci, ki jih vidim do zdaj, preprosto pripeljejo internet do stvari, ki jih imajo. Pomislite na te Amazonove gumbe - vse to je Amazon - te gumbe, ne morete jih spremeniti in jih pustite na spletu Walmart. Ni brskalnik, s katerim lahko vse mešaš in se ujemaš. Po drugi strani se dogaja stroj za strojem in ko vtaknete svoj Teslin avtomobil, da ga napolnite, Tesla pošlje ogromen povratni tok informacij, vsak posamezen senzor v avto, vendar teče v Teslin računalnik na analizo in izboljša kakovost. Kar vidim, je vse to od stroja do stroja in vsi senzorji v posameznem podjetju, ki ustvarjajo nove zahteve.
Zdaj večinoma danes, ki se pretaka v te analitične sisteme, in vzemimo primer Tesle; Teslina prva uporaba tega je bila, po mojem razumevanju, izboljšanje življenjske dobe baterije, pod naslovom "Kakšne so delovne temperature, kakšne so obremenitve?" Poglejmo si, oblikujmo boljšo baterijo. "Toda potem začnejo razmišljati, in to je vse dobro, to je nekakšna globoka analitična težava, ki je fascinantna, naslednje vprašanje je:" Kako izboljšati izkušnjo iz trenutka v trenutek ? "
Zdaj pa vzemimo primer kot Nest, kjer poskušate narediti prediktivno analitiko, da bi iz trenutka v trenutek spremenili temperaturo doma. Tak primer smo začeli opazovati v Aerospiku, kjer je ogromno podatkovno jezero in je ogromno analitičnih procesov, toda kaj bom zdaj storil? Moral bom obdržati, razmišljati o tem kot o gotovini, kakšen del zadnjega tedna, prejšnji mesec, morda celo samo informacije o zadnjem dnevu, verjetno na zadnji strani, ker imamo opravka s preprostim senzorjem naprav in v tem trenutku bom delal nabor analitike, da bom spremenil izkušnje. Tovrstne Nest -ove izkušnje, ki jih vidim v primerih uporabe Aerospike-a.
Robin Bloor: V redu, pri internetu sem pričakoval, da boste začeli dobivati sprožilce pragov in da bodo začeli ustvarjati kaskade dogodkov. Ste že videli kaj takega ali to še niste videli?
Brian Bulkowski: Jaz in Dez sem ravno spraševal Dezovo mnenje o tem, ko sva pred klicanjem klepetala. Česa še nisem zasledila, je vrsta kaskade podatkov enega podjetja, ki kaskadno preidejo v drugo podjetje, da se moj hladilnik Samsung pogovarja s svojim pralnim strojem LG, ker sem samo ugotovil, da sem po tleh razlil cel kup čokolade, tako da takšno podjetje do podjetja, če gre za napravo po napravi, mislim, da na internet stvari še čakam. Mislim, da obstajajo nekateri problemi v poslovanju in varnosti, ki so večinoma netehnični, na katere je treba odgovoriti, da bi to videli.
Robin Bloor: V redu, Dez?
Dez Blanchfield: Pravzaprav imam nekaj zelo močnih pogledov na to posebno točko, ki jo bom samo na kratko vključil v pogovor. Mislim, da podjetja in tehnologija pogosto mislijo, da dejansko vozijo tja, od koder prihaja povpraševanje, toda ko pogledamo, kaj se je zgodilo, ko je iPhone postal stvar, in v mojih mislih je bila to nekakšna prva mobilna naprava, če se oprostite punčka, a naprava, ki jo je mogoče nositi naokoli, v resnici lahko poganja veliko majhnih aplikacij v žepu in je prinesla pomembno preobrazbo tega, kar smo mislili, da je računalnik. Veliko ljudi o telefonih iPhone ali pametnih telefonih ali telefonih Android razmišlja kot o telefonih, vendar to niso, pravzaprav so le majhen računalnik, ki poganja aplikacije, ena izmed aplikacij, ki jih izvaja, pa kliče in niso tisti klici, o katerih mislimo več, niso analogni klic od točke do točke, kot je poudaril Brian, gre za majhne pakete, ki se usmerjajo naokoli.
Toda pogosteje, kar smo videli, je to uničenje pametnih telefonov, ki se v resnici ne uporabljajo za klice, ki verjetno 98% tega, kar delam na svojem pametnem telefonu, ne kličejo. Vse je razen klicev, to so aplikacije. Mislim, da ta kaskadni učinek - in želim si tega hitro zastavljati - ampak kaskadni učinek dejansko prinesejo potrošniki, v resnici pa imam to eno linijo, ki jo vržem precej pogosto, da bi kupil kup CXO-jev sedeti v sobi in biti pozoren, če mislim, da zaspim ob predstavitvi, ki jo delam, kar se ne zgodi prepogosto, upam.
Nekako sem rekel v motenju, ki ga vidite v svojem podjetju, dejansko ne poganja izključno tehnologija, pogosteje je, kot da vas stranke ne vodijo. In nekako se usedejo in se dejansko vprašajo, kaj misli tam? Torej, ko razmišljam o uporabi tehnologije, mislim, da smo videli USENET, videli smo vse te vrste zabave, ki se dogajajo na internetu, vendar ni veliko ljudi napovedovalo socialne in vpliv le-te. Vsi, ki želijo vsem povedati, kaj imajo za zajtrk, in hrup, ki je bil ustvarjen, in zaledno tehnologijo, ki smo jo imeli, in seveda oglaševanje poskuša napolniti stvari.
Mislim, da bomo prišli do kaskadnega učinka do točke, ko se naprave pogovarjajo z napravami, potrošniki pa šele ujamejo, kaj to dejansko pomeni in kaj lahko to naredi. Zanimili ste zanimivost, zakaj se Amazonov gumb ne bo pogovarjal z Walmartom. Objavil bom to vprašanje, kaj se zgodi, ko Walmart dobi svoj gumb, kaj pa, če dvajset najboljših Amazonov in Walmartov ter drugih večjih distribucijskih in maloprodajnih omrežij dobi lastne gumbe? Kam nas to vodi? Natančneje, moje vprašanje z Brianom se bo glasilo: »Kam gremo s to celotno novo paradigmo uspešnosti? Ste na robu krvavitve in sodelujete s podjetji, ki to počnejo tako na fizični ravni infrastrukture kot tudi na ravni prenosa podatkov. Kam nas pelje, ko pride naslednji naslednji veliki val? Kakšen vpogled lahko delite okoli tega s tem, kaj se dogaja ob koncu dogodka iz vaše izkušnje? "
Brian Bulkowski: Seveda, na to, kako razmišljam o številnih stvareh, se osredotočam na uporabniške izkušnje in natanko to, kar ste povedali, uporabniki so tisti, ki vozijo, čeprav kot tehnologi in kot poslovni ljudje morda zasnujemo pametna ideja, za katero mislimo, da je uporabnikom všeč, in nekako se vrnem na primer Nest. Ko je moja sestra namestila Nest v svojo hišo, je rekla: »Moja hiša je tišja, stvari slišim. Sploh ne plačujem manj energije, "je, toda Nest si zdaj ne bi mogel iztrgati iz rok, ker je rada v tišji hiši, v nasprotju s tisto, kjer ogrevanje piha največ in nato izklopite.
Vprašanje se konča, kakšne uporabniške izkušnje si lahko dodelimo? To je na koncu izkušnja s kakovostjo življenja, če bi imeli denar in smo na prvem svetu, bi veliko plačali. Dala bom primer iz moje hiše, moja punca ima rada hladno mleko. Všeč ji je res hladno mleko, zato moramo pogosto poskusiti in ugotoviti, kje bo v hladilniku dovolj hladno, in ne pregreti preostalih stvari. No, to je super - in deklici sem rekel: "Ali bi plačevali 10 dolarjev na mesec, da bi imeli hladno mleko in ne bi imeli zamrznjenih narezkov?" Bila je takšna: "Absolutno." In dobivala 10 USD na mesec od vsakega potrošnika je težko.
Mislim, da moramo pri teh izkušnjah resnično paziti, kaj je tisto uporabniško doživetje, ki bi ga res lahko vodili. Mislim, da je bilo to del skrivnosti iPhonea. Menim, da je del skrivnosti Tesline gradnje boljšega avtomobila z vsemi podatki, odpravlja zamisel o proizvodnem ciklu in letno izdajo ter nenehne izboljšave na vsakem delu. Morali bomo pripraviti nekaj pametnih idej, kako dejansko uporabiti vse te podatke na način, ki je iz trenutka v trenutek prepričljiv v življenje ljudi.
Dez Blanchfield: Ja, to je odličen vpogled. Glede na to je drugi konec spektra, ki natančno odmeva z najrazličnejšimi stvarmi, ki jih zdaj srečujemo s tistimi, kar potrošniki prosijo, in vsi imamo v hiši nekaj, kar nam je pri tem hladno. Drugi konec spektra je torej in to smo videli v tradicionalnem "svetu velikih podatkov", kjer dodeljevanje podatkov postaja redkejše od kokošjih zob in tiste, ki so na trgu, se ponujajo več, kot zaslužijo CIO-ji. v nekaterih primerih vrste podjetij, s katerimi sodelujete, in vrste razvoja, ki ste jih videli, ali gre za vrste razvijalca in vrsto arhitekta podatkov in posebne mrežne ponudbe, ki jih je vedno težje in težje najti ? Ali potrebujemo organizacije, da začnejo razmišljati o tem, kako prehitevati krivuljo vrste spretnosti, ki jih potrebujejo v zadnjem delu za vrsto razvijalcev in arhitekte podatkov? Kaj vidite na tej ravni, kolikor viri znanja in spretnosti razumejo, kako zdaj to tehnologijo uporabiti v dobro uporabo?
Brian Bulkowski: Ja, mislim, da je to eden od izzivov, s katerimi se soočam organizacije, s katerimi sem govoril. Naj gre za - najhujše težave, o katerih sem slišal, so pravzaprav nekatera večja podjetja, kajti če rečeš: "Jaz sem iz te velike banke, sem iz Chasea in sem arhitekt za podatke, " potem si na svetu ste dobili ostrige, plača pa se bo zvišala, zato je težava pri zaposlitvi na enem od teh krajev, ker ni dovolj ljudi, in potem, ko se lahko preprosto premaknete iz službe v službo. Ne slišim nič drugega kot tovrstne težave in to je pravzaprav eden od razlogov, zakaj sem se Aerospike osredotočil na uporabo orodja, ki je primerno za posamezno projektno skupino.
Namesto da bi stopili v projektno skupino in si rekli: "Hej, rabili bi naš jezik za poizvedbe." Poglejte, če ti fantje danes vozijo avtobus, fantje in ženski, in če uporabljajo določen jezik poizvedb in orodja, se bodo držali tega in ne morem jih preučiti v nič drugega. Moj cilj je, da lahko postavim vrsto moči Aerospike kot bazo podatkov za ne glede na orodje, ki ga uporabljajo, in to je del te ideje, diapozitivov o prihodnosti baze Poliglot. Podpirati moram vzorce uporabe in analitike med temi fanti, saj je resnično težko najti ljudi, ki imajo matematično ozadje in statistične zmožnosti za krmarjenje po tem svetu.
Dez Blanchfield: Še ena zanimivost, ki se je ljudje morda ne zavedajo, mislim, da je Aerospike zelo močan igralec v odprtokodnem svetu, zelo hiter mi je vpogled v to, kaj to pomeni, kako to podjetje posluje in kaj počne za vas. Omenili ste, da ste neposredno sodelovali z ljudmi, ki delajo stvari vse do ravni jedra v notranjosti, tako da Linux jedro. V tem prostoru je nekaj velikih igralcev in nekaj znanih blagovnih znamk, ki jih ne bomo omenjali, toda organizacija, kot je Aerospike, v svoji novejši novejši zgodovini, odprtokodno izkušnjo, kako se to ujema z veliko sliko in kakšne konkurenčne prednosti ste videli, da vam prinašajo?
Brian Bulkowski: Seveda, ko smo leta 2014 prestopili v odprtokodni vir, smo to storili, ker smo ugotovili, da mora biti osnovna infrastruktura, kot je baza podatkov, na voljo vir, zaupati in naravno ravnotežje med starim svetom zaprtega vir in ko enkrat investirate v določeno bazo podatkov, vas fantje naklonijo tehnološkemu ciklu po tehnološkem ciklu in mora biti ravnovesje. Izdelati moramo različice, ki delajo nove stvari, in morda je to v poslovni različici, imeti moramo model z dvojno licenco, ki ima odprtokodno različico za ljudi, ki brcajo pnevmatike, ki delajo neprofitno, kot tudi poslovna različica, ki je licenca imetnika in omogoča neomejeno delo.
In seveda bomo imeli tudi najvišjo stopnjo hitrosti in obsega, saj je to poslovna različica. Verjamemo v model dvobojne licence in to je bilo odlično za naše poslovanje. Želimo, da bi ljudje začeli z Aerospikeom, želimo majhne projekte, da bi pustili gume, zelo enostavno je samo, da gremo v Amazon, zaženemo potrditveni skript in v petih minutah začnemo izvajati grozd Aerospike. Po drugi strani pa želimo podjetnim strankam dati več.
Dez Blanchfield: Nekako se približujemo vrhuncem, zato se bom za trenutek vrnil nazaj k Rebeki, če pa bi bil tam samo eden linijski pas, bi ga vrnili, nasvet dali bi ljudem, ki si želijo priti v prostor tehnologije, ki ste jo prinesli na trg, in kako jo bodo sprejeli, kaj bi rekli, da je prvi korak zanje, da nekako potopite svoje in začeti gledati, kako bodo dosegli konkurenčno prednost z vaše platforme?
Brian Bulkowski: Seveda, del sporočila je v tem, da sta hitrost in spretnost zdaj lahka. Za doseganje milijonov transakcij na sekundo ne potrebujete grozdja Cassandra s tisoč vozlišč. To lahko storite tudi v prvih fazah projekta. Tako so stvari veliko lažje, kot so bile včasih. Potem je drugi nasvet, ki ga boste morali pripraviti, kot pravite, matematične modele za sodelovanje strank pri poslovnih procesih, ki uporabljajo vse te podatke, zato je dobra novica, da so podatki na voljo, slaba novica je, da morate dejansko poiskati nekaj vzorcev in nekaj prepričljivih primerov uporabe.
Dez Blanchfield: Ja, odličen nasvet, zato se bom zdaj vrnil k Rebeki. Najlepša hvala za to, bil je krasen klepet o tehnologiji, cenim.
Rebecca Jozwiak: Hvala, Dez. Imam nekaj dobrih vprašanj občinstva. Naj vržem ta diapozitiv. Vem, da ste govorili o sistemu snemanja in o mainframeu, toda kako pogosto opazite absolutno preobremenitev ali je podvajanje končna dnevna uskladitev, kot to, kar vidite več?
Brian Bulkowski: Kar vidimo v Aerospiku, je uporaba baze podatkov NoSQL pred tem sistemom sprave ob koncu dneva. Potrebujete čez dan pravilen odgovor. Ne morete imeti napačnega odgovora, zato je Robin povedal o premoženju, je premalo cenjen, vendar se poslovni procesi okrog zakonskih zahtev usklajevanja lahko zapletejo in že desetletja tehnologije in več desetletij zakonov in zakonov prihaja do usklajevanja. Torej, kar vidimo pri Aerospiku, je, da boste svoje algoritme delali na bolj vroči bazi podatkov z več transakcijami na sekundo. Toda zaradi pravnih razlogov nujno potrebujete sistem sprave, ki je bil v teh pravnih postopkih. Vidimo oboje in vidimo, da je to v bistvu dvotirna praksa IT, ki so jo do neke mere izpostavili ljudje, kot sta Anderson Consulting in Gartner. Veliko tega vidimo.
Rebecca Jozwiak: V redu, dobro. Nekdo drug je pokazal zanimanje za ta poseben diapozitiv, dejal je, da je res zanimiv, in se spraševal, ali bi lahko šli v malo več primerjave bliskavice in spomina.
Brian Bulkowski: Seveda, dovolite mi, da na hitro objemam stransko prečko. Vem, da smo že blizu konca. Pa bliskavica je spomin - to je čipi - ponavadi razmišljam o RAM-u. Torej ima RAM posebne lastnosti, zahteva veliko moči, zelo dober je pri naključnih zapisih in naključnih branjih. Kjer je NAND sposoben hitrega naključnega branja in nižje moči, je pa zelo slabo pri naključnih zapisih. Obstaja nekaj tankih razlik v načinu delovanja teh dveh čipov na ravni litografije, ki ustvarjata številne tehnične razlike.
V primeru, da opravljate analitiko in morate preskočiti veliko podatkov ali v primeru Aerospike, kjer imate indekse, je indekse še vedno zelo dobro uporabiti v RAM-u zaradi paralelizma in naključnega dostopa. Zahtevana je višja raven naključnega dostopa. Vendar v Aerospikeu ugotovimo, da s pomočjo teh indeksov poiščemo določen predmet ali kos podatkov, to je primerno mesto, da se obrnemo na NAND, ker postane nekakšna večja trgovina pod indeksi. To je potem ena transakcija s shranjevalno napravo, vendar še vedno po številnih možnostih in filtriranju znotraj vašega indeksirnega sistema.
Rebecca Jozwiak: V redu, dobro. In potem vem, da smo se že veliko pogovarjali o IoT-u in eden od udeležencev je povedal, da je IoT v veliki meri koristen, toda ali podjetja, vladni subjekti in razvijalci varno rastejo in zagotavljajo podatke z isto hitrostjo, ali mislite?
Brian Bulkowski: Mogoče bi Dez želel skočiti noter?
Dez Blanchfield: Ja, vesel sem, da skočim v tisto. Mislim, da je odgovor ne. Pravzaprav je ena izmed mojih najljubših vrstic na to temo zelo, zelo na kratko ta, da mislim, da je eksplozija stroja do stroja in splošni internet stvari, komunikacija in varnost, tveganje okoli tega, zdaj smo na mestu, kjer vlade ne morejo slediti hitrosti sprememb. In v resnici vemo, da veliko organizacij ne more slediti hitrosti sprememb. V resnici, če to parafraziram, je hitrost sprememb danes tako velika, da se morajo organizacije sprintati samo zato, da ne bi šle v korak, vendar morajo na več dirkah sprintati. Ne verjamem, da zakon in mislim, da vlada na splošno, bodisi na državni ali zvezni ravni, ne more slediti hitrosti sprememb.
Zdaj je moj splošni nasvet ljudem nekakšno ravnanje in pozneje prosijo za odpuščanje. V preteklosti je bilo veliko primerov tega. Dohiteli bodo, toda mislim, da je zdaj res, da podjetja in tehnološki ponudniki na tem področju nekaj prinašajo inovacije in zagotavljajo, da smo seznanjeni z varnostnimi tveganji ali tveganji zasebnosti in se jih moramo lotiti. Kot ste omenili, zlasti banke, ko razmišljate o tem, kaj je tradicionalna bančna organizacija storila s stvarmi, kot je pranje denarja, in poznate svojo stranko, izziv AML / KYC, je bilo včasih to, da bomo poskusili vsaka tri do pet let in izpolnjujejo skladnost.
Zdaj mislim, da je to treba vgraditi v vsako posamezno transakcijo. Vedno ste to lahko storili na ravni ponudb z oglaševanjem, trgovanjem z delnicami in obveznicami ter lastniškim kapitalom. Mislim, da smo na mestu, ko nam uspešnost, ki jo prinašate s platformo Aerospike, omogoča, da zdaj razmišljamo o tem, kako prinesti zasebnost, kako vključiti varnost v to takojšnjo odločilno verigo v realnem času? In zato je odgovor ne, mislim, da vlade ne držijo. Mislim, da morajo podjetja iti naprej, in mislim, da moramo zdaj ukrepati in pozneje prositi za odpuščanje.
Brian Bulkowski: Naj dodam še nekaj točk. Fantje, s katerimi imam opravka, tehnološka podjetja, s katerimi se ukvarjam, so zelo prepričani, da so prepričani, da so na desni strani zakona, in precej razprave je, ali je to PII, ali lahko to uporabim, kako sem Uporabljam ta del podatkov? Kakšna je bila njena providnost in ali je to zaščitena odločitev ali izkušnja? Kako naj naredim vse to? To je dobra novica. Včasih se sprašujem o naši razpravi kot družbi, kamor gremo, in če je celo naša razprava o družbi na ustrezni ravni v smislu uporabe novih zmogljivosti od IoT vse do strojnega učenja, to je edini način razvrstiti po količini podatkov, ki jih imamo. Dobra novica pa je, da so fantje, s katerimi sem govoril, res na pravi strani, da poskušamo ravnati po pravnih odločitvah, ki smo jih sprejeli.
Rebecca Jozwiak: To je res nekaj dobrih odgovorov obeh, in popolnoma se strinjam. Mislim, da se varnost ne giblje tako hitro kot tehnološki razvoj, zlasti ko gre za internet stvari, ampak mislim, da se ljudje potrudimo in upam, da bomo tam prišli. Vedno je malo težko ostati deset korakov pred kibernetskimi tatovi in kibernetskimi kriminalci, vendar bomo prišli tja.
No, ljudje, šli smo osem minut mimo vrha ure. Rad bi se zahvalil našim gostom Brianu Bulkowskiju iz podjetja Aerospike ter Dez Blanchfield in Robin Bloor. Najlepša hvala. Naše arhive lahko vedno najdete na insideanalysis.com, SlideShare, YouTubu. Imamo veliko dobrih spletnih oddaj, ki prihajajo ljudje, bil je naporen mesec. Naslednji mesec bo naporen mesec, zato se spremljajte in upamo, da se vidimo naslednjič. Hvala ljudje, dovida.