ETL (ekstrahiranje, preoblikovanje in nalaganje) je eden najpomembnejših procesov v analizi velikih podatkov - hkrati pa je lahko eden največjih ozkih grl. (Za več informacij o velikih podatkih si oglejte 5 koristnih velikih tečajev podatkov, ki jih lahko prevzamete na spletu.)
Razlog, da je ETL tako pomemben, je, da večina podatkov, ki jih podjetje zbira, v svoji surovi obliki ni pripravljena za prebavo analitične rešitve. Da bi rešitev za analitiko ustvarila vpogled, je treba surove podatke izvleči iz aplikacije, kjer trenutno prebiva, pretvoriti v obliko, ki jo lahko prebere analitični program, in jih nato naložiti v sam program analitike.
Ta postopek je analogen kuhanju. Vaše surove sestavine so vaši surovi podatki. Pred analizo (okušanjem) jih je treba izvleči (kupiti v trgovini), preoblikovati (kuhati) in nato naložiti (pospraviti). Težavnost in stroški lahko nepredvidljivo narastejo - enostavno je narediti mac n 'sir zase, veliko težje pa sestaviti gurmanski meni za 40 ljudi na večerji. Ni treba posebej poudarjati, da napaka v katerem koli trenutku lahko vaš obrok postane neprebavljiv.
