V preteklih časih je bilo smiselno ločiti podatke med transakcijskimi podatki, podatki, zajetimi v poslovnih aplikacijah, shranjenimi v tabelah baze podatkov in predstavljeni z orodji BI, ter vsemi drugimi podatki: e-poštni naslovi, spletne strani, slike, video in tako naprej. Dandanes takšne "druge podatke" navajamo kot nestrukturirane podatke.
Kljub temu je bilo analizo in programska oprema za izpeljavo vrednosti iz takih podatkov prestopila prepad. Prav analitični imperativ je bolj kot kar koli drugega povzročil prvotni koncept podatkovnega jezera, shrambe podatkov za obe vrsti podatkov in poleg tega za podatke, pridobljene iz več virov zunaj podjetja, od katerih so bili nekateri neizogibno nestrukturirani.
V tem prispevku bomo preučili, kako novi ekosistem, ustvarjen s podatkovnim jezerom, ne bo več v celoti sestavljen iz transakcij (ali dogodkov) poslovanja. Vključeval bo tudi podatke iz drugih virov, ki jih podjetje uporablja za izvajanje analitike in obveščanje uporabnikov o pomembnih informacijah, na katerih lahko temeljijo odločitve. Sistem zapisovanja bo, tako kot vedno, zlata kopija korporativnih podatkov in revizijska sled IT-dejavnosti podjetja.