Kazalo:
Opredelitev - Kaj pomeni Data Lake?
Podatkovno jezero je množično, lahko dostopno, centralizirano skladišče velikih količin strukturiranih in nestrukturiranih podatkov.Techopedia razlaga Data Lake
Arhitektura podatkovnega jezera je velik pristop k velikim podatkom. Podatki se ne razvrstijo, ko so shranjeni v skladišču, saj vrednost podatkov na začetku ni jasna. Kot rezultat, se priprava podatkov izloči. Podatkovno jezero je tako manj strukturirano v primerjavi z običajnim skladiščem podatkov. Ko so dostopni do podatkov, se šele nato razvrstijo, organizirajo ali analizirajo.
Hadoop, odprtokodni okvir za obdelavo in analizo velikih podatkov, je mogoče uporabiti za presejanje podatkov v skladišču.