Een data lake is een zeer grote gegevensopslag die gegevens uit verschillende bronnen in hun ruwe formaat bevat. De gegevens kunnen in gestructureerde of ongestructureerde vorm zijn. Naast gegevens op basis van tekst en cijfers kunnen ook afbeeldingen, video's en andere formaten worden opgenomen. Dankzij de grote hoeveelheid informatie in het data lake zijn diepgaande analyses mogelijk.
Door de opslag in onbewerkt formaat zonder voorafgaande structurering verlopen de opslagprocessen zeer snel. Dit maakt data lakes bijzonder geschikt voor Big Data-toepassingen. Aangezien een data lake, in tegenstelling tot een data warehouse, de vastgelegde gegevens niet op voorhand sorteert, zijn de mogelijkheden om de gegevens te analyseren onbeperkt. Data Lakes vormen zo een ideale basis voor machinaal leren en kunstmatige intelligentie.