Data Lake
Archiviazione dei dati per la successiva analisi e correlazione
Il primo passo per poter prendere decisioni sempre più informate è raccogliere i dati. Il Data Lake è il contenitore in cui i dati provenienti da fonti eterogenee vengono conservati per essere successivamente elaborati.
Cos'è il Data Lake? Caratteristiche e Vantaggi
Il Data Lake è un sistema di archiviazione dei dati centralizzato e flessibile, i dati provenienti da sorgenti eterogenee sono conservati in formato grezzo. Il Data Lake può contenere dati strutturati, semi-strutturati e non strutturati che generalmente sono indicizzati in modo da velocizzarne il successivo recupero per future elaborazioni. Il Data Lake:
- conserva quantità di dati grezzi enormi
- permette un rapido accesso ai dati
- si avvale di storage distribuito a costi limitati
Azure Data Lake
Azure Data Lake è la soluzione Cloud di Microsoft articolata su due livelli, storage e analisi. Azure Data Lake Storage è il livello di archiviazione e presenta alcune caratteristiche tali che lo posizionano come leader di mercato:
- storage basato sullo standard HDFS
- sicurezza di livello enterprise
- capacità di scalare massivamente
- nessun limite alla dimensione dei dati
Approfondisci nella nostra sezione dedicata a Microsoft Azure.
Archiviazione e Big Data
Le fonti di dati sono moltissime e continuano ad aumentare e ciò che caratterizza il big data non è solo la quantità davvero enorme di dati raccolti ma anche la loro complessità e varietà. L'archiviazione di questi dati è pertanto un aspetto fondamentale e servono sistemi in grado di gestirli in modo efficiente ed a costi competitivi.