Kudu: archiviazione per analisi agili dei fast data

Kudu è un motore di archiviazione open source per dati strutturati che supporta l’accesso random a bassa latenza e pattern avanzati di accesso ad analisi. Kudu distribuisce i dati secondo un partizionamento orizzontale e replica ogni partizione seguendo l’algoritmo di consenso Raft. In questo modo garantisce latenze coda e tempo medio di recupero ridotti.
Kudu è progettato all’interno dell’ecosistema Hadoop e supporta varie modalità di accesso con strumenti come Cloudera Impala, Apache Spark™ e MapReduce.