HDFS (Hadoop Distributed File System), layer penyimpanan data di Hadoop, adalah sebuah file system berbasis Java yang fault-tolerant, terdistribusi dan scalable, sangat sesuai untuk penyimpanan data yang sangat besar. Didesain untuk dapat diaplikasikan di atas cluster yang sangat besar, HDFS tidak hanya dapat diimplementasikan dengan server proprietary saja, namun juga server-server commodity (non-proprietary).