- Metadata
Data tentang data, data yang memberikan informasi mengenai data.
- Impala
- Impala adalah sebuah query engine yang berjalan di atas Hadoop. Impala memberikan kemampuan untuk melakukan query SQL secara interaktif terhadap data yang disimpan di HDFS atau HBase, dengan menggunakan metadata, SQL syntax (HiveQL), ODBC driver dan user interface (Hue Beeswax) yang sama dengan Apache Hive.
- Hue
Hue (Hadoop User Interface) adalah antarmuka berbasis web yang open source, dibuat untuk memudahkan penggunaan Apache Hadoop. Di antara fitur-fiturnya adalah file browser untuk HDFS, Aplikasi Oozie untuk membuat workflow dan koordinator, job desainer/browser untuk MapReduce, Hive dan Impala user interface, sebuah Shell, sekumpulan API Hadoop, dan lain sebagainya.
- Hive
Hive adalah framework data warehouse yang dibangun di atas Hadoop. Pada awalnya dikembangkan oleh Facebook, namun saat ini sudah banyak perusahaan besar lain yang mengembangkannya, seperti Netflix maupun Amazon. Hive menyediakan bahasa pemrograman yang mirip dengan SQL, yaitu HiveQL, yang pada eksekusinya diterjemahkan ke MapReduce. Dengan HiveQL, programmer yang tidak memiliki pengalaman menggunakan MapReduce dapat melakukan pengolahan data di Hadoop, serta memudahkan integrasi dengan tools BI maupun visualisasi seperti Tableau, Microstrategy, dll.
- HBase
HBase adalah database non-relasional yang memungkinkan pencarian data yang bersifat singkat dan low-latency di Hadoop. HBase memungkinkan adanya operasi transaksional di Hadoop, termasuk update, insert dan delete. Facebook dan EBay banyak menggunakan HBase.
- Hadoop
Sebuah proyek open source software yang dikelola oleh Apache Software Foundation. Apache Hadoop mendefinisikan sebagai "sebuah framework yang memungkinkan untuk pemrosesan terdistribusi pada dataset yang besar di klaster komputer menggunakan model pemrograman sederhana."