Kemampuan sistem, jaringan, atau proses untuk menangani pertumbuhan beban pekerjaan dengan cara diperbesar untuk mengakomodasi pertumbuhan itu.
Struktur yang mendefinisikan organisasi data dalam sistem database
Data agregat tentang istilah pencarian yang digunakan dari waktu ke waktu.
Data yang tidak terstruktur dengan model data formal, tetapi menyediakan cara lain untuk menggambarkan dan membaca data serta hirarkinya.
Penerapan fungsi statistik pada komentar orang yang dibuat di web atau melalui sosial media untuk menentukan bagaimana perasaan mereka tentang suatu produk, perusahaan ataupun isu tertentu.
Proses menerjemahkan struktur data atau status sebuah object ke dalam sebuah format yang dapat disimpan (misalnya ke dalam file atau memory buffer, atau dikirim melalui koneksi jaringan) dan direkonstruksi/dibentuk kembali seperti semula.
Software as a Service (SaaS) adalah model distribusi perangkat lunak di mana aplikasi yang di-host oleh vendor atau penyedia layanan dan diakses pelanggan melalui jaringan, biasanya Internet. Berbeda dengan model tradisional distribusi software, biasanya software dibeli dan diinstal pada PC pengguna, kadang-kadang disebut juga sebagai software as a product
Spark atau dikenal juga dengan nama Apache Spark merupakan open-source cluster framework computing, yang dibangun untuk pemrosesan big data dengan cepat, yang pada awalnya dikembangkan oleh AMPLab di UC Berkeley. Apache spark memiliki algoritma yang berbeda dengan Map/Reduce, tetapi dapat berjalan diatas Hadoop melalui YARN. Spark menyediakan API pemrograman Java, Python, Scala, dan SQL, dan dapat digunakan untuk menjalankan berbagai jenis proses secara efisien, termasuk proses ETL, data streaming, machine learning, perhitungan grafik, dan SQL.
Proses pemeriksaan data geografis atau data topologi melalui overlay dan teknik analisis lainnya untuk menjawab pertanyaan atau mendapatkan informasi. Analisis spasial biasnya mengekstrak atau menciptakan informasi baru dari data spasial.
Disebut juga sebagai Apache Sqoop, adalah tools atau aplikasi yang dirancang untuk mentransfer data secara efisien dari aplikasi penyimpanan non Hadoop, seperti database, ke dalam Hadoop
Disebut juga sebagai Apache Storm, adalah sistem komputasi real-time terdistribusi, open source dan gratis, yang pada awalnya dibangun oleh Twitter. Storm didisain memudahkan mengolah data secara realtime, sementara Hadoop untuk pemrosesan secara batch.
Sebuah bahasa pemrograman untuk mengambil data dari sebuah database relasional