CDR adalah data yang berkaitan dengan sebuah penggunaan jaringan telekomunikasi, seperti misalnya panggilan telepon, sms, maupun data service. Contoh data yang dicatat dalam CDR antara lain adalah nomor telepon, waktu, durasi, lokasi, jenis perangkat yang digunakan, dan lain sebagainya. Data ini dapat digunakan oleh perusahaan telekomunikasi untuk melakukan berbagai macam analisis.
Cascading adalah sebuah platform untuk membangun aplikasi di atas Hadoop. Cascading menyediakan abstraksi untuk Hadoop, sehingga developer dapat mengimplementasikan jobs yang kompleks dengan lebih mudah dan cepat, dalam beberapa bahasa yang dapat dijalankan di JVM, seperti Ruby, Scala, dan lain-lain.
www.cascading.org
Cassandra adalah database NoSQL yang terdistribusi. Pada awalnya dikembangkan oleh Facebook, saat ini sudah menjadi open source. Strukturnya berupa key-value. http://cassandra.apache.org/
Chukwa adalah sebuah sub-project Hadoop yang ditujukan untuk menangani dan menganalisa log dalam skala besar. Chukwa dibangun di atas HDFS dan MapReduce, di dalamnya mencakup toolkit untuk menampilkan hasil monitoring dan analisis.
Analisa terhadap aktifitas pengguna web melalui item yang diklik pada sebuah halaman web.
Clojure adalah bahasa pemrograman dinamis yang didasarkan pada LISP, yang menggunakan Java Virtual Machine (JVM). Digunakan pada pemrosesan data paralel.
Istilah yang secara umum digunakan untuk mengacu pada layanan atau aplikasi berbasis internet yang di-hosting secara remote.
A distributed computing system over a network used for storing data off-premises Istilah umum untuk penyediaan hosted services melalui internet. Merupakan gabungan pemanfaatan teknologi komputasi dengan layanan berbasis internet.
Menyimpan data lama yang sudah sangat jarang digunakan di server yang kinerjanya lebih rendah. Untuk mengambil kembali data tersebut biasanya akan memerlukan waktu dan effort yang relatif lebih besar.
Sebuah basis data yang menyimpan data dalam kolom. Jika dalam database biasa sebuah row/baris berisi nama, alamat dan nomor telepon, maka dalam database berbasis kolom, semua nama disimpan dalam sebuah kolom, semua alamat di kolom yang lain, dan seterusnya. Kelebihan columnar database adalah akses hard disk yang lebih cepat.
Penggunaan teknologi untuk memonitor dan memprediksi kejadian di tingkat yang lebih kompleks, dari sekumpulan event/kejadian yang lebih sederhana. CEP mengidentifikasi dan menganalisa hubungan sebab-akibat antar event secara real time, sehingga dapat diambil tindakan secara proaktif dan efektif. Paradigma CEP muncul pada tahun 1990an, dari sebuah project yang dikepalai oleh Dr. David Luckham di Stanford University.
Analisis menggunakan data dari berbagai channel, seperti misalnya sales, average order value, lifetime value.