:::: MENU ::::

Seputar Big Data edisi #7

Kumpulan berita, artikel, tutorial dan blog mengenai Big Data yang dikutip dari berbagai site. Berikut ini beberapa hal menarik yang layak untuk dibaca kembali selama minggu ketiga Februari 2017

Artikel dan berita
  1. Gartner’s 2017 Take on Data Science Software
    Gartner telah merilis Gartner Magic Quadran for Data Science Platforms 2017. Dari sekitar 100 perusahaan yang menjual software data sains, Gartner memilih 16 perussahaan yang memiliki pendapatan tinggi atau pendapatan rendah tetapi pertumbuhan yang tinggi. Setelah mendapat masukan baik dari pelanggan maupun perwakilan perusahaan, Gartner memberikan nilai pada perusahaan dengan kriteria "kelengkapan visi" dan "kemampuan untuk melaksanakan" visi tersebut.
  2. Big Data Opportunties
    Peluang-peluang besar dalam area Big Data pada saat ini yang merupakan hasil perbincangan dengan 22 eksekutif dari 20 perusahaan yang bekerja dalam bidang Big Data.
  3. IBM, Hortonworks tackle big data in Hadoop analytics partnership
    IBM dan Hortonworks telah bermitra untuk menawarkan penggunaan IBM Storage dengan Hadoop. Melalui kemitraan ini, keduanya akan menawarkan Hortonworks Data Platform (HDP) untuk IBM elastis Storage Server (ESS) dan IBM Spectrum Skala. Ini berarti bahwa klien IBM akan dapat menjalankan analisis Hadoop langsung di IBM Storage tanpa perlu melakukan pemisahan antar media penyimpanan khusus untuk analytics.
  4. Machine 4.0: Making your Factory, Production and Maintenance Data Work
    Untuk memanfaatkan potesi Big Data, perusahaan manufaktur harus mampu dengan baik mengintegrasikan dan menghubungkan sumber-sumber data pada sebuah platform terpadu dan menggunakan machine learning untuk mengambil insight, menganalisa dan mendapatkan hasilnya

Tutorial dan pengetahuan teknis

  1. What is a Support Vector Machine, and Why Would I Use it?
    Support Vector Machine saat ini menjadi salah satu algoritma yang popular. Dalam artikel ini dijelaskan bagaimana cara kerja SVM dan beberapa contoh menggunakan Python Scikits libraries.
  2. How To Set Up a Shared Amazon RDS as Your Hive Metastore
    Mulai CDH 5.10 dan selanjutnya, cluster di AWS cloud dapat menggunakan secara bersama-sama sebuah instance RDS persistence sebagai HMS backend database. Hal ini memungkinkan sharing metadata melampaui life cycle cluster, sehingga cluster berikutnya tidak perlu men-generate ulang metadatanya. Berikut ini bagaimana mengkonfigurasi RDS sebagai backend database untuk shared Hive Metastore.
  3. Prophet: How Facebook operationalizes time series forecasting at scale
    Facebook merilis prophet, sebuah open source package untuk R dan Python yang mengimplementasikan metodologi time-series yang digunakan Facebook di production sistem mereka untuk melakukan ‘forecasting at scale’.
  4. Moving from R to Python: The Libraries You Need to Know
    Berikut ini daftar library yang ada di R, dan counterpart-nya di Python, untuk anda yang perlu melakukan migrasi dari R ke Python.

Rilis Produk

  1. Announcing ggraph: A grammar of graphics for relational data
    ggraph, ekstensi dari ggplot2 API untuk mendukung data relasional seperti network dan tree, dirilis di CRAN repository.
  2. Announcing the release of Apache Samza 0.12.0
    Apache Samza adalah kerangka kerja pemrosesan stream terdistribusi, menggunakan Kafka untuk messaging dan Apache Hadoop YARN untuk fault tolerance, processor isolation, keamanan, dan manajemen resource. Release 0.12.0 ini menambahkan beberapa fitur untuk meningkatkan stabilitas, kinerja dan kemudahan penggunaan.
Tertarik dengan Big Data beserta ekosistemnya? Gabung