:::: MENU ::::

Seputar Big Data Edisi #19

Kumpulan berita, artikel, tutorial dan blog mengenai Big Data yang dikutip dari berbagai site. Berikut ini beberapa hal menarik yang layak untuk dibaca kembali selama minggu ker 3 bulan Juni 2017

Artikel dan Berita

  1. Behind Alibaba’s mission to reduce counterfeit goods using big data and technology
    Dalam laporan tahunan untuk platform governance, Alibaba mengungkapkan bahwa pada tahun 2016 mereka berhasil menyita barang tiruan senilai 3 milyar Yuan, atau dua kali lipat dari tahun sebelumnya. Hal ini, menurut Jessie Zheng, chief platform governance officer Alibaba Group, adalah hasil dari pemanfaatan big data dan teknologi machine learning. Upaya ini dilakukan untuk memperbaiki citra Alibaba dan mengeluarkannya dari daftar 'notorious market' yang dibuat oleh IIPA (International Intellectual Property Alliance) dan USTR (United States Office of the Trade Representative).
  2. NYK: Learning from Big Data
    NYK, salah satu maskapai pelayaran terbesar dan tertua di dunia, memanfaatkan big data dan analytics untuk melakukan optimasi dan mengantisipasi berbagai kondisi yang mungkin dihadapi, seperti kenaikan harga minyak, cuaca buruk, dan lain sebagainya.
  3. Can Machine Learning Turn Big Data into No Big Deal?
    Bagaimana IIoT dan Machine Learning meningkatkan kinerja dalam bidang manufakturing, apa hal yang perlu diperhatikan, dan langkah perlu diambil untuk dapat menerapkannya.
  4. How to start incorporating machine learning in the enterprise arena
    Dunia saat ini sudah tidak lagi berada dalam era Revolusi Industri, tapi saat ini sedang mengalami apa yang disebut sebagai Revolusi Digital. Machine learning, kecerdasan buatan dan analisa big data adalah suatu realitas pada saat ini. Banyak perusahaan telah menyadari akan pentingnya data, dan menggabungkan solusi Big Data dan Machine Learning ke dalam model bisnis mereka.
  5. Will big data transform development?
    Big data telah mentransformasi bisnis dan memberikan keuntungan yang besar. Namun, dapatkah big data mengubah arah pembangunan? Bagaimana posisinya terhadap data statistik ‘tradisional’ yang dikumpulkan oleh badan-badan milik pemerintah? Apa saja standar yang harus dipenuhi? Apa kendala yang dihadapi oleh negara-negara yang ingin menerapkannya?
  6. Commentary: The superpowers big data and analytics are quietly giving banks
    Bank akan memiliki kemampuan untuk menjadi lebih pintar, lebih responsif dan mampu memprediksi kejadian penting, seperti prediksi kegagalan ATM. Pemilihan teknologi seharusnya didorong oleh masalah bisnis yang akan diselesaikan dan dipandu oleh visi dan strategi. Ada satu pahlawan baru yang secara diam-diam memberikan hasil yang sangat berarti, yaitu Big Data beserta sidekick analytics-nya, termasuk machine learning dan kecerdasan buatan.

Tutorial dan Pengetahuan teknis

  1. K-means Clustering with R: Call Detail Record Analysis
    Desc
  2. PULSE LAB DIARIES : Inferring Jakarta Commuting Statistics from Twitter
    Sebuah perkiraan jumlah penduduk untuk wilayah Jabodetabek adalah di atas 30 juta. Pada daerah perbatasan antar kota itu sendiri sistem transportasi harus menangani 1,38 juta penumpang harian. Pembuat kebijakan memerlukan informasi terkini untuk memonitor irama kota dan mengoptimalkan transportasi umum. Pulse Lab Jakarta dan Sekolah Tinggi Ilmu Statistik Indonesia bekerja sama untuk melihat apakah data dari media sosial dapat membantu hal tersebut.
  3. Solr Memory Tuning for Production (part 2)
    Di bagian pertama blog ini, telah dibahas mengenai beberapa tantangan umum dalam hal memory tuning dan penyiapan dasar terkait dengan implementasi Solr pada lingkungan production. Pada bagian kedua ini, akan dijelaskan mengenai memory tuning, GC tuning dan beberapa best practise lainnya.
  4. Streaming in Spark, Flink, and Kafka
    Banyak hal yang digaungkan mengenai penggunaan Spark, Flink dan Kafka. Tulisan berikut akan membahas mengenai kelebihan dan perbandingan antara ketiganya.
  5. Medical Image Analysis with Deep Learning , Part 3
    Artikel ini mengulas mengenai deep learning menggunakan Keras dan Theano untuk analisis prediktif dan analisis medical image.

Rilis Produk

  1. Apache Kudu 1.4.0
    Pada rilis Apache Kudu 1.4.0 ini meliputi penambahan beberapa fitur baru, optimasi dan perbaikan.
  2. Apache Arrow 0.4.1
    Tim developer Apache Arrow dengan bangga mengumumkan rilis 0.4.1. Ini adalah rilis terkait dengan perbaikan terutama untuk mengakomodasi regresi dengan tipe Desimal dalam implementasi Java yang diperkenalkan pada versi 0.4.0 (lihat ARROW-1091). Total sekitar 31 perbaikan yang terdaftar pada JIRA.
  3. Apache Impala (incubating) 2.9.0
    Apache Impala (incubating) merilis versi 2.9.0.

Tertarik dengan Big Data beserta ekosistemnya? Gabung