:::: MENU ::::

Seputar Big Data Edisi #18

Kumpulan berita, artikel, tutorial dan blog mengenai Big Data yang dikutip dari berbagai site. Berikut ini beberapa hal menarik yang layak untuk dibaca kembali selama minggu kedua bulan Juni 2017

Artikel dan berita

  1. How Big Data Mines Personal Info to Craft Fake News and Manipulate Voters
    Banyak orang memasang atau membagikan status dan content lain di media sosial dengan maksud mempengaruhi orang lain. Tapi bagaimana jika justru status dan posting kita itu dipergunakan untuk mempengaruhi kita sendiri? Cambridge Analytica, salah satu perusahaan di balik kampanye Donald Trump, mengungkapkan mengenai “psychographic profiling”, yaitu memanfaatkan data-data sosial media untuk membentuk kampanye yang sesuai dengan profil emosi dan psikologis pengguna sosial media.
  2. Big data and relinquishing your right to privacy
    Masih mengenai pemanfaatan data personal untuk kepentingan identifikasi dan bisnis, artikel ini membahas beberapa issue terkait privasi dan beberapa kasus mengenai hal tersebut.
  3. Guizhou to become China’s ‘Big Data Valley’
    Akhir Mei lalu puluhan ribu pengunjung memadati “International Big Data Industry Expo 2017” yang diselenggarakan di Guizhou, China. Saat ini Guizhou dikembangkan sebagai “Big Data Valley”-nya China, yang menjadi tempat yang menarik bukan hanya bagi start-up, namun juga bagi industri besar seperti misalnya Alibaba, Qualcomm, IBM, Huawei, Tencent, Baidu, Lenovo dan Foxconn.
  4. Five Ways Big Data is Transforming Epidemics
    Salah satu permasalahan dalam mengatasi epidemi seperti Zika, Ebola, atau flu burung adalah kurangnya data yang cepat, tepat dan akurat. Perkembangan teknologi big data dan data sains memberikan solusi untuk permasalahan tersebut. Dengan big data dan aalytics, saat ini epidemi sudah dapat dimonitor, dimodelkan dan diatasi dengan jauh lebih baik. Artikel ini membahas 5 hal terkait big data yang mengubah penanganan epidemi di dunia.
  5. Rail researchers develop risk tool with big data
    Para peneliti di University of Huddersfield telah menciptakan perangkat lunak yang memanfaatkan big data untuk membantu operator kereta api mengurangi kemungkinan insiden yang dikenal sebagai SPAD - Signals Passed at Danger.

Tutorial dan pengetahuan teknis

  1. Five Spark SQL Utility Functions to Extract and Explore Complex Data Types
    Dalam tutorial ini, dijelaskan mengenai penggunaan lima fungsi dan API Spark Spark yang dapat digunakan untuk melakukan pembacaan dan pemrosesan format data yang kompleks. Fungsi-fungsi ini ada dalam Apache Spark 2.x sebagai bagian dari org.apache.spark.sql.functions, yang memungkinkan pengembang untuk dengan mudah bekerja dengan data kompleks atau tipe data bersarang (nested data type) seperti JSON.
  2. Top 15 Python Libraries for Data Science in 2017
    Kumpulan dari library-library opensource yang meliputi data wrangling, machine learning, nlp, data scraping, statistik hingga visualisasi dan yang dianggap sebagai daftar teratas oleh banyak data scientist dan data engineer yang patut dicermati atau paling tidak untuk diketahui jika ingin menggeluti dunia data science.
  3. Top 15 Python Libraries for Data Science in 2017
    Kumpulan dari library-library opensource yang meliputi data wrangling, machine learning, nlp, data scraping, statistik hingga visualisasi dan yang dianggap sebagai daftar teratas oleh banyak data scientist dan data engineer yang patut dicermati atau paling tidak untuk diketahui jika ingin menggeluti dunia data science.
  4. An Introduction to Kafka Streams
    Kafka, secara singkat, adalah sistem fault tolerant distributed publish-subscribe messaging system, yang dirancang untuk pemrosesan data dengan cepat dan memiliki kemampuan untuk menangani ratusan ribu pesan. Kafka Streams adalah library untuk membangun aplikasi streaming yang dapat melakukan transformasi pada aliran data yang masuk.
  5. Running SolrMeter Without a UI
    SolrMeter adalah sebuah program Java yang digunakan untuk menguji kinerja Solr. Program ini sangat membantu untuk mengevaluasi performa dari Solr, terutama jika melakukan evaluasi terhadap perbedaan konfigurasi pada file schema.xml atau hardware yang berbeda atau juga konfigurasi core pada prosessor.
  6. How to Use Power BI to Get GitHub Reports"
    Power BI adalah sebuah tools untuk analisa bisnis yang didukung oleh Microsoft. Tools ini memberikan visualisasi yang interaktif dan kemampuan intelijen bisnis swasembada. End user dapat membuat laporan dan dasboard sendiri tanpa memerlukan bantuan dari admin.

Rilis produk

  1. Apache Zeppelin Release 0.7.2
    Rilis ini mencakup 50+ patches dari 25 kontributor untuk perbaikan dan bug fixes. Lebih dari 40 issue berhasil diresolved.
  2. Apache Fluo 1.1.0-incubating released
    Pada rilis baru ini banyak terjadi perubahan yang cukup besar seperti API baru untuk konfigurasi observers, peningkatan skalabilitas, peningkatan intergrasi dengan Apache Spark
  3. Apache Solr 6.6.0 released
    The Lucene PMC mengumumkan Apache Solr 6.6.0 dan dapat diunduh langsung di: http://lucene.apache.org/solr/mirrors-solr-latest-redir.html. Perubahan meliputi versi 6 komponen pendukung, penambahan 38 fitur baru, optimasi dan perbaikan bug
  4. Apache Solr 6.6.0 released
    The Lucene PMC mengumumkan Apache Solr 6.6.0 dan dapat diunduh langsung di: http://lucene.apache.org/solr/mirrors-solr-latest-redir.html. Perubahan meliputi versi 6 komponen pendukung, penambahan 38 fitur baru, optimasi dan perbaikan bug

Tertarik dengan Big Data beserta ekosistemnya? Gabung