:::: MENU ::::

Seputar Big Data edisi #16

Kumpulan berita, artikel, tutorial dan blog mengenai Big Data yang dikutip dari berbagai site. Berikut ini beberapa hal menarik yang layak untuk dibaca kembali selama minggu keempat bulan Mei 2017.

Artikel dan berita

  1. Big Data will enable better network and application intelligence in 5G
    IoT akan menjadi bagian penting dari 5G network. Mengetahui pola penggunaan data IoT ini akan menjadi salah satu kebutuhan penting untuk dapat meningkatkan dan memperbaiki kinerja network itu sendiri. Big Data intelligence menjadi sebuah teknologi yang penting, yang dapat digunakan untuk secara otomatis meningkatkan layanan dan kinerja network, recover dari error, dan meningkatkan user experience, dengan cara menganalisis lokasi, konteks, dan lain sebagainya.
  2. Inside Europe’s biggest data visualisation laboratory
    Imperial College London, universitas negeri terkemuka di Inggris, memetakan transaksi bitcoin dalam 64 layar. Dengan diameter 6m dan tinggi 2.53m, observatorium ini menjadi laboratorium data visualization terbesar di Eropa saat ini. Bagaimana mereka mengumpulkan dan menampilkan data, dan apa rencana ke depan untuk komersialisasinya?
  3. Foursquare CEO on mapping the world, trend by trend
    CEO Foursquare, Jeff Glueck, menjelaskan mengenai adopsi big data di Foursquare, transformasinya menjadi sebuah perusahaan berbasis location intelligence, dan bagaimana mereka meningkatkan revenue mereka sampai 74% di tahun yang lalu.
  4. AI for imaging: Experts delve into its promise
    Salah satu pertanyaan yang muncul dalam konferensi Big Data in Biomedicine adalah, akankah AI menggantikan radiologist? Panelis memberikan penjelasan mengenai bagaimana posisi AI dan machine learning dalam dunia medis, khususnya radiologi.

Tutorial dan pengetahuan teknis

  1. Reading data securely from Apache Kafka to Apache Spark
    Mulai Spark 2.1 rilis 1 (Cloudera Distribution), sudah tercakup fungsionalitas untuk membaca data dari Kafka secara secure. Blog post ini menjelaskan secara singkat arsitektur dan mekanismenya.
  2. Create smooth animations in R with the tweenr package
    Salah satu unsur penting dalam Data Science adalah ‘data storytelling’, atau ‘membuat data bercerita’. Alat yang digunakan untuk menyajikan data agar menarik dan dapat bercerita adalah dengan animasi. Saat ini sudah ada beberapa package di R yang dapat menganimasikan grafik, seperti package gganimate dan animation, namun animasi yang ditampilkan keduanya masih kurang terasa halus. Package tweenr tidak menampilkan animasi, namun melengkapi gganimate agar animasi yang ditampilkannya menjadi lebih halus.
  3. Benchmark: Sub-Second Analytics with Apache Hive and Druid
    Bagian ke 2 dari artikel ultra fast analytics dengan Apache Druid. Pada bagian ini ditampilkan hasil benchmarking OLAP dengan skala 1TB, dan response time yang benar-benar interaktif.
  4. The Machine Intelligence Behind Gboard
    Bagaimana Gboard mendeteksi kesalahan ketik dan melakukan autocorrect? Tools yang digunakan sama dengan yang dipakai untuk melakukan speech recognition, yaitu machine learning. Artikel ini mengupas secara teknis bagaimana penerapan machine learning dalam meningkatkan kinerja Gboard.

Rilis Produk

  1. Apache Arrow 0.4.0
    Hanya 17 hari sejak rilis 0.3.0, Apache Arrow 0.4.0 ini mencakup 77 JIRA resolve, dan beberapa beberapa fitur penting dan bug fixes.
  2. Apache Beam v2.0.0
    Merupakan rilis stabil yang pertama, mencakup di antaranya perbaikan user experience, berfokus pada seamless portability antar berbagai environments, termasuk engine, operating system, on-premise cluster, cloud providers, dan data storage systems.
  3. Genome Analysis Toolkit 4 (GATK4) released as open source resource to accelerate research
    Broad institute merilis GATK4, toolkit untuk melakukan analisis genome, sebagai open source software. Hal ini adalah sebuah langkah yang sangat berarti bagi dunia open genomics dan open science pada umumnya.
Tertarik dengan Big Data beserta ekosistemnya? Gabung