Seputar Big Data Edisi #6 - idBigData idBigData

Seputar Big Data edisi #6

Kumpulan berita, artikel, tutorial dan blog mengenai Big Data yang dikutip dari berbagai site. Berikut ini beberapa hal menarik yang layak untuk dibaca kembali selama minggu ketiga bulan Februari 2017

Artikel dan berita

International Hadoop Market 2020 – Key Vendors Landscape, Trends, Challenges, and Drivers, Analysis, & Forecast
Hadoop Market Reaserch Report adalah sebuah studi yang mendalam dan profesional tentang keadaan pasar dan implementasi Hadoop saat ini, dan juga berfokus pada faktor pendorong utama dan hambatan bagi pemain kunci di area ini. Pasar Hadoop secara global diprediksikan akan tumbuh sekitar 59,37% CAGR selama periode 2016 - 2020
4 trends in how supply chains are using Big Data
Penggunaan dataset yang besar untuk tujuan analisa dan perencanaan pada area rantai pasokan (suply chain) membuat organisasi dapat bereaksi lebih cepat terhadap perubahan di berbagai titik. Berikut adalah tren penggunaan Big Data dalam area suply chain.
Microsoft’s future is in the cloud
Dua raksasa teknologi, Apple dan Microsoft, merupakan perusahaan yang masuk dalam daftar "2017's most innovative companies". Saat ini Microsoft banyak berinvastasi dan mendorong penggunaan cloud, baik private cloud maupun public cloud

Tutorial dan pengetahuan teknis

A comparison of deep learning packages for R
Perbandingan secara mendalam antara 4 package R untuk deep learning. Package yang direview adalah MXNet, darch, deepnet dan h2o. Dalam studi tersebut dibandingkan aspek fleksibilitas, kemudahan penggunaan, dukungan kerangka paralelisasi (GPU, cluster), dan kinerja.
Apache Arrow and Apache Parquet: Why We Needed Different Projects for Columnar Data, On Disk and In-Memory
Apache Arrow dan Apache Parquet sama-sama berfokus pada perbaikan kinerja dan efisiensi data analytics. Kedua project ini mengoptimasi kinerja untuk pemrosesan dalam disk dan dalam memori. Artikel ini mengulas mengenai peran kedua project tersebut dalam peningkatan performance pemrosesan big data analytics.
Introduction to Natural Language Processing, Part 1: Lexical Units
Berikut ini artikel yang mengeksplorasi konsep NLP. Pada bagian pertama kali ini, dimulai dengan pengenalan terhadap bidang NLP, serta penjelasan mengenai bagaimana mengidentifikasi unit leksikal sebagai bagian dari data preprocessing.

Rilis produk

Apache Hadoop 3.0.0-alpha2 Released
Apache Hadoop versi 3.0.0-alpha2 telah dirilis akhir Januari 2017 lalu. Rilis ini merupakan rilis alpha kedua dari rangkaian dari Hadoop versi 3, berisi 857 big fix, perbaikan dan penambahan fitur dibandingakn versi sebelumnya.
Performance improvements coming to R 3.4.0
R versi 3.4.0 sedang direncanakan untuk dirilis yang akan membawa banyak perbaikan kinerja dan fitur baru. Sementara itu R 3.3.3 (codename: Another Canoe) direncanakan akan dirilis bulan Maret 2017 hanya akan memperbaiki bug yang bersifat minor.
Announcing TensorFlow 1.0
TensorFlow 1.0 diumumkan pada acara tahunan TensorFlow Developer Summit pada 15 Februari lalu.
Yahoo open-sources TensorFlowOnSpark for deep learning with big data
Yahoo mengumumkan mengopensourcekan TensorFlowOnSpark, sebuah software yang digunakan supaya Google TensorFlow framework dapat berjalan diatas klaster Spark
Making Google Data Studio Free for Everyone
Tahun lalu, Google merilis Data Studio baik versi gratis maupun versi enterprise. Untuk lebih mengoptimalkan Data Studio, saat ini Google sudah tidak membatasi jumlah laporan (report). Pengguna dapat membuat dan membagikan sebanyak mungkin laporan sesuai kebutuhan dan semuanya gratis.

Contributor :

Tim idbigdata
always connect to collaborate every innovation 🙂