Seputar Big Data edisi #59 - idBigData idBigData

Kumpulan berita, artikel, tutorial dan blog mengenai Big Data yang dikutip dari berbagai site. Berikut ini beberapa hal menarik yang layak untuk dibaca kembali selama minggu ketiga bulan Januari 2019.

Artikel dan berita

Alibaba Snaps Up data Artisans for €90 million: Open Sources “Blink”
Alibaba telah membeli perusahaan startup Data Artisans yang berbasis di Berlin dengan harga € 90 juta (£ 80 juta). Data Artisans didirikan pada tahun 2014 oleh pembuat framework pemrosesan data stream, Apache Flink.
Creating a Data Strategy
Kita perlu memiliki strategi untuk memaksimalkan nilai data yang kita miliki. Bagaimana melakukannya? Data apa yang harus dikumpulkan? Data mana yang akan disimpan – dan di mana? Siapa audiens untuk data tersebut? Siapa yang mengonsumsi data yang telah dianalisa?
Was The Facebook ’10 Year Challenge’ A Way To Mine Data For Facial Recognition AI?
Baru-baru ini cukup viral tantangan bertagar #10yearschallenge mengenai posting foto terkini disandingkan dengan foto dari 10 tahun yang lalu. Banyak pihak yang menduga mengenai motif di balik challenge tersebut, di antaranya apakah ini sebuah strategi dari Facebook untuk mengumpulkan data pengenalan wajah. Meskipun pihak Facebook menyangkal keterlibatan mereka dalam hal ini, namun perlu diakui bahwa beredarnya ratusan ribu, bahkan mungkin jutaan foto tersebut dapat menjadi data yang sangat bagus untuk melatih model pengenalan wajah.
Novartis allies with Oxford academics for big data R&D drive
Kolaborasi riset antara Novartis dan Big Data Institute di University of Oxford yang bertujuan untuk mengubah kumpulan data yang besar untuk digabungkan dan dianalisa untuk memperoleh insight yang dapat meningkatkan pengembangan obat dan perawatan pasien. Novartis adalah sebuah perusahaan farmasi yang berasal dari Swiss. Kerja sama ini telah berlangsung selama 5 tahun.
What Is Data Profiling?
Data Profiling adalah proses pemeriksaan data dari sumber yang ada dan merangkum informasi tentang data itu. Artikel ini akan menjelaskan kegunaan dan keuntungan dari Data Profiling.
Researchers use Samsung data and AI to predict mobile game churn
Tim peneliti yang berasal dari Samsung Research America, Universitas A&M Samsung, Universitas Pittsburgh, dan Universitas Arizona melakukan penelitian mengenai analisis churn dalam mobile game skala besar menggunakan deep learning. Metode ini menjanjikan analisis dan prediksi churn dengan memanfaatkan data interaksi detail.
AI Devs Behind Robot Sophia Partner with Blockchain Agricultural Data Firm
SingularityNET yang dikenal sebagai salah satu pendukung teknologi di belakang robot Sophia, menjalin kerja sama dengan Hara, sebuah perusahaan startup blockchain bidang pertanian. Kemitraan ini bertujuan untuk memanfaatkan data dalam proses diagnosis tanaman dan analisis data berbasis AI.

Tutorial dan pengetahuan teknis

Accelerate the Training of Deep Neural Networks with Batch Normalization
Melatih deep neural network yang memiliki puluhan layer cukup sulit dan berat karena neural network ini sangat peka terhadap inisialisasi dan perubahan konfigurasi algoritma pembelajaran. Salah satu strategi untuk mempercepat proses training adalah dengan metode batch normalization.
What’s coming in TensorFlow 2.0
TensorFlow 2.0 akan fokus dalam kemudahan dan kesederhanaan penggunaan, termasuk didalamnya beberapa fitur andalan seperti kemudahaan pembuatan model dengan menggunakan Keras, kemampuan yang baik untuk mengimplementasikan model di lingkungan production dalam berbagai platform, dan kemampuan ujicoba yang baik dalam skala riset. Untuk selengkapnya bisa membaca artikel ini.
The Data Fabric for Machine Learning. Part 1
Data fabric merupakan sebuah konsep mutakhir mengenai kesatuan data dalam sebuah organisasi. Artikel ini menjelaskan mengenai data fabric dan pemanfaatannya untuk mendukung machine learning.
What Are Data Silos?
Salah satu permasalahan dalam pengolahan dan pemanfaatan data dalam bisnis adalah munculnya data silo, yaitu data yang terpisah-pisah dan tidak dapat diakses oleh divisi lain. Artikel ini mengupas mengenai apa data silo, mengapa dapat muncul, serta apa strategi yang tepat untuk mengatasinya.
ETL — Understanding It and Effectively Using It
ETL atau extract, load, transform, adalah proses inti dari sistem pengolahan dan pemanfaatan data, mulai dari database, data warehouse, data hub, ataupun data lake. Kualitas produk data dan analisis yang dihasilkan sebuah sistem data sangat bergantung pada kualitas ETL-nya. Artikel ini membahas mengenai serba-serbi ETL dan bagaimana kita dapat menggunakannya secara efektif untuk berbagai sistem data

Rilis Produk

AgilOne Announces Customer Data Platform Update with New Features for Machine Learning
AgilOne, mengumumkan kemampuan fitur machine learning yang jauh lebih baik, serta peningkatan kemampuan pelaporan dan fitur-fitur baru untuk memaksimalkan keuntungan dan hasil program kupon.
SOD: An Embedded OpenCV Alternative
SOD adalah library alternatif untuk embedded machine learning lintas-platform dan computer vision yang mengekspos serangkaian API untuk deep learning, analisis & pemrosesan.
Apache Arrow 0.12.0 released
Apache Arrow 0.12.0 mencakup 614 resolved issues sejak rilis 0.11.1. Apache Arrow adalah layer analisis memori kolumnar untuk big data.
Apache Kylin 2.6.0 released
Rilis ini adalah rilis utama setelah versi 2.5, dengan lebih dari 90 perbaikan bug dan fitur tambahan. Apache Kylin adalah open source Distributed Analytics Engine yang dirancang untuk menyediakan antarmuka SQL dan analisis multi-dimensi (OLAP) di Apache Hadoop.

Contributor :

Tim idbigdata
always connect to collaborate every innovation 🙂