Seputar Big Data edisi #64 - idBigData idBigData

Kumpulan berita, artikel, tutorial dan blog mengenai Big Data yang dikutip dari berbagai site. Berikut ini beberapa hal menarik yang layak untuk dibaca kembali selama minggu pertama bulan Maret 2019.

Artikel dan berita

Data Lakes Take Healthcare Analytics to the Next Level
Pada dasarnya, data lake adalah arsitektur yang digunakan untuk menyimpan data bervolume besar, memiliki kecepatan tinggi, bervariasi tinggi, sebagaimana adanya data dalam repositori terpusat untuk Big Data dan analisa real-time. Organisasi layanan kesehatan dapat mengakses data dalam jumlah besar – terstruktur, semi terstruktur, dan tidak terstruktur – secara real time melalui data lake, dari mana saja.
Kembangkan Pariwisata, Grab Bangun Big Data
Baru-baru ini, Otoritas Pariwisata Thailand (TAT) dan Grab Thailand mengumumkan kerjasama strategis untuk membangun sistem data yang merupakan bagian dari proyek.
Dengan sistem yang telah dimiliki oleh GrabTaxi Thailand, TAT bisa mengembangkan sistem lebih cerdas untuk pariwisata, yang akan mendukung strategi dan rencana pemasaran TAT
How AI/ML Help Secure the US Power Grid Infrastructure
Jaringan listrik Amerika Serikat adalah salah satu sistem paling kompleks di seluruh dunia. Pemerintah A.S. dan perusahaan-perusahaan listrik dan gas mulai fokus terhadap teknologi-teknologi masa depan di mana ilmu-ilmu baru seperti AI dan machine learning dapat dimanfaatkan untuk membantu mengamankan jaringan listrik, infrastrukturnya, dan pelanggan nasional.

Tutorial dan pengetahuan teknis

A Gentle Introduction to Learning Curves for Diagnosing Machine Learning Model Performance
Kurva model pembelajaran sering digunakan untuk mendeteksi masalah dalam proses learning, seperti misalnya apakah model underfit atau overfit, ataupun apakah dataset yang digunakan telah cukup representatif. Artikel ini membahas mengenai bagaimana melakukan evaluasi terhadap kinerja model, memvisualisasikan hasil evaluasi untuk mendapatkan kurva belajarnya, serta memanfaatkan kurva tersebut untuk mendeteksi permasalahan dalam proses learning itu sendiri.
Journey to Event Driven – Part 3: The Affinity Between Events, Streams and Serverless
Kunci dari desain sistem event-first adalah memahami bahwa serangkaian event menunjukkan perilaku. Dengan menyimpan aliran event di Kafka, kita memiliki catatan semua aktivitas sistem, dan juga mekanisme untuk mendorong reaksi. Artikel ini juga akan mengeksplorasi bagaimana karakteristik runtime FaaS (Function as a Service) cocok untuk berbagai jenis pemrosesan, karena dalam beberapa kasus, masalah latensi atau konkurensi perlu dipenuhi.
Text Mining 101: What it Is and How it Works
Sebuah pengantar yang bagus untuk bidang teks mining, yang mencakup kasus penggunaan populer, algoritma, dan implikasinya dalam AI dan ML.
Spark Streaming and Kafka, Part 2 – Configuring a Kafka Connector
Dalam posting sebelumnya, dibahas mengenai pengembangan Kafka Source Connector kustom, yang ditulis dalam Scala. Posting kali ini adalah mengenai konfigurasi dan setting Konektor tersebut.

Rilis Produk

Apache Kafka 2.1.1
Versi ini adalah bugfix rilis untuk Kafka 2.1.0. Perubahan yang tercakup dalam rilis ini dapat ditemukan dalam rilis note berikut ini :
https://www.apache.org/dist/kafka/2.1.1/RELEASE_NOTES.html.
Apache NiFi 1.9.0 release
Selain lebih dari 100 perubahan, perbaikan bugs dan peningkatan, rilis ini juga mencakup fitur yang memudahkan integrasi dengan Apache Kudu dan Impala, serta memperkuat integrasi dengan Google BigQuery dan AWS. Komponen dan ekstensi baru dapat di-load secara runtime, sehingga meminimalisir downtime operasional.
Apache Trafodion 2.3.0 is released
Apache Trafodion adalah solusi SQL-on-Hadoop solution yang memungkinkan operasi transaksional di atas Apache Hadoop.

Contributor :

Tim idbigdata
always connect to collaborate every innovation 🙂