:::: MENU ::::

Posts By / admin

  • Apr 13 / 2017
  • Comments Off on Seputar Big Data Edisi #10
Big Data, Forum Info, Hadoop, Implementation, IoT, Komunitas

Seputar Big Data Edisi #10

Kumpulan berita, artikel, tutorial dan blog mengenai Big Data yang dikutip dari berbagai site. Berikut ini beberapa hal menarik yang layak untuk dibaca kembali selama minggu kedua bulan april 2017

Artikel dan Berita

  1. UK government using R to modernize reporting of official statistics
    UK Government Digital Service, sebuah badan pemerintah Inggris, meluncurkan project untuk mengotomasi proses pelaporan statistik pemerintah dengan menggunakan R. Project ini bertujuan untuk menyederhanakan pelaporan dengan cara mengotomasi proses ekstraksi data, analisis dan pembuatan dokumen.
  2. Hadoop in finance: big data in the pursuit of big bucks
    Bagaimana Hadoop dan teknologi big data membantu industri keuangan untuk meminimalisir resiko transaksi dan memaksimalkan keuntungan.
  3. How GoDaddy powers its team with big data analytics
    GoDaddy, penyedia layanan web hosting dan registrasi domain name internet yang memiliki 14.7 juta pelanggan, memproses lebih dari 13 terabytes data. GoDaddy membangun online self service analytics dalam rangka memperbaiki layanan dan mengantisipasi berbagai issue.
  4. Predictive analytics can stop ransomware dead in its tracks
    Ransomware menjadi salah satu ancaman yang serius di era digital ini. Data penting dapat terancam hilang begitu saja jika tuntutan penjahat saiber yang menyanderanya tidak dipenuhi. Kerugian yang ditimbulkan sangatlah besar, baik dari sisi biaya, waktu, maupun reputasi. Seperti yang hampir dialami oleh pemerintah kota Livingston, Michigan 2 tahun yang lalu, ketika mereka terancam kehilangan data perpajakan selama 3 tahun. Predictive analytics dan machine learning menjadi salah satu solusi untuk mengantisipasi ancaman keamanan semacam ini.
  5. Look before you leap: 4 hard truths about IoT
    Internet of Things membuka berbagai peluang yang menarik dan disruptive, sehingga menjadi salah satu teknologi yang paling berkembang dan banyak diadopsi saat ini. Namun ada beberapa hal yang perlu diperhatikan untuk dapat memanfaatkan teknologi ini dengan maksimal, di antaranya adalah kualitas data, keamanan, dan standard yang masih terus berubah.
  6. How companies and consumers benefit from AI-powered networks
    Sebagai pemegang 12.500 lebih paten, 8 Nobel, dan pengalaman 140 tahun dalam pengembangan dan ujicoba berbagai ide 'liar', tidaklah mengherankan jika AT&T menjadi salah satu pemain penting dalam bidang AI. Apa saja penerapan AI dan machine learning dalam bisnis AT&T dan apa keuntungan yang dirasakan perusahaan maupun konsumen?

Tutorial dan pengetahuan teknis

  1. Must-Read Free Books for Data Science
    Beberapa free E-book yang berkaitan dengan data science, yang jangan sampai anda lewatkan.
  2. Python Pandas Tutorial: DataFrame Basics
    DataFrame adalah struktur data yang paling umum digunakan dalam Python Pandas. Karena itu, sangat penting untuk mempelajari berbagai hal tentang penggunaan DataFrame tersebut. Tutorial ini menjelaskan beberapa metode penggunaan DataFrame.
  3. How can I bulk-load data from HDFS to Kudu using Apache Spark?
    Seperti yang disebutkan dalam judulnya, video tutorial ini menjelaskan mengenai penggunaan Spark untuk mengunggah data secara bulk dari HDFS ke Kudu.
  4. Federated Learning: Collaborative Machine Learning without Centralized Training Data
    Google research memperkenalkan metode machine learning terbaru yaitu federated learning. Dengan metode ini, tidak perlu lagi mengumpulkan data dari device yang digunakan oleh user untuk digunakan sebagai data training. Saat ini federated learning sedang diujicobakan melalui Gboard on Android.
  5. Accordion: HBase Breathes with In-Memory Compaction
    Aplikasi-aplikasi yang menggunakan Apache HBase dituntut untuk dapat memenuhi kebutuhan kinerja dalam read-write prosesnya. Idealnya, aplikasi tersebut dapat memanfaatkan kecepatan in-memory database, dengan tetap mempertahankan jaminan reliabilitas persistent storage. Accordion adalah sebuah algoritma yang diperkenalkan dalam HBase 2.0, yang ditujukan untuk dapat memenuhi tuntutan tersebut.
  6. Feature Engineering for Churn Modeling
    Churn model dapat membantu dalam menentukan alasan utama customer berhenti menggunakan produk atau layanan anda, namun faktor apa yang akan ditest dan dimasukkan ke dalam model, tergantung keputusan dari data saintist. Proses ini disebut dengan rekayasa fitur (feature engineering).

Rilis produk

  1. Apache Zeppelin Release 0.7.1
    Beberapa perbaikan yang dilakukan dalam rilis ini adalah stabilitas proses restart interpreter, perbaikan interpreter python, perbaikan bug untuk table/chart rendering. 24 kontributor menyumbangkan lebih dari 80 patch, dan lebih dari 70 issue berhasil diselesaikan.
  2. Storm 1.1.0 released
    Rilis ini mencakup supports native Streaming SQL, perbaikan integrasi ke Apache Kafka, PMML support, Druid Integration, OpenTSDB Integration, AWS Kinesis Support, HDFS spout, Flux Improvements, dll.
  3. MapR Releases New Ecosystem Pack with Optimised Security and Performance for Apache Spark
    MEP (MapR Ecosystem Pack) adalah sekumpulan project ekosistem open source yang memungkinkan aplikasi big data untuk berjalan di atas MapR Converged Data Platform dengan kompatibilitas internal. MEP Versi 3.0 mencakup perbaikan dari sisi Spark security, konektor Spark ke MapR-DB dan HBase, update dan integrasi dengan Drill, dan versi Hive yang lebih cepat.

 

Contributor :

Tim idbigdata
always connect to collaborate every innovation 🙂
  • Mar 30 / 2017
  • Comments Off on Seputar Big Data Edisi #9
Uncategorized

Seputar Big Data Edisi #9

Kumpulan berita, artikel, tutorial dan blog mengenai Big Data yang dikutip dari berbagai site. Berikut ini beberapa hal menarik yang layak untuk dibaca kembali selama minggu kedua bulan Maret 2017

Artikel dan Berita

  1. Amid Shortages in Apache Spark Skillsets, Training Options Proliferate
    Salah satu teknologi yang paling ‘hot’ di bidang big data adalah Apache Spark. Saat ini kebutuhan terhadap implementasi Spark sangat tinggi, namun ketersediaan tenaga-tenaga ahli di bidang tersebut masih sangat terbatas. Hal ini menjadi pendorong munculnya banyak training mengenai Spark, yang banyak diantaranya adalah free training.
  2. Microsoft moves ahead on cloud, data, AI fronts
    Dalam ajang Hadoop Summit 2017, Microsoft meluncurkan beberapa hal terkait big data. Di antaranya adalah konektor Spark ke DocumentDB. DocumentDB adalah distributed data store yang mendukung SQL dan kompatibel dengan antarmuka query MongoDB. Microsoft juga mengumumkan peningkatan dukungan security untuk Hive LLAP (melalui HDP 2.6) dan Spark, peningkatan dukungan streaming dari Spark ke Azure Event Hub, dan lain sebagainya.
  3. How Adobe used its huge data bank to build Sensei, an AI tool for creatives
    Tak mau ketinggalan dengan raksasa teknologi seperti Google, Amazon dan Microsoft dalam pengembangan AI dan bots, Adobe meluncurkan layanan AI dan virtual assistant, yang diberi nama Sensei. Melengkapi fitur yang telah ada di Creative Cloud, Sensei menyediakan kemampuan mengedit ekspresi wajah menggunakan fitur Face Aware Editing di Photoshop. Sensei akan dapat ‘berbicara’ dan memandu penggunanya seperti guru profesional, berkat jutaan sesi editing foto dan video yang direkam oleh Adobe. Sensei juga akan mendukung teknologi Adobe yang lain, seperti melukis dalam VR dengan Project Dali, dan photo restyling dengan Artistic Tool.
  4. Abundant Data: The Currency for the Digital Transformation
    Beberapa poin penting mengenai berlimpahnya data dan perannya dalam mendorong transformasi digital, dari Gartner Data and Analytics Summit, yang diselenggarakan awal Maret 2017 lalu di Texas.
  5. Government Sponsored Data Analytics in Healthcare and Life Sciences
    Data analytics di bidang kesehatan dan life science menjadi sebuah kebutuhan yang tidak terhindarkan. Pemerintah memegang peran yang penting dalam implementasi project-project terkait data analytics di bidang tersebut. Artikel ini mengulas beberapa di antaranya.
  6. MIT-Stanford project uses LLVM to break big data bottlenecks
    Salah satu permasalahan dalam memaksimalkan penggunaan multicore system adalah, semakin mudah sebuah big data framework digunakan, akan semakin sulit pipeline yang dihasilkan untuk dijalankan secara paralel sebagai sebuah unit. Untuk itu para peneliti CSAIL MIT bekerja sama dengan Infolab Stanford membangun Weld, yang men-generate code untuk workflow data analisis yang dapat berjalan secara efisien menggunakan framework compiler LVVM.
  7. On computational ethics
    Tulisan mengenai etika dan filosofi dalam bidang komputasi dan AI. Mungkinkah etika diterapkan dalam komputasi? Bagaimana?
  8. Slides and videos Spark Summit East, Boston
    Video dan presentasi yang menarik dari pembicara-pembicara terkemuka, di acara Spark Summit East, Boston, Februari 2017.

Tutorial dan Pengetahuan Teknis
  1. Finding Influencers on Twitter
    Menjelaskan secara singkat langkah menentukan influencer di Twitter.
  2. Data science for Doctors: Inferential Statistics Exercises (part-2)
    Data sains memperbaiki kualitas pengambilan keputusan. Dokter serta peneliti perlu membuat keputusan penting hampir tiap hari, sehingga data sains akan sangat membantu mereka. Tulisan ini adalah bagian dari serangkaian tutorial data sains yang ditujukan khususnya untuk para dokter dan tenaga medis.
  3. Big Data Processing Using Apache Spark - Part 6: Graph Data Analytics with Spark GraphX
    Bagian ke 6 dari serangkaian artikel mengenai pemrosesan data dalam Spark. Dari artikel ini kita dapat mempelajari tentang :
    • pengolahan dan analisis data grafis dan library Apache Spark GraphX sebagai solusinya
    • algoritma seperti PageRank, Connected Components dan Triangle Counting
    • komponen dan API dari Spark GraphX
    • contoh aplikasi menggunakan Spark GraphX

  4. Python & R vs. SPSS & SAS
    Artikel ini membandingkan empat bahasa (Python & R vs. SPSS & SAS) dalam hal : metode dan teknik, kemudahan belajar, visualisasi, support dan biaya. Pembahasan difokuskan pada aspek bahasa, sedangkan antarmuka pengguna pada SAS Enterprise Miner dan SPSS Modeler tidak tercakup dalam ruang lingkup pembahasan.
  5. Neural Networks: How they work, and how to train them in R
    Dengan meningkatnya perhatian pada penerapan deep learning, maka neural network kembali menjadi bahasan yang menarik. Neural network adalah engine prediktif yang mendasari deep learning, namun tidak mudah untuk memahami cara kerjanya. Artikel ini menyebutkan beberapa sumber yang dapat memberikan penjelasan dan contoh mengenai neural network dan penerapannya dalam R.

Rilis produk

  1. Apache Drill 1.10.0
    Beberapa fitur tambahan adalah perintah 'create temporary table as..', peningkatan dukungan untuk timestamp dalam file Parquet, perbaikan fault tolerance di atas JDBC, dukungan untuk autentikasi Kerberos, dan lain sebagainya.
  2. Python SDK released in Apache Beam 0.6.0
    Selain dukungan Python SDK, rilis Apache Beam minggu ini juga menambahkan dukungan untuk Apache HBase, meningkatkan support untuk model Beam dalam implementasi runner, dan lain-lain.
  3. release of Kudu 1.3.0.
    Apache Kudu 1.3 adalah rilis minor yang menambahkan berbagai fitur baru, perbaikan, perbaikan bug, dan optimasi di atas Kudu 1.2.

 

Contributor :

Tim idbigdata
always connect to collaborate every innovation 🙂
  • Mar 15 / 2017
  • Comments Off on Paralel DNA Sequence Alignment Diatas Hadoop [Bagian 2]
Big Data, Forum Info, Hadoop, Uncategorized

Paralel DNA Sequence Alignment Diatas Hadoop [Bagian 2]

ini merupakan lanjutan dari artikel PARALEL DNA SEQUENCE ALIGNMENT DIATAS HADOOP [BAGIAN 1]

Implementasi

Implementasi dilakukan dengan memanfaatkan HGrid247 sebagai Big Data engineering tools, yang mendukung pemrosesan dengan MapReduce. Dengan memanfaatkan HGrid247, implementasi sequence alignment dapat dilakukan secara modular, dan dapat memanfaatkan komponen-komponen yang telah ada di HGrid247.

Untuk mengimplementasikan sequence alignment workflow, penulis menambahkan beberapa komponen, yaitu komponen parsing input data, komponen untuk proses alignment, dan komponen untuk formatting output.

Workflow yang dihasilkan adalah seperti di bawah ini:

Artikel_bioinformatik_1

Secara garis besar, proses yang dilakukan adalah sbb:

  1. Data preprocessing : pemrosesan data genbank dan data sample (data input yang akan diproses), sebelum dilakukan alignment.
  2. Filter data genbank, berdasar panjang sekuens yang akan di-align, ditentukan dengan batas atas dan batas bawah. Untuk proses global alignment, idealnya dilakukan antar sekuens yang panjangnya hampir sama, sebab untuk sekuens dengan selisih panjang yang besar, hasil score alignment akan kurang bagus dan akan tersisihkan.
  3. Alignment dan formatting output.

Hasil uji coba

Ujicoba dilakukan pada dua environment, yaitu :

  1. Local Node
  2. Hadoop cluster

Software yang digunakan adalah HGrid247-2.3.2, dan cluster menggunakan Hadoop version 2.5.0 (distro Cloudera versi 5.2.0).

Hasil uji coba pada local node

Artikel_bioinformatik_2

Hasil di atas menunjukkan peningkatan yang signifikan dengan menggunakan metode pemrograman dinamik (iteratif). Di mana pada penelitian sebelumnya yang menggunakan metode rekursif, terjadi stack overflow disaat melakukan alignment untuk panjang sekuens pertama 214 residu dan sekuens kedua 208 residu, dengan menggunakan scoring scheme yaitu Matc h : 2, Mismatch - 3, Gap Opening : 0 dan Gap Extension :0. Sedangkanpada penelitian ini terjadi out of memory saat panjang sekuens pertama dan kedua 5300 residu. Keterbatasan ini disebabkan oleh kapasitas memori perangkat yang digunakan.

Hasil uji coba pada cluster

Dalam uji coba ini digunakan data sample berupa sekuens yang berasal dari mamalia yaitu locus X71497, definition B.taurus microsatellite sequence INRA053. Accession X71497, version X71497.1 GI:509111, dan source Bos taurus (cattle).

Pada uji coba ini yang divariasikan adalah batas atas dan batas bawah yang menentukan data reference yang akan diikutsertakan dalam proses multipairwise alignment. Semakin besar nilainya, maka jumlah record dari genbank yang akan dibandingkan dengan data sample akan semakin besar.

Artikel_bioinformatik_3

Uji coba dengan variasi jumlah node

Pada uji coba ini jumlah node yang digunakan dalam cluster divariasikan.

Artikel_bioinformatik_4

Dari implementasi dan uji coba tersebut, didapatkan kesimpulan bahwa :

Dengan menggunakan teknik iteratif pada algoritma Needleman Wunsch, kejadian stack overflow dapat dihindari.

Penggunaan paralel processing memungkinkan dilakukannya multipairwise alignment dengan waktu yang jauh lebih singkat. Waktu yang diperlukan untuk melakukan alignment berbanding terbalik dengan jumlah node yang digunakan. Dengan arsitektur Hadoop yang scalable secara linear, penambahan kapasitas pemrosesan cukup dilakukan dengan penambahan node saja.

Dengan memanfaatkan HGrid247 sebagai tools data processing, dapat meminimalisasi implementasi, dengan cara memanfaatkan komponen-komponen yang telah ada dan dapat menambahkan komponen yang belum ada jika diperlukan. Antarmuka grafis memudahkanvariasi proses, di mana perubahan flow dan parameter dapat dilakukan dengan relatif lebih mudah.

Dari sisi algoritma, untuk melakukan multipairwise alignment cukup dengan melakukan 1 kali traceback dengan kondisi parameter input untuk gap opening dan gap extension sama. Hal ini dikarenakan traceback dimulai dari nilai optimum, dan nilai tersebut merupakan nilai optimum score alignment, sehingga semua traceback akan memiliki nilai score alignment yang sama.
  • Mar 13 / 2017
  • Comments Off on Paralel DNA Sequence Alignment Diatas Hadoop [Bagian 1]
Uncategorized

Paralel DNA Sequence Alignment Diatas Hadoop [Bagian 1]

Banyak tantangan-tantangan Big Data di berbagai bidang yang dapat diselesaikan dengan Hadoop, tak terkecuali pada bidang BioInformatika. DNA Sequence aligment yang merupakan salah satu area dalam bioinformatika, adalah sebuah proses untuk membandingkan dua atau lebih DNA sequence yang berbeda dengan cara mencari kesesuaian pola karakter pada suatu urutan yang sama. Berikut ini merupakan sebuah studi kasus dalam penerapan algoritma DNA sequence menggunakan MapReduce, yang disarikan dari sebuah tugas akhir berjudul SEQUENCE ALIGNMENT SECARA PARALEL MENGGUNAKAN MAPREDUCE DI ATAS HADOOP DISTRIBUTED FILE SYSTEM (HDFS) karya Rusnah Setiani, dari Program Studi Teknik Informatika Fakultas Sains dan Teknologi, Universitas Al Azhar Indonesia.

Masalah

Salah satu kegiatan yang dilakukan dalam bidang bioinformatika adalah pembentukan phylogenetic tree, yaitu sebuah diagram yang menunjukkan hubungan evolusi antar organisme. Hubungan evolusi organisme tersebut diperoleh dengan menganalisis hubungan antara leluhur dan keturunannya dengan cara membandingkan gen yang berasal dari spesies yang akan diteliti.

Saat ini Universitas Al Azhar Indonesia melakukan penelitian mengenai pairwise sequence alignment yang merupakan tahap untuk membentuk phylogenetic tree.

Salah satu permasalahan yang dihadapi dalam penelitian tersebut ditemui dalam pemrosesan sequence alignment. Proses ini dilakukan dengan cara memilih dua sekuens yang terdapat pada genbank Universitas Al Azhar Indonesia, dan dilakukan dengan single processing.Keterbatasan penelitian tersebut yaitu untuk memproses sekuens yang memiliki panjang 214 residu untuk sekuens pertama dan 208 residu untuk sekuens kedua, dengan scoring scheme untuk gap bernilai 0, program tidak dapat berjalan dikarenakan adanya stack overflow. Terdapat dua penyebab terjadinya stack overflow, yaitu banyaknya recursive yang dilakukan dan banyaknya nilai yang disimpan pada stack.

Untuk mengatasinya, penulis mengembangkan penelitian tersebut dengan melakukan proses sequence alignment secara paralel menggunakan MapReduce di atas Hadoop distributed system. Di samping mengatasi keterbatasan di atas, pemrosesan secara paralel juga memungkinkan proses alignment tidak terbatas hanya membandingkan 2 sekuens saja (pairwise alignment). Proses alignment dapat dilakukan dengan membandingkan input sekuens dengan semua data yang terdapat dalam genbank, yang disebut dengan multipairwise alignment.

Solusi/Metodologi

Pembuatan sequence alignment untuk sekuens DNA dengan pendekatan pemograman dinamik secara iteratif menggunakan algoritma Needleman- Wunsch, yang menghasilkan global alignment. Input file yang akan dilakukan proses alignment dalam format FASTA. Output file disimpan ke dalam Hadoop Distributed File System (HDFS).

Data Reference

Sebagai data reference, dibuat sebuah genbank yang disimpan di dalam HDFS. Data diambil dari NCBI (National Center for Biotechnology Information). Data ini yang nantinya akan digunakan sebagai pembanding untuk sequence yang akan di-align.

Bagian Implementasi dan Ujicoba akan di lanjutkan pada Bagian dua, jangan sampai terlewatkan ya 🙂
  • Mar 07 / 2017
  • Comments Off on Seputar Big Data Edisi #8
Uncategorized

Seputar Big Data Edisi #8

Seputar Big Data edisi #8

Kumpulan berita, artikel, tutorial dan blog mengenai Big Data yang dikutip dari berbagai site. Berikut ini beberapa hal menarik yang layak untuk dibaca kembali selama minggu terakhir bulan Februari dan awal Maret 2017
  1. JPMorgan Software Does in Seconds What Took Lawyers 360,000 Hours
    Sebuah program yang disebut COIN, Contract Intelligent, dikembangkan oleh JPMorgan, merupakan sebuah machine learning program yang mampu mereview dokumen kontrak dengan sangat cepat, yang sebelumnya dikerjakan membutuhkan waktu ratusan jam.
  2. The Difficulties of Teaching Wall Street About Big Data
    Sebuah wawancara Leigh Drogan, founder dan CEO Estimize, mengenai bagaimana sulitnya mengedukasi dan bagaimana menggunakannya secara efektif Big Data di Wall Street
  3. When the Big Lie Meets Big Data
    Masih mengenai studi kasus tentang pemilu Amerika Serikat. Menurut Joseph Goebbels, Reich Miniter of Propaganda Nazi, jika sebuah ketidakbenaran terus dibesar-besarkan dan diulang-ulang, maka orang akhirnya akan mempercayainya. Tidak demikian di era Big Data saat ini, sedikit ketidakbenaran dengan bantuan machine learning, akan menjadi lebih efektif.
  4. MWC 2017: Barcelona trial uses IoT and big data to manage tourists
    Pada Mobile World Congress (MWC) lalu, kota Barcelona melakukan sebuah proyek ujicoba IoT dan Big Data untuk mengelola pergerakan dan meningkatkan pengalaman turis di gereja Sagrada Familia.
  5. Why Big Data Kills Businesses
    Walaupun Big Data telah diakui sebagai penyelamat bisnis, pada kenyataannya data merupakan ancaman yang membunuh. Data tidak serta merta dapat digunakan dan menghasilkan keuntungan, akan tetapi banyak permasalahan yang timbul akibat data.
  6. Big Data, IoT Key to Fixing Crumbling Water Infrastructure, Reducing Operating Costs
    Penerapan pengelolaan air berbasis smart technology semakin meluas. Tidak hanya pemerintahan kota dan perusahaan utilitas, namun juga perusahaan lain yang menggunakan air dalam jumlah besar. Hal ini dilakukan dalam rangka pengurangan biaya penggunaan air dan pelestarian lingkungan. Sektor ini diproyeksikan akan tumbuh sampai US$12 milyar di Amerika dan US$11 milyar di Eropa.
  7. Fighting Illegal Fishing With Big Data
    Global Fishing Watch menggunakan data satelit untuk memantau aktifitas kapal yang mencurigakan di laut.

Tutorial dan pengetahuan teknis

  1. Bringing HPC Algorithms to Big Data Platforms
    Sebuah video presentasi dari Nikolay Malitsky dari Brookhaven National Laboratory pada acara SPARK Summit East 2017 lalu, membahas mengenai akstensi MPI-based pada Spark.
  2. Make your R simulation models 20 times faster
    R akan menjadi sangat lambat jika menggunakan loop. Namun hal ini dapat dipercepat secara signifikan, sekitar 20 kali, dengan menggunakan paket Rcpp.
  3. HBase Compaction and Data Locality With Hadoop
    Pengumpulan data Geospatial memungkinkan developer dan para profesional untuk mengembangkan pendekatan yang paling efisien dan biaya yang efektif untuk memenuhi kebutuhan yang spesifik.
  4. Ushering in a New Tech Era for Geospatial Data
    Pemanfaatan geospasial data membuka kemungkinan untuk solusi-solusi yang efisien dan efektif. Berikut ini dibahas beberapa hal yang perlu menjadi pertimbangan dalam pemanfaatan data geospasial.
  5. Building Data Science Skills as an Undergraduate
    Keahlian dalam bidang data sains saat menjadi suatu modal yang sangat penting terutama bagi para pencari kerja. Artikel ini memberikan sedikit tips mengenai bagaimana memulai membangun skill di bidang ini.

Rilis produk

  1. Apache Accumulo 1.8.1 released
    Rilis ini mencakup perubahan dan perbaikan untuk lebih dari 40 issue, terdiri dari bug-fixes, perbaikan kinerja, peningkatan kualitas build, dan lain-lain.

 

Contributor :

Tim idbigdata
always connect to collaborate every innovation 🙂
  • Feb 27 / 2017
  • Comments Off on Seputar Big Data edisi #7
Big Data, Forum Info, Hadoop

Seputar Big Data edisi #7

Kumpulan berita, artikel, tutorial dan blog mengenai Big Data yang dikutip dari berbagai site. Berikut ini beberapa hal menarik yang layak untuk dibaca kembali selama minggu ketiga Februari 2017

Artikel dan berita
  1. Gartner’s 2017 Take on Data Science Software
    Gartner telah merilis Gartner Magic Quadran for Data Science Platforms 2017. Dari sekitar 100 perusahaan yang menjual software data sains, Gartner memilih 16 perussahaan yang memiliki pendapatan tinggi atau pendapatan rendah tetapi pertumbuhan yang tinggi. Setelah mendapat masukan baik dari pelanggan maupun perwakilan perusahaan, Gartner memberikan nilai pada perusahaan dengan kriteria "kelengkapan visi" dan "kemampuan untuk melaksanakan" visi tersebut.
  2. Big Data Opportunties
    Peluang-peluang besar dalam area Big Data pada saat ini yang merupakan hasil perbincangan dengan 22 eksekutif dari 20 perusahaan yang bekerja dalam bidang Big Data.
  3. IBM, Hortonworks tackle big data in Hadoop analytics partnership
    IBM dan Hortonworks telah bermitra untuk menawarkan penggunaan IBM Storage dengan Hadoop. Melalui kemitraan ini, keduanya akan menawarkan Hortonworks Data Platform (HDP) untuk IBM elastis Storage Server (ESS) dan IBM Spectrum Skala. Ini berarti bahwa klien IBM akan dapat menjalankan analisis Hadoop langsung di IBM Storage tanpa perlu melakukan pemisahan antar media penyimpanan khusus untuk analytics.
  4. Machine 4.0: Making your Factory, Production and Maintenance Data Work
    Untuk memanfaatkan potesi Big Data, perusahaan manufaktur harus mampu dengan baik mengintegrasikan dan menghubungkan sumber-sumber data pada sebuah platform terpadu dan menggunakan machine learning untuk mengambil insight, menganalisa dan mendapatkan hasilnya

Tutorial dan pengetahuan teknis

  1. What is a Support Vector Machine, and Why Would I Use it?
    Support Vector Machine saat ini menjadi salah satu algoritma yang popular. Dalam artikel ini dijelaskan bagaimana cara kerja SVM dan beberapa contoh menggunakan Python Scikits libraries.
  2. How To Set Up a Shared Amazon RDS as Your Hive Metastore
    Mulai CDH 5.10 dan selanjutnya, cluster di AWS cloud dapat menggunakan secara bersama-sama sebuah instance RDS persistence sebagai HMS backend database. Hal ini memungkinkan sharing metadata melampaui life cycle cluster, sehingga cluster berikutnya tidak perlu men-generate ulang metadatanya. Berikut ini bagaimana mengkonfigurasi RDS sebagai backend database untuk shared Hive Metastore.
  3. Prophet: How Facebook operationalizes time series forecasting at scale
    Facebook merilis prophet, sebuah open source package untuk R dan Python yang mengimplementasikan metodologi time-series yang digunakan Facebook di production sistem mereka untuk melakukan ‘forecasting at scale’.
  4. Moving from R to Python: The Libraries You Need to Know
    Berikut ini daftar library yang ada di R, dan counterpart-nya di Python, untuk anda yang perlu melakukan migrasi dari R ke Python.

Rilis Produk

  1. Announcing ggraph: A grammar of graphics for relational data
    ggraph, ekstensi dari ggplot2 API untuk mendukung data relasional seperti network dan tree, dirilis di CRAN repository.
  2. Announcing the release of Apache Samza 0.12.0
    Apache Samza adalah kerangka kerja pemrosesan stream terdistribusi, menggunakan Kafka untuk messaging dan Apache Hadoop YARN untuk fault tolerance, processor isolation, keamanan, dan manajemen resource. Release 0.12.0 ini menambahkan beberapa fitur untuk meningkatkan stabilitas, kinerja dan kemudahan penggunaan.

     

    Contributor :

    Tim idbigdata
    always connect to collaborate every innovation 🙂
  • Feb 20 / 2017
  • Comments Off on Seputar Big Data Edisi #6
Uncategorized

Seputar Big Data Edisi #6

Seputar Big Data edisi #6

Kumpulan berita, artikel, tutorial dan blog mengenai Big Data yang dikutip dari berbagai site. Berikut ini beberapa hal menarik yang layak untuk dibaca kembali selama minggu ketiga bulan Februari 2017

Artikel dan berita

  1. International Hadoop Market 2020 – Key Vendors Landscape, Trends, Challenges, and Drivers, Analysis, & Forecast
    Hadoop Market Reaserch Report adalah sebuah studi yang mendalam dan profesional tentang keadaan pasar dan implementasi Hadoop saat ini, dan juga berfokus pada faktor pendorong utama dan hambatan bagi pemain kunci di area ini. Pasar Hadoop secara global diprediksikan akan tumbuh sekitar 59,37% CAGR selama periode 2016 - 2020
  2. 4 trends in how supply chains are using Big Data
    Penggunaan dataset yang besar untuk tujuan analisa dan perencanaan pada area rantai pasokan (suply chain) membuat organisasi dapat bereaksi lebih cepat terhadap perubahan di berbagai titik. Berikut adalah tren penggunaan Big Data dalam area suply chain.
  3. Microsoft’s future is in the cloud
    Dua raksasa teknologi, Apple dan Microsoft, merupakan perusahaan yang masuk dalam daftar "2017's most innovative companies". Saat ini Microsoft banyak berinvastasi dan mendorong penggunaan cloud, baik private cloud maupun public cloud

Tutorial dan pengetahuan teknis

  1. A comparison of deep learning packages for R
    Perbandingan secara mendalam antara 4 package R untuk deep learning. Package yang direview adalah MXNet, darch, deepnet dan h2o. Dalam studi tersebut dibandingkan aspek fleksibilitas, kemudahan penggunaan, dukungan kerangka paralelisasi (GPU, cluster), dan kinerja.
  2. Apache Arrow and Apache Parquet: Why We Needed Different Projects for Columnar Data, On Disk and In-Memory
    Apache Arrow dan Apache Parquet sama-sama berfokus pada perbaikan kinerja dan efisiensi data analytics. Kedua project ini mengoptimasi kinerja untuk pemrosesan dalam disk dan dalam memori. Artikel ini mengulas mengenai peran kedua project tersebut dalam peningkatan performance pemrosesan big data analytics.
  3. Introduction to Natural Language Processing, Part 1: Lexical Units
    Berikut ini artikel yang mengeksplorasi konsep NLP. Pada bagian pertama kali ini, dimulai dengan pengenalan terhadap bidang NLP, serta penjelasan mengenai bagaimana mengidentifikasi unit leksikal sebagai bagian dari data preprocessing.

Rilis produk

  1. Apache Hadoop 3.0.0-alpha2 Released
    Apache Hadoop versi 3.0.0-alpha2 telah dirilis akhir Januari 2017 lalu. Rilis ini merupakan rilis alpha kedua dari rangkaian dari Hadoop versi 3, berisi 857 big fix, perbaikan dan penambahan fitur dibandingakn versi sebelumnya.
  2. Performance improvements coming to R 3.4.0
    R versi 3.4.0 sedang direncanakan untuk dirilis yang akan membawa banyak perbaikan kinerja dan fitur baru. Sementara itu R 3.3.3 (codename: Another Canoe) direncanakan akan dirilis bulan Maret 2017 hanya akan memperbaiki bug yang bersifat minor.
  3. Announcing TensorFlow 1.0
    TensorFlow 1.0 diumumkan pada acara tahunan TensorFlow Developer Summit pada 15 Februari lalu.
  4. Yahoo open-sources TensorFlowOnSpark for deep learning with big data
    Yahoo mengumumkan mengopensourcekan TensorFlowOnSpark, sebuah software yang digunakan supaya Google TensorFlow framework dapat berjalan diatas klaster Spark
  5. Making Google Data Studio Free for Everyone
    Tahun lalu, Google merilis Data Studio baik versi gratis maupun versi enterprise. Untuk lebih mengoptimalkan Data Studio, saat ini Google sudah tidak membatasi jumlah laporan (report). Pengguna dapat membuat dan membagikan sebanyak mungkin laporan sesuai kebutuhan dan semuanya gratis.

 

Contributor :

Tim idbigdata
always connect to collaborate every innovation 🙂
  • Feb 13 / 2017
  • Comments Off on Seputar Big Data Edisi #5
Apache, Big Data, Forum Info, Hadoop, Social Media

Seputar Big Data Edisi #5

Seputar Big Data edisi #5

Kumpulan berita, artikel, tutorial dan blog mengenai Big Data yang dikutip dari berbagai site. Berikut ini beberapa hal menarik yang layak untuk dibaca kembali selama minggu ke dua bulan Februari 2017

Artikel dan berita

  1. A Very Short History of Artificial Intelligence (AI)
    Sejarah singkat mengenai perkembangan kecerdasan buatan (AI) dari masa ke masa
  2. Chicken Wings or Pizza? Adobe Discusses Super Bowl Insights
    Adobe melakukan penggalian dan analisa pada data mobile ads, sentimen sosial media dan transaksi pembelian untuk mendapatkan tren yang terjadi menjelang pertandingan pada Sunday's Super Bowl antara Atlanta Falcons melawan New England Patriots
  3. 5 Major Big Data Predictions for 2017
    Seputar prediksi area yang akan berkembang dalam penggunaan dan pemanfaatan layanan komputasi awan pada tahun ini 2017.
  4. How to Boost Your Career in Big Data and Analytics
    Saat ini adalah era digital, segala sesuatu dapat menjadi data digital, sehingga peran penting Big Data dan Data Analytics terus meningkat dan tumbuh kedepannya. Ini merupakan kesempatan untuk berkarir di area ini.
  5. How Facebook Is Getting Better at Recognizing Your Photo
    Awal Februari ini Facebook mengupdate fitur pencarian foto menggunakan platform computer vision mereka. Sekarang anda dapat mencari foto di Facebook menggunakan keyword yang mendeskripsikan isi foto.
  6. Big data, financial services and privacy : Should our bankers and insurers be our Facebook friends?
    Bank dan perusahaan asuransi biasanya mendasarkan penilaian mereka pada apa yang dilaporkan oleh customer dan agen mereka. Namun akhir-akhir ini mereka mulai menggunakan sumber-sumber lain yang lebih personal seperti data aplikasi website dan mobile-banking. Bahkan sumber yang tidak konvensional semacam profil media sosial, web browsing, maupun phone location tracker. Dalam sebuah percobaan, FICO, penilai kredit terkemuka di Amerika, menemukan bahwa status Facebook seseorang dapat membantu memprediksi kelayakan kredit seseorang. Saat ini mereka bahkan berusaha mempelajari ekspresi dan nada suara seseorang untuk menentukan resiko kreditnya. Hal ini di samping menjadi peluang, namun juga mengundang beberapa kritik, terutama dari sisi privacy maupun kemungkinan financial exclusion.
  7. How nonprofits use big data to change the world
    Bagaimana organisasi-organisasi nirlaba memanfaatkan data untuk mendukung kegiatan mereka.
  8. Healthcare DATA Integration: The Foundation for Population Health
    Integrasi data dalam pelayanan kesehatan merupakan sebuah hal yang sangat penting, terutama untuk memberikan layanan kesehatan yang terbaik dan terintegrasi untuk masyarakat. Artikel ini membahas mengenai apa saja sumber data yang penting dalam bidang kesehatan, dan apa saja use case yang penting untuk diimplementasikan.

Tutorial dan pengetahuan teknis

  1. Automatically Segmenting Data With Clustering
    Dalam tutorial ini dijelaskan secara singkat mengenai algoritma K-Means Clustering, dan bagaimana mengukur keakuratannya, dan bagaimana memilih segmen yang dihasilkan
  2. You Want Data Science, Now What?
    Langkah-langkah praktis bagi sebuah organisasi yang ingin memulai implementasi data science.
  3. ModernDive: A free introduction to statistics and data science with R
    Sebuah open source textbook mengenai statistik dan data science dalam R. Menjelaskan dengan komprehensif mengenai : menggunakan R untuk mengeksplor dan memvisualisasikan data, menggunakan randomizaation dan simulasi untuk membangun ide inferensial, dan membangun sebuah 'cerita' menggunakan ide-ide tersebut dan menampilkannya ke audiens umum. Menariknya, buku ini sendiri ditulis dalam R, menggunakan package bookdown.
  4. 5 Data Science Books You Should Read in 2017
    5 buku yang perlu dibaca untuk anda yang ingin mengenal atau memperdalam pengetahuan dalam bidang data sains dan big data.
  5. Text mining and word cloud fundamentals in R : 5 simple steps you should know
    Metode text mining memungkinkan kita untuk menyoroti kata kunci yang paling sering digunakan dalam sebuah teks. Untuk menampilkannya dapat digunakan word cloud, juga disebut sebagai text cloud atau tag cloud, yang merupakan representasi visual dari data teks. Artikel ini akan menjelaskan langkah demi langkah cara untuk menghasilkan word cloud dengan menggunakan R.
  6. Fueling the Gold Rush: The Greatest Public Datasets for AI
    Saat ini makin mudah bagi kita untuk membangun sebuah sistem berbasis AI atau machine learning, terutama dengan semakin banyaknya open source tools semacam Tensorflow, Torch, Spark, dan lain sebagainya. Faktor lain yang tidak kalah penting dalam pembuatan sistem berbasis AI adalah data. Berikut ini daftar open dataset dalam berbagai format, yang tidak boleh dilewatkan untuk penggiat dan peminat AI.

Rilis produk

  1. Welcome to Apache Zeppelin 0.7.0
    Rilis Apache Zeppelin 0.7.0 dengan beberapa perbaikan dan penambahan fitur, di antaranya adalah peningkatan multi user, pluggable visualisation, peningkatan dukungan untuk Apache Spark dan security.
  2. The Apache Software Foundation Announces Apache® Ranger™ as a Top-Level Project
    Awal Februari ini Apache Foundation mengumumkan bahwa Apache Ranger ‘lulus’ dari status incubating menjadi sebuah top level project (TLP). Apache Ranger menyediakan cara sederhana dan efektif untuk setting access control dan mengaudit akses data di seluruh Hadoop stack. Salah satu manfaat utama dari Ranger adalah bahwa access control policies dapat dikelola oleh security administrator secara konsisten di seluruh ekosistem Hadoop. Dengan arsitektur plugin yang kuat, Ranger juga memungkinkan komunitas untuk menambahkan sistem baru untuk otorisasi bahkan di luar ekosistem Hadoop, dengan effort yang minimal.
  3. Google is Set to Open Source Google Earth Enterprise
    Google mengumumkan bahwa mereka akan segera membuka seluruh core Google Earth Enterprise (GEE) tools mereka menjadi open source. Rencananya langkah ini akan dilakukan pada bulan maret mendatang.
  4. Apache OpenNLP 1.7.2 released
    Rilis Apache OpenNLP versi 1.2.7. Apache OpenNLP library adalah toolkit berbasis machine learning untuk pengolahan teks bahasa alami. Mendukung task NLP yang paling umum, seperti tokenization, segmentasi kalimat, part-of-speech tagging, named entity extraction, chunking, parsing, dan coreference resolution.
  5.  

    Contributor :

    Tim idbigdata
    always connect to collaborate every innovation 🙂
  • Feb 06 / 2017
  • Comments Off on Seputar Big Data edisi #4
Big Data, Forum Info, Hadoop, Implementation

Seputar Big Data edisi #4

Kumpulan berita, artikel, tutorial dan blog mengenai Big Data yang dikutip dari berbagai site. Berikut ini beberapa hal menarik yang layak untuk dibaca kembali selama terakhir bulan Januari 2017 dan awal Februari 2017

Artikel dan berita
  1. All You Need To Know About Business Models in Digital Transformation
    Dalam istilah yang sangat sederhana, Model Bisnis adalah bagaimana perencaam kita untuk menghasilkan uang dari bisnis yang kita jalani. Sebuah versi halus adalah bagaimana kita menciptakan dan memberikan nilai kepada pelanggan.
  2. Five Ways Data Analytics Will Storm the Stage in 2017
    Telah menjadi sesuatu yang jelas saat ini, bagaimana analisis data mengarahkan pendapatan di bidang e-commerce. Dan perkembangan ini telah memaksa perusahaan e-tailers dan e-commerce untuk mempekerjakan lebih banyak data scientist dalam rangka untuk lebih memahami bagaimana faktor pelanggan berdampak kepada pendapatan dan penjualan.
  3. Stream Processing Myths Debunked
    Stream processing menjadi bagian yang penting dalam sebuah sistem big data, dan semakin banyak aplikasi dan platform yang mendukungnya. Meskipun demikian, masih banyak miskonsepsi yang terjadi terkait dengan stream processing. Dalam artikel ini para ahli dari data Artisans mengupas dan membongkar 6 mitos dan miskonsepsi mengenai stream processing.
  4. How Madden Got So Good at Predicting Super Bowl Winners
    Bagaimana Madden, sebuah videogame, dapat memanfaatkan data untuk memprediksikan pemenang superbowl, perhelatan olahraga terbesar di Amerika, hingga 9 dari 13 kali.

Tutorial dan pengetahuan teknis

  1. The Top Predictive Analytics Pitfalls to Avoid
    Tidak dapat dipungkiri lagi bahwa predictive modelling dan machine learning memberikan kontribusi signifikan untuk bisnis, namun keduanya sangat sensitif terhadap data dan perubahan di dalamnya, sehingga pemilihan teknik yang tepat dan menghindari kesalahan dan perangkap dalam membangun model data sains. Berikut ini beberapa perangkap utama yang perlu dihindari.
  2. How to set up a Twitter bot using R
    Dalam rangka dirilisnya package R ke 10.000 di CRAN, eoda menjalankan akun Twitter yang otomatis menampilkan jumlah package yang tersedia di CRAN sampai package ke 10 ribu tercapai pada tanggal 28 Januari 2017. Artikel ini menjelaskan mengenai cara set up account Twitter tersebut dengan R script.
  3. Journey Science: Combining 18 Data Sources + 1 Billion Interactions to take UX to The Next Level
    Journey Science, yang menyatukan data dari berbagai aktifitas pelanggan, telah menjadi bagian penting bagi industri telekomunikasi. Data tersebut dapat digunakan untuk meningkatkan customer experience dan retention. Dengan menggunakan insight yang didapat dari customer journey analytics, bisnis telekomunikasi dapat mengukur user experience dengan lebih baik, dan membuat keputusan yang tepat untuk meningkatkannya. Mulai dari melakukan tindakan proaktif untuk kepuasan pelanggan, namun juga untuk memprediksi dan mengantisipasi kegagalan yang mungkin terjadi di masa datang. Berikut ini sekilas mengenai bagaimana memanfaatkan customer journey untuk meningkatkan pelayanan dan kepuasan pelanggan.
  4. Performance comparison of different file formats and storage engines in the Hadoop ecosystem
    CERN telah mempublikasikan perbandingan kinerja Apache Avro, Apache Parquet, Apache HBase dan Apache Kudu. Ujicoba ini untuk mengevaluasi efficiency, ingestion performance, analytic scans and random data lookup pada data layanan CERN Hadoop.
  5. Working with UDFs in Apache Spark
    Dalam tulisan ini, akan dijelaskan contoh yang sederhana pembuatan UDF dan UDAF pada Apache Spark menggunakan Python, Java dan Scala
  6. Perfecting Lambda Architecture with Oracle Data Integrator (and Kafka / MapR Streams)
    Artikel yang menjelaskan konfogurasi pada Oracle Data Integrator menggunakan Apache Kafka/MapR Stream untuk menangkap perubahan yang terjadi pada MySQL.

Rilis produk

  1. Google : Using Machine Learning to predict parking difficulty
    Saat ini sebagian besar waktu mengemudi dihabiskan dalam kemacetan atau berputar-putar mencari tempat parkir. Salah satu tujuan produk-produk semacam Google Maps dan Waze adalah membantu pengguna kendaraan untuk mengemudi dengan lebih mudah dan efisien. Namun sampai saat ini, belum ada tool yang khusus mengatasi permasalahan parkir. Minggu lalu, Google merilis fitur baru untuk Android Google Map, yang menawarkan prediksi kondisi perparkiran di sekitar tempat tujuan anda, sehingga anda dapat mengantisipasinya dengan lebih baik. Fitur ini memanfaatkan kombinasi antara crowdsourcing dan machine learning. Saat ini fitur tersebut baru terdapat di di 25 kota di Amerika Serikat saja.
  2. Apache Atlas 0.7.1-incubating released
    Apache Atlas 0.7.1-incubating telah dirilis. Ada banyak perbaikan bugs dan beberapa peningkatan yang bersifat minor.
  3. Cloudera Enterprise 5.10 is Now Available
    Cloudera telah mengumumkan bahwa Cloudera Enterprise 5.10 telah dirilis dengan support GA untuk Apache Kudu, peningkatan kinerja pada cloud, peningkatan pada pengelolaan data dalam Amazon S3, dan banyak lagi.
  4. Announcing The Latest Hortonworks Data Cloud Release !
    Hortonworks mengumumkan rilis baru dari Hortonworks Data Cloud for AWS. Versi 1.11 ini terus mendorong untuk membuat pengolahan data menjadi mudah dan berbiaya efektif dalam komputasi awan.
  5. Announcing Data Collector ver 2.3.0.0
    StreamSets Data Collector versi 2.3.0.0 telah dirilis. Fokus utama dari rilis kali ini adalah mulithreaded pipelines, dukungan terhadap multitable copy, MongoDB change data capture, and HTTP API untuk Elasticsearch
  6. [ANNOUNCE] Apache Bahir 2.0.2
    Apache Bahir, tools yang menyediakan ekstensi dari Apache Spark, merilis versi 2.0.2

 

Contributor :

Tim idbigdata
always connect to collaborate every innovation 🙂
  • Feb 02 / 2017
  • Comments Off on Meetup #12 : Sinergi IDBigData, ITERA dan AIDI
Big Data, Forum Info, Hadoop, Implementation, Komunitas

Meetup #12 : Sinergi IDBigData, ITERA dan AIDI

Menggandeng ITERA (Institut Teknologi Sumatra) dan AIDI (Asosiasi Ilmuwan Data Indonesia, IDBigData menggelar meetup yang pertama di tahun 2017 di kampus ITERA, Lampung.

Meetup dibuka oleh Wakil Rektor I ITERA, Prof. Dr.-Ing. Mitra Djamal, dan menampilkan topik-topik menarik dan terkini yang terkait dengan big data.

Pembicara yang tampil di antaranya adalah Dr. Masayu Leylia Khodra dari ITB, memaparkan mengenai "Text Mining: Peringkasan Teks Bahasa Indonesia". Dalam era di mana pertumbuhan data dan informasi terjadi secara luar biasa, muncul fenomena yang biasa disebut "Information Overload", atau kebanjiran informasi. Orang tidak mungkin lagi membaca semua informasi yang ditemui. Untuk mengatasi hal ini, peringkasan teks menjadi sebuah proses yang penting dan sangat memudahkan bagi manusia untuk menyerap sebanyak mungkin informasi dalam waktu yang terbatas.

Pembicara lain adalah Andry Alamsyah, S.Si, M.Sc, Chairman dari Asosiasi Ilmuwan Data Indonesia (AIDI), menjelaskan mengenai Data Sains dalam perspektif bisnis. Dalam paparannya Andry menyampaikan banyak sekali use case yang menarik yang berkaitan dengan pengolahan data dan opportunity yang dapat digali dan diciptakan dari data.

Tampil pula Ir. Beno K Pradekso MSc.EE, CEO SOLUSI247, membawa tema "Big Data untuk Kedaulatan Data Indonesia", dan tidak ketinggalan pula, Sigit Prasetyo, ketua IDBigData, yang mengajak peserta untuk berkenalan dengan YAVA, distro Hadoop buatan anak bangsa.

Meetup #12 ini dihadiri oleh 89 peserta, yang berasal dari kalangan universitas, pemerintahan dan industri, di antaranya dari ITERA, Unila, Bapeda Lampung dan Bank Lampung.

Selain seminar singkat, di hari ke 2 diadakan pula workshop yang merupakan kerja sama dengan Lab247, yang memberikan kesempatan pada para peserta untuk mendapatkan hands on experience dengan big data tools dan platform seperti Chanthel (distributed document management), dan HGrid (big data engineering).

Untuk rekan-rekan yang belum berkesempatan mengikutinya, rekaman meetup ke 12 ini dapat disaksikan melalui channel IDBigData.

Meetup ke 13 rencananya akan dilaksanakan pada bulan Februari 2017, bekerja sama dengan Universitas Indonesia.

 

Contributor :

Tim idbigdata
always connect to collaborate every innovation 🙂
Tertarik dengan Big Data beserta ekosistemnya? Gabung