WEKA, Pentaho Data Mining berbasis Java

WEKA, Pentaho Data Mining berbasis Java

Bisnis Intelijen (BI) merupakan kategori yang luas dari aplikasi dan teknologi untuk mengumpulkan, menyimpan, menganalisis, dan menyediakan akses ke data untuk membantu pengguna enterprise membuat keputusan bisnis yang lebih baik. Secara garis besar teknik yang dipakai dalam BI adalah teknik untuk mengidentifikasi, mengekstraksi, dan menganalisa data-data dari bisnis tertentu berdasarkan kategori-kategori yang mempengaruhi, contoh: menganalisa pendapatan penjualan (sales revenue) berdasarkan produk yang dijual dan cabang.

Pentaho merupakan open source BI sekaligus menyediakan platform dan program untuk membangun suatu aplikasi BI. Pentaho terdiri dari banyak program komputer yang bekerja secara bersamaan dan menyediakan solusi bisnis intelijen. Karena terdiri dari berbagai komponen, dimana ada komponen level bawah, namun juga ada komponen yang menyediakan fungsionalitas level atas yang biasanya mengandalkan fungsionalitas yang ditawarkan oleh komponen level bawah, keseluruhan koleksi komponen dalam Pentaho dapat dilihat seperti stack, yang mana semakin tinggi levelnya maka akan semakin dekat dengan end-user.

Pentaho BI Suite yang terdiri dari beberapa produk salah satunya Weka. Weka merupakan sebuah aplikasi data mining open source berbasis Java GUI Chooser yang dikembangkan pertama kalinya oleh Universitas Waikato di Selandia Baru. Aplikasi ini terdiri dari beberapa algoritma Machine Learning yang dapat digunakan untuk menggeneralisasikan ataupun memformulasikan sekumpulan data sample. Walaupun kekuatan Weka terletak pada algoritma yang semakin lengkap dan canggih, kesuksesan data mining tetap terletak pada faktor pengetahuan manusia implementor nya. Tugas pengumpulan data yang berkualitas tinggi dan pengetahuan pemodelan dan penggunaan algoritma yang tepat diperlukan untuk menjamin keakuratan formulasi yang diharapkan.

Beberapa fitur unggulan yang dimiliki oleh WEKA yaitu:

  • Classification
    Di dalam WEKA terdapat banyak algoritma yang mendukung untuk proses klasifikasi sebuah objek serta pengguna dimudahkan dalam melakukan implementasi secara langsung. User dapat melakukan load dataset, melakukan pemilihan algoritma untuk klasifikasi, kemudian diberikan beberapa representasi data yang mewakili hasil akurasi, tingkat kesalahan dari proses klasifikasi.

  • Regression
    Regression merupakan sebuah proses yang dapat melakukan suatu prediksi terhadap berbagai pola yang sudah terbentuk sebelumnya yang dijadikan sebagai model data. Tujuan dari regression adalah menciptakan suatu variabel baru yang mewakili suatu representasi perkembangan data pada masa yang akan datang. WEKA mendukung proses regression dan hal tersebut dipermudah dengan user interface/user experience yang sederhana.

  • Clustering
    Clustering merupakan salah satu cabang konsep dari unsupervised method dari machine learning yang bertujuan untuk melakukan pengelompokan data dan juga menjelaskan hubungan/relasi yang ada di antara data tersebut dan memaksimalkan kesamaan antar satu kelas/cluster tetapi meminimumkan kesamaan antar kelas/cluster. Clustering digunakan untuk analisa suatu data dan diharapkan menghasilkan suatu representasi data yang mewakili suatu pola yang terbentuk akibat relasi yang ada antar data.
    Di dalam WEKA tersedia beberapa pendekatan algoritma untuk menangani permasalahan clustering dan pada fitur ini juga terdapat bagian kesimpulan dari proses clustering data yang memberikan secara garis besar perhitungan dan hasil yang diberikan dalam implementasi algoritma clustering.

  • Association Rules
    Association Rules merupakan metode yang digunakan untuk menemukan berbagai relasi antara banyaknya variabel yang terdapat di dalam sebuah basis data dengan jumlah yang besar.

  • Visualization
    WEKA memiliki fitur untuk memberikan sebuah representasi data hasil sebuah proses data mining dalam bentuk gambar atau chart yang juga dapat dilakukan pemilihan berbagai parameter yang mendukung dalam membentuk representasi data yang ada dalam aplikasi WEKA.

Pada umumnya data mining dapat dilakukan dengan aplikasi yang bersifat komersil seperti SPSS Celemtine maupun yang open source seperti WEKA. Aplikasi-aplikasi tersebut akan mempermudah dalam melakukan penggalian data. Aplikasi pengolahan data ini dapat digunakan sesuai dengan kebutuhan hasil analisis dalam penelitian yang sedang dilakukan. Untuk lebih mengenal penggunaan WEKA, silahkan kunjungi referensi di bawah ini.

 

Sumber :

http://socs.binus.ac.id/2018/11/29/weka-software-untuk-memahami-konsep-data-mining/

https://steemit.com/programming/@alfarisi/proses-menganalisis-data-dalam-data-mining-weka-java-gui-chooser-version-3-8-0

https://www.researchgate.net/profile/Priati_Assiroj/publication/324054868_Perbandingan_Aplikasi_Data_Mining_WEKA_dan_SPSS_Clementine_Menggunakan_Dataset_Mahasiswa/links/5abaf8aca6fdcc7164708b22/Perbandingan-Aplikasi-Data-Mining-WEKA-dan-SPSS-Clementine-Menggunakan-Dataset-Mahasiswa.pdf?origin=publication_detail

http://journals.usm.ac.id/index.php/transformatika/article/download/62/62

Sumber gambar : https://www.cs.waikato.ac.nz/~ml/weka/gui_explorer.html