Unsupervised Learning
Kita dapat mebayangkan unsupervised learning sebagai usaha cara menemukan variabel-variabel tertentu dari data. Seperti namanya, unsupervised learning machine learning tidak memiliki pengawasan atau panduan dari manusia dalam mempelajari data. Sebaliknya, mesin diharapkan menghasilkan solusi berdasarkan pembelajaran algoritma.
Unsupervised learning dimaksudkan untuk mengeksplorasi data dan menghasilkan output berdasarkan pembelajaran algoritma. Algoritma memberi umpan dari data training tanpa label dan menghasilkan learning output. perhatikan contoh hasil unsupervised learning dengan algoritma K-Means.
Gambar 2. Hasil unsupervised learning dengan K-Means
Hasil di atas adalah algoritma Clustering yang digunakan untuk mengelompokkan data ke dalam sejumlah group. Pemanfaatan lain dari unsupervised learning adalah Dimensionality Reduction yang menyederhanakan data tanpa kehilangan terlalu banyak informasi dari data asli.
A Structured Approach to Learning Data Science
The Machine Learning Specialization is an 8-week bundle curated to accelerate a student’s mastery in building data products, developing machine learning models, and understanding the core components that form most of industrial-grade AI today.
Students are not assumed to have a working knowledge of R or prior proficiency in statistics/mathematics/algebra. The workshop follows a gentle learning curve and emphasizes hands-on, one-to-one tutoring from our team of instructors and teaching assistants.
Throughout the course of the Academy, you will learn to build, evaluate and deploy your data science products, one project after another.
Algoritma machine learning adalah metode dimana sistem artificial intelligence mengerjakan tugasnya secara otomatis. Umumnya algoritma machine learning ini digunakan untuk memprediksi nilai output dari input yang diberikan. Dua proses utama dari algoritma machine learning adalah klasifikasi dan regresi. Algoritma machine learning sendiri dibagi menjadi dua, yaitu supervised dan unsupervised learning. Supervised learning membutuhkan data input dan data output yang diinginkan dan digunakan untuk membuat pelabelan, sedangkan algoritma unsupervised learning bekerja dengan data yang tidak diklasifikasikan atau tidak diberi label. Contoh algoritma unsupervised learning adalah pengelompokan atau clustering data yang tidak difilter berdasarkan persamaan dan perbedaan. Pada artikel kali ini, kita akan membahas algoritma supervised learning, yaitu algoritma klasifikasi.
Terkadang sulit memutuskan algoritma machine learning mana yang paling baik untuk klasifikasi diantara banyaknya pilihan dan jenis algoritma klasifikasi yang ada. Namun, ada algoritma klasifikasi machine learning yang paling baik digunakan dalam masalah atau situasi tertentu. Algoritma klasifikasi ini digunakan untuk klasifikasi teks, analisis sentimen, deteksi spam, deteksi penipuan, segmentasi pelanggan, dan klasifikasi gambar. Pilihan algoritma yang sesuai bergantung pada kumpulan data dan tujuan yang akan dicapai. Lalu apa saja algoritma klasifikasi terbaik tersebut? Yuk simak artikel kali ini hingga akhir!
Support Vector Machine (SVM)
SVM adalah algoritma klasifikasi yang cukup populer karena berhasil melampaui beberapa algoritma canggih lainnya pada kasus tertentu, seperti digits recognition. Dalam istilah yang lebih sederhana, SVM adalah pengklasifikasi yang membuat batasan untuk memisahkan kelas-kelas yang berbeda. Data disebut support vektor untuk membantu membuat batasan.
Batasan itu disebut hyperplane atau pembagi. Ini dihitung berdasarkan dataset dan dengan mengukur margin terbaik dengan memindahkan hyperplane. Ketika data berada dalam dimensi yang lebih tinggi atau ketika ada data yang tidak dapat dipisahkan secara linear, kita akan menggunakan Kernel trick untuk menemukan hyperplane.
Perhitungan untuk mengukur hyperplane memang sulit, dan saya menyarankan membaca materi berikut di sini. Berikut adalah representasi gambar SVM.
Gambar 12. Ilustrasi SVM dapat dipisahkan dari hyperplane
Dapatkan Software Digital Monitoring Terbaik Hanya di Ivosights!
Anda bisa mendapatkan software analisis data yang komprehensif dan lengkap untuk data report bisnis dan sosial media di Ivosights! Ivosights menyediakan berbagai layanan terkait comprehensive analytics. Ivosights dapat membuat Anda lebih mudah memahami data dan juga dapat memberikan rekomendasi strategi yang tepat untuk kelangsungan bisnis Anda dengan bantuan tim Ivosights yang sudah berpengalaman melakukan analisa mendalam dari berbagai macam data.
Comprehensive analytics dari Ivosights hadir sebagai solusi yang dapat memudahkan Anda mengelola big data dan mendapatkan insights terbaik. Sebagai penyedia layanan customer engagement terlengkap di bidang ini, Ivosights juga menyediakan layanan Ripple 10 yang dapat membantu Anda memenangkan kompetisi di pasar bisnis.
Ripple 10 dapat menjadi mata-mata perusahaan Anda untuk mengetahui seperti apa sentimen warganet terhadap produk atau layanan yang Anda tawarkan kepada mereka. Bahkan, lebih dari itu, Anda juga bisa mengetahui aktivitas digital kompetitor, mengetahui topik perbincangan netizen mengenai brand, hingga menjaga reputasi brand dari isu negatif yang berpotensi viral.
Support Vector Machine
Support Vector Machine atau biasa dikenal dengan algoritma SVM adalah algoritma machine learning yang digunakan untuk masalah klasifikasi atau regresi. Namun, aplikasi yang paling sering digunakan adalah masalah klasifikasi. Algoritma SVM banyak digunakan untuk mengklasifikasikan dokumen teknis misalnya spam filtering, mengkategorikan artikel berita berdasarkan topik, dan lain sebagainya. Keuntungan algoritma ini adalah cepat, efektif untuk ruang dimensi tinggi, akurasi yang bagus, powerful dan fleksibel, dan dapat digunakan di banyak aplikasi.
Random Forest Classifier
Algoritma Random Forest Classifier merupakan salah satu algoritma klasifikasi machine learning yang paling populer. Seperti namanya, algoritma ini bekerja dengan cara membuat hutan pohon secara acak. Semakin banyak pohon yang dibuat, maka hasilnya akan semakin akurat. Dasar dari algoritma random forest adalah algoritma decision tree. Keuntungan dari algoritma ini adalah dapat digunakan u8ntuk rekayasa fitur seperti mengidentifikasi fitur yang paling penting diantara semua fitur yang tersedia dalam dataset training, bekerja sangat baik pada database berukuran besar, sangat fleksibel, dan memiliki akurasi yang tinggi.
Baca juga : Belajar Data Science: Pahami Penggunaan Machine Learning pada Python
Naive Bayes Classifier
Naive bayes classifier merupakan algoritma klasifikasi yang sangat sederhana berdasarkan apa yang disebut pada teorema bayesian. Algoritma ini memiliki satu sifat umum, yaitu setiap data diklasifikasikan tidak bergantung pada fitur lain yang terikat pada kelas atau biasa disebut dengan independen. Artinya, satu data tidak berdampak pada data yang lain. Meskipun algoritma ini merupakan algoritma yang tergolong sederhana, namun naive bayes dapat mengalahkan beberapa metode klasifikasi yang lebih canggih. Algoritma ini biasa digunakan untuk deteksi spam dan klasifikasi dokumen teks. Kelebihan algoritma ini adalah sederhana dan mudah diterapkan, tidak sensitif terhadap fitur yang tidak relevan, cepat, hanya membutuhkan sedikit data training, dan dapat digunakan untuk masalah klasifikasi multi-class dan biner.
Baca juga : 3 Jenis Algoritma Machine Learning yang Dapat Digunakan di Dunia Perbankan
Decision tree membangun model klasifikasi dan regresi dalam bentuk struktur pohon. Algoritma ini menguraikan kumpulan data menjadi himpunan bagian yang lebih kecil dan menghubungkannya menjadi pohon keputusan yang terkait. Tujuan utama dari algoritma decision tree adalah untuk membangun model pelatihan yang digunakan untuk memprediksi nilai variabel target dengan mempelajari aturan keputusan. Aturan ini disimpulkan dari data training yang sebelumnya telah diinput. Keuntungan algoritma ini adalah mudah dimengerti, mudah menghasilkan aturan, tidak mengandung hiper-parameter, dan model decision tree yang kompleks dapat disederhanakan secara signifikan dengan visualisasinya.
Algoritma Klasifikasi pada Machine Learning
Kita telah memahami dasar untuk setiap sistem machine learning dan bagaimana masalah yang berbeda memerlukan algoritma yang berbeda. Secara umum, sebagian besar masalah di industri adalah masalah klasifikasi, sehingga akan berguna bagi kita untuk memahami lebih lanjut tentang algoritma klasifikasi.
Mari kita pahami tujuh algoritma klasifikasi yang paling sering digunakan dan kapan masing-masing algoritma bisa digunakan.
Belajar Algoritma machine learning Beserta Tools-nya
Di era big data, machine learning merupakan salah satu teknologi yang banyak dicari. Hal ini menyebabkan meningkatnya minat belajar algoritma machine learning. Karena sebagian besar menggunakan data berukuran besar, maka tools yang digunakan pun tidak sembarangan dan perlu keahlian untuk mengaplikasikan tools tersebut. Ingin belajar machine learning beserta tools-nya? Yuk bergabung bersama DQLab! Kursus belajar data DQLab memiliki berbagai modul yang berisi bermacam-macam metode machine learning dengan tools yang banyak digunakan oleh data scientist profesional. Tunggu apa lagi? Klik button di bawah ini dan nikmati modul gratis DQLab sebagai pijakan awal dalam belajar algoritma machine learning. Selamat belajar!
Penulis: Galuh Nurvinda K
Editor: Annissa Widya Davita
%PDF-1.5 %µµµµ 1 0 obj <>>> endobj 2 0 obj <> endobj 3 0 obj <>/XObject<>/ProcSet[/PDF/Text/ImageB/ImageC/ImageI] >>/Annots[ 22 0 R 23 0 R 24 0 R] /MediaBox[ 0 0 595.32 841.92] /Contents 4 0 R/Group<>/Tabs/S/StructParents 0>> endobj 4 0 obj <> stream xœµ<Û’Û6²ï®ò?°NÕVI[#q!f·¶Ö—8vÏzÇ““ï>p4 3i,QNÍþôþÂén $A�ʩIJ6Ý�¾ôù‹]]ÝË:úë_Ï_Ôu±¼+o¢ÏçWÛÇŸ_==–ç‹Uµ)êj»9ÿt¸®qèmYÜ”»¿ý-zùúUôòêù³ó7,b,Ndtuûü‹ø�E)Kb!#-X,utõðüYðã‡çÏ>Ï¢ù¿£«Ÿ?ûæyþìŸÏŸ!&7Whç,ÒLÇJÒÜϳOõ¡3ǃÎuÌ…}SÎõl3W³z¾�³è²Ü—Å\Ìvs9[ÞEðíGø¶…?BÀb@ïé¢?A~ÊãJÒXi;ãízk\ó¡œ/Ä,†¯lžÎÎàïèèÅçq€ ÉYÌR§ Âf±ê…`ErDëk �ÏöåÃ5TîB3q“&.¢eì-`Õ4Í¢«åçO¸8!ûÎÌ„æoÀù> ‰\&q*¢,ç±vø}`A.U¬sv‚M“X1öÝ<Ÿ}ÂÍý4Ïfø%ú”+â¹’!õMäšÐ’"ѱè±"x:gÉŒG7Å´)úš«X,&²&T³>kŸ ;ñæñ5gbäM²MsÒš’Ðo*‰žEoÁd‹uP¿²$æÊŸÊ%J%h"ZÇéDº ˆór…ÈYoƨ#ôæ«/CçÈ3ðd ö,CŸÉE,#F³våóg·Ur75�uÇÝ‚1ÿãÝw!¹‰„‘êu&Å ËUÃ@g`¢»Õàð%ùñ»º~Ü£·ø6èüüµa[�¢Ä[Ý@IÎA (.PS6KU¢Îñ×óîWxþ^¦x|¬bT«¯ä° 5ïÒ<âuçÒ‡ :X»Í]X�„Èv·±]‘ã8 Œ¾]ź€|›� T+Ï
Reinforcement Learning
Reinforcement learning adalah sistem machine learning yang melakukan tugas dengan memaksimalkan reward melalui tindakan tertentu. Reinforcement learning menggunakan agen untuk mengamati keadaan lingkungan tertentu dan memilih suatu keadaan untuk bertindak. Tindakan akan menghasilkan reward atau penalty tergantung pada pilihan tersebut. Reinforcement learning akan mendorong algoritma untuk menemukan strategi terbaik dalam memaksimalkan reward. Keputusan tersebut kemudian akan menjadi agen dalam suatu lingkungan tertentu.
Kita sering menggunakan reinforcement learning ketika kita tidak memiliki banyak data atau mendapatkan data dengan berinteraksi dengan lingkungan. Contoh reinforcement learning adalah self-driving car dan AI Chess.