Supervised Learning vs Unsupervised Learning

Hai teman-teman! Sudah siap untuk mulai belajar bersama tentang machine learning? Pada artikel ini, kita akan membahas topik yang seru, yaitu Supervised vs Unsupervised Learning. Awalnya mungkin terdengar sedikit rumit, tapi tenang saja, kami akan membantu kamu memahami semuanya dengan cara yang menyenangkan!

First of all, bayangkan kamu memiliki data yang ingin ditelaah, tapi tidak yakin harus mulai dari mana. Nah, inilah saatnya untuk memanfaatkan machine learning! Dua metode utama yang sering kita dengar adalah Supervised Learning dan Unsupervised Learning. Pertanyaannya sekarang, manakah yang paling cocok untuk data yang kamu miliki?

💻 Mulai Belajar Pemrograman

Belajar pemrograman di Dicoding Academy dan mulai perjalanan Anda sebagai developer profesional.

Daftar Sekarang

Pada artikel ini, kita akan belajar terkait perbedaannya dan memberikan beberapa contoh penggunaan praktis dari masing-masing metode. Kita juga akan membahas terkait bagaimana cara memilih pendekatan yang sesuai dengan kebutuhan data kamu.

Gimana, sudah siap? Bikin seblak pakai kencur, meluncuuuuurr~

**A. Apa itu Machine Learning?**

Machine Learning (ML) adalah cabang dari kecerdasan buatan atau Artificial Intelligence (AI) yang memungkinkan sistem komputer untuk belajar dari data dan pengalaman tanpa harus secara eksplisit diprogram. Dengan menggunakan berbagai algoritma dan teknik statistik, ML memungkinkan komputer untuk mengidentifikasi pola-pola dalam data, membuat prediksi, dan mengambil keputusan secara mandiri.

Pendekatan ini memungkinkan sistem untuk meningkatkan kinerjanya seiring waktu tanpa perlu perubahan kode yang signifikan karena sistem akan terus belajar dari data baru yang mereka proses. Dalam konteks yang lebih luas, ML menjadi salah satu pendorong utama dalam pengembangan aplikasi dan teknologi baru di berbagai bidang, termasuk bisnis, ilmu pengetahuan, kesehatan, dan masih banyak lagi.

Ini adalah pertanyaan yang sering muncul. Gimana sih mesin bisa “belajar” seperti manusia? Rasanya seperti ajaib, tapi sebenarnya, bukan tiba-tiba lho! Sini kami ceritain, ya!

Jadi ceritanya begini….

ML itu ibaratnya murid di sekolah. Dia bisa belajar dari contoh yang sudah diberikan ke dia sebelumnya (misalnya, guru sudah kasih contoh pelajaran), dan juga dia bisa belajar dari contoh baru yang dia temukan di sepanjang perjalanannya atau yang biasa kita sebut sebagai eksplorasi. Tugasnya dia akan berbeda-beda tergantung cara dia belajarnya, yang disebut metode. Nah, ada beberapa cara yang bisa dipilih, dan tiap cara punya kelebihan dan kekurangan. Apa saja itu? Mari kita bahas bersama! ^^

B. Supervised Learning

1. Pengertian dan Konsep

Dalam dunia ML, salah satu metode yang penting untuk dipahami adalah Supervised Learning (SL). Jadi, SL itu seperti guru yang memberi petunjuk pada muridnya tentang cara melakukan tugas tertentu. Nah, dalam hal ini, mesin atau komputer berperan sebagai murid yang belajar dari contoh-contoh yang diberikan oleh guru, dalam kasus ini adalah data yang sudah dilabeli dengan benar.

Misalnya, kita memiliki kumpulan data tentang berbagai jenis sayuran seperti wortel, tomat, dan paprika yang disebut sebagai Data Latih. Setiap sayuran dalam dataset ini telah dilabeli dengan benar sesuai dengan jenisnya. Nah, mesin atau model training akan belajar dari data ini untuk memahami pola-pola yang ada dalam setiap jenis sayuran dan kemudian dapat mengidentifikasi sayuran yang baru berdasarkan karakteristiknya.

Lalu, kita akan menguji model tersebut dengan memberikan contoh baru berupa gambar sayuran mirip wortel yang belum pernah dilihat sebelumnya oleh model atau bisa disebut sebagai Data Uji. Model akan mencoba memprediksi bahwa sayuran tersebut kemungkinan besar adalah wortel karena ia telah belajar bahwa wortel memiliki ciri-ciri tertentu, seperti berwarna oranye dan berbentuk panjang silindris.

Sebaliknya, jika kita memberikan contoh yang lebih mirip dengan paprika, model akan cenderung memprediksi bahwa sayuran tersebut adalah paprika berdasarkan pada pola yang telah dipelajari dari data sebelumnya, seperti warna hijau, dan bentuk bulat atau lonjong.

Dengan cara ini, model dalam SL dapat mengenali dan membedakan berbagai jenis sayuran berdasarkan karakteristik yang telah dipelajari dari data latihnya.

2. Ciri-ciri Data Supervised Learning

Dalam SL, data yang digunakan untuk melatih model memiliki beberapa ciri khas yang membedakannya dari jenis pembelajaran lainnya.

Pertama, setiap contoh data dalam data latih memiliki label atau kelas yang sudah ditentukan sebelumnya. Misalnya, jika kita memiliki dataset tentang penjualan buah-buahan di sebuah toko, setiap entri dalam dataset ini mencakup informasi tentang jenis buah, harga, dan jumlah penjualan, serta dilengkapi dengan label atau kelas yang menunjukkan apakah buah tersebut laku terjual atau tidak.

Kedua, terdapat hubungan antara fitur atau atribut yang ada dalam data dengan labelnya. Dalam kasus penjualan buah-buahan, terdapat hubungan antara fitur-fitur seperti jenis buah, harga, dan jumlah penjualan dengan label “Laku Terjual” atau “Tidak Laku Terjual”. Misalnya, buah-buahan dengan harga lebih rendah cenderung memiliki peluang lebih besar untuk terjual.

Ketiga, biasanya terdapat tujuan yang jelas dalam melakukan prediksi atau klasifikasi. Tujuan dari menggunakan SL dalam kasus ini adalah untuk memprediksi apakah suatu buah akan terjual atau tidak berdasarkan atribut-atributnya. Dengan demikian, model dapat membantu toko dalam merencanakan persediaan dan mengoptimalkan penjualan.

Terakhir, data dalam SL sering kali harus diverifikasi atau dilabeli secara manual oleh manusia. Sebelum kita dapat menggunakan dataset penjualan buah-buahan untuk melatih model, kita harus melakukan verifikasi dan memberi label secara manual pada setiap entri dalam dataset. Misalnya, kita perlu mengecek apakah informasi tentang penjualan setiap buah sudah tepat dan memberikan label yang sesuai berdasarkan informasi tersebut.

Dengan ciri-ciri ini, data SL memberikan kerangka kerja yang jelas bagi model untuk belajar dan membuat prediksi yang akurat berdasarkan contoh-contoh yang telah diberikan.

C. Unsupervised Learning

1. Pengertian dan Konsep

Unsupervised Learning (UL) adalah seperti petualangan tanpa peta. Jadi, bayangkan kamu diberi tumpukan puzzle tanpa petunjuk apapun tentang bagaimana memecahkan puzzle tersebut. Dalam UL, model diajak untuk menjelajahi data tanpa arahan atau label yang jelas seperti pada SL.

Bayangkan kamu memiliki sejumlah gambar yang tersusun acak. Tidak ada label atau petunjuk tentang jenis sayuran tersebut. Dalam UL, model akan berusaha mencari pola atau kelompok dalam gambar-gambar itu tanpa panduan eksternal dan diakhiri dengan memberikan label pada masing-masing kelompok.

Seperti mencari jejak dalam peran seorang detektif, model akan mengenali ciri-ciri visual yang tersirat dalam gambar-gambar tersebut. Beberapa gambar mungkin menampilkan warna merah atau hijau yang terang dengan bentuk bulat, sementara yang lain mungkin memiliki warna ungu dengan bentuk yang lebih panjang.

Salah satu contoh aplikasi dari pendekatan yang telah dijelaskan adalah dalam mengelompokkan gambar-gambar sayur-sayuran berdasarkan kesamaan visualnya. Sebagai contoh, model dapat mengidentifikasi bahwa gambar-gambar dalam Kelompok 1 cenderung memiliki warna hijau atau merah terang dengan bentuk yang bulat, sementara gambar dalam Kelompok 2 mungkin berwarna ungu dengan bentuk yang lebih panjang. Kemudian, gambar-gambar dalam Kelompok 3 mungkin cenderung memiliki warna putih dengan bentuk yang bulat dan lapisan-lapisan coklat.

Dengan mengenali pola-pola visual ini, kita dapat memberikan nama kepada setiap kelompok. Misalnya, Kelompok 1 dapat disebut sebagai “Paprika”, Kelompok 2 sebagai “Terong”, dan Kelompok 3 sebagai “Bawang”. Ini adalah salah satu cara yang berguna dalam mengorganisir dan mengklasifikasikan data visual secara efisien.

Meskipun tidak ada tujuan yang jelas seperti dalam SL, namun UL memberi kita kebebasan untuk mengeksplorasi data dengan cara yang lebih bebas tanpa perlu panduan atau label sebelumnya.

2. Ciri-ciri Data Supervised Learning

Dalam UL, data memiliki beberapa ciri khas yang membedakannya dari jenis pembelajaran lainnya.

Pertama, tidak ada label atau kelas yang sudah ditentukan sebelumnya untuk setiap contoh data dalam data latih. Ini berarti bahwa model diajak untuk menjelajahi data tanpa petunjuk yang jelas tentang apa yang harus dicari atau diprediksi.

Misalkan, kita memiliki dataset tentang penjualan buah-buahan di sebuah toko yang sudah dilengkapi dengan label “Laku Terjual” untuk setiap entri data. Dalam UL, kita akan mengabaikan label ini dan hanya fokus pada atribut-atribut seperti jenis buah, harga, dan jumlah penjualan. Model akan mencoba menemukan pola-pola dalam data tanpa memperhatikan label “Laku Terjual”.

Kedua, dalam data UL, model mencoba menemukan pola-pola atau struktur tersembunyi dalam data tersebut tanpa bantuan eksternal. Model akan mengidentifikasi ciri-ciri atau kesamaan dalam data untuk mengelompokkan atau mengklasifikasikan data tanpa panduan manusia.

Ambil contoh dataset ulasan produk dari pelanggan yang sudah dilengkapi dengan label sentimen positif atau negatif. Dalam UL, kita akan mengabaikan label ini dan hanya fokus pada teks ulasan itu sendiri. Model akan mencoba menemukan pola atau tema umum dalam ulasan tersebut tanpa memiliki tujuan tertentu dalam analisisnya.

Ketiga, dalam UL, tidak ada tujuan spesifik dalam melakukan analisis atau prediksi. Meskipun model dapat menemukan pola-pola dalam data, tidak ada petunjuk tentang apa yang seharusnya dicapai atau diprediksi oleh model. Ini memberikan kebebasan yang lebih besar dalam mengeksplorasi data tanpa batasan tujuan yang telah ditetapkan sebelumnya.

Misalkan kita memiliki dataset transaksi belanja pelanggan di sebuah supermarket yang sudah dilengkapi dengan label “Jenis Transaksi” seperti “Makanan”, “Minuman”, atau “Peralatan Rumah Tangga”. Dalam UL, kita akan mengabaikan label ini dan hanya fokus pada atribut-atribut seperti item yang dibeli dan jumlah pembelian. Model akan mencoba menemukan pola-pola belanja yang tersembunyi tanpa memperhatikan label jenis transaksi.

Terakhir, data dalam UL tidak memerlukan proses labeling atau verifikasi manual oleh manusia. Karena tidak ada label yang sudah ditentukan sebelumnya, tidak perlu melakukan tugas-tugas ini seperti pada Supervised Learning. Model dapat belajar dan mengeksplorasi data secara mandiri tanpa campur tangan manusia.

Contohnya dataset gambar berbagai jenis buah-buahan yang sudah dilabeli dengan jenis buah yang tergambar. Dalam UL, kita akan menghilangkan label jenis buah tersebut dan hanya menggunakan gambar-gambar tersebut sebagai input. Model akan mencoba menemukan pola visual atau kesamaan antara gambar-gambar tersebut tanpa memerlukan proses labeling atau verifikasi manual oleh manusia.

Dengan ciri-ciri ini, data UL memberikan kesempatan untuk penelitian yang lebih bebas dan eksplorasi yang tak terduga dalam dunia data, di mana model dapat menemukan pola-pola dan struktur dalam data tanpa bantuan eksternal atau petunjuk sebelumnya.

D. Apa Perbedaannya?

Berikut adalah tabel yang diperbarui dengan contoh algoritma dan cara prediksinya untuk Supervised Learning dan Unsupervised Learning.

Point of View	Supervised Learning	Unsupervised Learning
Label/Data Kelas	Setiap contoh data memiliki label/kelas yang ditentukan sebelumnya.	Tidak ada label/kelas yang ditentukan sebelumnya untuk setiap contoh data.
Tujuan Prediksi	Tujuan prediksi atau klasifikasi yang jelas.	Tidak ada tujuan prediksi yang spesifik, lebih tentang eksplorasi dan pemahaman data.
Bantuan Eksternal	Memerlukan bantuan eksternal dalam memberikan label/kelas pada data.	Mengidentifikasi pola atau struktur dalam data tanpa bantuan eksternal.
Contoh Algoritma	Random Forest, Naive Bayes, Support Vector Machine.	K-Means Clustering, Hierarchical Clustering, DBSCAN.
Contoh Prediksi	Klasifikasi: Prediksi apakah email adalah spam atau bukan. Regresi: Prediksi harga rumah berdasarkan fitur-fiturnya.	Clustering: Mengelompokkan berita berdasarkan topiknya.

E. Kelebihan dan Kekurangan

Berikut adalah tabel yang memperlihatkan kelebihan dan kekurangan dari Supervised Learning dan Unsupervised Learning.

	Kelebihan	Kekurangan
Supervised Learning	Hasil prediksi yang akurat karena adanya label/kelas yang sudah ditentukan. Tujuan prediksi yang jelas dan terdefinisi.	Memerlukan label/kelas yang sudah ditentukan untuk setiap contoh data, yang mungkin sulit atau mahal untuk diperoleh. Pelatihan tidak dapat menangani data baru yang tidak memiliki label/kelas.
Unsupervised Learning	Dapat mengungkap pola-pola atau struktur tersembunyi dalam data tanpa adanya label/kelas yang sudah ditentukan. Dapat digunakan untuk eksplorasi data dan penemuan wawasan baru.	Tidak ada tujuan prediksi yang spesifik sehingga interpretasi hasil mungkin menjadi lebih sulit. Rentan terhadap kelemahan seperti kekurangannya dalam menangani data yang sangat kompleks atau berantakan.

Nah, itulah sedikit cerita tentang Supervised Learning dan Unsupervised Learning. Dua hal yang sering banget dipakai dalam dunia ML dan bisa kamu temui di banyak aplikasi sehari-hari, loh! Jadi, di Supervised Learning, kamu punya petunjuk jelas dengan label atau kelas yang udah ditentuin. Sementara di Unsupervised Learning, kamu lebih bebas buat eksplorasi data tanpa harus bergantung sama label.

Sekarang, kamu sudah memiliki bekal untuk mulai bereksperimen sendiri dan terjun ke dunia ML! Jangan ragu untuk mencoba dan terus belajar, ya. Semakin kamu mengerti, semakin luas juga pengetahuanmu tentang ML.

Kalau kamu penasaran dan mau belajar lebih lanjut tentang Supervised Learning dan Unsupervised Learning, kamu bisa mulai dengan mengeksplorasi materi dan contoh lebih dalam lagi pada Kelas Belajar Machine Learning untuk Pemula. Siapa tahu dari sana kamu bisa dapet insight baru yang seru! Happy exploring dan sampai jumpa pada blog selanjutnya! 🚀😊