Supervised Learning
Mayoritas machine learning secara praktis banyak menggunakan suerpvised learning / pembelajaran yang diawasi.
Pembelajaran yang diawasi adalah di mana Anda memiliki variabel input (x) dan variabel output (Y) dan Anda menggunakan algoritma untuk mempelajari fungsi pemetaan dari input ke output.
Y = f (X)
Tujuannya adalah untuk memperkirakan fungsi pemetaan dengan baik sehingga ketika Anda memiliki data input baru (x) Anda dapat memprediksi variabel output (Y) untuk data tersebut.
Ini disebut pembelajaran terawasi karena proses belajar algoritma dari dataset pelatihan dapat dianggap sebagai guru yang mengawasi proses pembelajaran. Kita tahu jawaban yang benar, algoritma secara iteratif membuat prediksi pada data pelatihan dan dikoreksi oleh guru. Pembelajaran berhenti ketika algoritma mencapai tingkat kinerja yang dapat diterima.
Secara umum, ada dua jenis yang biasa digunakan sebagai algoritma pembelajaran yang diawasi:
- Regression, Output yang akan diprediksi adalah angka kontinyu yang relevan dengan dataset input yang diberikan. Contoh kasus penggunaan adalah prediksi penjualan ritel, prediksi jumlah staf yang diperlukan untuk setiap shift, jumlah tempat parkir mobil yang diperlukan untuk toko ritel, skor kredit, untuk pelanggan, dll. Dengan kata lain: Masalah klasifikasi adalah ketika variabel output adalah kategori, seperti "merah" atau "biru" atau "penyakit" dan "tidak ada penyakit".
- Classification, Output yang akan diprediksi adalah aktual atau probabilitas dari suatu kejadian / kelas dan jumlah kelas yang diprediksi dapat menjadi dua atau lebih. Algoritme harus mempelajari pola dalam input yang relevan dari setiap kelas dari data historis dan dapat memprediksi kelas atau peristiwa yang tidak terlihat di masa depan mempertimbangkan masukan mereka. Contoh kasus penggunaan adalah pemfilteran email spam di mana keluaran yang diharapkan adalah mengklasifikasikan email menjadi "spam" atau "bukan spam". Dengan kata lain: Masalah regresi adalah ketika variabel output adalah nilai nyata, seperti "dolar" atau "berat".
Beberapa jenis masalah umum yang dibangun di atas klasifikasi dan regresi termasuk rekomendasi dan prediksi deret waktu masing-masing.
Beberapa contoh populer algoritma pembelajaran mesin yang diawasi adalah:
- Linear regression untuk masalah regresi.
- Random forest untuk klasifikasi dan masalah regresi.
- Support vector machines untuk masalah klasifikasi.
Membangun machine learning mesin pembelajaran yang diawasi memiliki tiga tahap:
- Pelatihan: Algoritma ini akan dilengkapi dengan data input historis dengan output yang dipetakan. Algoritma ini akan mempelajari pola dalam data input untuk setiap output dan menyatakannya sebagai persamaan statistik, yang juga dikenal sebagai model.
- Pengujian atau validasi: Pada fase ini, kinerja model yang dilatih dievaluasi, biasanya dengan menerapkannya pada dataset (yang tidak digunakan sebagai bagian dari pelatihan) untuk memprediksi kelas atau kejadian.
- Prediksi: Di sini kami menerapkan model yang terlatih ke kumpulan data yang bukan bagian dari pelatihan atau pengujian. Prediksi akan digunakan untuk mendorong keputusan bisnis.
Unsupervised Learning
Ada situasi di mana kelas / kejadian keluaran yang diinginkan tidak diketahui sebagai data historis. Tujuannya adalah untuk mempelajari pola-pola dalam dataset input untuk mendapatkan pemahaman yang lebih baik dan mengidentifikasi pola-pola serupa yang dapat dikelompokkan ke dalam kelas atau kejadian tertentu. Karena jenis-jenis algoritma ini tidak memerlukan intervensi apa pun dari para pemateri ahli pelajaran sebelumnya, mereka disebut pembelajaran tanpa pengawasan.
Pembelajaran tanpa pengawasan adalah di mana Anda hanya memiliki data input (X) dan tidak ada variabel output yang sesuai.
Tujuan pembelajaran tanpa pengawasan adalah untuk memodelkan struktur atau distribusi yang mendasari dalam data untuk mempelajari lebih lanjut tentang data.
Ini disebut pembelajaran tanpa pengawasan karena tidak seperti pembelajaran terawasi di atas tidak ada jawaban yang benar dan tidak ada guru. Algoritme diserahkan kepada devisa mereka sendiri untuk menemukan dan menyajikan struktur yang menarik dalam data.
Masalah belajar tanpa pengawasan dapat dikelompokkan lebih lanjut ke dalam masalah clustering dan association.
- Clustering: masalah clustering adalah dimana Anda ingin menemukan kelompok-kelompok yang melekat di dalam data, seperti kelompok kustomer dari perilaku pembeliannya.
- Association: Masalah pembelajaran aturan asosiasi adalah tempat Anda ingin menemukan aturan yang menjelaskan sebagian besar data Anda, seperti orang yang membeli X juga cenderung membeli Y.
- Dimension Reduction, Di sini tujuannya adalah untuk menyederhanakan dataset masukan yang besar dengan memetakannya ke ruang dimensi yang lebih rendah. Misalnya, membawa analisis pada dataset berdimensi besar yang sangat intensif secara komputasi, sehingga untuk menyederhanakan Anda mungkin ingin menemukan variabel kunci yang menyimpan persentase informasi yang signifikan (katakanlah 95%) dan hanya menggunakannya untuk analisis.
- Anomaly Detection, Deteksi anomali juga umumnya dikenal sebagai deteksi outlier adalah identifikasi item, peristiwa atau pengamatan yang tidak sesuai dengan pola atau perilaku yang diharapkan dibandingkan dengan item lain dalam dataset tertentu. Ini memiliki penerapan dalam berbagai domain, seperti mesin atau pemantauan sistem kesehatan, deteksi peristiwa, penipuan / deteksi penyusupan, dll. Titik data disebut anomali jika jauh dari titik data lain dalam konteks tertentu, sehingga perhitungan standar deviasi atau clusterring adalah teknik yang paling sering digunakan untuk mendeteksi anomali.
Beberapa contoh populer dari algoritma pembelajaran yang tidak diawasi adalah:
- K-Means untuk masalah pengelompokan.
- Algoritma Apriori untuk masalah pembelajaran aturan asosiasi.
Reinforcement Learning
Tujuan dasar dari algoritma reinforcement learning adalah untuk memetakan situasi ke tindakan yang menghasilkan hasil akhir maksimum. Ini memungkinkan mesin dan agen perangkat lunak untuk secara otomatis menentukan perilaku ideal dalam konteks tertentu, untuk memaksimalkan kinerjanya. Umpan balik reward/penghargaan sederhana diperlukan bagi agen untuk mempelajari perilakunya; ini dikenal sebagai reinforcement signal.
Dalam masalah, agen seharusnya memutuskan tindakan terbaik untuk dipilih berdasarkan keadaannya saat ini. Ketika langkah ini diulang, masalah ini dikenal sebagai Proses Keputusan Markov (Markov Decision Process).
Contoh teknik belajar penguatan adalah sebagai berikut:
- Proses pengambilan keputusan Markov
- Q-learning
- Metode Perbedaan Temporal
- Metode Monte-Carlo
No comments:
Post a Comment