5 Algoritme Pembelajaran Mesin Populer – Menuju AI — Teknologi, Sains, dan Rekayasa Terbaik

Pengarang: Or

Pembelajaran mesin

Sumber: Gambar oleh GDJ di Pixabay

Algoritma pembelajaran mesin secara konseptual mirip dengan algoritma lain dalam ilmu komputer. Algoritme ML adalah proses berbasis data yang digunakan untuk membuat model machine learning siap produksi.

Jika Anda menganggap pembelajaran mesin sebagai kereta untuk menyelesaikan suatu pekerjaan, maka model pembelajaran mesin adalah mesin yang mendorong kereta. Algoritme pembelajaran mesin yang paling efektif ditentukan oleh masalah bisnis yang bersangkutan, kompleksitas kumpulan data, dan sumber daya yang tersedia.

Jenis algoritma Machine Learning?

Algoritma pembelajaran mesin yang diawasi

Algoritma yang menggunakan pembelajaran mesin untuk menghasilkan prediksi berdasarkan kumpulan data. Algoritme pembelajaran mesin yang diawasi mencari pola dalam label nilai titik data.

Algoritma pembelajaran mesin tanpa pengawasan

Tidak ada label terkait untuk titik data. Algoritme pembelajaran mesin ini mengelompokkan data untuk menjelaskan strukturnya dan membuat data kompleks tampak sederhana dan terorganisir untuk penelitian.

Algoritma pembelajaran semi-diawasi

Pembelajaran semi-terawat adalah teknik pembelajaran mesin yang melibatkan pelatihan pada sejumlah kecil data berlabel dan sejumlah besar data tidak berlabel. Semi-supervised learning adalah jenis pembelajaran yang terletak antara unsupervised (tanpa label data pelatihan) dan supervised learning (dengan hanya berlabel data pelatihan).

Lembar Cheat model Pembelajaran Mesin

Algoritma Pembelajaran Mesin Teratas

1. Regresi Linier

Metode Regresi Linier menggambarkan hubungan antara dua variabel dan pengaruh perubahan yang satu terhadap yang lain. Algoritma tersebut menggambarkan pengaruh modifikasi variabel independen terhadap variabel dependen. Variabel bebas dianggap sebagai variabel penjelas karena memberikan informasi tentang hal-hal yang mempengaruhi variabel terikat. Seringkali, variabel dependen dikenal sebagai faktor minat atau prediktor. Regresi linier adalah teknik yang digunakan untuk memperkirakan nilai kontinu aktual. Aplikasi regresi linier yang paling sering adalah peramalan harga properti, peramalan penjualan, peramalan cuaca, dan perkiraan gaji karyawan. Tujuan mendasar dari regresi linier adalah untuk menemukan garis yang paling cocok antara prediksi. Persamaan regresi linier adalah Y=a*x+b, di mana y adalah variabel dependen dan x menunjukkan kumpulan variabel independen. Kemiringan dilambangkan dengan a, sedangkan intersep dilambangkan dengan b.

Contoh:

Regresi linier sering digunakan dalam bisnis untuk peramalan penjualan berbasis tren. Jika bisnis secara konsisten meningkatkan penjualannya dari bulan ke bulan, studi regresi linier dari data penjualan bulanan memungkinkan bisnis untuk memprediksi penjualan di masa depan.

Regresi linier sangat membantu untuk penilaian risiko dalam domain asuransi atau keuangan. Sebuah perusahaan asuransi kesehatan dapat melakukan analisis regresi linier untuk menentukan jumlah klaim per klien tentang usia mereka. Penelitian ini membantu perusahaan asuransi dalam menentukan bahwa konsumen lanjut usia memiliki kecenderungan yang lebih tinggi untuk mengajukan klaim asuransi. Temuan analisis ini sangat penting dalam membuat pilihan bisnis penting dan digunakan untuk memperhitungkan risiko.

2. Regresi Logistik

Algoritma ini menggunakan fungsi logistik untuk memprediksi hasil dari variabel dependen kategoris menggunakan variabel prediktor. Probabilitas atau peluang yang menentukan hasil percobaan tunggal direpresentasikan sebagai fungsi dari faktor penjelas. Berdasarkan faktor prediktor yang diberikan, algoritma regresi logistik membantu dalam memperkirakan kemungkinan jatuh ke tingkat tertentu dari variabel dependen kategoris.

Contoh:

Dalam epidemiologi, teknik regresi logistik memperkirakan faktor risiko penyakit dan merancang tindakan pencegahan yang tepat. Mereka digunakan untuk meramalkan hasil pemilihan politik atau meramalkan apakah seseorang akan memilih kandidat tertentu. Digunakan untuk mengelompokkan kumpulan kata menjadi kata benda, kata ganti, kata kerja, dan kata sifat. Dalam peramalan cuaca, digunakan untuk meramalkan kemungkinan hujan. Mereka digunakan dalam sistem peringkat kredit untuk tujuan manajemen risiko untuk memperkirakan default akun.

Sci-Kit Learn adalah pustaka data science Python yang mengimplementasikan Algoritma Pembelajaran Mesin Regresi Logistik.

3. Pohon Keputusan

Pohon keputusan adalah representasi grafis yang menggunakan percabangan untuk menggambarkan semua hasil potensial dari suatu pilihan dalam keadaan tertentu. Node internal dari pohon keputusan mewakili pengujian atribut. Setiap cabang pohon mencerminkan hasil pengujian, dan simpul daun mewakili label kelas tertentu, yaitu keputusan yang dibuat setelah menghitung semua atribut. Rute dari root ke leaf node digunakan untuk mengilustrasikan aturan klasifikasi.

Pohon klasifikasi- Ini adalah pohon keputusan yang paling umum digunakan untuk mengkategorikan dataset tergantung pada variabel respon. Umumnya, mereka digunakan ketika variabel jawaban adalah kategoris.

Pohon Regresi- Pohon regresi digunakan ketika respons atau variabel target konsisten atau numerik. Berbeda dengan klasifikasi, mereka sering digunakan dalam masalah prediksi.

Selain itu, pohon keputusan dapat dibagi menjadi dua jenis sesuai dengan jenis variabel target: Pohon Keputusan Variabel Kontinu dan Pohon Keputusan Variabel Biner. Variabel target digunakan untuk menentukan jenis pohon keputusan yang diperlukan untuk masalah tertentu.

Contoh

Pohon keputusan adalah algoritme pembelajaran mesin khas yang sangat berguna di bidang keuangan untuk penetapan harga opsi. Penginderaan jauh merupakan bidang aplikasi untuk identifikasi pola berbasis pohon keputusan. Bank menggunakan algoritme pohon keputusan untuk mengkategorikan pemohon pinjaman berdasarkan kemungkinan mereka gagal membayar.

4. Algoritma Naive Bayes

Naive Bayes Classifier adalah salah satu teknik pembelajaran mesin paling umum yang dikategorikan berdasarkan kesamaan. Ini didasarkan pada Teorema Probabilitas Bayes yang terkenal dan digunakan untuk mengembangkan model pembelajaran mesin untuk prediksi penyakit dan kategorisasi dokumen. Ini adalah kategorisasi kata yang tepat berdasarkan Teorema Probabilitas Bayes untuk analisis konten subjektif. Algoritma klasifikasi ini menggunakan teorema Bayes untuk menghitung probabilitas. Premis mendasar di balik algoritma Naive Bayesian adalah bahwa semua karakteristik dianggap independen satu sama lain. Ini adalah metode yang cukup sederhana yang mudah diterapkan. Ini sangat menguntungkan untuk kumpulan data besar dan dapat digunakan dengan kumpulan data teks.

Contoh

Facebook menggunakan analisis sentimen untuk menentukan apakah postingan status mengungkapkan perasaan positif atau negatif. Kategorisasi Dokumen- Google menggunakan klasifikasi dokumen untuk mengindeks dokumen dan menentukan peringkat relevansinya, yang disebut sebagai PageRank. PageRank menganggap halaman yang telah ditetapkan sebagai signifikan dalam database yang telah diproses dan dikategorikan menggunakan metode klasifikasi dokumen. Algoritma Naive Bayes juga digunakan untuk mengkategorikan item berita tentang Teknologi, Hiburan, Olahraga, dan Politik. Email Spam Filtering-Google Mail menggunakan algoritma Naive Bayes untuk menentukan apakah sebuah email adalah spam atau bukan.

5. Algoritma Jaringan Syaraf Tiruan

Ini adalah area dalam kecerdasan buatan berdasarkan simulasi otak. Ini adalah semacam jaringan komputasi yang terdiri dari neuron yang terhubung satu sama lain. Struktur terkait ini digunakan untuk menyediakan berbagai prediksi untuk masalah regresi dan klasifikasi. JST terdiri dari banyak lapisan: lapisan input, lapisan tersembunyi, dan lapisan output. Jumlah lapisan tersembunyi mungkin lebih dari satu. Lapisan tersembunyi adalah tempat perhitungan jaringan saraf berlangsung. Persamaan bobot dan bias aktual disertakan di sini, serta penerapan fungsi aktivasi. Fungsi aktivasi ini sangat penting untuk penataan dan pemangkasan output dan terutama digunakan untuk memecahkan masalah nonlinier seperti pengenalan tulisan tangan. ANN secara komputasi mahal karena membutuhkan komputasi matematis yang canggih.

Contoh

Lembaga keuangan menggunakan algoritme pembelajaran mesin untuk meningkatkan evaluasi aplikasi pinjaman, peringkat obligasi, target pemasaran, dan skor kredit. Mereka juga digunakan untuk mendeteksi kasus penipuan kartu kredit. Buzzfeed mengatur dan mencari video dan gambar menggunakan teknik jaringan saraf tiruan untuk pengenalan gambar. Google menggunakan Jaringan Syaraf Tiruan untuk pengenalan ucapan, identifikasi gambar, dan aplikasi pengenalan pola lainnya (seperti pengenalan tulisan tangan). ANN digunakan oleh Google untuk mendeteksi spam dan untuk berbagai tujuan lainnya. Jaringan Syaraf Tiruan ideal untuk mengubah pengaturan suhu, mengoperasikan peralatan, dan mendiagnosis kesalahan di pabrik robot.

Pikiran Akhir

Dalam artikel ini, kami telah membahas berbagai jenis pembelajaran mesin dan algoritme terkaitnya. Pembelajaran mesin sangat penting karena memberikan wawasan kepada bisnis tentang tren perilaku konsumen dan pola operasional serta membantu menciptakan produk baru. Saat ini, beberapa bisnis besar, seperti Facebook, Google, dan Uber, telah menjadikan pembelajaran mesin sebagai komponen kunci dari operasi mereka. Bagi banyak bisnis, pembelajaran mesin telah menjadi perbedaan kompetitif yang signifikan.

Algoritma digunakan untuk mengidentifikasi pola, dan bahkan ilmuwan data yang paling berpengalaman pun tidak dapat memprediksi algoritma mana yang akan melakukan yang terbaik tanpa mencoba banyak teknik berbeda terlebih dahulu. Meskipun ada banyak lagi algoritme Pembelajaran Mesin, yang dijelaskan dalam artikel ini adalah yang paling umum digunakan.

5 Algoritma Pembelajaran Mesin Populer awalnya diterbitkan di Towards AI on Medium, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Menuju AI