Pahami Teorema Bayes Melalui Visualisasi – Menuju AI – Teknologi, Sains, dan Teknik Terbaik

Penulis: Satsawat Natakarnkitkul

ILMU DATA

Pengantar lembut untuk teorema Bayes dan mengapa itu penting

Foto oleh Balázs Utasi dari Pexels

Saat kami memulai perjalanan pembelajaran mesin, kami sering bertanya pada diri sendiri apakah kami harus mempelajari statistik dan probabilitas atau tidak, terutama probabilitas. Jawabannya tergantung di mana Anda berada dan seberapa dalam Anda ingin membuat diri Anda memahaminya. Namun, ingatlah ini:

Banyak algoritma yang dirancang dengan menggunakan konsep dan teknik dari probabilitas, yaitu Naive Bayes dan Probabilistic Graphical Model; banyak version dilatih menggunakan algoritma iteratif yang dirancang di bawah kerangka probabilistik, yaitu estimasi kemungkinan maksimum (menggunakan frequentist), dan estimasi posterior maksimum (menggunakan Bayesian); dan, parameter version disetel dengan kerangka kerja probabilistik – pengoptimalan Bayesian.

Pada artikel ini, saya akan menjelaskan konsep teorema Bayes menggunakan visualisasi dan mengapa tidak sulit seperti yang mungkin dipikirkan beberapa orang.

Teorema Bayes sebagai Visualisasi…

Mari kita mulai dengan contoh di sebuah perusahaan dengan 30 insinyur dengan 25 insinyur yang laki-laki seperti visualisasi di bawah ini.

Visualisasi pernyataan

Kita bisa menghitung P (perempuan) = 5/30 = 1/6. Pertimbangkan pernyataan berikutnya 50 percent dari insinyur ini adalah PhD, yang dapat menulis P (PhD) = 0,5, dengan 3 perempuan memperoleh PhD.

Insinyur dengan PhD

Sekarang, pertanyaan yang mungkin ingin kami jawab adalah”seperti yang kami ketahui, ada 50 percent insinyur yang memiliki gelar Ph.D.. untuk individu yang dipilih secara acak dari perusahaan ini, berapakah probabilitas bahwa individu tersebut adalah perempuan? ” . Pertanyaan ini bisa ditulis menjadi P (perempuan memberi Ph.D.) atau P (perempuan | Ph.D.). Berdasarkan visualisasi, yang diterjemahkan menjadi “diberikan Ph.D.. sebagai alam semesta baru, berapa probabilitas perempuan. Kami dapat menghitung menggunakan rumus di bawah ini:

Sebenarnya menggunakan diagram di atas, kita cukup menghitung dengan melihat Ph.D.. sebagai alam semesta baru (abaikan mereka yang non-PhD) lalu P (perempuan | Ph.D.) = # tidak dari perempuan / tidak ada Ph.D.. insinyur (lihat gambar di bawah).

Ini sebenarnya adalah Teorema Bayes.

Dasar Teorema Bayes

Sebelum pergi ke definisi apa pun, biasanya Teorema Bayes digunakan ketika kami memiliki hipotesis dan kami telah mengamati beberapa bukti dan kami ingin mengetahui kemungkinan hipotesis tersebut berlaku mengingat bahwa bukti tersebut benar. Sekarang mungkin terdengar agak membingungkan, mari gunakan visualisasi di atas untuk penjelasan yang lebih baik.

Dalam contoh ini, kami ingin mengetahui probabilitas pemilihan insinyur wanita yang diberikan yang telah menyelesaikan Ph.D.. pendidikan.

Hal pertama yang kami perlukan adalah kemungkinan memilih insinyur wanita dari populasi tanpa mempertimbangkan bukti apa pun. Istilah P (H) disebut”earlier”.

Probabilitas hipotesis berlaku tanpa mempertimbangkan bukti apa pun

Angka relevan berikutnya adalah proporsi ketika insinyur wanita sesuai dengan deskripsi (menyelesaikan Ph.D.), yaitu P (E | H). Dalam Teorema Bayes, kami menyebut istilah ini “kemungkinan”.

Proporsi insinyur wanita dengan gelar PhD

Demikian pula, kita perlu mengetahui sisi lain ketika hipotesis tidak benar.

Proporsi PhD untuk insinyur pria

Dengan gagasan ini, kita dapat menghitung probabilitas seorang insinyur wanita yang memegang gelar Ph.D., P (wanita | Ph.D.). Penyebut kemudian dapat ditulis sebagai P (E).

Rumus Teorema Bayes

Untuk menambah satu pengertian terakhir, P (H | E) disebut”anterior” dalam Teorema Bayes, yang berarti mereka percaya pada hipotesis setelah melihat bukti. Biasanya, kami akan menggunakan rumus ini ketika kami menganalisis perluasan information baru untuk memvalidasi dan membuat version tidak valid. Teorema Bayes membantu kita mengukur dan mensistematisasikan gagasan untuk mengubah keyakinan. Dengan cara ini kita dapat menerapkan teorema Bayes ke mesin untuk memvalidasi keyakinan.

Definisi…

Teorema Bayes (atau hukum Bayes, aturan Bayes, teorema Bayes-Price) menjelaskan probabilitas peristiwa berdasarkan pengetahuan sebelumnya tentang bukti atau kondisi yang mungkin terkait dengan peristiwa tersebut. Misalnya, kita dapat menggunakan teorema Bayes untuk menilai risiko Covid-19 pada individu yang diketahui usianya agar lebih akurat (dengan mengkondisikannya pada usia individu) daripada sekadar mengasumsikan bahwa individu tersebut khas dari populasi secara keseluruhan. .

Apa lagi? )

Seperti yang kita ketahui, teorema Bayes bercabang dari statistik Bayesian, yang mengandalkan probabilitas subyektif dan menggunakan teorema Bayes untuk memperbarui pengetahuan dan keyakinan mengenai peristiwa dan jumlah minat berdasarkan data. Oleh karena itu, berdasarkan beberapa pengetahuan, kita dapat menarik beberapa kesimpulan awal pada sistem (“prior” dalam Bayes) dan kemudian”memperbarui” kesimpulan tersebut berdasarkan information dan information baru untuk mendapatkan”anterior”.

Selain itu, ada istilah seperti inferensi Bayesian dan inferensi statistik frequentist, yang tidak tercakup dalam artikel ini. Namun, artikel ini akan memberi Anda gambaran sekilas tentang inferensi Bayesian, dan Anda harus dapat meneliti sendiri inferensi statistik frequentist.

Kesimpulan

Pada artikel ini, saya telah menjelaskan Teorema Bayes dengan menggunakan visualisasi dan semoga Anda telah memperoleh pemahaman tentang;

Apa Teorema Bayes dan apa yang dikatakannya? Kapan itu berguna?

Jika Anda memiliki komentar atau pertanyaan terkait topik ini, silakan hubungi saya melalui akun LinkedIn.

Satsawat Natakarnkitkul – Kepala Segmentasi – Grup True Digital | LinkedIn

Teorema Memahami Bayes Melalui Visualisasi awalnya diterbitkan di Limit AI on Moderate, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Towards AI