Menyelam ke Distribusi Poisson dan Proses Poisson | Menuju AI

Peran apa yang diambil distribusi Poisson dan proses Poisson dalam probabilitas dan statistik, dan bagaimana hal itu digunakan dalam skenario kehidupan nyata?

Menuju Tim AI

Penulis: Saniya Parveez, Roberto Iriondo

Pada artikel ini, kita akan mendalami Proses Poisson dan Distribusi Poisson. Kami akan menampilkan beberapa konsep statistik yang relevan, diikuti oleh skenario kasus dunia nyata dan contoh dengan implementasi Python. Pastikan untuk memeriksa seluruh implementasi dari tutorial ini baik di Google Colab atau Github.

Kami menggunakan pengoptimalan bahasa alami dalam artikel ini untuk mengoptimalkan pengalaman dan sentimen bagi pembaca kami. Harap beri tahu kami jika Anda memiliki umpan balik tentang apakah Anda ingin melihat lebih banyak tentang pengoptimalan ini.

Distribusi Poisson secara alternatif diturunkan dari distribusi binomial. Ini adalah distribusi probabilitas yang digunakan dalam pekerjaan terkait statistik. Ini digunakan dalam situasi di mana kemungkinan suatu peristiwa terjadi jarang. Oleh karena itu, distribusi digunakan untuk mendeskripsikan perilaku kejadian langka [1].

Banyak situasi eksperimental terjadi ketika kita mengamati hitungan peristiwa dalam satu set waktu, area, panjang, dan sebagainya. Ini adalah distribusi probabilitas terpisah, dan digunakan secara luas dalam pekerjaan statistik. Ini digunakan dalam situasi di mana probabilitas suatu peristiwa kecil, yaitu peristiwa jarang terjadi [2].

Distribusi Poisson dimulai setelah matematikawan Perancis Siméon Poisson pada tahun 1837 dan aplikasi pertama adalah deskripsi jumlah kematian akibat menendang kuda di tentara Prusia. [11].

Persamaan distribusi Poisson dapat digambarkan sebagai:

Gambar 1: Persamaan distribusi Poisson

Dimana,
P (X = x) mewakili probabilitas mendapatkan x jumlah keberhasilan.
m = np menunjukkan parameter distribusi.
e = 2,71828 membentuk basis dari logaritma natural [3].

Dalam persamaan ini, e adalah umber terkenal dari kalkulus yang ditunjukkan di bawah ini:

Gambar 2: Persamaan batas eksponensial.

Singkatnya:

Distribusi Poisson diperhitungkan – jika peristiwa terjadi pada tingkat yang konsisten dari waktu ke waktu, distribusi Poisson memberikan probabilitas jumlah X peristiwa yang terjadi dalam waktu T.

Contoh:

Model distribusi Poisson dihitung sebagai jumlah kasus SARS baru pada wanita New England bulan depan. Distribusi menunjukkan probabilitas semua kemungkinan jumlah kasus baru, dari 0 hingga tak terhingga.

Oleh karena itu, mendefinisikan contoh di atas ke dalam persamaan distribusi Poisson:

Misal X = Jumlah kasus baru bulan depan dan X ~ Poisson (λ), maka probabilitas X = k (hitungan khusus) adalah:

Gambar 3: Persamaan distribusi Poisson dari jumlah SAARS

Contoh:

Asumsikan bahwa virus menunjukkan tingkat kejadian 1 dari 1000 orang per tahun. Andaikan anggota populasi terpengaruh secara independen, temukan kemungkinan k kasus dalam populasi 10.000 (diikuti selama 1 tahun) untuk k = 0,1,2 [4].

Nilai yang diharapkan (rata-rata) = l = .001 * 10.000 = 10

Oleh karena itu, sepuluh kasus baru diharapkan dalam populasi ini per tahun berdasarkan perhitungan berikut:

Gambar 4: Kasus distribusi baru.

Penggunaan Distribusi Poisson

Ini adalah beberapa contoh di mana distribusi Poisson bisa menjadi praktis:

Selama pengendalian kualitas statistik untuk menghitung jumlah cacat suatu item atau set item.Di bidang Biologi, untuk menghitung jumlah bakteri.Dalam asuransi, untuk menghitung jumlah korban potensial.Untuk menghitung jumlah kerugian di jalan raya yang sangat padat karena kecelakaan jalan Untuk menghitung jumlah bunuh diri yang dilakukan oleh titik cinta dalam setahun Untuk mengumpulkan jumlah pelanggan yang tiba di portal e-commerce Untuk menghitung jumlah kekurangan dalam pengukuran tertentu di serat optik kabel.Untuk menghitung jumlah partikel radioaktif yang terdeteksi dalam waktu tertentu.Untuk menghitung jumlah foton yang tiba di piksel CCD dalam beberapa waktu eksposur (misalnya, pengamatan astronomi) .Untuk menghitung jumlah pasien di ruang tunggu di jam Untuk menghitung jumlah pelanggan yang menelepon untuk mengeluh tentang layanan atau produk per bulan.

Kita dapat menggunakan metode titik Poisson karena jumlah kejadian yang terjadi dalam interval tersebut mencerminkan distribusi Poisson untuk interval waktu tetap. Di sisi lain, lamanya waktu antara kejadian berikut mengikuti distribusi eksponensial, yang menunjukkan hubungan matematis yang erat antara distribusi Poisson dan eksponensial. [1].

Berikut langkah-langkah menghitung distribusi Poisson:

Langkah 1: Hitung mean dari data frekuensi yang diamati:

Gambar 5: Perhitungan mean.

Langkah 2: Nilai e ^ -m diperoleh. Jika nilai e ^ -m tidak diberikan dalam pernyataan soal, maka –

Gambar 6: Nilai e ^ -m

Langkah 3: Hitung probabilitas 0, 1, 2, 3, atau x sukses dengan menggunakan Distribusi Poisson –

Gambar 7: Persamaan Distribusi Poisson

Oleh karena itu, ada dua sifat percobaan Poisson:

Probabilitas suatu kejadian adalah sama untuk dua interval dengan panjang yang sama. Terjadinya atau tidak terjadi dalam interval apa pun tidak tergantung dari kemunculan atau non-kejadian dalam interval lainnya.

Distribusi Poisson terkait erat dengan persamaan distribusi binomial, seperti yang disebutkan pada tabel di bawah ini:

Gambar 8: Distribusi Poisson dan Distribusi Binomial

Pengamatan dari tabel pada gambar 8:

Dalam tiga kolom probabilitas di atas tabel, entri dan nilai identik. Memang, setiap kolom probabilitas memberikan perkiraan yang baik untuk entri di kolom lain. Oleh karena itu, dalam banyak kasus, distribusi Poisson dapat digunakan untuk mendekati distribusi binomial.

Persamaan distribusi Poisson menjawab beberapa pertanyaan. Misalnya, pernyataan masalah berdasarkan distribusi Poisson ditunjukkan di bawah ini:

Biarlah jumlah kasus gigitan ular yang terlihat di Nigeria dalam setahun memiliki sebaran Poisson dengan rata-rata 6 kasus gigitan.

Berapa probabilitas dalam setahun:

Jumlah kasus gigitan ular adalah 7? Jumlah kasus gigitan ular kurang dari 2? Berapa probabilitas dalam 2 tahun akan ada 10 kasus gigitan ular? Berapa probabilitas dalam sebulan tidak ada ular kasus gigitan?

Larutan:

Misalkan X = Jumlah kasus gigitan ular dalam satu tahun:

X ~ Ikan (6) → (λ = 6)

Gambar 9: Solusi.

Berdasarkan pernyataan yang ditunjukkan pada gambar 9:

Jumlah kasus gigitan ular akan menjadi 7?

Menempatkan nilai 7 dalam persamaan:

Gambar 10: Persamaan untuk mendapatkan peluang no. dari 7 gigitan ular

Oleh karena itu, tidak. Jumlah kasus gigitan ular akan menjadi 7 = 0.13768

Jumlah kasus gigitan ular akan kurang dari 2?

Menempatkan nilai 2 dalam persamaan –

Gambar 11: Jumlah kasus gigitan ular akan kurang dari 2?

Oleh karena itu, tidak. kasus gigitan ular akan kurang dari 2 = 0,01735

Berapa probabilitas dalam 2 tahun, akan ada 10 kasus gigitan?

Misalkan Y = Jumlah kasus gigitan ular dalam 2 tahun

Gambar 12: Jumlah kasus gigitan ular dalam 2 tahun

Sehingga probabilitas dalam 2 tahun akan terjadi 10 kasus gigitan = 0,1048

Misal W = Jumlah kasus gigitan ular dalam sebulan.

Gambar 13: Jumlah kasus gigitan ular dalam sebulan.

Sehingga probabilitas dalam sebulan tidak ada kasus gigitan ular = 0,6065

Implementasi Python

Impor semua paket yang diperlukan:

impor matematika

Cara menghitung faktorial:

def factorial (n):
jika n == 0 atau n == 1:
return 1
lain:
mengembalikan n * faktorial (n-1)

Metode untuk menghitung Distribusi Poisson:

def poisson_distribution (mean, k):
temp = ((mean ** k) * (math.e ** (- mean))) / factorial (k) return temp

Eksekusi metode Distribusi Poisson:

poisson_dist = distribusi_ poisson (2,7)
poisson_dist Gambar 14: Hasil Distribusi Poisson.

Distribusi Binomial

Distribusi binomial adalah distribusi probabilitas dimana kita mengharapkan beberapa keberhasilan dalam n percobaan dimana P (sukses dalam satu jejak) = p.

Itu diberikan oleh

Gambar 15: Rumus binomial.

Hubungan antara Poisson dan Binomial

Distribusi Poisson digunakan untuk memodelkan kejadian langka rata-rata dengan laju λ per interval waktu. Dapat memikirkan kejadian “jarang” dalam istilah p Æ 0 dan n Æ ∞. Ambillah batasan ini sehingga λ = np — model distribusi binomial untuk n sukses dengan probabilitas p [5].

Untuk lebih melihat hubungan antara kedua distribusi ini, pertimbangkan probabilitas binomial untuk melihat x sukses dalam percobaan nn, dengan probabilitas sukses yang disebutkan di atas, hal, seperti yang ditunjukkan di bawah ini.

Gambar 16: Mempertimbangkan probabilitas x sukses dalam percobaan nn.

Mari kita tunjukkan nilai yang diharapkan dari distribusi binomial, npnp, dengan λλ. Catatan, ini berarti:

Gambar 17: Nilai yang diharapkan dari binomial.

Dimana q = 1-p

Gambar 18: q = 1 – p.

Menulis kembali P (x) P (x) dalam suku-suku dari λλ, nn, dan xx, kita dapatkan

Gambar 19: Menulis ulang persamaan.

Menggunakan rumus standar untuk kombinasi nn benda yang diambil xx pada satu waktu

Gambar 20: Menggunakan rumus standar.

Selanjutnya, kita memiliki faktor x tepat di pembilang pecahan pertama. Mari kita menukar penyebut antara pecahan pertama dan kedua, membagi nx [7].

Gambar 21: Menukar penyebut.

Membagi faktor terakhir menjadi dua bagian

Gambar 22: Memisahkan faktor.

Akhirnya, kita sampai pada persamaannya.

Gambar 23: Persamaan akhir.

Distribusi Binomial dan Poisson adalah distribusi probabilitas diskrit.

Secara umum:

Jika n besar (n> 70) dan p kecil (katakanlah <0,1) maka Bin (n, p) dapat didekati dengan Po (λ) di mana λ = np

Mengapa kita menggunakan distribusi perkiraan ketika kita mengetahui distribusi pastinya?

Distribusi pastinya mungkin sulit untuk dikerjakan. Distribusi pastinya mungkin memiliki terlalu banyak detail. Dengan menggunakan distribusi perkiraan, kami fokus pada hal-hal tertentu [6].

Pernyataan masalah

Unit Perakitan TV sedang melakukan analisis kerusakan untuk memahami jumlah kerusakan untuk TV cacat yang diberikan. Terlihat dari data audit & kualitas masa lalu bahwa 12 cacat ditandai rata-rata untuk TV cacat.

Menghitung:

Kemungkinan laptop yang rusak memiliki tepat 5. Kemungkinan bahwa laptop yang rusak memiliki kurang dari 5 cacat.

Larutan

Impor semua paket penting yang diperlukan:

impor numpy sebagai np
impor scipy.stats sebagai statistik
impor matplotlib.pyplot sebagai plt

Dapatkan semua nomor:

n = np.arange (0,30) n Gambar 24: Angka Distribusi Poisson

Selama audit, rata-rata 12 cacat telah ditandai, oleh karena itu:

rate = 12

rate = 12poisson = stats.poisson.pmf (n, rate) poisson

Pisces:

Gambar 25: Array distribusi Poisson.

Kemungkinan:

poisson[5]Gambar 26: Probability.poisson[0] + poisson[1] + poisson[2] + poisson[3] + poisson[4]Gambar 27: Probabilitas.

Merencanakan probabilitas:

plt.plot (n, poisson, ‘o -‘) plt.show () Gambar 28: Representasi probabilitas.

Representasi grafis

Berikut ini adalah representasi grafis dari distribusi Poisson:

Menetapkan a = 10

Menghitung probabilitas waktu kedatangan n:

Gambar 29: Menghitung probabilitas n kedatangan dalam waktu t. Gambar 30: Representasi grafis dari distribusi Poisson.

Grafik Distribusi Poisson, dengan mean = 5

Gambar 31: Bagan distribusi Poisson.

Dalam aplikasi kehidupan nyata, distribusi Poisson terutama digunakan untuk memutuskan probabilitas apakah suatu peristiwa mungkin terjadi atau tidak, memahami seberapa sering hal itu biasanya terjadi, memprediksi berapa kali suatu peristiwa dapat terjadi dalam interval waktu tertentu, bersama aplikasi lain [8].

Misalnya, perusahaan asuransi menggunakan distribusi Poisson untuk melakukan analisis risiko guna memprediksi jumlah kecelakaan dan kecelakaan mobil dalam rentang waktu yang telah ditentukan). Berdasarkan perhitungan ini, perusahaan memutuskan harga asuransi mobil – distribusi memutuskan model mana yang dihitung, seperti jumlah polis yang dibeli, jumlah klaim yang dibuat, dan sebagainya.).

Tidak sesuai untuk memperlakukannya sebagai variabel kontinu dalam keadaan seperti itu dan berlaku, yaitu regresi linier. Oleh karena itu, mengadopsi pendekatan pemodelan umum dan menetapkan distribusi sebagai Poisson adalah distribusi diskrit.

Ini adalah ekuivalen kontinu adalah distribusi eksponensial, yang memodelkan interval antara dua peristiwa. Suatu peristiwa hanya dapat diukur sebagai terjadi atau tidak terjadi. Artinya, variabel hanya dapat diukur dalam bilangan bulat. Peristiwa pecahan bukan merupakan bagian dari model [9].

Proses ini merupakan inti dari teori antrian [10] – antrian adalah peristiwa yang terjadi, mengatur dalam antrian atau antrian. Misalnya, meskipun sebagian besar kapasitas server cukup untuk melayani banyak orang selama hari kerja, distribusi Poisson dapat membantu memprediksi dan mencegah antrean panjang pada waktu-waktu tertentu dalam sehari.