Nama : Seno Aditya
Kelas : 2KB04
NPM : 26116907
Teorema Bayes
Teorema Bayes, diambil dari nama Rev. Thomas Bayes, menggambarkan hubungan antara peluang bersyarat dari dua kejadian A dan B sebagai berikut:
P(A | B) =
|
P(B | A) P(A)
|
P(B)
|
or
P(A | B) =
|
P(B | A) P(A)
|
P(B | A)P(A) + P(B | A)P(A)
|
Teorema Bayes adalah sebuah teorema dengan dua penafsiran berbeda. Dalam penafsiran Bayes, teorema ini menyatakan seberapa jauh derajat kepercayaan subjektif harus berubah secara rasional ketika ada petunjuk baru. Dalam penafsiran frekuentis teorema ini menjelaskan representasi invers probabilitas dua kejadian. Teorema ini merupakan dasar daristatistika Bayes dan memiliki penerapan dalam sains, rekayasa, ilmu ekonomi (terutama ilmu ekonomi mikro), teori permainan, kedokteran dan hukum. Penerapan teorema Bayes untuk memperbarui kepercayaan dinamakan inferens Bayes.
Tujuan dari inferensi statistik adalah untuk menarik kesimpulan dari data sampel yang diketahui tentang populasi yang tidak ada datanya. Sebagai contoh, kita tahu dari sampel bahwa 55 persen pemilih cenderung untuk memilih pilihan A, tapi sebenarnya berapa banyak pemilih secara keseluruhan yang cenderung memilih A?
Saat ini, terdapat dua pendekatan filosofis utama dalam statistik inferens, yang pertama disebut sebagai pendekatan frequentist atau kadang-kadang disebut sebagai pendekatan klasik (karena berkembang lebih dulu). Dalam pendekatan ini, prosedur dikembangkan hanya dengan melihat performa seluruh kemungkinan sampel acak (all possible random sample) saat ini. Informasi sampel acak yang diperoleh sebelumnya (pada percobaan/observasi lain di masa lalu) diabaikan. Kemudian pendekatan kedua, dikenal sebagai Bayesian, yang akan kita bahas dalam artikel ini.
Frequentist versus Bayesian
Pendekatan frequentist berlandaskan pada ide-ide dibawah ini:
- Parameter, yaitu karakteristik dari populasi, adalah konstan namun tidak diketahui.
- Probabilita selalu diinterpretasikan sebagai frekuensi relatif jangka panjang, tak peduli datanya.
- Prosedur statistik dinilai dengan seberapa baik prosedur itu dalam jangka panjang dengan mengulang-ulang percobaan sampai tak hingga.
Karena dalam pendekatan ini parameter adalah tetap, maka kita tidak bisa membuat pernyataan tentang peluang dari nilai parameter tersebut (bagaimana kita menyatakannya dalam peluang jika nilai parameter adalah tetap dengan kata lain pasti). Interval kepercayaan tidak memiliki arti peluang akan nilai parameter, namun hanya digunakan untuk uji hipotesis apakah nilai penduga parameter bisa kita terima atau tidak.
Misal diperoleh P(a < θ ≤ b)=0.95, kita tidak bisa mengatakan peluang θ diantara [a,b] adalah 95 persen karena jika kita mengatakan demikian berarti θ adalah suatu nilai acak. Karena itu dalam frequentist interval itu selalu diartikan begini: dari 100 percobaan dengan random sampel iid maka 95 percobaan akan mendapatkan nilai penduga parameter θ̂ berada pada interval [a,b].
Sedangkan Bayesian berlandaskan pada ide-ide berikut:
- Sejak kita tak pernah yakin akan nilai sebenarnya dari parameter, maka parameter dianggap sebagai suatu random variabel.
- Aturan probabilita digunakan secara langsung untuk melakukan inferens tentang parameter.
- Pernyataan probabilita tentang parameter diinterpretasikan sebagai “derajat kepercayaan”. Distribusi prior adalah subyektif. Setiap orang bisa memilih priornya sendiri, yang mengandung bobot relatif yang diberikannya pada parameter tersebut, yang mengukur bagaimana sejauh mana bisa diterima/dipercaya setiap parameter tersebut sebelum percobaan.
- Setelah itu kita menyesuaikan kepercayaan/penerimaan kita pada parameter tersebut setelah memperoleh data dengan menggunakan teorema Bayes, sehingga akan menghasilkan distribusi posterior, yang memberikan bobot relatif tiap parameter setelah data dianalisis. Distribusi posterior diperoleh dari dua sumber, yaitu: distribusi prior
dan data pengamatan.
Dengan pendekatan Bayesian ini kita bisa membuat pernyataan probabilita dari parameter karena memang parameter adalah random variabel. P(a < θ ≤ b) = 0.95 memang berarti peluang nilai parameter θ berada pada interval [a,b] dengan syarat data seperti pada data observasi adalah 95 persen. Hanya dengan teorema Bayes kita bisa secara konsisten memperbaiki kepercayaan kita pada parameter berdasarkan data yang benar-benar terjadi! Selain itu pendekatan Bayesian sangat bermanfaat dalam menangani parameter pengganggu (nuisance parameter). Parameter pengganggu adalah suatu parameter yang kita tidak tertarik untuk melakukan inferens atasnya, tapi kita tidak ingin parameter tersebut mempengaruhi inferens tentang parameter utama (tidak kita bahas dalam artikel ini.
Contoh Penerapan Teorema :
Misalkan kawan Anda bercerita dia bercakap-cakap akrab dengan seseorang lain di atas kereta api. Tanpa informasi tambahan, peluang dia bercakap-cakap dengan perempuan adalah 50%. Sekarang misalkan kawan Anda menyebut bahwa orang lain di atas kereta api itu berambut panjang. Dari keterangan baru ini tampaknya lebih bolehjadi kawan Anda bercakap-cakap dengan perempuan, karena orang berambut panjang biasanya wanita. Teorema Bayes dapat digunakan untuk menghitung besarnya peluang bahwa kawan Anda berbicara dengan seorang wanita, bila diketahui berapa peluang seorang wanita berambut panjang.
Misalkan:
W adalah kejadian percakapan dilakukan dengan seorang wanita.
L adalah kejadian percakapan dilakukan dengan seorang berambut panjang
M adalah kejadian percakapan dilakukan dengan seorang pria
Kita dapat berasumsi bahwa wanita adalah setengah dari populasi. Artinya peluang kawan Anda berbicara dengan wanita,
Misalkan juga bahwa diketahui 75 persen wanita berambut panjang. Ini berarti bila kita mengetahui bahwa seseorang adalah wanita, peluangnya berambut panjang adalah 0,75. Kita melambangkannya sebagai :
Sebagai keterangan tambahan kita juga mengetahui bahwa peluang seorang pria berambut panjang adalah 0,3. Dengan kata lain:
Di sini kita mengasumsikan bahwa seseorang itu adalah pria atau wanita, atau P(M) = 1 -P(W) = 0,5. Dengan kata lain M adalah kejadian komplemen dari W.
Tujuan kita adalah menghitung peluang seseorang itu adalah wanita bila diketahui dia berambut panjang, atau dalam notasi yang kita gunakan, P(W|L).
Peluang
Teorema Bayes
Teorema Bayes, diambil dari nama Rev. Thomas Bayes, menggambarkan hubungan antara peluang bersyarat dari dua kejadian A dan B sebagai berikut:
P(A | B) =
|
P(B | A) P(A)
|
P(B)
|
or
P(A | B) =
|
P(B | A) P(A)
|
P(B | A)P(A) + P(B | A)P(A)
|
Contoh aplikasi dari Teorema Bayes
Di sebuah negara, diketahui bahwa 2% dari penduduknya menderita sebuah penyakit langka. 97% dari hasil tes klinik adalah positif bahwa seseorang menderita penyakit itu. Ketika seseorang yang tidak menderita penyakit itu dites dengan tes yang sama, 9% dari hasil tes memberikan hasil positif yang salah.
Jika sembarang orang dari negara itu mengambil test dan mendapat hasil positif, berapakah peluang bahwa dia benar-benar menderita penyakit langka itu?
Secara sepintas, nampaknya bahwa ada peluang yang besar bahwa orang itu memang benar-benar menderita penyakit langka itu. Karena kita tahu bahwa hasil test klinik yang cukup akurat (97%). Tetapi apakah benar demikian? Marilah kita lihat perhitungan matematikanya.
Marilah kita lambangkan informasi di atas sebagai berikut:
- B = Kejadian tes memberikan hasil positif.
- B = Kejadian tes memberikan hasil negatif.
- A = Kejadian seseorang menderita penyakit langka itu.
- A = Kejadian seseorang tidak menderita penyakit langkat itu.
Kita ketahui juga peluang dari kejadian-kejadian berikut:
- P (A) = 2%
- P (A) = 98%
- P (B | A) = 97%
- P (B | A) = 9%
Dengan menggunakan rumus untuk peluang bersyarat, dapat kita simpulkan peluang dari kejadian-kejadian yang mungkin terjadi dalam tabel di bawah ini:
A (2%)
|
A (98%)
| |
B
|
Positif yang benar
P (B ∩ A) = P (A) × P (B | A) = 2% × 97% = 0,0194 |
Positif yang salah
P (B ∩ A) = P (A) × P (B | A) = 98% × 9% = 0,0882 |
B
|
Negatif yang salah
P (B ∩ A) = P (A) × P (B | A) = 2% × 3% = 0,0006 |
Negatif yang benar
P (B ∩ A) = P (A) × P (B | A) = 98% × 91% = 0,8918 |
Misalnya seseorang menjalani tes klinik tersebut dan mendapatkan hasil positif, berapakah peluang bahwa ia benar-benar menderita penyakit langka tersebut?
Dengan kata lain, kita mencoba untuk mencari peluang dari A, dimana B atau P (A | B).
Dengan kata lain, kita mencoba untuk mencari peluang dari A, dimana B atau P (A | B).
Dari tabel di atas, dapat kita lihat bahwa P (A | B) adalah peluang dari positif yang benar dibagi dengan peluang positif (benar maupun salah), yaitu 0,0194 / (0,0194 + 0,0882) = 0,1803.
Kita dapat juga mendapatkan hasil yang sama dengan menggunakan rumus teorema Bayes di atas:
P(A | B) =
|
P(B ∩ A)
|
P(B)
| |
=
|
P(B | A) × P(A)
|
P(B | A)P(A) + P(B | A)P(A)
| |
=
|
97% × 2%
|
(97% × 2%) + (9% × 98%)
| |
=
|
0.0194
|
0.0194 + 0.0882
| |
=
|
0.0194
|
0.1076
| |
P(A | B) =
|
0.1803
|
Hasil perhitungan ini sangat berbeda dengan intuisi kita di atas. Peluang bahwa orang yang mendapat hasil tes positif itu benar-benar menderita penyakit langka tidak sebesar yang kita bayangkan. Cuma ada sekitar 18% kemungkinan bahwa dia benar-benar menderita penyakit itu.
Mengapakah demikian?
Ketika mengira-ngira peluangnya, seringkali kita lupa bahwa dari seluruh populasi negara itu, hanya 2% yang benar-benar menderita penyakit langka itu. Jadi, walaupun hasil tes adalah positif, peluang bahwa seseorang menderita penyakit langka itu tidaklah sebesar yang kita bayangkan.
Kita bisa juga meninjau situasi di atas sebagai berikut. Misalnya populasi negara tersebut adalah 1000 orang. Hanya 20 orang yang menderita penyakit langka itu (2%). 19 orang dari antaranya akan mendapat hasil tes yang positif (97% hasil positif yang benar). Dari 980 orang yang tidak menderita penyakit itu, sekitar 88 orang juga akan mendapat hasil tes positif (9% hasil positif yang salah).
Jadi, 1000 orang di negara itu dapat kita kelompokkan sebagai berikut:
- 19 orang mendapat hasil tes positif yang benar
- 1 orang mendapat hasil tes negatif yang salah
- 88 orang mendapat hasil tes positif yang salah
- 892 orang mendapat hasil tes negatif yang benar
Bisa kita lihat dari informasi di atas, bahwa ada (88 + 19) = 107 orang yang akan mendapatkan hasil tes positif (tidak perduli bahwa dia benar-benar menderita penyakit langka itu atau tidak). Dari 107 orang ini, berapakah yang benar-benar menderita penyakit? Hanya 19 orang dari 107, atau sekitar 18%.