analisis data - fmipa personal blogs /...

23
Catatan Kuliah Analisis Data “Orang Cerdas Belajar Statistika” disusun oleh Khreshna I.A. Syuhada, MSc. PhD. Kelompok Keilmuan STATISTIKA - FMIPA Institut Teknologi Bandung 2013

Upload: dinhthu

Post on 06-Feb-2018

232 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

Catatan Kuliah

Analisis Data

“Orang Cerdas Belajar Statistika”

disusun oleh

Khreshna I.A. Syuhada, MSc. PhD.

Kelompok Keilmuan STATISTIKA - FMIPAInstitut Teknologi Bandung

2013

Page 2: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

Tentang Analisis Data

A. Jadwal kuliah (total 40 jam):

• Senin, 08.00-selesai

• Rabu, 08.00-selesai

B. Silabus:

• Statistika deskriptif

• Peluang

• Distribusi diskrit dan kontinu

C. Buku teks:Ronald Walpole, Raymond Myers, Sharon Myers, Keying Ye, 2007, Probabilityand Statistics for Engineers and Scienctists.

D. Penilaian:

1. Ujian 1 (30%) - Rabu, 4.12.2013

2. PR/Kuis (10%)

3. Praktikum (10%)

D. Matriks kegiatan perkuliahan:

Table 1: Matriks perkuliahan Analisis Data.

Minggu- Materi Keterangan

1 Pengantar Penjelasan kuliah, motivasi (Kaprodi)2 Statistika deskriptif 4 jam3 -4 Statistika deskriptif (lanjutan) 6+4 jam5 Peluang 6+4 jam6 Distribusi diskrit dan kontinu 6+4 jam7 Kilas balik (review) 6 jam7 Ujian Tengah Semester Rabu, 4.12.2013

Analisis Data i K. Syuhada, PhD.

Page 3: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

Daftar Isi

1 Statistika Deskriptif 11.1 Data, Jenis Data, Memahami Data . . . . . . . . . . . . . . . . 21.2 Ukuran Pusat/Lokasi dan Penyebaran . . . . . . . . . . . . . . 31.3 Mengamati Observasi Luar . . . . . . . . . . . . . . . . . . . . . 61.4 Data Kelompok . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.5 Memahami Grafik . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2 Peluang 12.1 Ilustrasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.2 Konsep Peluang . . . . . . . . . . . . . . . . . . . . . . . . . . . 22.3 Peluang Bersyarat dan Teorema Bayes . . . . . . . . . . . . . . 4

2.3.1 Teorema Bayes . . . . . . . . . . . . . . . . . . . . . . . 52.4 Topik Lanjut Peluang . . . . . . . . . . . . . . . . . . . . . . . . 5

2.4.1 Peubah acak dan fungsi distribusi . . . . . . . . . . . . . 6

3 Distribusi Diskrit dan Kontinu 13.1 Distribusi Diskrit . . . . . . . . . . . . . . . . . . . . . . . . . . 1

3.1.1 Distribusi Binomial . . . . . . . . . . . . . . . . . . . . . 13.1.2 Distribusi Poisson . . . . . . . . . . . . . . . . . . . . . . 23.1.3 Distribusi Geometrik . . . . . . . . . . . . . . . . . . . . 4

3.2 Distribusi Kontinu . . . . . . . . . . . . . . . . . . . . . . . . . 4

ii

Page 4: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

BAB 1

Statistika Deskriptif

Silabus: Jenis data, ukuran pusat/lokasi, ukuran penyebaran, koefisien variasi,observasi luar, data kelompok, distribusi frekuensi, grafik

Statistika adalah ilmu yang digunakan untuk mengumpulkan, mengorganisasi,melakukan inferensi dan menafsirkan data. Secara singkat, statistika adalahilmu/pekerjaan untuk meyimpulkan tentang suatu fenomena pada populasimenggunakan sampel.

Kajian awal dan utama dalam analisis data adalah statistika deskriptif. Kitadapat menghitung berbagai statistik dan membuat grafik serta memberikaninterpretasi. Kesimpulan yang diberikan dalam statistika deskriptif bersifatsubyektif; walau demikian, kesimpulan yang salah akan terlihat.

Tujuan yang ingin dicapai dalam memahami statistika deskriptif, secara detil,adalah

1. membedakan jenis data dan memahami data

2. menghitung dan memaknai ukuran lokasi/pusat

3. membedakan variansi dan koefisien variasi

4. mengamati observasi luar

5. memahami data kelompok

6. menentukan distribusi frekuensi

7. membuat dan menafsirkan grafik

1

Page 5: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

1.1 Data, Jenis Data, Memahami Data

Data adalah hasil observasi tunggal (datum) yang didapat baik secara langsung(observasi/survey, praktikum) ataupun tidak langsung (buku, koran, internet).Data merupakan sumber utama analisis data. Pengumpulan, pengorganisasiandan pengolahan data merupakan pekerjaan statistika yang menuntut kerapiandan detil.

Dalam praktiknya, data yang kita kumpulkan dapat dikelompokkan menjadidata kategorik atau data numerik. Hal ini merujuk pada sifat data yang memi-liki label (kategorik) atau memiliki nilai (numerik). Data dapat pula dibedakanmenjadi jenis data berikut:

• nominal (jenis kelamin, golongan darah)

• ordinal (tingkat kecemasan, tingkat nyeri)

• rasio/interval (denyut nadi, tekanan darah, nilai ujian)

Latihan:Perhatikan kalimat-kalimat berikut. Tentukan jenis datanya (nominal, ordi-nal, rasio/interval).(a) “dr. KS, SpD. mengatakan bahwa penyakit Noor sudah kronis, bukanakut”(b) Wanda dan Windi berdebat tentang harga mobil yang kiranya layak untukmobil yang hendak mereka beli(c) “Apakah anda lahir pada bulan September?”

Diskusi: Perhatikan data jarak tempuh (dalam meter) ke sekolah dari beber-apa siswa di suatu daerah.

Table 1.1: Data jarak tempuh ke sekolah dari beberapa siswa.

Siswa- Jarak Siswa- Jarak Siswa- Jarak Siswa- Jarak

1 3265 6 3323 11 2581 16 27592 3260 7 3649 12 2841 17 32483 3245 8 3200 13 3609 18 33144 3484 9 3031 14 2838 19 31015 4146 10 2069 15 3541 20 2834

Analisis Data 2 K. Syuhada, PhD.

Page 6: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

Apakah analisis data rasio/interval akan lebih “kaya” dibandingkan dengandata nominal/ordinal? Apa yang bisa kita katakan tentang data tersebut?Dapatkah data numerik diubah menjadi data kategorik?

Diskusi: Data peserta ujian di beberapa sekolah di suatu kecamatan tercatatdalam diagram batang dan daun sebagai berikut. Untuk membaca data, kitaperhatikan kolom disebelah kiri garis yang menyatakan “angka puluhan” danangka-angka disebelah kanan garis yang menyatakan “angka satuan”. Sebagaicontoh, “3—5” berarti jumlah peserta ujian di sekolahg tertentu adalah 35orang.

0 3578891 0223 5

Apakah data dalam bentuk diagram batang dan daun cukup informatif? Da-patkah data numerik tersebut diubah menjadi data kategorik?

1.2 Ukuran Pusat/Lokasi dan Penyebaran

Setelah data dikumpulkan dan diorganisasikan, kita dapat memberikan tafsiransederhana melalui ukuran atau statistik. Beberapa ukuran yang dikenal an-tara lain mean dan variansi/deviasi standar yang menyatakan nilai tengah dansimpangan data.

Ukuran atau statistik yang melekat pada data dapat dibagi menjadi

• Ukuran pusat/lokasi: mean (aritmetik), median, modus

• Ukuran penyebaran: jangkauan, variansi/deviasi standar, kuartil

Misalkan data sampel adalah

x1, x2, . . . , xn,

dimana xi menyatakan titik sampel ke-i. Mean (aritmetik) didefinisikan seba-gai

x =

n∑i=1

xi

n.

Analisis Data 3 K. Syuhada, PhD.

Page 7: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

Sifat-sifat mean

(a) Untuk suatu konstanta k,

n∑i=1

k xi = · · ·

(b) Jika yi = xi + k maka y = x+ k. Buktikan!

(c) Jika yi = k xi maka y = · · · .

Median atau median sampel seringkali dikatakan sebagai nilai tengah. Den-gan demikian, menghitung median haruslah dilakukan pada data yang sudahdiurutkan. Definisi median adalah

(a) Observasi ke-((n+ 1)/2), (n ganjil), atau

(b) Nilai tengah dari observasi ke-(n/2) dan ke-((n/2) + 1), (n genap)

Diskusi: Bagaimana (perbandingan) nilai mean dan median untuk data yang(i) simetrik, (ii) menceng ke kanan, (iii) menceng ke kiri?

Modus atau Mode adalah ukuran pusat yang menyatakan nilai observasi yangpaling sering muncul. Menentukan modus dapat dilakukan pada data tanpadiurutkan (meskipun lebih mudah apabila diurutkan lebih dahulu).

Latihan:1. Tentukan ukuran lokasi/pusat dari contoh data diatas2. Diketahui suatu data tentang jumlah saudara (kandung, angkat, tiri) dari20 orang siswa sekolah menengah. Apabila setiap titik data ditambah tigamaka nilai mean dan jangkauan menjadi...

Ukuran penyebaran menyatakan seberapa jauh data menyebar dari mean. Mis-alkan kita memiliki dua data sampel. Kedua sampel memiliki mean yang sama,namun mungkin saja memiliki penyebaran data yang berbeda. Beberapa uku-ran penyebaran yang dikenal antara lain:

1. Jangkauan (Range):

R = xmaks − xmin

2. Variansi atau variansi sampel:

s2 =

n∑i=1

(xi − x)2

n− 1

Analisis Data 4 K. Syuhada, PhD.

Page 8: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

Catatan:Deviasi standar atau simpangan baku adalah akar kuadrat dari variansi.

3. Kuartil:Umumnya kita kenal kuartil pertama dan ketiga, dinotasikan dengan K1

dan K3. Apa yang dapat kita katakan tentang kuartil kedua atau K2?

4. Kuantil atau persentil:...

Sifat-sifat variansi:Diketahui data sampel x1, . . . , xn memiliki variansi s2x. Jika data sampel

(a) yi = xi + k,

(b) yi = k xi,

untuk suatu konstanta k, maka

s2y = . . .

Variansi versus Koefisien Variasi: Kita dapat menghitung suatu ukuran yangmengaitkan ukuran penyebaran (deviasi standar) dengan ukuran lokasi (mean),yaitu koefisien variasi (coefficient of variation atau CV):

CV = 100%× (s/x)

yang tidak dipengaruhi unit ukuran yang dipakai. CV bermanfaat untuk mem-bandingkan variabilitas beberapa sampel yang berbeda relatif terhadap nilaimean-nya. Dapat pula kita membanding CV dari beberapa variabel.

Latihan:Data pada tabel berikut menyatakan berbagai faktor yang mempengaruhimasalah pada sistem jantung dan peredaran darah anak. Tentukan CV danberikan interpretasinya.

Table 1.2: Faktor risiko kardiovaskular pada anak.

n mean s CV(%)Tinggi (cm) 364 142.6 0.31Berat (kg) 365 39.5 0.77

Tekanan darah (mm Hg) 337 104 4.97Kolesterol (mg/dL) 395 160.4 3.44

Analisis Data 5 K. Syuhada, PhD.

Page 9: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

1.3 Mengamati Observasi Luar

Observasi luar atau pencilan atau outlier adalah nilai/observasi yang “menyim-pang” dari nilai-nilai/observasi yang lain. Observasi luar dapat ditentukan/dihitungdengan melihat apakah ada nilai/observasi yang LEBIH BESAR dari

K3 + 1.5 (K3 −K1)

atau LEBIH KECIL dari

K1 − 1.5 (K3 −K1),

dengan K1 dan K3 adalah kuartil pertama dan ketiga seperti telah dijelaskansebelumnya.

Dalam praktiknya, observasi luar dapat menyatakan sesuatu yang baik/jelek.Misalnya, seseorang dengan tingkat kecerdasan (IQ) yang sangat tinggi (jauhdiatas rata-rata alias observasi luar) adalah baik. Seringkali observasi luardiabaikan dalam analisis data meskipun sesungguhnya cara ini tidaklah tepat.Mendeteksi observasi luar adalah sesuatu yang sangat menantang dalam statis-tika.

Diskusi: Sekelompok observasi x1, . . . , xn memiliki observasi luar xj untuksuatu j. Dapatkah kita membandingkan mean dengan dan tanpa observasiluar? Mungkinkah terdapat lebih dari satu observasi luar?

1.4 Data Kelompok

Pandang data sampel dengan 275 observasi. Ukuran sampel tersebut terlalubesar sehingga menampilkan data apa adanya menjadi tidak efisien. Dengandemikian, data sampel dapat dikelompokkan. Pengelompokan ini dapat pulaterjadi (harus dilakukan) karena tingkat keakuratan data yang diambil tidakdapat diperoleh dengan baik.

Pengelompokan data memberikan masalah: Berapa banyak kelompok atauinterval kelas (class intervals) yang ingin kita buat? Berapa lebar interval(interval width)? Salah satu formula yang bisa kita pakai adalah FormulaSturges, dimana banyaknya interval kelas adalah

k = 1 + (3.322× log10 n),

dimana n adalah besar sampel. Lebar intervalnya:

w = R/k,

Analisis Data 6 K. Syuhada, PhD.

Page 10: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

dengan R adalah jangkauan.

Untuk contoh data sampel dengan 275 observasi, kita peroleh:

k ≈ 8, w = (63− 18)/8 = 5.625

Dengan demikian, lebar kelas interval adalah 5 atau 10. Diketahui obervasiterkecil dan terbesar, berturut-turut, adalah 18 dan 63. Jadi, kelas intervalyang bisa dibuat adalah:10-1920-2930-3940-4950-5960-69

1.5 Memahami Grafik

Tampilan visual (baca: grafik) dari data merupakan salah satu cara untukmemahami dan menginterpretasi data. Grafik bersifat menarik, memudahkandalam membentuk pola, dan prediktif. Beberapa tampilan visualn untuk dataadalah diagram pencar (scatter diagram), diagram bar/batang (bar chart),diagram batang dan daun (stem-and-leaf plot), histogram, box-plot.

Diagram pencar merupakan bentuk grafik yang sederhana namun cukup in-formatif. Diagram ini berupa titik-titik yang menggambarkan nilai observasi.Pola atau kecenderungan data dapat dilihat dengan melihat grafik ini.

Diagram batang dan daun memiliki ke-khas-an berupa tampilan nilai utama/pertama(batang) dan nilai satuan/kedua (daun). Diagram ini membantu kita untukmenghitung kuantil/persentil data dengan mudah.

Analisis Data 7 K. Syuhada, PhD.

Page 11: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

BAB 2

Peluang

Silabus: Ruang sampel dan kejadian, konsep peluang, peluang bersyarat, Teo-rema Bayes.

Setelah kita mempelajari analisis data secara deskriptif, maka kajian berikut-nya adalah melakukan perhitungan secara probabilistik. Hal ini berkaitan den-gan konsep distribusi frekuensi relatif yang telah dibahas sebelumnya. Analisisdata secara probabilistik memerlukan pemahaman tentang hal-hal yang belumterjadi atau yang bersifat percobaan. Secara khusus, kita akan membangunruang sampel dan mendefinisikan kejadian.

Tujuan yang ingin dicapai dalam mempelajari peluang adalah:

1. Mendefinisikan ruang sampel dan kejadian

2. Menghitung peluang suatu kejadian

3. Mengkaji konsep dan menghitung peluang bersyarat

4. Memanfaatkan Teorema Bayes untuk menghitung peluang bersyarat su-atu kejadian

2.1 Ilustrasi

Sebagai pengantar, perhatikan ilustrasi-ilustrasi berikut. Pemahaman peluangmemerlukan pengetahuan tentang cara menyusun atau kombinasi/permutasi.Secara khusus, kita dituntut untuk dapat membangun pertanyaan peluang.

Ilustrasi-1. Tanti baru saja mengikuti tes mata. Ia masih teringat beberapahuruf yang muncul: A-E-M-R-S. Kini, Tanti mencoba menyusun kata-katayang mungkin dari huruf-huruf tersebut.

1

Page 12: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

Ilustrasi-2. Hanin bermaksud menyumbangkan darahnya di suatu tempatdonor. Hanin terlebih dahulu harus dicek golongan darahnya.

• Golongan darah yang mungkin untuk Hanin adalah...

• Rupanya Hanin tidak sendirian. Ada Hana dan Hanan disana yangmemiliki maksud yang sama dengan Hanin. Jika seorang diantara merekadipilih secara acak menjadi pendonor, berapa peluang orang yang ter-pilih adalah Hana?

• Jika, diantara mereka bertiga, Hanan terpilih menjadi pendonor, berapapeluang golongan darah Hanan adalah B?

Ilustrasi-3. B dan G pergi berburu dengan cara menembak. Pada waktuyang disepakati, B dan G secara bersamaan menembak sasaran tertentu. Pelu-ang tembakan B mengenai sasaran adalah 0.7 sedangkan peluang tembakan G(bebas dari tembakan B) mengenai sasaran adalah 0.4.

• Berapa peluang sebuah tembakan mengenai sasaran?

• Berapa peluang sasaran tertembak?

Ilustrasi-4. “Ayahku meninggal waktu usiaku tiga tahun. Lalu Ibu kawinlagi. Dengan ayah tiriku, Ibu mendapat dua orang anak tiri dan melahirkantiga orang anak. Ketika usiaku lima belas tahun, Ibu pun meninggal. Ayahtiriku kawin lagi dengan seorang janda yang sudah beranak dua. Ia melahirkandua orang anak pula dengan ayah tiriku”

2.2 Konsep Peluang

Ruang sampel, S, adalah himpunan semua hasil mungkin dari suatu per-cobaan. Kejadian, E, adalah himpunan bagian dari ruang sampel. Peluangsuatu kejadian, P (E), adalah rasio dari banyaknya titik kejadian dan ruangsampel, atau

P (E) =n(E)

n(S),

dimana n(E) dan n(S), berturut-turut, adalah banyaknya titik kejadian danruang sampel.

Peluang suatu kejadian haruslah memenuhi aksioma dan sifat-sifat berikut:

1. 0 ≤ P (E) ≤ 1

Analisis Data 2 K. Syuhada, PhD.

Page 13: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

2. P ({}) = 0

3. P (S) = 1

4. Untuk kejadian A dan B,

P (A ∪B) = P (A) + P (B)− P (A ∩B)

5. Jika kejadian A dan B saling asing maka P (A ∩B) = 0

6. Kejadian A dan kejadian B dikatakan saling bebas jika

P (A ∩B) = P (A)P (B)

Definisi peluang yang lain merujuk pada frekuensi relatif. Misalkan suatupercobaan dengan ruang sampel S diulang-ulang. Misalkan n(E) banyaknyakejadian E yang terjadi selama n pengulangan. Peluang kejadian E adalah

P (E) = limn→∞

n(E)

n

Latihan:

1. Dalam suatu rapat yang terdiri dari 20 orang, setiap orang berjabatantangan dengan orang lain diakhir rapat. Ada berapa banyak jumlah’salaman’ yang terjadi?

2. Sebuah lift bergerak dari lantai dasar berisi 8 orang (tidak termasukoperator lift) dan orang-orang tersebut akan keluar hingga lift mencapailantai paling tinggi yaitu lantai 6. Dalam berapa cara sang operatordapat mengenali orang-orang yang keluar dari lift jika semuanya nampakmirip bagi sang operator? Bagaimana jika 8 orang tersebut terdiri atas5 pria dan 3 wanita dan sang operator membedakan pria dan wanita?

3. Lima orang siswa meletakkan tasnya masing-masing ketika memasukiperpustakaan. Kemudian, ketika mereka keluar dari perpustakaan merekamengambil tasnya secara acak tanpa memperhatikan apakah tas yang di-ambil adalah benar-benar miliknya. Apakah ruang sampel “percobaan”diatas?

4. Setiap pagi Swarna meninggalkan rumahnya untuk berlari pagi. Swarnapergi lewat pintu depan atau belakang dengan peluang sama. Ketikameninggalkan rumah Swarna memakai sepatu olah raga atau bertelan-jang kaki jika sepatu tidak tersedia di depan pintu yang dia lewati. Ketika

Analisis Data 3 K. Syuhada, PhD.

Page 14: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

pulang, Swarna akan masuk lewat pintu atau belakang dan meletakkansepatunya dengan pelung sama. Jika dia memiliki 4 pasang sepatu olahraga, akan dihitung berapa peluang Swarna akan sering berolah ragadengan bertelanjang kaki. Pertanyaan awal, tentukan ruang sampelnya!

5. Bapak Kepala Sekolah mengundang guru-guru yang memiliki setidaknyasatu anak laki-laki (L) ke acara syukuran. Seorang guru yang bernamaPak Jaim memiliki dua anak. Kita akan menghitung peluang bahwa ke-dua anak Pak Jaim adalah laki-laki, diberikan bahwa Pak Jaim diundangke acara syukuran tersebut. Pertanyaan awal adalah apa ruang sampel“percobaan” diatas?

2.3 Peluang Bersyarat dan Teorema Bayes

Ilustrasi-1. Pandang Ilustrasi-3 diatas.

• Jika sebuah tembakan mengenai sasaran, berapa peluang bahwa itu tem-bakan G?

• Berapa peluang bahwa, jika sasaran tertembak, kedua tembakan menge-nai sasaran?

• Berapa peluang bahwa, jika sasaran tertembak, tembakan G mengenaisasaran?

Ilustrasi-2. Seorang praktikan, Ega, tahu bahwa sebuah lembar kerja prak-tikum akan berada di salah satu dari tiga buah kotak surat lab yang ada.Misalkan pi adalah peluang bahwa Ega akan menemukan lembar kerja prak-tikum setelah mengecek kotak surat lab i dengan cepat jika ternyata surattersebut berada di kotak surat lab i, i = 1, 2, 3.

• Misalkan Ega mengecek kotak surat 1 tidak menemukan surat. Berapapeluang hal itu akan terjadi?

• Jika diketahui Ega mengecek kotak surat 1 tidak menemukan surat, be-rapa peluang bahwa surat itu ada di kotak surat 1?

Peluang kejadian A, apabila kejadian B telah terjadi, adalah peluang bersyaratP (A|B) yaitu:

P (A|B) =P (A ∩B

P (B),

Analisis Data 4 K. Syuhada, PhD.

Page 15: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

asalkan P (B) > 0. Jelas bahwa jika kejadian A dan B saling bebas makaP (A|B) = P (A).

Perhatikan bahwa konsep peluang bersyarat dapat digunakan untuk menghi-tung peluang total:

P (B) = P (B|A)P (A) + P (B|Ac)P (Ac)

Latihan:

1. Laila memiliki 2 buah koin; satu koin “baik” (memiliki sisi M dan B)dan satu koin “tidak baik” (memiliki dua sisi M). Sebuah koin dipilihsecara acak, kemudian dilantunkan. Berapa peluang muncul M?

2. Laila memiliki 2 buah koin; satu koin “baik” (memiliki sisi M dan B)dan satu koin “tidak baik” (memiliki dua sisi M). Sebuah koin dipilihsecara acak, kemudian dilantunkan. Muncul M. Berapa peluang bahwakoin yang dilantunkan adalah koin “baik”?

2.3.1 Teorema Bayes

TEOREMA BAYES:Misalkan {B1, B2, . . . , Bn} adalah partisi dari ruang sampel dan misalkan Aadalah kejadian yang terobservasi. Peluang kejadian Bj diberikan A adalah

P (Bj|A) =P (ABj)

P (A)

=P (A|Bj)P (Bj)∑ni=1 P (A|Bi)P (Bi)

Latihan:Tes darah di suatu laboratorium akan 95% efektif dalam mendeteksi suatupenyakit tertentu jika penyakit itu ada. Namun demikian, tes tersebut jugamemberikan ’hasil positif yang salah’ pada 1% orang sehat yang dites. Jika0.5% dari populasi mengidap penyakit tertentu tersebut, tentukan peluangbahwa seseorang menderita penyakit itu jika hasil tes positif?

2.4 Topik Lanjut Peluang

Ilustrasi-1. Maskapai penerbangan mengetahui bahwa lima persen pemesantiket tidak akan datang untuk membeli tiketnya. Dengan alasan ini, maskapai

Analisis Data 5 K. Syuhada, PhD.

Page 16: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

tidak ragu untuk menjual 52 tiket penerbangan pada pesawat dengan kapasitasduduk 50 orang. Berapa peluang akan ada kursi yang tersedia untuk setiappemesan tiket yang datang?

Ilustrasi-2. Pasien di IGD adalah orang-orang yang dianggap dekat dengankematian. Kesembuhan dari penyakit yang dideritanya bagi mereka adalahseperti mimpi. Untuk bisa bertahan hidup dari hari ke hari sudahlah meru-pakan mukjizat. Asumsikan bahwa setiap orang memiliki peluang sama untukdapat bertahan hidup sampai hari esok sebesar α. Jika jumlah pasien IGDpada suatu hari adalah 5 orang, berapa peluang besok hanya akan ada 2 orangsaja yang masih hidup?

Apa yang dapat anda katakan tentang soal-soal peluang pada ilustrasi-ilustrasidiatas? Mungkinkah kita mendefinisikan suatu kejadian? ruang sampel? Per-lukah cara lain untuk memahami peluang suatu kejadian?

2.4.1 Peubah acak dan fungsi distribusi

Apa yang dapat kita katakan tentang peubah acak?

• Peubah acak tidaklah “acak” dan bukanlah “peubah”

• Peubah acak adalah “fungsi” yang memetakan anggota S ke bilanganreal R

Peubah acak X dikatakan diskrit jika terdapat barisan terhitung dari bilangan{ai, i = 1, 2, . . . } sedemikian hingga

P(∪

i

{X = ai})=

∑i

P (X = ai) = 1

Catatan:Sebuah peubah acak diskrit tidak selalu berasal ruang sampel diskrit.

FX disebut fungsi distribusi (diskrit) dari X jika terdapat barisan terhitung{ai, i = 1, 2, . . . } dari bilangan real dan barisan {pi, i = 1, 2, . . . } dari bilanganpositif yang bersesuaian sedemikian hingga∑

i

pi = 1

dan

FX(x) =∑ai≤x

pi

Analisis Data 6 K. Syuhada, PhD.

Page 17: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

Jika diberikan himpunan terhitung {ai, i = 1, 2, . . . } dan bilangan positif{pi, i = 1, 2, . . . } sdh

∑i pi = 1, fungsi peluang pX(x) adalah

pX(x) = pi = P (X = ai),

dengan x = ai

Fungsi distribusi (kumulatif), F (x) = P (X ≤ x), memiliki sifat-sifat:(a) F fungsi tidak turun(b) lim

x→∞F (x) = 1

(c) limx→−∞

F (x) = 0

(d) F fungsi kontinu kanan

Catatan:

• P (a < X ≤ b) = F (b)− F (a)

• P (X ≤ b) = P (X < b)

P (X < b) = P(limn→∞

{X ≤ b− 1

n

})= lim

n→∞P(X ≤ b− 1

n

)= lim

n→∞F(b− 1

n

)Latihan:

1. Diketahui fungsi peluang sebagai berikut:

f(x) =

p, x = −1.9

0.1, x = −0.1

0.3, x = 20p

p, x = 3

4p, x = 4

0, x yang lain

Hitung P (−1.9 ≤ |X| ≤ 3), F (2), F (F (3.1))

2. Tentukan fungsi peluang dari fungsi distribusi berikut:

F (x) =

0, x < −3.1

3/5, −3.1 ≤ x < 0

7/10, 0 ≤ x < 1

1, 1 ≤ x

Analisis Data 7 K. Syuhada, PhD.

Page 18: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

BAB 3

Distribusi Diskrit dan Kontinu

Silabus: Distribusi peubah acak, distribusi diskrit, distribusi kontinu.

Peubah acak merupakan alat yang dapat digunakan untuk mempelajari kon-sep pada tingkat lanjut. Salah satu karakteristik utama peubah acak adalahmemiliki distribusi. Distribusi diskrit adalah fenomena yang digambarkan olehpeubah acak diskrit melalui fungsi peluang/distribusi. Beberapa distribusidiskrit yang dikenal adalah binomial, Poisson dan geometrik. Distribusi uni-form, eksponensial dan normal adalah contoh-contoh distribusi kontinu.

3.1 Distribusi Diskrit

3.1.1 Distribusi Binomial

Misalkan S = {sukses, gagal} adalah ruang sampel yang menotasikan ’sukses’atau ’gagal’ dari suatu percobaan.Definisikan X(sukses) = 1 dan X(gagal) = 0 dan

pX(1) = P (X = 1) = θ

pX(0) = P (X = 0) = 1− θ

dimana 0 ≤ θ ≤ 1 adalah peluang diperoleh sukses. X dikatakan peubah acakBernoulli dengan parameter θ.

Jika dilakukan n percobaan independen dan jika X menyatakan banyaknyasukses yang diperoleh makaX dikatakan sebagai peubah acak Binomial denganparameter (n, θ), dinotasikan X ∼ B(k;n, θ). Fungsi peluangnya adalah

f(k) = pX(k) = Cnk θk (1− θ)n−k

1

Page 19: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

Latihan:

1. Misalkan X ∼ B(5, 0.2). Hitung:(a) P (0 < X ≤ 1)(b) P (X ≥ 1)

2. Maskapai penerbangan mengetahui bahwa lima persen pemesan tikettidak akan datang untuk membeli tiketnya. Dengan alasan ini, maskapaitidak ragu untuk menjual 52 tiket penerbangan pada pesawat dengankapasitas duduk 50 orang. Berapa peluang akan ada kursi yang tersediauntuk setiap pemesan tiket yang datang?

3. Misalkan X peubah acak Binomial yang menyatakan banyak orang yangdatang ke toko dan membeli barang. Diketahui nilai parameter “suk-ses” adalah 0.6. Jika 10 orang masuk toko, berapa peluang terjadinyamaksimal sebuah “sukses”?

4. Tentukan mean dan variansi peubah acak Binomial dengan parameter(n, θ)

5. Suatu hasil produksi (misalkan sebuah TV) akan rusak dengan peluang0.1. Hasil produksi saling bebas. Jika terdapat 3 hasil produksi (3 buahTV), berapa peluang bahwa paling banyak 1 TV rusak?

6. Empat buah koin dilantunkan. Asumsikan bahwa hasil lantunan salingbebas. Hitung peluang akan muncul 2 Muka dan 2 Belakang?

3.1.2 Distribusi Poisson

Distribusi diskrit lain yang cukup dikenal adalah distribusi Poisson. Umumnyadistribusi ini terlihat pada fenomena banyaknya telfon yang masuk pada suatuhari, banyaknya kendaraan yang lewat di jalanan pada periode waktu tertentudsb. Perhatian kita adalah pada banyaknya “sukses” pada periode tertentu.

Misalkan X peubah acak dengan fungsi peluang

f(i) = pX(i) = e−λ λi

i!,

untuk i = 0, 1, 2, . . . dan λ > 0. Peubah acak X disebut peubah acak Poissondengan parameter λ.

Latihan

1. Banyaknya kecelakaan yang terjadi di tol setiap hari berdistribusi Poissondengan parameter λ = 3. Berapa peluang tidak ada kecelakaan pada hariini?

Analisis Data 2 K. Syuhada, PhD.

Page 20: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

2. MisalkanX peubah acak Poisson dengan parameter λ. Tunjukkan bahwaP (X = i) naik secara monoton sebelum kemudian turun secara monotonuntuk i semakin besar.

Apa yang anda ketahui tentang pendekatan Poisson untuk Binomial?Misalkan X berdistribusi Binomial dengan parameter (n, θ),

P (X = x) = Cnx θx (1− θ)n−x

and misalkan λ = nθ. Maka,

P (X = x) =n!

x! (n− x)!θx (1− θ)n−x

=n!

x! (n− x)!

n

)x (1− λ

n

)n−x

=n(n− 1) · · · (n− i+ 1)

nx

λx

x!

(1− λ/n)n

(1− λ/n)x

= . . .

≈ e−λ λx

x!

Petunjuk:Untuk n besar dan λ moderat (karena θ cukup kecil),(

1− λ

n

)n

≈ · · ·

n(n− 1) · · · (n− i+ 1)

nx≈ · · ·(

1− λ

n

)x

≈ · · ·

Latihan:

1. Misalkan peluang sebuah produk susu akan tercemar melamin adalah 0.1.Tentukan peluang bahwa paling banyak 1 produk susu yang tercemardari sampel sebanyak 10 produk susu! (0.7361, 0.7368)

2. Misalkan X ∼ B(n, θ) dan Y ∼ POI(λ). Cari hubungan antara f(k+1)dan f(k) untuk kedua peubah acak.

Analisis Data 3 K. Syuhada, PhD.

Page 21: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

3.1.3 Distribusi Geometrik

Misalkan percobaan-percobaan dilakukan hingga diperoleh sukses yang per-tama. Percobaan-percobaan tersebut saling bebas dan memiliki peluang suk-ses α. Misalkan X menyatakan banyaknya percobaan yang dilakukan untukmendapatkan sukses pertama tersebut, maka X dikatakan peubah acak Ge-ometrik dengan parameter α. Fungsi peluangnya adalah

fX(n) = p(n) = P (X = n) = (1− α)n−1 α,

untuk n = 1, 2, . . . dan α > 0.

Misalkan Y peubah acak yang menyatakan kegagalan yang sudah dialami se-belum mendapatkan sukses yang pertama; diketahui peluang mendapatkansukses adalah α. Fungsi peluang untuk Y adalah

fY (k) = (1− α)k α, k = 0, 1, 2, . . .

Diskusi:

• Apa yang dapat anda katakan tentang mean dan variansi untuk keduapeubah acak X dan Y tersebut?

• Apakah nilai mean lebih besar daripada variansi?

Latihan:

1. Hitung momen pertama dan kedua untuk peubah acak Geometrik den-gan parameter α

2. Tiga remaja makan disuatu restoran. Untuk menentukan siapa yangakan membayar, mereka sepakat untuk mengundi dengan melantunkankoin. Seseorang dengan hasil lantunan yang berbeda dengan yang lainwajib membayar makanan yang telah dipesan. JikaX menyatakan banyaknyalantunan koin yang harus dilakukan, tentukan:a. P (X = 3)b. P (X > 4)

3.2 Distribusi Kontinu

MisalkanX peubah acak dan fungsi distribusinya FX dapat diturunkan. Fungsipeluang fX adalah turunan dari fungsi distribusi,

fX(x) =d

dxFX(x)

Analisis Data 4 K. Syuhada, PhD.

Page 22: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

atau dengan kata lain

FX(x) =

∫ x

−∞fX(t) dt

Catatan:

1 = FX(∞) =

∫ ∞

−∞fX(t) dt

P (a ≤ X ≤ b) = FX(b)− FX(a) =

∫ b

a

fX(t) dt

P (X = a) =

∫ a

a

fX(t) dt = 0

Latihan:

1. Diketahui

f(x) = c e−2x, x > 0,

Hitung (i) c, (ii) P (X > 2)

2. Suatu peubah acak X memiliki fungsi peluang

f(x) = k (1− x2),

untuk −1 < x < 1. Tentukan FX(x)

Distribusi UniformPeubah acak kontinu X dikatakan berdistrbusi Uniform pada selang [a, b] jikafungsi peluang fX nya sebagai berikut

fX(x) =1

b− a, a ≤ x ≤ b.

Distribusi NormalPeubah acak kontinu X adalah peubah acak normal atau Gauss dengan pa-rameter µ dan σ2 jika fungsi peluangnya adalah

fX(x) =1√2π σ

exp

(− 1

2σ2(x− µ)2

),

untuk −∞ ≤ x ≤ ∞.

Analisis Data 5 K. Syuhada, PhD.

Page 23: Analisis Data - FMIPA Personal Blogs / ITBpersonal.fmipa.itb.ac.id/khreshna/files/2011/02/catkuliah_AnDat2.pdf · interpretasi. Kesimpulan yang diberikan dalam statistika deskriptif

Latihan:

1. Jika X berdistribusi Uniform pada selang (-1,1), tentukan P (X > 1/2)

2. Tentukan mean dan variansi dari peubah acak Uniform pada selang noldan satu

3. Jika X ∼ N(1, 4), hitung P (2 < X < 3)

4. Peubah acak normal dengan parameter (0, 1) dikatakan sebagai peubahacak normal standar. Tentukan c sedemikian hingga P (|X| < c) = 0.5

5. Diketahui fungsi peluang suatu peubah acak adalah

f(x) = α e−αx, x > 0

Hitung E(eaX)

6. Tentukan fungsi distribusi dari peubah acak eksponensial dengan param-eter λ

Analisis Data 6 K. Syuhada, PhD.