simple random sampling
DESCRIPTION
Sampling SRSTRANSCRIPT
-
2
Dasar Metode Simple Random Sampling
1.1 SIMPLE RANDOM SAMPLING
Metode yang paling sederhana dan paling umum dari metode sampling adalah simple
random sampling (SRS) dimana sampel diambil unit per unit, dengan peluang yang masing-
masing eleman mempunyai peluang sama untuk terpilih sebagai sampel. Dengan demikian
SRS adalah metode memilih n unit sampling dari sebuah populasi berrukuran N dengan
peluang yang sama bagi semua elemen atau prosedur sampling yang mungkin dari n unit
yang bisa dibentuk dari N unit populasi mempunyai peluang yang sama dalam pemilihan.
SRS juga kadang-kadang disebut sampling acak yang tak terbatas. Jika n unit dipilih dan
dicatat kemudian dikembalikan ke populasi sebalum pengambilan berikutnya dibuat dan
prosedur ini diulangi n kali, langkah ini dikenal sebagai SRS dengan pemuluhan (with
replacement). Jika prosedur ini diulang sampi n unit yang berbeda yang dipilih dan semua
pengulangan diabaikan, pemilihan ini disebut SRS tanpa pengembalian (without replacement)
THEORMA 2.1.1 peluang unit yang telah ditentukan dari sebuah populasi yang dipilih dari
beberapa pengambilan yang ditentukan adalah sama dengan peluang pengambilan yang
pertama.
Bukti.
Peluang unit yang dispecifikan dipiulih sampai pengambilan ke r secara jelas hasilnya
(a) peluang unit tidak dipilih dalam pengambilan tertentu (r-1) dan (b) peluang terpilih
dalam pengambilan ke r dengan kondisi ini, init tak terpilih dalam pengambilan sebelumnya
(r-1) peluang (a) ditentukan dengan
....
=
Peluang (b) ditentukan dengan karena itu peluang yang dibutuhkan
adalah
yang independen diistilahkan r yang menunjukan nomer pengambilan
THEOREMA 2.1.2 peluang unit yang ditentukan menjadi masukan dalam sampel sama
dengan
Bukti
N menunjukan jumlah sampel sehingga unit yang dijadikan sampel dalam n
pengambilan, peluang unit yang dijadikan sampel merupakan peluang dari n peristiwa yang
saling bebas viz. hal ini tercangkup dalam sampel saat pengambilan pertama, kedua hingga
ke n. seperti yang ditunjukkan theorem 2.1.1 peluang masing-masing unit adalah
sedangkan peluang terpilihnya dalam sampel adalah
.
-
Kesimpulan 1. peluang sampel terpilih dari n unit adalah ( )
Kesimpulan 2. Jika populasi N unit m unit dihilangkan dan ditambah m maka peluang
terpilih setiap unit adalah( )
1.2 PREOSEDUR PEMILIHAN SAMPEL ACAK
Karena teori sampling berdasarkan sumsi random sampling, teknik random sampling
mempunyai dasar yang penting. Beberapa prosedur yang digunakan dalam memilih sampel
acak adalah sebagai berikut
i. Metode Undian ii. Menggunakan Tabel Angka Random
2.2.1 Metode Undian
Dalam praktek, karcis atau undian dapat dianggap merupakan bagian dari unit sebuah
populasi. Jadi, setiap unit sampel mempunyai tanda pengenal sendiri dari 1 sampai dengan N.
Prosedur dalam memilih setiap unit sampel sangat sederhana. Semua karcis atau undian
dimasukkan dalam suatu wadah seperti alat logam berbentuk bola, dimana memungkinkan
untuk diacak secara cermat sebelum diadakan pengambilan. Pengambilan setiap karcis dapat
diteruskan sampai ukuran sampel yang dibutuhkan didapatkan.
Prosedur menomori setiap karcis dan mengambil satu sampel setelah diacak menjadi
tidak praktis jika ukuran populasi besar. Dalam praktek akan menjadi lebih sulit untuk
mendapatkan pengacakan yang cermat. Kesalahan pengamatan manusia akan mempengaruhi
keabsahan metode ini.
2.2.2 Menggunakan Tabel Angka Random
Sebuah tabel angka random terdiri atas susunan angka-angka dari 0 sampai 9, yang
disusun dalam bentuk linier atau pola persegi panjang (tabel), dimana setiap posisi berisikan
satu dari nomor tersebut. Tabel angka random juga disusun dari angka 0, 1, 2, . . . , 9 dimana
setiap angka bersifat independen terhadap angka lainnya. Beberapa tabel angka random yang
umum digunakan yaitu :
i. Tabel angka random Tippett ii. Tabel Fisher dan Yates
iii. Tabel Kendall dan Smith iv. Satu juta angka acak
Untuk memastikan apakah seri angka random ini benar-benar merupakan angka acak,
beberapa tes berikut ini dapat digunakan :
-
i. Tes frekuensi ii. Tes berseri
iii. Gap test iv. Poker test
Metode praktis untuk memilih sampel secara acak adalah dengan memilih unit sampel
satu per satu dengan bantuan tabel angka random. Dengan mengambil dua buah angka, kita
mendapatkan angka untuk unit sampel dari 00 sampai 99, dan semuanya mempunyai
frekuensi yang sama. Dengan cara yang sama, tiga atau lebih kombinasi angka bisa
didapatkan dengan mengkombinasikan tiga atau lebih baris atau kolom tabel tersebut.
Cara sederhana dalam memilih sampel yang dibutuhkan adalah dengan memilih
angka acak dari 1 sampai dengan N dan kemudian memilih unit yang sesuai dengan angka
tersebut. Prosedur ini meliputi angka yang tidak terpakai karena angka tersebut melebihi
besarnya N. Dalam penggunaan tabel angka random terdapat beberapa modifikasi dalam
prosedur pengambilan angka random, yaitu :
i. Pendekatan sisa ii. Pendekatan hasil bagi
iii. Pemilihan angka secara bebas
Pendekatan Sisa
Suatu ukuran populasi ditentukan sebagai N yang mempunyai sebanyak r digit angka
dan kemudian hasil perkalian dari N yang masih mempunyai jumlah digit r dianggap sebagai
N. Sebuah angka acak k dipilih dari 1 sampai N dan kemudian unit yang memiliki nomor urut yang sama dengan sisa dari hasil pembagian angka random yang terpilih (k) dengan N
dipilih sebagai sampel. Apabila sisa pembagian sama dengan nol, maka unit sampel terakhir
yang terpilih. Misalnya, N = 123, hasil perkalian dari N yang masih memiliki 3 digit angka
adalah 984. Untuk memilih sebuah unit, sebuah angka acak dari 001 sampai 984 dipilih.
Misalnya angka random yang terpilih adalah 287. kemudian 287 dibagi dengan 123, sisanya
adalah 41. Jadi, unit dengan nomor urut 41 adalah yang terpilih sebagai sampel.
Pendekatan hasil bagi
Sebuah ukuran populasi sebesar N memiliki r digit angka kemudian hasil perkalian
sebanyak r digit dari N dianggap sebagai N dimana N/ N = q. Sebuah angka acak k dipilih dari 0 sampai dengan N 1. Dengan membagi k dengan q maka hasil bagi r didapatkan dan unit dengan nomor urut r 1 adalah unit yang terpilih. Sebagai gambaran, N = 16 sedangkan N = 96 dengan q = 6. Sebua angka random yang terpilih dari 0 sampai 95 adalah 65. Dengan membagi 65 dengan 6, hasil baginya adalah 10 dan kemudian sampel yang terpilih
adalah 9.
-
Pemilihan angka secara bebas
Metode ini diusulkan oleh Mathai (1954). Sebuah angka acak dipilh berdasarkan digit
pertama dan yang lainnya menurut sisa dari ukuran populasi. Jika angka yang terpilih adalah
0 maka unit yang terpilih adalah unit yang terakhir. Tapi jika angka acak yang didapatkan
lebih besar dari atau sama dengan N, maka angka tersebut tidak dipakai dan prosedur ini
kembali diulang.
Contoh 2.1 Memilih contoh acak dari 11 rumah tangga dari daftar 112 rumah tangga di
sebuah desa.
(i) Dengan menggunakan 3 digit angka acak yang berada di kolom 1 sampai 3, 4
sampai 6 dan seterusnya dari tabel angka random dan angka yang tak terpakai yang lebih
besar dari 112 (angka 000 juga termasuk), kita mempunyai urutan angka yang diambil
sebagai sampel yaitu 033, 051, 052, 099, 102, 081, 092, 013, 017, 076, dan 079.
(ii) Pada prosedur diatas, angka yang lebih besar dari 112 ditolak. Oleh karenanya,
metode yang biasanya digunakan adalah pendekatan sisa yang dapa menghindari tidak
terpakainya angka random yang lebih besar dari N. Hasil perkalian terbesar dari 112 adalah
896. dengan menggunakan 3 digit angka random seperti diatas, maka angka random yang
terpilih akan memuat sampel dengan nomor urut 086, 033, 049, 097, 051, 052, 066, 107, 015,
106 dan 020.
(iii) Jika pendekatan hasil bagi diterapkan, hasil perkalian tertinggi dengan 3 digit
angka dari 112 adalah 896 sedangkan q = 8. Dengan menggunakan angka random yang sama
dan membaginya dengan 8, kita mendapatkan contoh acak bernomor urut 025, 004, 020, 026,
006, 006, 092, 041, 085, 027 dan 086 dengan metode pengembalian dan nomor urut 025, 004,
020, 026, 006, 092, 041, 085, 027, 086, dan 042 dengan metode tanpa pengembalian.
Contoh 2.2 Sepuluh kebun buah di sebuah tempat dekat dengan sebuah desa berturut-turut
mempunyai 125, 793, 970, 830, 1502, 864, 503, 106, 970, 312 pohon buah. Tariklah sebuah
sampel acak dari 10 pohon buah dengan menggunakan tabel angka random.
Kita anggap bahwa kebun buah pertama mempunyai nomor urut pohon buah dari 1
sampai 125, di kebun buah kedua dari nomor 126 sampai 918, dan seterusnya. Oleh
karenanya, angka kumulatif dari nomor urut tersebut dapat ditulis sebagai berikut, 125, 918,
1888, 2718, 4220, 5084, 5587, 6663, 6975. dengan menggunakan 4 digit angka random
seperti contoh diatas dan dengan dugaan yang serupa, kita mendapatkan sepuluh angka acak
1983, 0330, 1614, 2096, 0511, 0524, 3311, 6874, 2183 dan 6926.
Dengan angka random yang pertama 1983, kita memilih pohon yang bernomor urut
95 di kebun buah keempat. Serupa dengan yang tadi, dengan angka acak kedua 0330, kita
memilih pohon dengan nomor urut 205 di kebun buah kedua, dan seterusnya.
-
2.3 ESTIMATION OF POPULATION PARAMETERS
Mari kita mengasumsikan setiap unit iu dalam sebuah populasi memiliki suatu nilai
variabel iY untuk setiap karakter y. Untuk beberapa parameter, mari didefinisikan sebagai
Total populasi, N
i
iyY
Rata-rata populasi, N
i
i NYY
Varian populasi, N
i
i NYY22 )(
Dalam sebuah n contoh acak unit-unit dalam sampel 1u , 2u , . . ., nu , secara berturut-
turut mempunyai 1y , 2y , . . ., ny . Estimator dari total populasi dan rata-rata adalah
n
i
i yNyn
NY . , dan
n
i
i ynyY
Faktor nN yang ada di rumusan untuk total sampel biasanya disebut perluasan atau
peningkatan atau faktor inflasi. Kebalikanya Nn disebut fraksi sampling dan dinyatakan
dengan huruf f dalam buku ini.
Dalil 2.3.1 Dalam penarikan sampel aca sederhana, tanpa pengembalian, rata-rata sampel y
adalah estimator yang unbiased dari parameter Y dan varian samplingnya diberikan sebagai
NSfnSNnyV22 )1()1()( (2.3.1)
dimana
)1(22 NNS
Bukti Kita ketahui
-
2
2
22
1
1
PtPN
PPNtn (2.7.9)
(i) Jika faktor koreksi terbatas (kpt) diabaikan, maka :
220 1 PPtn (2.7.10)
(ii) Jika faktor koreksi tidak diabaikan, maka :
Nnn
n11 0
01
(2.7.11)
Contoh 2. 8
Dalam suatu populasi terdapat 4000 orang yang dipanggil untuk memberikan hak
suaranya, 50% mengembalikannya ke kotak suara. Perkiraan jumlah sampel untuk
mengestimasi proporsi orang yang mengembalikan kertas suara sehingga mempunyai
batas kesalahan (MoE) 5% dari 95% derajat kepercayaan dimana pengambilan sampel
dilakukan secara :
(iii) Pada kasus penarikan sample sederhana secara acak tanpa pengembalian (WOR),
banyaknya kemungkinan sample adalah 10 yaitu 52 . Dapat kita lihat bahwa setiap kemungkinan sample memiliki peluang yang sama untuk terpilih yaitu masing-masing 1/10.
(a) Nilai harapan dari y , yang diberikan dari hasil rata-rata pada kolom (6) dalam tabel 2.3.2,
dengan nilai 158,0 sebagai rata-rata pada populasi, hal itu membuktikan bahwa y
merupakan estimator yang tidak bias bagi Y . Selanjutnya, varians sampling yang didapatkan
dari rata-rata terhadap kuadrat error (kesalahan) yang ditunjukkan pada kolom (7) dimana
hasilnya adalah 14,55 ,dengan asumsi bahwa .
)10/3(8/3)(22 Syv
(b) Sejak varians dari sampel ( 2s , diberikan oleh 2/)(2
21 yy ), dimana hal ini akan lebih
mempermudah penghitungan, rata-rata dari 10 sampel berarti kuadrat yang ada seperti 2)(sE .
Perhatikan, 5,4810/485)(2 sE
Juga, kuadrat rata-rata populasi = 48,5
Jadi, kuadrat rata-rata sample menunjukkan estimator yang tidak bias dari kuadrat rata-rata
populasi )(2S , buktinya :
22 )( SsE
-
(c) Estimator dari )( yV berasal dari :
20/)(3)( 221 yyyv
Nilainya ditunjukkan oleh kolom (8) pada tabel 2.3.2. Nilai harapan (Expected Value) dari
)(yv yang di dapat dari hasil rata-rata nilai pada kolom (8) yaitu 14,55. Menunjukkan bahwa
nilai itu adalah estimasi tidak bias
10
3)()]([
2SyVyvE
2.4. Estimasi Proporsi Populasi
Sering kali, unit-unit di dalam populasi dikelompokkan kedalam dua grup (i) yang
mempunyai karakteristik khusus dan (ii) tidak memiliki karakteristik tersebut. Contohnya,
hasil panen ladang yang diari dengan ladang yang tidak diari. Apabila ladangnya diari, kita
dapat mengatakan bahwa dia memiliki karakteristik yaitu irigasi/pengairan. Jika ladang
tersebut tidak diari, dapat dikatakan bahwa ia tidak memiliki karakteristik khusus tersebut.
Jika kita ingin memperkirakan proporsi ladang yang diari, dengan populasi ladang adalah
sebanyak N ladang dan diasumsikan bahwa iy memiliki nilai 1 jika ladang tersebut diari, dan
lainnya dianggap nol (0). Dimana, total dari ladang yang diari sebagai 1N adalah bagian dari
N.
N
i
ii Ny
Jadi,
N
i
i PN
Ny
NY
1
11 proporsi dari ladang yang di irigasi
dan
NPNy i
N
i
i 1
2
Jadi, masalah yang ada dalam memperkirakan proporsi populasi adalah dengan
mendefinisikan varians seperti diatas. Apabila 1n unit sample diambil dengan SRS dan
ukuran n yang memiliki karakteristik tertentu, maka proporsi sampel diberikan dengan
./1 nnp Sehingga :
-
npynyn
i
i
n
i
i 1
2
1
1
Karena itu, estimasi tidak bias dari P adalah
pnnp )/( 1 (2.4.1)
TEOREMA 2.4.1 Pada penarikan sampel tanpa pengembalian (WOR), varians dari p adalah :
)1(
)1(
)1(
)()(
Nn
NPQf
Nn
PQnNpV (2.4.2)
Dimana PQ 1 . Pembuktiannya adalah :
Bukti 1. Dalam pengambilan sampel tanpa pengembalian (WOR), varians dari p adalah
nPQpV /)( (2.4.3)
Bukti 2. Varians dari pNN 1 , perkiraan total untuk beberapa unit dengan beberapa
karakteristik tertentu adalah :
)1(/)()( 21 NnPQnNNNV (2.4.4)
TEOREMA 2.4.2 Pada pengambilan sampel tanpa pengembalian (WOR), perkiraan tidak
bias dari )( pV adalah :
)1/()1()( npqfpv (2.4.5)
Pembuktiannya :
Bukti 1. Pada pengambilan sampel dengan pengembalian (WR), estimasi tidak bias dari
)( pV adalah :
)1/()( npqpv (2.4.6)
Bukti 2. Estimasi tidak bias dari varians untuk NpN 1 adalah :
)1/()1()1/()()( 21 npqNfnpqnNNNv (2.4.7)
Bukti 3. Koefisien variasi dari p adalah :
-
2/12/1
]/[]/[
nPQP
nPQCV (2.4.8)
CONTOH 2.4. Daftar pemilih dalam suatu lomba disuatu kota yang mengukur kebenaran
usia tiap orang sebanyak 3000. Diambil sampel sebanyak 300 nama secara SRS, dimana 51
orang diketahui menunjukkan umur yang salah. Perkirakan total dari pemilih yang memiliki
kesalahan dalam menggambarkan usia dan perkirakan standart error-nya.
Dimana ;
17.0,51,300,3000 1 pnnN
Estimasi total dari pemilih yang melakukan kesalahan dalam menggambarkan usia mereka
dapat dijelaskan oleh :
510)17.0)(3000( 1 NpN
(i) Jika sampel diambil dengan pengembalian (WR), perkiraan standart error-nya adalah
2/1 )]1/([1
npqNsN
2/1]50/)83.0)(17.0[(3000
3.159
(ii) Jika sampel diambil tanpa pengembalian (WOR), perkiraan standart error-nya adalah :
2/1 )]1/()1[(1
npqfNsN
2/1]50/)83.0)(17.0)(10.01[(3000
1.151
2.5. Kombinasi dari estimasi yang tidak bias
Ada situasi dimana beberapa sampel dapat diperkirakan karena sampel-sampel
tersebut diklasifikasikan menjadi 2 kombinasi. Jika ti (I = 1,2,,m) merupakan estimasi
tidak bias dari parameter , dimana satu dan lainnya dianggap saling bebas, maka estimasi
gabungannya adalah :
m
i
i mtt1
/ (2.5.1)
-
juga adalah estimasi yang tidak bias dari . Varians dari t adalah :
m
i
i mtvtV1
2/)()( (2.5.2)
dan estimasi varians-nya adalah :
m
i
i mmtttv1
2 )1(/)()( (2.5.3)
Kita akan mempergunakannya dalam kasus-kasus sebagai berikut :
(i) SRS dalam variabel (ii) SRS dalam kebijaksanaan.
2.5.1 SRS dalam variable
Apabila myyy ,...,, 21 adalah rata-rata sampel, dimana setiap variabel adalah saling
bebas, dengan banyak sampel masing-masing adalah n1, n2,, nm . Perkiraan gabungan dari
semua sampel tersebut adalah :
(i) Estimasi m dengan rata-rata aritmatik
m
i
i myy1
/' (2.5.4)
(ii) Estimasi m dengan rata-rata tertimbang
m
i
ii nyny1
/'' (2.5.5)
dimana,
m
i
inn1
Jika sampel diambil dengan pengembalian
Varians sampling dari 'y dan ''y adalah :
m
i
i
m
i
i nim
myVyV1
2
2
1
2 //)()'(
(2.5.6)
Dan
-
n
nyVnyVm
i
ii
2
1
22 /)(.)''(
(2.5.7)
Estimator tidak bias dari )'(yV dan )''(yV berasal dari :
m
i
i mmyyyv )1(/)'()'(2 (2.5.8)
Dan
in
j
ij
m
i
nnyyyv )1(/)''()''( 2 (2.5.9)
Hal ini akan menunjukkan bahwa perkiraan seperti pada (2.5.5) jauh lebih efisien jika
dibandingkan dengan hubungan pada (2.5.4) dan dapat diuji dengan membandingkan variasi
keduanya dalam satu kasus.
Jika sampel diambil tanpa pengembalian
Varians sampling dari 'y dan ''y adalah sebagai berikut :
m
i
iii
m
i
i nmSfmyVyV222 /)1(/)()'( (2.5.10)
dan
m
i
inNnn
SyV 2
2 11)''( (2.5.11)
Estimasi tidak bias dari )'(yV dan )''(yV diperoleh dari :
m
i
iii nmsfyv22 /)1()'( (2.5.12)
dan
m
i
iii nsfnyv22 /)1()''( (2.5.13)
2.5.2. SRS dalam kebijaksanaan (attributes)
Hasil yang diperoleh pada bagian sebelumnya dapat diterapkan kedalam SRS dengan
attributes ini. Jika p1, p2,,pm adalah proporsi sampel sebanyak m dengan ukuran masing-
masing sampel n1, n2, , nm , dengan asumsi bahwa masing-masing saling independent.
Estimasi gabungan dari semua sampel dapat diberikan sebagai berikut :
-
(i) Estimasi m dengan rata-rata aritmatik
m
i
i mpp / (2.5.14)
(ii) Estimasi m dengan rata-rata tertimbang
m
i
ii npnp / (2.5.15)
Dimana;
m
i
inn
Jika sampel diambil dengan pengembalian
Varians sampling dari p dan p adalah sebagai berikut :
m
i
i
m
i
i nmPPmpVpV22 /)1(/)()( (2.5.16)
Dan
nPPnpVnpVm
i
ii /)1(/)(.)(22 (2.5.17)
Estimasi tidak bias dari )'( pV dan )''( pV diperoleh dari :
m
i
i mmpppv )1(/)()'(2 (2.5.18)
Dan
m
i
iiii nnppnpv )1(/)1()''(2 (2.5.19)
Estimator lainnya adalah :
npppv /)1()''( (2.5.20)
Jika sampel diambil dengan pengembalian
Varians sampling dari 'p dan ''p adalah :
-
m
i
ii mNnPPnNpV2)1(/)1()()'( (2.5.21)
Dan
m
i
ii NnPPnNpV )1(/)1()()''( (2.5.22)
Estimasi tidak bias dari )'( pV dan )''( pV diperoleh dari :
m
i
i mmpppv )1(/)'()'(2 (2.5.23)
Dan
m
i
iiiii nNnppnnNpv )1(/)1()()''(22 (2.5.24)
2.6. Batas Kepercayaan
Setelah memperkirakan (estimasi) nilai parameter yang tidak diketahui, penting bagi
kita untuk mengetahui atau mengukur kepercayaan dan tingkat ketelitian (kebenaran) dari
perhitungan estimasi yang kita dapat dan untuk membuat beberapa batasan tertentu dengan
memberikan tingkat kepercayaan / kebenarannya. Jika kita mengasumsikan bahwa estimator
y berdistribusi normal terhadap rata-rata populasi Y , batas bawah dan batas atas untuk rata-
rata populasi Y adalah :
2/1
)1,( ]/)1[(. nfstyY nL (2.6.1)
Dan
2/1
)1,( ]/)1[(. nfstyY nU (2.6.2)
Dimana t(,n-1) adalah nilai dari tabel student-t dengan (n-1) sebagai derajat bebas dan
merupakan tingkat kesalahan atau peluang melakukan kesalahan dalam perhitungan. Sama
halnya dengan batas kepercayaan dari total populasi dapat dituliskan sebagai berikut :
2/1)1,( ]/)1[(.. nfsNtyNY nL (2.6.3)
Dan
2/1)1,( ]/)1[(.. nfsNtyNY nU (2.6.4)
-
CONTOH 2.5. Tanda tangan untuk sebuah permohonan dikumpulkan dalam 700 lembar.
Setiap lembar diberi tempat sebanyak 50 tanda tangan, tapi para pemberi tanda tangan
meletakkan tanda tangan mereka dengan tidak teratur sehingga banyaknya tanda tangan tiap
lembar tidak dapat dipastikan jumlahnya. Dalam pengumpulan, terdapat 12 lembar yang
mengalami gangguan atau hilang. Kemudian diambil sampel secara acak sebanyak 50 lembar
dan jumlah tanda tangan per lembar dukumpul dan hasilnya adalah seperti tabel dibawah ini :
Banyaknya Tanda
tangan (yi)
Banyaknya Lembaran
(ni)
52
51
46
42
40
37
32
29
27
15
14
10
8
1
2
21
8
7
2
2
1
1
2
1
1
1
Perkirakan total tanda tangan untuk permohonan tersebut dan perhitungkan batas
kepercayaannya sebesar 95%.
Yang kita ketahui,
50,68812700 innN
84820,1992 2 iiii ynyn
Sehingga, perkiraan total tanda tangan adalah
50/)1992)(688(. yNY
410.27
Dan
)1/()( 22 nyyns ii
-
]50/)1992(84820[49
1 2
55,10s
Karena itu, selang kepercayaan dengan tingkat kepercayaan 95% adalah :
184.13)55,10)(688)(96,1(27410 LY
636.41)55,10)(688)(96,1(27410 UY
2.7. Perkiraan Ukuran Sampel
Dalam merencanakan survey sampel untuk memperkirakan parameter populasi, salah
satu pertanyaan terpenting adalah bagaimana menentukan banyaknya sampel yang akan
digunakan. Hal tersebut dilakukan dengan tingkat atau derajat ketelitian (Presisi) yang
diperbolehkan dan dengan tingkat kepercayaan tertentu. Sebelum kita membahas mengenai
perbedaan metode penarikan sampel yang digunakan, mari kita lihat pendekatan solusi secara
umum pada masalah perkiraan ukuran atau banyaknya sampel yang digunakan.
Apabila z merupakan jumlah kesalahan dari estimasi dan l(z) merupakan kerugian
yang dibuat dalam pengestimasian tersebut. Untuk metode penarikan sampel yang digunakan,
teori yang ada akan menyediakan bagi kita fungsi kepekatannya. Jadi, nilai harapan dari
kehilangan/kerugian dari banyaknya sampel yang digunakan dapat dihtung dari :
][ )()( zn lEL (2.7.1)
Dan apabila kita juga mempetimbangkan fungsi biaya untuk ukuran sampel n, dinotasikan
sebagai berikut :
cnaC n )( (2.7.2)
Dimana a adalah biaya pendahuluan dan c merupakan biaya setiap unit dalam metode
penarikan sampel tersebut.
Hubungan kombinasi (2.7.1) dengan (2.7.2), kita mendapatkan total kerugian, yaitu :
)()()( nn CLn (2.7.3)
Dimana adalah jumlah tetap (konstan).
Apabila dalam penarikan sampel dimaksudkan untuk meminimumkan kerugian,
banyaknya n dipilih melalui rumus (2.7.3) yang diperkecil.
Dengan menurunkan )(n dan mendapatkan n serta menyamakan 0/ n , nilai dari n
yang paling optimum dapat ditentukan.
-
CONTOH 2.6 Jika fungsi kerugian terhadap kesalahan/error dalam estimasi proportional
dengan Yy dan jika biaya total dalam survey adalah cnaC , tunjukkan bahwa dengan
metode SRS, fpc diabaikan, ukuran n optimum adalah :
,2/ 3/2 ck dimana k adalah konstan.
Disini Yyl z )(
Atau Yykl z 1
)(
Dimana k1 juga konstan.
Jadi,mengikuti
nkYyEkL n /.211
)(
[dengan asumsi bahwa y terdistribusi )/,( nYN ]
Karena itu,
nkcnan /.2
)( 1
nkcna /.2
Kemudian diturunkan dan disamakan 0/ n , kita peroleh :
3/22/. ckn
Dengan tindakan yang sama dan analisis dapat dipakai untuk beberapa metode penarikan
sampel dimana fungsi kerugian adalah kebalikan dari proportional untuk n dan fungsi biaya
juga merupakan fungsi dari n. pembahasan secara umum ditunjukkan oleh Yates(1960),
Raiffa dan Schlaifer(1961), Chaudhary(1977), dan Chaudhary dan Singh(1979) yang
membahas garis tentang metode berangkai. Untuk pembahasan yang diklasifikasikan atau
dikelompokkan, nilai yang baik dari metode ini dibahas oleh Nordin(1944), Blythe(1945),
Deming(1950) dan Tippett(1950).
Sekarang mari kita menguraikan hasil dari SRS untuk karakteristik yang dapat diukur
secara kuantitatif. Apabila marginal error (presisi) yang diperbolehkan dalam
estimasi/perkiraan adalah , dan (1-) tingkat kepercayaan/ketelitian. Rata-rata sampel y
diasumsikan terdistribusi normal dengan rata-rata populasi Y dan varians :
-
n
S
N
nNyV
2
.)(
)(
Karena itu,
2/12
),( .
n
S
N
nNt (2.7.4)
Dimana t(, ) adalah nilai variasi bersama yang diberikan (1-), dimana ;
222222 /1// NSttSn (2.7.5)
(i) Jika fpc diabaikan,didapat
2
22
0
St
n (2.7.6)
(ii) Jika fpc tidak diabaikan, kita bias mendapatkan nilai n dengan meletakkan nilai dari n0 kedalam Eq. (2.7.5) dan kita peroleh :
)/1/( 001 Nnnn (2.7.7)
CONTOH 2.7. Sebuah studi tentang metode sampling dalam sebuah populasi mempunyai
500 unit sampling. Nilai total yang didapat 49Y dan 6,442 S . Dalam SRS, berapa
banyak unit sampel yang dapat dipilih untuk memperkirakan Y dengan maerginal error 10%
dan koefisien kepercayaan 95%, ketika penarikan sampel dilakukan dengan (i) metode
pengembalian, (ii) dengan metode tanpa pengembalian?
(i) Sampling dengan pengembalian (WR). Dalam kasus ini, kita dapat mengabaikan fpc/kpt dan diperoleh :
8136,7)9,4(
6,44)96,1(2
2
2
22
0
St
n
(ii) Sampling tanpa pengembalian (WOR). Dalam kasus ini, fpc tidak diabaikan dan diperoleh :
8035,7/1 0
0
Nn
nn
Dengan cara yang sama, kita juga dapat membahas hasil ketika unit sampel diklasifikasikan /
dikelompokkan berdasarkan karakteristik yang ada. Dengan dugaan yang sama, proporsi
sampel p dapat diasumsikan berdistribusi normal dengan P dan varians (N-n)P(1-P)/n(N-1).
Karena itu, nilai dari n sebelum diberikan, tingkat ketelitian dapat di estimasi dengan
2/1
),( )]1(/)1()[( NnPPnNt (2.7.8)
dimana t(, ) memiliki pengertian yang sama seperti yang diberikan dalam hubungan (2.7.4),
dimana diberikan :
-
(i) Pengambilan sampel dengan pengembalian Dalam kasus ini kita dapat mengabaikan kpt, sehingga diperoleh :
3850025,05,05,096,11 2220 PPtn
(ii) Pengambilan sampel dengan tanpa pengembalian Dalam kasus ini, kpt tidak dapat diabaikan dan kita peroleh :
352
11 0
01
Nn
nn
KUMPULAN PERMASALAHAN
2.1.Diketahui pada suatu daftar terdapat N pabrik dengan penomoran secara terurut, m
pabrik sudah tidak beroperasi lagi dan n pabrik baru telah ditambah ke daftar
pembuatan jumlah pabrik nmN Berikan prosedur sederhana untuk pemilihan satu pabrik dengan alokasi sama dari
nmN pabrik, untuk menghindari penomoran ulang N pabrik pabrik dan tunjukkan bahwa prosedur yang Anda berikan menggunakan alokasi sama untuk
pabrik pabrik yang baru.
2.2.Dengan bantuan angka random, buatlah sampel acak, masing masing berukuran 5
dengan mengikuti :
(i) Populasi Cauchy :
22
1
xxf dimana x
8,3 cm dan 1,2 cm
(ii) Populasi normal :
22 2exp2
1
xxf dimana x
8 dan 2
(iii) Populasi Bivariate Normal, dimana rata rata dari 2 peubah x dan y aalah 68 cm dan 170 kg, standar deviasi dari x dan y adalah 3cm dan 7 kg dan koefisien
korelasi p adalah :
(i) + 1 (ii) dan (iii) 1
2.3.Prosedur yang dilakukan telah menggunakan pemilihan sampel lahan untuk
eksperimen crop-cutting kuantitas padi :
-
Sebaliknya, nomor setiap desa terpilih ditunjukkan dala 3 angka random yang
nilainya lebih kecil daripada angka survey tertinggi. Angka angka random tersebut menggambarkan tiga lahan padi untuk eksperimen crop-cutting. Jika
angka survey terpilih menunjukkan bahwa padi tidak tumbuh, maka pilih angka
survey pertumbuhan padi selanjutnya di tempat lain.
Uji bahwa metode di bawah akan memberikan kemungkinan yang sama termasuk
pada sampel untuk keseluruhan angka survey pertumbuhan padi, diberikan sebagai
berikut :
(i) Nama desa Payagpur (ii) Total jumlah survey 299 (iii) Angka random 28, 189, 269 (iv) Jumlah survey pertumbuhan padi 39 - 88 dan 189 - 299
Tunjukkan bahwa angka survey 39 memiliki kemungkinan 39/299 termasuk
dalam sampel, angka survey 189 kemungkinannya 101/299, sementara angka
survey selanjutnya hanya mempunyai kemungkinan 1/299 untuk masing masing angka.
2.4. Suatu populasi terdiri dari N unit, nilai peubah dari satu unit diketahui menjadi yo.
Suatu sampel acak WOR dilemparkan sehingga menjadi (N-1) unit. Tunjukkan bahwa
perkiraan
yNy 10 memiliki varians yang lebih kecil daripada Ny didasarkan
pada sampel acak, WOR, jumlah n diambil dari populasi tersebut.
2.5.
(i) Diketahui pengambilan sampel acak sederhana (SRS). Apakah rata rata sampel konsisten dan unbiased estimator untuk rata rata populasi ? Tunjukkan varians rata rata sampel dan juga perkiraan varians unbiased. Apakah jumlah sampel dapat mewakili perkiraan rata rata populasi dengan diberikan suatu standar error?
(ii) Jika 1n dari unit unit sampel adalah tipe A, tunjukkan estimasi proporsi yang
unbiased dari unit unit tipe A dalam populasi and pengambilan sampel varians serta perkirakan jika ukuran sampel cukup besar dengan 95% tingkat keyakinan
dari proporsi unit yang tidak diketahui tipe A dalam populasi.
2.6.Diketahui v menghilangkan perbedaan unit unit yang terjadi dalam suatu sampel n unit unit terpilih dengan alokasi sama dengan pengembalian dari suatu populasi N
unit unit. Perlihatkan bahwa estimator
v
i
iv vyy adalah unbiased untuk rata
rata populasi. Jelaskan suatu unbiased estimator varians dari estimator tersebut.
2.7.Dari suatu sampel acak n unit unit, suatu bagian sampel acak, m unit unit dilemparkan tanpa pengembalian dan bertambah ke sampel asal. Perlihatkan bahwa
rata rata pada (n+m) unit unit adalah suatu unbiased estimator dari populasi rata rata dan rasio varians tersebut memiliki rata rata mula mula n unit dengan
perkiraan 2131 nmnm . Asumsikan bahwa populasi berukuran besar. 2.8.Diketahui nilai varians dari suatu pelemparan sampel acak sederhana dengan tanpa
pengembalian dari suatu populasi terbatas.
N bola bola terletak dalm sebuah container besar, dilemparkan secara rando dari suatu penambahan Mp merah dan Mq bola bola putih. Kemudian sampel n bola bola dilemparkan secara acak dari container sampel. Hal ini menujukkan bahwa selain
n bola bola tersebut, r adalah merah. Carilah v(r) dimana N bola bola diletakkan ke container besar.
-
(i) dengan pengembalian (ii) dengan tanpa pengembalian
2.9.Varians rata rata sampel pada SRS adalah :
111 2
NyNyNnyVN
i
i
Penulisan unbiased estimator V(y) oleh v dengan catatan bahwa :
N
i
i
n
i
i yyn
NE 22. 22 YvyE
Sehingga
n
i
i vyNyn
NE
NNnvE 22.
1
1.
11
2.10. Suatu produksi dalam kuintal untuk sejumlah padi yang tumbuh pada 200 desa pada tehsil, halaman 44.
( Gambar dalam pasangan indicator angka desa )
(i) Pemilihan sampel acak sederhana dengan jumlah 20 dan 25 unit dan perkirakan rata rata lahan per luas diketahui standar errornya sebagai dasar terpilihnya unit.
(ii) Buatlah 95% interval kepercayaan dan interpretasikan. (iii)Berapakah jumlah sampel yang diberikan dari estimasi rata rata lahan dengan 55
standar error.
(1) 20 (2) 21 (3) 32 (4) 41 (5) 55
(6) 22 (7) 64 (8) 42 (9) 28 (10) 35
(11) 25 (12) 25 (13) 24 (14) 32 (15) 75
(16) 28 (17) 29 (18) 38 (19) 19 (20) 19
(21) 16 (22) 28 (23) 30 (24) 29 (25) 29
(26) 19 (27) 37 (28) 34 (29) 31 (30) 35
(31) 29 (32) 19 (33) 27 (34) 42 (35) 39
(36) 11 (37) 26 (38) 21 (39) 45 (40) 61
(41) 16 (42) 29 (43) 32 (44)32 (45) 63
(46) 30 (47) 21 (48) 35 (49) 28 (50) 18
(51) 24 (52) 32 (53) 23 (54) 8 (55) 35
(56) 27 (57) 35 (58) 25 (59) 29 (60) 29
(61) 25 (62) 31 (63) 38 (64) 31 (65) 43
(66) 21 (67) 36 (68) 30 (69) 37 (70) 47
(71) 15 (72) 27 (78) 36 (79) 28 (80) 43
-
(81) 28 (82) 25 (83) 31 (84) 6 (85) 4
(86) 22 (87) 24 (88) 39 (89) 71 (90) 44
(91) 24 (92) 34 (93) 18 (94) 28 (95) 10
(96) 70 (97) 20 (98) 32 (99) 42 (100) 47
2.11. Bahan bahan untuk membangun 5000 sumur telah diberitakan selama tahun 1964 pada suatu wilayah sebagai bagian dari Grow-more-Food Campaign di India. Daftar
penyelenggaraan yang diberitakan bersama dengan lokasi tujuan masing masing sumur sebenarnya membangun dan menggunakannya untuk tujuan irigasi. Sampel
dimaksudkan untuk terpilih dalam SRS. Diketahui julah sampel untuk nilai p
berkisar antara 0,5 sampai 0,9, jika dapat dimungkinkan MoE (batas kesalahan)
adalah 10% dan tingkat kepercayaan 95%.
2.12. Suatu data menunjukkan hubungan suatu jumlah laktat dari produksi susu (dalam kg) 250 sapi di suatu daerah peternakan.
(i) Pilihlah sampel acak sederhana sebanyak 25. (ii) Perkirakan rata rata dengan menggunakan standar error. (iii)Buatlah perkiraan rata rata populasi dengan tingkat keyakinan 95%. 230 293 163 290 200 173 194 322 169 230
297 151 248 271 259 214 167 207 240 286
184 248 327 338 165 177 270 177 202 155
155 293 190 172 150 319 151 118 213 114
186 167 129 185 231 199 265 306 173 276
291 231 205 220 246 239 186 299 233 208
265 204 300 195 239 173 237 282 221 218
197 215 213 290 146 232 305 184 149 267
188 219 171 99 329 199 180 225 257 202
189 207 792 327 201 300 206 199 299 153
175 287 277 230 258 137 174 301 260 282
211 212 284 214 283 139 223 212 207 224
207 111 272 192 127 303 221 187 309 263
203 176 233 239 176 218 193 243 236 275
288 198 241 219 167 193 234 179 126 173
279 178 275 260 191 174 235 338 242 238
211 187 184 189 305 221 253 225 327 203
-
195 158 156 185 170 271 160 188 165 218
312 143 267 298 196 139 205 298 238 217
145 201 313 230 185 166 147 223 271 133
155 230 287 329 265 150 286 271 268 198
214 231 163 335 198 270 187 174 163 201
192 247 247 297 178 240 290 234 170 227
230 353 170 159 236 181 230 240 212 242
151 158 253 179 263 158 250 226 246 301
2.13. Distribusi frekuensi dari 232 kota di beberapa negara dengan ukuran populasi dalam ribuan (000) adalah sebagai berikut :
Ukuran kelas
populasi
Jumlah
kota
50 - 75 81
75 - 100 45
100 - 150 42
150 - 200 14
200 - 250 9
250 - 300 5
300 - 350 6
350 - 400 5
400 - 450 5
450 - 500 2
500 - 550 2
550 - 600 3
600 - 650 1
650 - 700 1
700 - 750 0
750 - 800 1
800 - 850 2
-
850 - 900 1
900 - 950 2
950 - 1800 0
1800 - 1850 1
1850 - 1950 0
1950 - 2000 1
2000 - 2050 0
2050 - 2100 1
2100 - 3600 0
3600 - 3650 1
3650 - 7850 0
7850 - 7900 1
Hitunglah standar error dari perkiraan rata rata populasi, dimana :
(i) Suatu sampel dari 50 kota dipilih secara SRS WOR, dan (ii) Dua kota terbesar pasti terdapat dalam survey dan hanya 48 kota dipilih dari
230 kota dengan SRS WOR.
2.14. Dalam sebuah survey pertanian, 36 sampel diambil secara SRS WOR dari 432 populasi yang terdapat di desa tersebut. Hubungan data dengan ukuran wilayah
dicatat dalam data berikut :
No. urut
RT
Ukuran luas
lahan
1 21,04
2 12,59
3 20,30
4 16,16
5 23,82
6 1,79
7 26,91
8 7,41
9 7,68
-
10 66,55
11 141,80
12 28,12
13 8,29
14 7,27
15 1,47
16 1,12
17 10,67
18 5,94
19 3,15
20 4,84
21 9,07
22 3,69
23 14,61
24 1,10
25 22,13
26 1,68
27 49,58
28 1,68
29 4,80
30 12,72
31 6,31
32 14,18
33 22,19
34 5,50
35 25,29
36 20,99
-
Perkirakan dengan standar error proporsi wilayah 4321 ,,, PPPP dalam 4 wilayah kelas
0 4,99; 5,00 9,99; 10,00 24,99 dan lebih dari 25.
DAFTAR PUSTAKA
Blyth, R. H., The economics of sample size applied to the scaling of saw logs. Bio, Bull, 1, 67-70, (1945).
Chaudhary, F. S. Sequential approach to sample surveys, Ph. D. thesis, Meerut University,
(1977).
Chaudary, F. S. and D. Singh, Sequential estimation of population and sample sizes, (unpublished), (1979).
Deming, W. E., Some theory of sampling, John Wiley and Sons, New York, (1950).
L.C. A. R., Sample surveys for the estimation of yield of food crops, Bull, 72, New Delhi, (1951)
Mathai, A. On selecting random numbers for large scale sampling, Sankhya, 13, 157 160. (1954).
Nordin, J. A., Determining sample size, J. Amer. Statist.Assoc., 39, 497 506, (1944).
Raiffa, H. and R. Schlaifer, Applied Statistical Decision Theory, Harvard Bussiness School,
Boston, (1961).
Tippett, L. H. C., Technological application of statistics, John Willey & Sons, New York,
(19500.
Yates, F. Sampling methods for cencuses and survey, Charles Griffin and Co., London,
(1960).