simple random sampling

2

Dasar Metode Simple Random Sampling

1.1 SIMPLE RANDOM SAMPLING

Metode yang paling sederhana dan paling umum dari metode sampling adalah simple

random sampling (SRS) dimana sampel diambil unit per unit, dengan peluang yang masing-

masing eleman mempunyai peluang sama untuk terpilih sebagai sampel. Dengan demikian

SRS adalah metode memilih n unit sampling dari sebuah populasi berrukuran N dengan

peluang yang sama bagi semua elemen atau prosedur sampling yang mungkin dari n unit

yang bisa dibentuk dari N unit populasi mempunyai peluang yang sama dalam pemilihan.

SRS juga kadang-kadang disebut sampling acak yang tak terbatas. Jika n unit dipilih dan

dicatat kemudian dikembalikan ke populasi sebalum pengambilan berikutnya dibuat dan

prosedur ini diulangi n kali, langkah ini dikenal sebagai SRS dengan pemuluhan (with

replacement). Jika prosedur ini diulang sampi n unit yang berbeda yang dipilih dan semua

pengulangan diabaikan, pemilihan ini disebut SRS tanpa pengembalian (without replacement)

THEORMA 2.1.1 peluang unit yang telah ditentukan dari sebuah populasi yang dipilih dari

beberapa pengambilan yang ditentukan adalah sama dengan peluang pengambilan yang

pertama.

Bukti.

Peluang unit yang dispecifikan dipiulih sampai pengambilan ke r secara jelas hasilnya

(a) peluang unit tidak dipilih dalam pengambilan tertentu (r-1) dan (b) peluang terpilih

dalam pengambilan ke r dengan kondisi ini, init tak terpilih dalam pengambilan sebelumnya

(r-1) peluang (a) ditentukan dengan

....

=

Peluang (b) ditentukan dengan karena itu peluang yang dibutuhkan

adalah

yang independen diistilahkan r yang menunjukan nomer pengambilan

THEOREMA 2.1.2 peluang unit yang ditentukan menjadi masukan dalam sampel sama

dengan

Bukti

N menunjukan jumlah sampel sehingga unit yang dijadikan sampel dalam n

pengambilan, peluang unit yang dijadikan sampel merupakan peluang dari n peristiwa yang

saling bebas viz. hal ini tercangkup dalam sampel saat pengambilan pertama, kedua hingga

ke n. seperti yang ditunjukkan theorem 2.1.1 peluang masing-masing unit adalah

sedangkan peluang terpilihnya dalam sampel adalah

.

Kesimpulan 1. peluang sampel terpilih dari n unit adalah ( )

Kesimpulan 2. Jika populasi N unit m unit dihilangkan dan ditambah m maka peluang

terpilih setiap unit adalah( )

1.2 PREOSEDUR PEMILIHAN SAMPEL ACAK

Karena teori sampling berdasarkan sumsi random sampling, teknik random sampling

mempunyai dasar yang penting. Beberapa prosedur yang digunakan dalam memilih sampel

acak adalah sebagai berikut

i. Metode Undian ii. Menggunakan Tabel Angka Random

2.2.1 Metode Undian

Dalam praktek, karcis atau undian dapat dianggap merupakan bagian dari unit sebuah

populasi. Jadi, setiap unit sampel mempunyai tanda pengenal sendiri dari 1 sampai dengan N.

Prosedur dalam memilih setiap unit sampel sangat sederhana. Semua karcis atau undian

dimasukkan dalam suatu wadah seperti alat logam berbentuk bola, dimana memungkinkan

untuk diacak secara cermat sebelum diadakan pengambilan. Pengambilan setiap karcis dapat

diteruskan sampai ukuran sampel yang dibutuhkan didapatkan.

Prosedur menomori setiap karcis dan mengambil satu sampel setelah diacak menjadi

tidak praktis jika ukuran populasi besar. Dalam praktek akan menjadi lebih sulit untuk

mendapatkan pengacakan yang cermat. Kesalahan pengamatan manusia akan mempengaruhi

keabsahan metode ini.

2.2.2 Menggunakan Tabel Angka Random

Sebuah tabel angka random terdiri atas susunan angka-angka dari 0 sampai 9, yang

disusun dalam bentuk linier atau pola persegi panjang (tabel), dimana setiap posisi berisikan

satu dari nomor tersebut. Tabel angka random juga disusun dari angka 0, 1, 2, . . . , 9 dimana

setiap angka bersifat independen terhadap angka lainnya. Beberapa tabel angka random yang

umum digunakan yaitu :

i. Tabel angka random Tippett ii. Tabel Fisher dan Yates

iii. Tabel Kendall dan Smith iv. Satu juta angka acak

Untuk memastikan apakah seri angka random ini benar-benar merupakan angka acak,

beberapa tes berikut ini dapat digunakan :

i. Tes frekuensi ii. Tes berseri

iii. Gap test iv. Poker test

Metode praktis untuk memilih sampel secara acak adalah dengan memilih unit sampel

satu per satu dengan bantuan tabel angka random. Dengan mengambil dua buah angka, kita

mendapatkan angka untuk unit sampel dari 00 sampai 99, dan semuanya mempunyai

frekuensi yang sama. Dengan cara yang sama, tiga atau lebih kombinasi angka bisa

didapatkan dengan mengkombinasikan tiga atau lebih baris atau kolom tabel tersebut.

Cara sederhana dalam memilih sampel yang dibutuhkan adalah dengan memilih

angka acak dari 1 sampai dengan N dan kemudian memilih unit yang sesuai dengan angka

tersebut. Prosedur ini meliputi angka yang tidak terpakai karena angka tersebut melebihi

besarnya N. Dalam penggunaan tabel angka random terdapat beberapa modifikasi dalam

prosedur pengambilan angka random, yaitu :

i. Pendekatan sisa ii. Pendekatan hasil bagi

iii. Pemilihan angka secara bebas

Pendekatan Sisa

Suatu ukuran populasi ditentukan sebagai N yang mempunyai sebanyak r digit angka

dan kemudian hasil perkalian dari N yang masih mempunyai jumlah digit r dianggap sebagai

N. Sebuah angka acak k dipilih dari 1 sampai N dan kemudian unit yang memiliki nomor urut yang sama dengan sisa dari hasil pembagian angka random yang terpilih (k) dengan N

dipilih sebagai sampel. Apabila sisa pembagian sama dengan nol, maka unit sampel terakhir

yang terpilih. Misalnya, N = 123, hasil perkalian dari N yang masih memiliki 3 digit angka

adalah 984. Untuk memilih sebuah unit, sebuah angka acak dari 001 sampai 984 dipilih.

Misalnya angka random yang terpilih adalah 287. kemudian 287 dibagi dengan 123, sisanya

adalah 41. Jadi, unit dengan nomor urut 41 adalah yang terpilih sebagai sampel.

Pendekatan hasil bagi

Sebuah ukuran populasi sebesar N memiliki r digit angka kemudian hasil perkalian

sebanyak r digit dari N dianggap sebagai N dimana N/ N = q. Sebuah angka acak k dipilih dari 0 sampai dengan N 1. Dengan membagi k dengan q maka hasil bagi r didapatkan dan unit dengan nomor urut r 1 adalah unit yang terpilih. Sebagai gambaran, N = 16 sedangkan N = 96 dengan q = 6. Sebua angka random yang terpilih dari 0 sampai 95 adalah 65. Dengan membagi 65 dengan 6, hasil baginya adalah 10 dan kemudian sampel yang terpilih

adalah 9.

Pemilihan angka secara bebas

Metode ini diusulkan oleh Mathai (1954). Sebuah angka acak dipilh berdasarkan digit

pertama dan yang lainnya menurut sisa dari ukuran populasi. Jika angka yang terpilih adalah

0 maka unit yang terpilih adalah unit yang terakhir. Tapi jika angka acak yang didapatkan

lebih besar dari atau sama dengan N, maka angka tersebut tidak dipakai dan prosedur ini

kembali diulang.

Contoh 2.1 Memilih contoh acak dari 11 rumah tangga dari daftar 112 rumah tangga di

sebuah desa.

(i) Dengan menggunakan 3 digit angka acak yang berada di kolom 1 sampai 3, 4

sampai 6 dan seterusnya dari tabel angka random dan angka yang tak terpakai yang lebih

besar dari 112 (angka 000 juga termasuk), kita mempunyai urutan angka yang diambil

sebagai sampel yaitu 033, 051, 052, 099, 102, 081, 092, 013, 017, 076, dan 079.

(ii) Pada prosedur diatas, angka yang lebih besar dari 112 ditolak. Oleh karenanya,

metode yang biasanya digunakan adalah pendekatan sisa yang dapa menghindari tidak

terpakainya angka random yang lebih besar dari N. Hasil perkalian terbesar dari 112 adalah

896. dengan menggunakan 3 digit angka random seperti diatas, maka angka random yang

terpilih akan memuat sampel dengan nomor urut 086, 033, 049, 097, 051, 052, 066, 107, 015,

106 dan 020.

(iii) Jika pendekatan hasil bagi diterapkan, hasil perkalian tertinggi dengan 3 digit

angka dari 112 adalah 896 sedangkan q = 8. Dengan menggunakan angka random yang sama

dan membaginya dengan 8, kita mendapatkan contoh acak bernomor urut 025, 004, 020, 026,

006, 006, 092, 041, 085, 027 dan 086 dengan metode pengembalian dan nomor urut 025, 004,

020, 026, 006, 092, 041, 085, 027, 086, dan 042 dengan metode tanpa pengembalian.

Contoh 2.2 Sepuluh kebun buah di sebuah tempat dekat dengan sebuah desa berturut-turut

mempunyai 125, 793, 970, 830, 1502, 864, 503, 106, 970, 312 pohon buah. Tariklah sebuah

sampel acak dari 10 pohon buah dengan menggunakan tabel angka random.

Kita anggap bahwa kebun buah pertama mempunyai nomor urut pohon buah dari 1

sampai 125, di kebun buah kedua dari nomor 126 sampai 918, dan seterusnya. Oleh

karenanya, angka kumulatif dari nomor urut tersebut dapat ditulis sebagai berikut, 125, 918,

1888, 2718, 4220, 5084, 5587, 6663, 6975. dengan menggunakan 4 digit angka random

seperti contoh diatas dan dengan dugaan yang serupa, kita mendapatkan sepuluh angka acak

1983, 0330, 1614, 2096, 0511, 0524, 3311, 6874, 2183 dan 6926.

Dengan angka random yang pertama 1983, kita memilih pohon yang bernomor urut

95 di kebun buah keempat. Serupa dengan yang tadi, dengan angka acak kedua 0330, kita

memilih pohon dengan nomor urut 205 di kebun buah kedua, dan seterusnya.

2.3 ESTIMATION OF POPULATION PARAMETERS

Mari kita mengasumsikan setiap unit iu dalam sebuah populasi memiliki suatu nilai

variabel iY untuk setiap karakter y. Untuk beberapa parameter, mari didefinisikan sebagai

Total populasi, N

i

iyY

Rata-rata populasi, N

i

i NYY

Varian populasi, N

i

i NYY22 )(

Dalam sebuah n contoh acak unit-unit dalam sampel 1u , 2u , . . ., nu , secara berturut-

turut mempunyai 1y , 2y , . . ., ny . Estimator dari total populasi dan rata-rata adalah

n

i

i yNyn

NY . , dan

n

i

i ynyY

Faktor nN yang ada di rumusan untuk total sampel biasanya disebut perluasan atau

peningkatan atau faktor inflasi. Kebalikanya Nn disebut fraksi sampling dan dinyatakan

dengan huruf f dalam buku ini.

Dalil 2.3.1 Dalam penarikan sampel aca sederhana, tanpa pengembalian, rata-rata sampel y

adalah estimator yang unbiased dari parameter Y dan varian samplingnya diberikan sebagai

NSfnSNnyV22 )1()1()( (2.3.1)

dimana

)1(22 NNS

Bukti Kita ketahui

2

2

22

1

1

PtPN

PPNtn (2.7.9)

(i) Jika faktor koreksi terbatas (kpt) diabaikan, maka :

220 1 PPtn (2.7.10)

(ii) Jika faktor koreksi tidak diabaikan, maka :

Nnn

n11 0

01

(2.7.11)

Contoh 2. 8

Dalam suatu populasi terdapat 4000 orang yang dipanggil untuk memberikan hak

suaranya, 50% mengembalikannya ke kotak suara. Perkiraan jumlah sampel untuk

mengestimasi proporsi orang yang mengembalikan kertas suara sehingga mempunyai

batas kesalahan (MoE) 5% dari 95% derajat kepercayaan dimana pengambilan sampel

dilakukan secara :

(iii) Pada kasus penarikan sample sederhana secara acak tanpa pengembalian (WOR),

banyaknya kemungkinan sample adalah 10 yaitu 52 . Dapat kita lihat bahwa setiap kemungkinan sample memiliki peluang yang sama untuk terpilih yaitu masing-masing 1/10.

(a) Nilai harapan dari y , yang diberikan dari hasil rata-rata pada kolom (6) dalam tabel 2.3.2,

dengan nilai 158,0 sebagai rata-rata pada populasi, hal itu membuktikan bahwa y

merupakan estimator yang tidak bias bagi Y . Selanjutnya, varians sampling yang didapatkan

dari rata-rata terhadap kuadrat error (kesalahan) yang ditunjukkan pada kolom (7) dimana

hasilnya adalah 14,55 ,dengan asumsi bahwa .

)10/3(8/3)(22 Syv

(b) Sejak varians dari sampel ( 2s , diberikan oleh 2/)(2

21 yy ), dimana hal ini akan lebih

mempermudah penghitungan, rata-rata dari 10 sampel berarti kuadrat yang ada seperti 2)(sE .

Perhatikan, 5,4810/485)(2 sE

Juga, kuadrat rata-rata populasi = 48,5

Jadi, kuadrat rata-rata sample menunjukkan estimator yang tidak bias dari kuadrat rata-rata

populasi )(2S , buktinya :

22 )( SsE

(c) Estimator dari )( yV berasal dari :

20/)(3)( 221 yyyv

Nilainya ditunjukkan oleh kolom (8) pada tabel 2.3.2. Nilai harapan (Expected Value) dari

)(yv yang di dapat dari hasil rata-rata nilai pada kolom (8) yaitu 14,55. Menunjukkan bahwa

nilai itu adalah estimasi tidak bias

10

3)()]([

2SyVyvE

2.4. Estimasi Proporsi Populasi

Sering kali, unit-unit di dalam populasi dikelompokkan kedalam dua grup (i) yang

mempunyai karakteristik khusus dan (ii) tidak memiliki karakteristik tersebut. Contohnya,

hasil panen ladang yang diari dengan ladang yang tidak diari. Apabila ladangnya diari, kita

dapat mengatakan bahwa dia memiliki karakteristik yaitu irigasi/pengairan. Jika ladang

tersebut tidak diari, dapat dikatakan bahwa ia tidak memiliki karakteristik khusus tersebut.

Jika kita ingin memperkirakan proporsi ladang yang diari, dengan populasi ladang adalah

sebanyak N ladang dan diasumsikan bahwa iy memiliki nilai 1 jika ladang tersebut diari, dan

lainnya dianggap nol (0). Dimana, total dari ladang yang diari sebagai 1N adalah bagian dari

N.

N

i

ii Ny

Jadi,

N

i

i PN

Ny

NY

1

11 proporsi dari ladang yang di irigasi

dan

NPNy i

N

i

i 1

2

Jadi, masalah yang ada dalam memperkirakan proporsi populasi adalah dengan

mendefinisikan varians seperti diatas. Apabila 1n unit sample diambil dengan SRS dan

ukuran n yang memiliki karakteristik tertentu, maka proporsi sampel diberikan dengan

./1 nnp Sehingga :

npynyn

i

i

n

i

i 1

2

1

1

Karena itu, estimasi tidak bias dari P adalah

pnnp )/( 1 (2.4.1)

TEOREMA 2.4.1 Pada penarikan sampel tanpa pengembalian (WOR), varians dari p adalah :

)1(

)1(

)1(

)()(

Nn

NPQf

Nn

PQnNpV (2.4.2)

Dimana PQ 1 . Pembuktiannya adalah :

Bukti 1. Dalam pengambilan sampel tanpa pengembalian (WOR), varians dari p adalah

nPQpV /)( (2.4.3)

Bukti 2. Varians dari pNN 1 , perkiraan total untuk beberapa unit dengan beberapa

karakteristik tertentu adalah :

)1(/)()( 21 NnPQnNNNV (2.4.4)

TEOREMA 2.4.2 Pada pengambilan sampel tanpa pengembalian (WOR), perkiraan tidak

bias dari )( pV adalah :

)1/()1()( npqfpv (2.4.5)

Pembuktiannya :

Bukti 1. Pada pengambilan sampel dengan pengembalian (WR), estimasi tidak bias dari

)( pV adalah :

)1/()( npqpv (2.4.6)

Bukti 2. Estimasi tidak bias dari varians untuk NpN 1 adalah :

)1/()1()1/()()( 21 npqNfnpqnNNNv (2.4.7)

Bukti 3. Koefisien variasi dari p adalah :

2/12/1

]/[]/[

nPQP

nPQCV (2.4.8)

CONTOH 2.4. Daftar pemilih dalam suatu lomba disuatu kota yang mengukur kebenaran

usia tiap orang sebanyak 3000. Diambil sampel sebanyak 300 nama secara SRS, dimana 51

orang diketahui menunjukkan umur yang salah. Perkirakan total dari pemilih yang memiliki

kesalahan dalam menggambarkan usia dan perkirakan standart error-nya.

Dimana ;

17.0,51,300,3000 1 pnnN

Estimasi total dari pemilih yang melakukan kesalahan dalam menggambarkan usia mereka

dapat dijelaskan oleh :

510)17.0)(3000( 1 NpN

(i) Jika sampel diambil dengan pengembalian (WR), perkiraan standart error-nya adalah

2/1 )]1/([1

npqNsN

2/1]50/)83.0)(17.0[(3000

3.159

(ii) Jika sampel diambil tanpa pengembalian (WOR), perkiraan standart error-nya adalah :

2/1 )]1/()1[(1

npqfNsN

2/1]50/)83.0)(17.0)(10.01[(3000

1.151

2.5. Kombinasi dari estimasi yang tidak bias

Ada situasi dimana beberapa sampel dapat diperkirakan karena sampel-sampel

tersebut diklasifikasikan menjadi 2 kombinasi. Jika ti (I = 1,2,,m) merupakan estimasi

tidak bias dari parameter , dimana satu dan lainnya dianggap saling bebas, maka estimasi

gabungannya adalah :

m

i

i mtt1

/ (2.5.1)

juga adalah estimasi yang tidak bias dari . Varians dari t adalah :

m

i

i mtvtV1

2/)()( (2.5.2)

dan estimasi varians-nya adalah :

m

i

i mmtttv1

2 )1(/)()( (2.5.3)

Kita akan mempergunakannya dalam kasus-kasus sebagai berikut :

(i) SRS dalam variabel (ii) SRS dalam kebijaksanaan.

2.5.1 SRS dalam variable

Apabila myyy ,...,, 21 adalah rata-rata sampel, dimana setiap variabel adalah saling

bebas, dengan banyak sampel masing-masing adalah n1, n2,, nm . Perkiraan gabungan dari

semua sampel tersebut adalah :

(i) Estimasi m dengan rata-rata aritmatik

m

i

i myy1

/' (2.5.4)

(ii) Estimasi m dengan rata-rata tertimbang

m

i

ii nyny1

/'' (2.5.5)

dimana,

m

i

inn1

Jika sampel diambil dengan pengembalian

Varians sampling dari 'y dan ''y adalah :

m

i

i

m

i

i nim

myVyV1

2

2

1

2 //)()'(

(2.5.6)

Dan

n

nyVnyVm

i

ii

2

1

22 /)(.)''(

(2.5.7)

Estimator tidak bias dari )'(yV dan )''(yV berasal dari :

m

i

i mmyyyv )1(/)'()'(2 (2.5.8)

Dan

in

j

ij

m

i

nnyyyv )1(/)''()''( 2 (2.5.9)

Hal ini akan menunjukkan bahwa perkiraan seperti pada (2.5.5) jauh lebih efisien jika

dibandingkan dengan hubungan pada (2.5.4) dan dapat diuji dengan membandingkan variasi

keduanya dalam satu kasus.

Jika sampel diambil tanpa pengembalian

Varians sampling dari 'y dan ''y adalah sebagai berikut :

m

i

iii

m

i

i nmSfmyVyV222 /)1(/)()'( (2.5.10)

dan

m

i

inNnn

SyV 2

2 11)''( (2.5.11)

Estimasi tidak bias dari )'(yV dan )''(yV diperoleh dari :

m

i

iii nmsfyv22 /)1()'( (2.5.12)

dan

m

i

iii nsfnyv22 /)1()''( (2.5.13)

2.5.2. SRS dalam kebijaksanaan (attributes)

Hasil yang diperoleh pada bagian sebelumnya dapat diterapkan kedalam SRS dengan

attributes ini. Jika p1, p2,,pm adalah proporsi sampel sebanyak m dengan ukuran masing-

masing sampel n1, n2, , nm , dengan asumsi bahwa masing-masing saling independent.

Estimasi gabungan dari semua sampel dapat diberikan sebagai berikut :

(i) Estimasi m dengan rata-rata aritmatik

m

i

i mpp / (2.5.14)

(ii) Estimasi m dengan rata-rata tertimbang

m

i

ii npnp / (2.5.15)

Dimana;

m

i

inn


Varians sampling dari p dan p adalah sebagai berikut :

m

i

i

m

i

i nmPPmpVpV22 /)1(/)()( (2.5.16)

Dan

nPPnpVnpVm

i

ii /)1(/)(.)(22 (2.5.17)

Estimasi tidak bias dari )'( pV dan )''( pV diperoleh dari :

m

i

i mmpppv )1(/)()'(2 (2.5.18)

Dan

m

i

iiii nnppnpv )1(/)1()''(2 (2.5.19)

Estimator lainnya adalah :

npppv /)1()''( (2.5.20)


Varians sampling dari 'p dan ''p adalah :

m

i

ii mNnPPnNpV2)1(/)1()()'( (2.5.21)

Dan

m

i

ii NnPPnNpV )1(/)1()()''( (2.5.22)

Estimasi tidak bias dari )'( pV dan )''( pV diperoleh dari :

m

i

i mmpppv )1(/)'()'(2 (2.5.23)

Dan

m

i

iiiii nNnppnnNpv )1(/)1()()''(22 (2.5.24)

2.6. Batas Kepercayaan

Setelah memperkirakan (estimasi) nilai parameter yang tidak diketahui, penting bagi

kita untuk mengetahui atau mengukur kepercayaan dan tingkat ketelitian (kebenaran) dari

perhitungan estimasi yang kita dapat dan untuk membuat beberapa batasan tertentu dengan

memberikan tingkat kepercayaan / kebenarannya. Jika kita mengasumsikan bahwa estimator

y berdistribusi normal terhadap rata-rata populasi Y , batas bawah dan batas atas untuk rata-

rata populasi Y adalah :

2/1

)1,( ]/)1[(. nfstyY nL (2.6.1)

Dan

2/1

)1,( ]/)1[(. nfstyY nU (2.6.2)

Dimana t(,n-1) adalah nilai dari tabel student-t dengan (n-1) sebagai derajat bebas dan

merupakan tingkat kesalahan atau peluang melakukan kesalahan dalam perhitungan. Sama

halnya dengan batas kepercayaan dari total populasi dapat dituliskan sebagai berikut :

2/1)1,( ]/)1[(.. nfsNtyNY nL (2.6.3)

Dan

2/1)1,( ]/)1[(.. nfsNtyNY nU (2.6.4)

CONTOH 2.5. Tanda tangan untuk sebuah permohonan dikumpulkan dalam 700 lembar.

Setiap lembar diberi tempat sebanyak 50 tanda tangan, tapi para pemberi tanda tangan

meletakkan tanda tangan mereka dengan tidak teratur sehingga banyaknya tanda tangan tiap

lembar tidak dapat dipastikan jumlahnya. Dalam pengumpulan, terdapat 12 lembar yang

mengalami gangguan atau hilang. Kemudian diambil sampel secara acak sebanyak 50 lembar

dan jumlah tanda tangan per lembar dukumpul dan hasilnya adalah seperti tabel dibawah ini :

Banyaknya Tanda

tangan (yi)

Banyaknya Lembaran

(ni)

52

51

46

42

40

37

32

29

27

15

14

10

8

1

2

21

8

7

2

2

1

1

2

1

1

1

Perkirakan total tanda tangan untuk permohonan tersebut dan perhitungkan batas

kepercayaannya sebesar 95%.

Yang kita ketahui,

50,68812700 innN

84820,1992 2 iiii ynyn

Sehingga, perkiraan total tanda tangan adalah

50/)1992)(688(. yNY

410.27

Dan

)1/()( 22 nyyns ii

]50/)1992(84820[49

1 2

55,10s

Karena itu, selang kepercayaan dengan tingkat kepercayaan 95% adalah :

184.13)55,10)(688)(96,1(27410 LY

636.41)55,10)(688)(96,1(27410 UY

2.7. Perkiraan Ukuran Sampel

Dalam merencanakan survey sampel untuk memperkirakan parameter populasi, salah

satu pertanyaan terpenting adalah bagaimana menentukan banyaknya sampel yang akan

digunakan. Hal tersebut dilakukan dengan tingkat atau derajat ketelitian (Presisi) yang

diperbolehkan dan dengan tingkat kepercayaan tertentu. Sebelum kita membahas mengenai

perbedaan metode penarikan sampel yang digunakan, mari kita lihat pendekatan solusi secara

umum pada masalah perkiraan ukuran atau banyaknya sampel yang digunakan.

Apabila z merupakan jumlah kesalahan dari estimasi dan l(z) merupakan kerugian

yang dibuat dalam pengestimasian tersebut. Untuk metode penarikan sampel yang digunakan,

teori yang ada akan menyediakan bagi kita fungsi kepekatannya. Jadi, nilai harapan dari

kehilangan/kerugian dari banyaknya sampel yang digunakan dapat dihtung dari :

][ )()( zn lEL (2.7.1)

Dan apabila kita juga mempetimbangkan fungsi biaya untuk ukuran sampel n, dinotasikan

sebagai berikut :

cnaC n )( (2.7.2)

Dimana a adalah biaya pendahuluan dan c merupakan biaya setiap unit dalam metode

penarikan sampel tersebut.

Hubungan kombinasi (2.7.1) dengan (2.7.2), kita mendapatkan total kerugian, yaitu :

)()()( nn CLn (2.7.3)

Dimana adalah jumlah tetap (konstan).

Apabila dalam penarikan sampel dimaksudkan untuk meminimumkan kerugian,

banyaknya n dipilih melalui rumus (2.7.3) yang diperkecil.

Dengan menurunkan )(n dan mendapatkan n serta menyamakan 0/ n , nilai dari n

yang paling optimum dapat ditentukan.

CONTOH 2.6 Jika fungsi kerugian terhadap kesalahan/error dalam estimasi proportional

dengan Yy dan jika biaya total dalam survey adalah cnaC , tunjukkan bahwa dengan

metode SRS, fpc diabaikan, ukuran n optimum adalah :

,2/ 3/2 ck dimana k adalah konstan.

Disini Yyl z )(

Atau Yykl z 1

)(

Dimana k1 juga konstan.

Jadi,mengikuti

nkYyEkL n /.211

)(

[dengan asumsi bahwa y terdistribusi )/,( nYN ]

Karena itu,

nkcnan /.2

)( 1

nkcna /.2

Kemudian diturunkan dan disamakan 0/ n , kita peroleh :

3/22/. ckn

Dengan tindakan yang sama dan analisis dapat dipakai untuk beberapa metode penarikan

sampel dimana fungsi kerugian adalah kebalikan dari proportional untuk n dan fungsi biaya

juga merupakan fungsi dari n. pembahasan secara umum ditunjukkan oleh Yates(1960),

Raiffa dan Schlaifer(1961), Chaudhary(1977), dan Chaudhary dan Singh(1979) yang

membahas garis tentang metode berangkai. Untuk pembahasan yang diklasifikasikan atau

dikelompokkan, nilai yang baik dari metode ini dibahas oleh Nordin(1944), Blythe(1945),

Deming(1950) dan Tippett(1950).

Sekarang mari kita menguraikan hasil dari SRS untuk karakteristik yang dapat diukur

secara kuantitatif. Apabila marginal error (presisi) yang diperbolehkan dalam

estimasi/perkiraan adalah , dan (1-) tingkat kepercayaan/ketelitian. Rata-rata sampel y

diasumsikan terdistribusi normal dengan rata-rata populasi Y dan varians :

n

S

N

nNyV

2

.)(

)(

Karena itu,

2/12

),( .

n

S

N

nNt (2.7.4)

Dimana t(, ) adalah nilai variasi bersama yang diberikan (1-), dimana ;

222222 /1// NSttSn (2.7.5)

(i) Jika fpc diabaikan,didapat

2

22

0

St

n (2.7.6)

(ii) Jika fpc tidak diabaikan, kita bias mendapatkan nilai n dengan meletakkan nilai dari n0 kedalam Eq. (2.7.5) dan kita peroleh :

)/1/( 001 Nnnn (2.7.7)

CONTOH 2.7. Sebuah studi tentang metode sampling dalam sebuah populasi mempunyai

500 unit sampling. Nilai total yang didapat 49Y dan 6,442 S . Dalam SRS, berapa

banyak unit sampel yang dapat dipilih untuk memperkirakan Y dengan maerginal error 10%

dan koefisien kepercayaan 95%, ketika penarikan sampel dilakukan dengan (i) metode

pengembalian, (ii) dengan metode tanpa pengembalian?

(i) Sampling dengan pengembalian (WR). Dalam kasus ini, kita dapat mengabaikan fpc/kpt dan diperoleh :

8136,7)9,4(

6,44)96,1(2

2

2

22

0

St

n

(ii) Sampling tanpa pengembalian (WOR). Dalam kasus ini, fpc tidak diabaikan dan diperoleh :

8035,7/1 0

0

Nn

nn

Dengan cara yang sama, kita juga dapat membahas hasil ketika unit sampel diklasifikasikan /

dikelompokkan berdasarkan karakteristik yang ada. Dengan dugaan yang sama, proporsi

sampel p dapat diasumsikan berdistribusi normal dengan P dan varians (N-n)P(1-P)/n(N-1).

Karena itu, nilai dari n sebelum diberikan, tingkat ketelitian dapat di estimasi dengan

2/1

),( )]1(/)1()[( NnPPnNt (2.7.8)

dimana t(, ) memiliki pengertian yang sama seperti yang diberikan dalam hubungan (2.7.4),

dimana diberikan :

(i) Pengambilan sampel dengan pengembalian Dalam kasus ini kita dapat mengabaikan kpt, sehingga diperoleh :

3850025,05,05,096,11 2220 PPtn

(ii) Pengambilan sampel dengan tanpa pengembalian Dalam kasus ini, kpt tidak dapat diabaikan dan kita peroleh :

352

11 0

01

Nn

nn

KUMPULAN PERMASALAHAN

2.1.Diketahui pada suatu daftar terdapat N pabrik dengan penomoran secara terurut, m

pabrik sudah tidak beroperasi lagi dan n pabrik baru telah ditambah ke daftar

pembuatan jumlah pabrik nmN Berikan prosedur sederhana untuk pemilihan satu pabrik dengan alokasi sama dari

nmN pabrik, untuk menghindari penomoran ulang N pabrik pabrik dan tunjukkan bahwa prosedur yang Anda berikan menggunakan alokasi sama untuk

pabrik pabrik yang baru.

2.2.Dengan bantuan angka random, buatlah sampel acak, masing masing berukuran 5

dengan mengikuti :

(i) Populasi Cauchy :

22

1

xxf dimana x

8,3 cm dan 1,2 cm

(ii) Populasi normal :

22 2exp2

1

xxf dimana x

8 dan 2

(iii) Populasi Bivariate Normal, dimana rata rata dari 2 peubah x dan y aalah 68 cm dan 170 kg, standar deviasi dari x dan y adalah 3cm dan 7 kg dan koefisien

korelasi p adalah :

(i) + 1 (ii) dan (iii) 1

2.3.Prosedur yang dilakukan telah menggunakan pemilihan sampel lahan untuk

eksperimen crop-cutting kuantitas padi :

Sebaliknya, nomor setiap desa terpilih ditunjukkan dala 3 angka random yang

nilainya lebih kecil daripada angka survey tertinggi. Angka angka random tersebut menggambarkan tiga lahan padi untuk eksperimen crop-cutting. Jika

angka survey terpilih menunjukkan bahwa padi tidak tumbuh, maka pilih angka

survey pertumbuhan padi selanjutnya di tempat lain.

Uji bahwa metode di bawah akan memberikan kemungkinan yang sama termasuk

pada sampel untuk keseluruhan angka survey pertumbuhan padi, diberikan sebagai

berikut :

(i) Nama desa Payagpur (ii) Total jumlah survey 299 (iii) Angka random 28, 189, 269 (iv) Jumlah survey pertumbuhan padi 39 - 88 dan 189 - 299

Tunjukkan bahwa angka survey 39 memiliki kemungkinan 39/299 termasuk

dalam sampel, angka survey 189 kemungkinannya 101/299, sementara angka

survey selanjutnya hanya mempunyai kemungkinan 1/299 untuk masing masing angka.

2.4. Suatu populasi terdiri dari N unit, nilai peubah dari satu unit diketahui menjadi yo.

Suatu sampel acak WOR dilemparkan sehingga menjadi (N-1) unit. Tunjukkan bahwa

perkiraan

yNy 10 memiliki varians yang lebih kecil daripada Ny didasarkan

pada sampel acak, WOR, jumlah n diambil dari populasi tersebut.

2.5.

(i) Diketahui pengambilan sampel acak sederhana (SRS). Apakah rata rata sampel konsisten dan unbiased estimator untuk rata rata populasi ? Tunjukkan varians rata rata sampel dan juga perkiraan varians unbiased. Apakah jumlah sampel dapat mewakili perkiraan rata rata populasi dengan diberikan suatu standar error?

(ii) Jika 1n dari unit unit sampel adalah tipe A, tunjukkan estimasi proporsi yang

unbiased dari unit unit tipe A dalam populasi and pengambilan sampel varians serta perkirakan jika ukuran sampel cukup besar dengan 95% tingkat keyakinan

dari proporsi unit yang tidak diketahui tipe A dalam populasi.

2.6.Diketahui v menghilangkan perbedaan unit unit yang terjadi dalam suatu sampel n unit unit terpilih dengan alokasi sama dengan pengembalian dari suatu populasi N

unit unit. Perlihatkan bahwa estimator

v

i

iv vyy adalah unbiased untuk rata

rata populasi. Jelaskan suatu unbiased estimator varians dari estimator tersebut.

2.7.Dari suatu sampel acak n unit unit, suatu bagian sampel acak, m unit unit dilemparkan tanpa pengembalian dan bertambah ke sampel asal. Perlihatkan bahwa

rata rata pada (n+m) unit unit adalah suatu unbiased estimator dari populasi rata rata dan rasio varians tersebut memiliki rata rata mula mula n unit dengan

perkiraan 2131 nmnm . Asumsikan bahwa populasi berukuran besar. 2.8.Diketahui nilai varians dari suatu pelemparan sampel acak sederhana dengan tanpa

pengembalian dari suatu populasi terbatas.

N bola bola terletak dalm sebuah container besar, dilemparkan secara rando dari suatu penambahan Mp merah dan Mq bola bola putih. Kemudian sampel n bola bola dilemparkan secara acak dari container sampel. Hal ini menujukkan bahwa selain

n bola bola tersebut, r adalah merah. Carilah v(r) dimana N bola bola diletakkan ke container besar.

(i) dengan pengembalian (ii) dengan tanpa pengembalian

2.9.Varians rata rata sampel pada SRS adalah :

111 2

NyNyNnyVN

i

i

Penulisan unbiased estimator V(y) oleh v dengan catatan bahwa :

N

i

i

n

i

i yyn

NE 22. 22 YvyE

Sehingga

n

i

i vyNyn

NE

NNnvE 22.

1

1.

11

2.10. Suatu produksi dalam kuintal untuk sejumlah padi yang tumbuh pada 200 desa pada tehsil, halaman 44.

( Gambar dalam pasangan indicator angka desa )

(i) Pemilihan sampel acak sederhana dengan jumlah 20 dan 25 unit dan perkirakan rata rata lahan per luas diketahui standar errornya sebagai dasar terpilihnya unit.

(ii) Buatlah 95% interval kepercayaan dan interpretasikan. (iii)Berapakah jumlah sampel yang diberikan dari estimasi rata rata lahan dengan 55

standar error.

(1) 20 (2) 21 (3) 32 (4) 41 (5) 55

(6) 22 (7) 64 (8) 42 (9) 28 (10) 35

(11) 25 (12) 25 (13) 24 (14) 32 (15) 75

(16) 28 (17) 29 (18) 38 (19) 19 (20) 19

(21) 16 (22) 28 (23) 30 (24) 29 (25) 29

(26) 19 (27) 37 (28) 34 (29) 31 (30) 35

(31) 29 (32) 19 (33) 27 (34) 42 (35) 39

(36) 11 (37) 26 (38) 21 (39) 45 (40) 61

(41) 16 (42) 29 (43) 32 (44)32 (45) 63

(46) 30 (47) 21 (48) 35 (49) 28 (50) 18

(51) 24 (52) 32 (53) 23 (54) 8 (55) 35

(56) 27 (57) 35 (58) 25 (59) 29 (60) 29

(61) 25 (62) 31 (63) 38 (64) 31 (65) 43

(66) 21 (67) 36 (68) 30 (69) 37 (70) 47

(71) 15 (72) 27 (78) 36 (79) 28 (80) 43

(81) 28 (82) 25 (83) 31 (84) 6 (85) 4

(86) 22 (87) 24 (88) 39 (89) 71 (90) 44

(91) 24 (92) 34 (93) 18 (94) 28 (95) 10

(96) 70 (97) 20 (98) 32 (99) 42 (100) 47

2.11. Bahan bahan untuk membangun 5000 sumur telah diberitakan selama tahun 1964 pada suatu wilayah sebagai bagian dari Grow-more-Food Campaign di India. Daftar

penyelenggaraan yang diberitakan bersama dengan lokasi tujuan masing masing sumur sebenarnya membangun dan menggunakannya untuk tujuan irigasi. Sampel

dimaksudkan untuk terpilih dalam SRS. Diketahui julah sampel untuk nilai p

berkisar antara 0,5 sampai 0,9, jika dapat dimungkinkan MoE (batas kesalahan)

adalah 10% dan tingkat kepercayaan 95%.

2.12. Suatu data menunjukkan hubungan suatu jumlah laktat dari produksi susu (dalam kg) 250 sapi di suatu daerah peternakan.

(i) Pilihlah sampel acak sederhana sebanyak 25. (ii) Perkirakan rata rata dengan menggunakan standar error. (iii)Buatlah perkiraan rata rata populasi dengan tingkat keyakinan 95%. 230 293 163 290 200 173 194 322 169 230

297 151 248 271 259 214 167 207 240 286

184 248 327 338 165 177 270 177 202 155

155 293 190 172 150 319 151 118 213 114

186 167 129 185 231 199 265 306 173 276

291 231 205 220 246 239 186 299 233 208

265 204 300 195 239 173 237 282 221 218

197 215 213 290 146 232 305 184 149 267

188 219 171 99 329 199 180 225 257 202

189 207 792 327 201 300 206 199 299 153

175 287 277 230 258 137 174 301 260 282

211 212 284 214 283 139 223 212 207 224

207 111 272 192 127 303 221 187 309 263

203 176 233 239 176 218 193 243 236 275

288 198 241 219 167 193 234 179 126 173

279 178 275 260 191 174 235 338 242 238

211 187 184 189 305 221 253 225 327 203

195 158 156 185 170 271 160 188 165 218

312 143 267 298 196 139 205 298 238 217

145 201 313 230 185 166 147 223 271 133

155 230 287 329 265 150 286 271 268 198

214 231 163 335 198 270 187 174 163 201

192 247 247 297 178 240 290 234 170 227

230 353 170 159 236 181 230 240 212 242

151 158 253 179 263 158 250 226 246 301

2.13. Distribusi frekuensi dari 232 kota di beberapa negara dengan ukuran populasi dalam ribuan (000) adalah sebagai berikut :

Ukuran kelas

populasi

Jumlah

kota

50 - 75 81

75 - 100 45

100 - 150 42

150 - 200 14

200 - 250 9

250 - 300 5

300 - 350 6

350 - 400 5

400 - 450 5

450 - 500 2

500 - 550 2

550 - 600 3

600 - 650 1

650 - 700 1

700 - 750 0

750 - 800 1

800 - 850 2

850 - 900 1

900 - 950 2

950 - 1800 0

1800 - 1850 1

1850 - 1950 0

1950 - 2000 1

2000 - 2050 0

2050 - 2100 1

2100 - 3600 0

3600 - 3650 1

3650 - 7850 0

7850 - 7900 1

Hitunglah standar error dari perkiraan rata rata populasi, dimana :

(i) Suatu sampel dari 50 kota dipilih secara SRS WOR, dan (ii) Dua kota terbesar pasti terdapat dalam survey dan hanya 48 kota dipilih dari

230 kota dengan SRS WOR.

2.14. Dalam sebuah survey pertanian, 36 sampel diambil secara SRS WOR dari 432 populasi yang terdapat di desa tersebut. Hubungan data dengan ukuran wilayah

dicatat dalam data berikut :

No. urut

RT

Ukuran luas

lahan

1 21,04

2 12,59

3 20,30

4 16,16

5 23,82

6 1,79

7 26,91

8 7,41

9 7,68

10 66,55

11 141,80

12 28,12

13 8,29

14 7,27

15 1,47

16 1,12

17 10,67

18 5,94

19 3,15

20 4,84

21 9,07

22 3,69

23 14,61

24 1,10

25 22,13

26 1,68

27 49,58

28 1,68

29 4,80

30 12,72

31 6,31

32 14,18

33 22,19

34 5,50

35 25,29

36 20,99

Perkirakan dengan standar error proporsi wilayah 4321 ,,, PPPP dalam 4 wilayah kelas

0 4,99; 5,00 9,99; 10,00 24,99 dan lebih dari 25.

DAFTAR PUSTAKA

Blyth, R. H., The economics of sample size applied to the scaling of saw logs. Bio, Bull, 1, 67-70, (1945).

Chaudhary, F. S. Sequential approach to sample surveys, Ph. D. thesis, Meerut University,

(1977).

Chaudary, F. S. and D. Singh, Sequential estimation of population and sample sizes, (unpublished), (1979).

Deming, W. E., Some theory of sampling, John Wiley and Sons, New York, (1950).

L.C. A. R., Sample surveys for the estimation of yield of food crops, Bull, 72, New Delhi, (1951)

Mathai, A. On selecting random numbers for large scale sampling, Sankhya, 13, 157 160. (1954).

Nordin, J. A., Determining sample size, J. Amer. Statist.Assoc., 39, 497 506, (1944).

Raiffa, H. and R. Schlaifer, Applied Statistical Decision Theory, Harvard Bussiness School,

Boston, (1961).

Tippett, L. H. C., Technological application of statistics, John Willey & Sons, New York,

(19500.

Yates, F. Sampling methods for cencuses and survey, Charles Griffin and Co., London,

(1960).

simple random sampling

Documents