simple random sampling

25
2 Dasar Metode Simple Random Sampling 1.1 SIMPLE RANDOM SAMPLING Metode yang paling sederhana dan paling umum dari metode sampling adalah simple random sampling (SRS) dimana sampel diambil unit per unit, dengan peluang yang masing- masing eleman mempunyai peluang sama untuk terpilih sebagai sampel. Dengan demikian SRS adalah metode memilih n unit sampling dari sebuah populasi berrukuran N dengan peluang yang sama bagi semua elemen atau prosedur sampling yang mungkin dari n unit yang bisa dibentuk dari N unit populasi mempunyai peluang yang sama dalam pemilihan. SRS juga kadang-kadang disebut sampling acak yang tak terbatas. Jika n unit dipilih dan dicatat kemudian dikembalikan ke populasi sebalum pengambilan berikutnya dibuat dan prosedur ini diulangi n kali, langkah ini dikenal sebagai SRS dengan pemuluhan (with replacement). Jika prosedur ini diulang sampi n unit yang berbeda yang dipilih dan semua pengulangan diabaikan, pemilihan ini disebut SRS tanpa pengembalian (without replacement) THEORMA 2.1.1 peluang unit yang telah ditentukan dari sebuah populasi yang dipilih dari beberapa pengambilan yang ditentukan adalah sama dengan peluang pengambilan yang pertama. Bukti. Peluang unit yang dispecifikan dipiulih sampai pengambilan ke r secara jelas hasilnya (a) peluang unit tidak dipilih dalam pengambilan tertentu (r-1) dan (b) peluang terpilih dalam pengambilan ke r dengan kondisi ini, init tak terpilih dalam pengambilan sebelumnya (r-1) peluang (a) ditentukan dengan ...…. = Peluang (b) ditentukan dengan karena itu peluang yang dibutuhkan adalah yang independen diistilahkan r yang menunjukan nomer pengambilan THEOREMA 2.1.2 peluang unit yang ditentukan menjadi masukan dalam sampel sama dengan Bukti N menunjukan jumlah sampel sehingga unit yang dijadikan sampel dalam n pengambilan, peluang unit yang dijadikan sampel merupakan peluang dari n peristiwa yang saling bebas viz. hal ini tercangkup dalam sampel saat pengambilan pertama, kedua hingga ke n. seperti yang ditunjukkan theorem 2.1.1 peluang masing-masing unit adalah sedangkan peluang terpilihnya dalam sampel adalah .

Upload: rakanggonggawe

Post on 04-Sep-2015

260 views

Category:

Documents


2 download

DESCRIPTION

Sampling SRS

TRANSCRIPT

  • 2

    Dasar Metode Simple Random Sampling

    1.1 SIMPLE RANDOM SAMPLING

    Metode yang paling sederhana dan paling umum dari metode sampling adalah simple

    random sampling (SRS) dimana sampel diambil unit per unit, dengan peluang yang masing-

    masing eleman mempunyai peluang sama untuk terpilih sebagai sampel. Dengan demikian

    SRS adalah metode memilih n unit sampling dari sebuah populasi berrukuran N dengan

    peluang yang sama bagi semua elemen atau prosedur sampling yang mungkin dari n unit

    yang bisa dibentuk dari N unit populasi mempunyai peluang yang sama dalam pemilihan.

    SRS juga kadang-kadang disebut sampling acak yang tak terbatas. Jika n unit dipilih dan

    dicatat kemudian dikembalikan ke populasi sebalum pengambilan berikutnya dibuat dan

    prosedur ini diulangi n kali, langkah ini dikenal sebagai SRS dengan pemuluhan (with

    replacement). Jika prosedur ini diulang sampi n unit yang berbeda yang dipilih dan semua

    pengulangan diabaikan, pemilihan ini disebut SRS tanpa pengembalian (without replacement)

    THEORMA 2.1.1 peluang unit yang telah ditentukan dari sebuah populasi yang dipilih dari

    beberapa pengambilan yang ditentukan adalah sama dengan peluang pengambilan yang

    pertama.

    Bukti.

    Peluang unit yang dispecifikan dipiulih sampai pengambilan ke r secara jelas hasilnya

    (a) peluang unit tidak dipilih dalam pengambilan tertentu (r-1) dan (b) peluang terpilih

    dalam pengambilan ke r dengan kondisi ini, init tak terpilih dalam pengambilan sebelumnya

    (r-1) peluang (a) ditentukan dengan

    ....

    =

    Peluang (b) ditentukan dengan karena itu peluang yang dibutuhkan

    adalah

    yang independen diistilahkan r yang menunjukan nomer pengambilan

    THEOREMA 2.1.2 peluang unit yang ditentukan menjadi masukan dalam sampel sama

    dengan

    Bukti

    N menunjukan jumlah sampel sehingga unit yang dijadikan sampel dalam n

    pengambilan, peluang unit yang dijadikan sampel merupakan peluang dari n peristiwa yang

    saling bebas viz. hal ini tercangkup dalam sampel saat pengambilan pertama, kedua hingga

    ke n. seperti yang ditunjukkan theorem 2.1.1 peluang masing-masing unit adalah

    sedangkan peluang terpilihnya dalam sampel adalah

    .

  • Kesimpulan 1. peluang sampel terpilih dari n unit adalah ( )

    Kesimpulan 2. Jika populasi N unit m unit dihilangkan dan ditambah m maka peluang

    terpilih setiap unit adalah( )

    1.2 PREOSEDUR PEMILIHAN SAMPEL ACAK

    Karena teori sampling berdasarkan sumsi random sampling, teknik random sampling

    mempunyai dasar yang penting. Beberapa prosedur yang digunakan dalam memilih sampel

    acak adalah sebagai berikut

    i. Metode Undian ii. Menggunakan Tabel Angka Random

    2.2.1 Metode Undian

    Dalam praktek, karcis atau undian dapat dianggap merupakan bagian dari unit sebuah

    populasi. Jadi, setiap unit sampel mempunyai tanda pengenal sendiri dari 1 sampai dengan N.

    Prosedur dalam memilih setiap unit sampel sangat sederhana. Semua karcis atau undian

    dimasukkan dalam suatu wadah seperti alat logam berbentuk bola, dimana memungkinkan

    untuk diacak secara cermat sebelum diadakan pengambilan. Pengambilan setiap karcis dapat

    diteruskan sampai ukuran sampel yang dibutuhkan didapatkan.

    Prosedur menomori setiap karcis dan mengambil satu sampel setelah diacak menjadi

    tidak praktis jika ukuran populasi besar. Dalam praktek akan menjadi lebih sulit untuk

    mendapatkan pengacakan yang cermat. Kesalahan pengamatan manusia akan mempengaruhi

    keabsahan metode ini.

    2.2.2 Menggunakan Tabel Angka Random

    Sebuah tabel angka random terdiri atas susunan angka-angka dari 0 sampai 9, yang

    disusun dalam bentuk linier atau pola persegi panjang (tabel), dimana setiap posisi berisikan

    satu dari nomor tersebut. Tabel angka random juga disusun dari angka 0, 1, 2, . . . , 9 dimana

    setiap angka bersifat independen terhadap angka lainnya. Beberapa tabel angka random yang

    umum digunakan yaitu :

    i. Tabel angka random Tippett ii. Tabel Fisher dan Yates

    iii. Tabel Kendall dan Smith iv. Satu juta angka acak

    Untuk memastikan apakah seri angka random ini benar-benar merupakan angka acak,

    beberapa tes berikut ini dapat digunakan :

  • i. Tes frekuensi ii. Tes berseri

    iii. Gap test iv. Poker test

    Metode praktis untuk memilih sampel secara acak adalah dengan memilih unit sampel

    satu per satu dengan bantuan tabel angka random. Dengan mengambil dua buah angka, kita

    mendapatkan angka untuk unit sampel dari 00 sampai 99, dan semuanya mempunyai

    frekuensi yang sama. Dengan cara yang sama, tiga atau lebih kombinasi angka bisa

    didapatkan dengan mengkombinasikan tiga atau lebih baris atau kolom tabel tersebut.

    Cara sederhana dalam memilih sampel yang dibutuhkan adalah dengan memilih

    angka acak dari 1 sampai dengan N dan kemudian memilih unit yang sesuai dengan angka

    tersebut. Prosedur ini meliputi angka yang tidak terpakai karena angka tersebut melebihi

    besarnya N. Dalam penggunaan tabel angka random terdapat beberapa modifikasi dalam

    prosedur pengambilan angka random, yaitu :

    i. Pendekatan sisa ii. Pendekatan hasil bagi

    iii. Pemilihan angka secara bebas

    Pendekatan Sisa

    Suatu ukuran populasi ditentukan sebagai N yang mempunyai sebanyak r digit angka

    dan kemudian hasil perkalian dari N yang masih mempunyai jumlah digit r dianggap sebagai

    N. Sebuah angka acak k dipilih dari 1 sampai N dan kemudian unit yang memiliki nomor urut yang sama dengan sisa dari hasil pembagian angka random yang terpilih (k) dengan N

    dipilih sebagai sampel. Apabila sisa pembagian sama dengan nol, maka unit sampel terakhir

    yang terpilih. Misalnya, N = 123, hasil perkalian dari N yang masih memiliki 3 digit angka

    adalah 984. Untuk memilih sebuah unit, sebuah angka acak dari 001 sampai 984 dipilih.

    Misalnya angka random yang terpilih adalah 287. kemudian 287 dibagi dengan 123, sisanya

    adalah 41. Jadi, unit dengan nomor urut 41 adalah yang terpilih sebagai sampel.

    Pendekatan hasil bagi

    Sebuah ukuran populasi sebesar N memiliki r digit angka kemudian hasil perkalian

    sebanyak r digit dari N dianggap sebagai N dimana N/ N = q. Sebuah angka acak k dipilih dari 0 sampai dengan N 1. Dengan membagi k dengan q maka hasil bagi r didapatkan dan unit dengan nomor urut r 1 adalah unit yang terpilih. Sebagai gambaran, N = 16 sedangkan N = 96 dengan q = 6. Sebua angka random yang terpilih dari 0 sampai 95 adalah 65. Dengan membagi 65 dengan 6, hasil baginya adalah 10 dan kemudian sampel yang terpilih

    adalah 9.

  • Pemilihan angka secara bebas

    Metode ini diusulkan oleh Mathai (1954). Sebuah angka acak dipilh berdasarkan digit

    pertama dan yang lainnya menurut sisa dari ukuran populasi. Jika angka yang terpilih adalah

    0 maka unit yang terpilih adalah unit yang terakhir. Tapi jika angka acak yang didapatkan

    lebih besar dari atau sama dengan N, maka angka tersebut tidak dipakai dan prosedur ini

    kembali diulang.

    Contoh 2.1 Memilih contoh acak dari 11 rumah tangga dari daftar 112 rumah tangga di

    sebuah desa.

    (i) Dengan menggunakan 3 digit angka acak yang berada di kolom 1 sampai 3, 4

    sampai 6 dan seterusnya dari tabel angka random dan angka yang tak terpakai yang lebih

    besar dari 112 (angka 000 juga termasuk), kita mempunyai urutan angka yang diambil

    sebagai sampel yaitu 033, 051, 052, 099, 102, 081, 092, 013, 017, 076, dan 079.

    (ii) Pada prosedur diatas, angka yang lebih besar dari 112 ditolak. Oleh karenanya,

    metode yang biasanya digunakan adalah pendekatan sisa yang dapa menghindari tidak

    terpakainya angka random yang lebih besar dari N. Hasil perkalian terbesar dari 112 adalah

    896. dengan menggunakan 3 digit angka random seperti diatas, maka angka random yang

    terpilih akan memuat sampel dengan nomor urut 086, 033, 049, 097, 051, 052, 066, 107, 015,

    106 dan 020.

    (iii) Jika pendekatan hasil bagi diterapkan, hasil perkalian tertinggi dengan 3 digit

    angka dari 112 adalah 896 sedangkan q = 8. Dengan menggunakan angka random yang sama

    dan membaginya dengan 8, kita mendapatkan contoh acak bernomor urut 025, 004, 020, 026,

    006, 006, 092, 041, 085, 027 dan 086 dengan metode pengembalian dan nomor urut 025, 004,

    020, 026, 006, 092, 041, 085, 027, 086, dan 042 dengan metode tanpa pengembalian.

    Contoh 2.2 Sepuluh kebun buah di sebuah tempat dekat dengan sebuah desa berturut-turut

    mempunyai 125, 793, 970, 830, 1502, 864, 503, 106, 970, 312 pohon buah. Tariklah sebuah

    sampel acak dari 10 pohon buah dengan menggunakan tabel angka random.

    Kita anggap bahwa kebun buah pertama mempunyai nomor urut pohon buah dari 1

    sampai 125, di kebun buah kedua dari nomor 126 sampai 918, dan seterusnya. Oleh

    karenanya, angka kumulatif dari nomor urut tersebut dapat ditulis sebagai berikut, 125, 918,

    1888, 2718, 4220, 5084, 5587, 6663, 6975. dengan menggunakan 4 digit angka random

    seperti contoh diatas dan dengan dugaan yang serupa, kita mendapatkan sepuluh angka acak

    1983, 0330, 1614, 2096, 0511, 0524, 3311, 6874, 2183 dan 6926.

    Dengan angka random yang pertama 1983, kita memilih pohon yang bernomor urut

    95 di kebun buah keempat. Serupa dengan yang tadi, dengan angka acak kedua 0330, kita

    memilih pohon dengan nomor urut 205 di kebun buah kedua, dan seterusnya.

  • 2.3 ESTIMATION OF POPULATION PARAMETERS

    Mari kita mengasumsikan setiap unit iu dalam sebuah populasi memiliki suatu nilai

    variabel iY untuk setiap karakter y. Untuk beberapa parameter, mari didefinisikan sebagai

    Total populasi, N

    i

    iyY

    Rata-rata populasi, N

    i

    i NYY

    Varian populasi, N

    i

    i NYY22 )(

    Dalam sebuah n contoh acak unit-unit dalam sampel 1u , 2u , . . ., nu , secara berturut-

    turut mempunyai 1y , 2y , . . ., ny . Estimator dari total populasi dan rata-rata adalah

    n

    i

    i yNyn

    NY . , dan

    n

    i

    i ynyY

    Faktor nN yang ada di rumusan untuk total sampel biasanya disebut perluasan atau

    peningkatan atau faktor inflasi. Kebalikanya Nn disebut fraksi sampling dan dinyatakan

    dengan huruf f dalam buku ini.

    Dalil 2.3.1 Dalam penarikan sampel aca sederhana, tanpa pengembalian, rata-rata sampel y

    adalah estimator yang unbiased dari parameter Y dan varian samplingnya diberikan sebagai

    NSfnSNnyV22 )1()1()( (2.3.1)

    dimana

    )1(22 NNS

    Bukti Kita ketahui

  • 2

    2

    22

    1

    1

    PtPN

    PPNtn (2.7.9)

    (i) Jika faktor koreksi terbatas (kpt) diabaikan, maka :

    220 1 PPtn (2.7.10)

    (ii) Jika faktor koreksi tidak diabaikan, maka :

    Nnn

    n11 0

    01

    (2.7.11)

    Contoh 2. 8

    Dalam suatu populasi terdapat 4000 orang yang dipanggil untuk memberikan hak

    suaranya, 50% mengembalikannya ke kotak suara. Perkiraan jumlah sampel untuk

    mengestimasi proporsi orang yang mengembalikan kertas suara sehingga mempunyai

    batas kesalahan (MoE) 5% dari 95% derajat kepercayaan dimana pengambilan sampel

    dilakukan secara :

    (iii) Pada kasus penarikan sample sederhana secara acak tanpa pengembalian (WOR),

    banyaknya kemungkinan sample adalah 10 yaitu 52 . Dapat kita lihat bahwa setiap kemungkinan sample memiliki peluang yang sama untuk terpilih yaitu masing-masing 1/10.

    (a) Nilai harapan dari y , yang diberikan dari hasil rata-rata pada kolom (6) dalam tabel 2.3.2,

    dengan nilai 158,0 sebagai rata-rata pada populasi, hal itu membuktikan bahwa y

    merupakan estimator yang tidak bias bagi Y . Selanjutnya, varians sampling yang didapatkan

    dari rata-rata terhadap kuadrat error (kesalahan) yang ditunjukkan pada kolom (7) dimana

    hasilnya adalah 14,55 ,dengan asumsi bahwa .

    )10/3(8/3)(22 Syv

    (b) Sejak varians dari sampel ( 2s , diberikan oleh 2/)(2

    21 yy ), dimana hal ini akan lebih

    mempermudah penghitungan, rata-rata dari 10 sampel berarti kuadrat yang ada seperti 2)(sE .

    Perhatikan, 5,4810/485)(2 sE

    Juga, kuadrat rata-rata populasi = 48,5

    Jadi, kuadrat rata-rata sample menunjukkan estimator yang tidak bias dari kuadrat rata-rata

    populasi )(2S , buktinya :

    22 )( SsE

  • (c) Estimator dari )( yV berasal dari :

    20/)(3)( 221 yyyv

    Nilainya ditunjukkan oleh kolom (8) pada tabel 2.3.2. Nilai harapan (Expected Value) dari

    )(yv yang di dapat dari hasil rata-rata nilai pada kolom (8) yaitu 14,55. Menunjukkan bahwa

    nilai itu adalah estimasi tidak bias

    10

    3)()]([

    2SyVyvE

    2.4. Estimasi Proporsi Populasi

    Sering kali, unit-unit di dalam populasi dikelompokkan kedalam dua grup (i) yang

    mempunyai karakteristik khusus dan (ii) tidak memiliki karakteristik tersebut. Contohnya,

    hasil panen ladang yang diari dengan ladang yang tidak diari. Apabila ladangnya diari, kita

    dapat mengatakan bahwa dia memiliki karakteristik yaitu irigasi/pengairan. Jika ladang

    tersebut tidak diari, dapat dikatakan bahwa ia tidak memiliki karakteristik khusus tersebut.

    Jika kita ingin memperkirakan proporsi ladang yang diari, dengan populasi ladang adalah

    sebanyak N ladang dan diasumsikan bahwa iy memiliki nilai 1 jika ladang tersebut diari, dan

    lainnya dianggap nol (0). Dimana, total dari ladang yang diari sebagai 1N adalah bagian dari

    N.

    N

    i

    ii Ny

    Jadi,

    N

    i

    i PN

    Ny

    NY

    1

    11 proporsi dari ladang yang di irigasi

    dan

    NPNy i

    N

    i

    i 1

    2

    Jadi, masalah yang ada dalam memperkirakan proporsi populasi adalah dengan

    mendefinisikan varians seperti diatas. Apabila 1n unit sample diambil dengan SRS dan

    ukuran n yang memiliki karakteristik tertentu, maka proporsi sampel diberikan dengan

    ./1 nnp Sehingga :

  • npynyn

    i

    i

    n

    i

    i 1

    2

    1

    1

    Karena itu, estimasi tidak bias dari P adalah

    pnnp )/( 1 (2.4.1)

    TEOREMA 2.4.1 Pada penarikan sampel tanpa pengembalian (WOR), varians dari p adalah :

    )1(

    )1(

    )1(

    )()(

    Nn

    NPQf

    Nn

    PQnNpV (2.4.2)

    Dimana PQ 1 . Pembuktiannya adalah :

    Bukti 1. Dalam pengambilan sampel tanpa pengembalian (WOR), varians dari p adalah

    nPQpV /)( (2.4.3)

    Bukti 2. Varians dari pNN 1 , perkiraan total untuk beberapa unit dengan beberapa

    karakteristik tertentu adalah :

    )1(/)()( 21 NnPQnNNNV (2.4.4)

    TEOREMA 2.4.2 Pada pengambilan sampel tanpa pengembalian (WOR), perkiraan tidak

    bias dari )( pV adalah :

    )1/()1()( npqfpv (2.4.5)

    Pembuktiannya :

    Bukti 1. Pada pengambilan sampel dengan pengembalian (WR), estimasi tidak bias dari

    )( pV adalah :

    )1/()( npqpv (2.4.6)

    Bukti 2. Estimasi tidak bias dari varians untuk NpN 1 adalah :

    )1/()1()1/()()( 21 npqNfnpqnNNNv (2.4.7)

    Bukti 3. Koefisien variasi dari p adalah :

  • 2/12/1

    ]/[]/[

    nPQP

    nPQCV (2.4.8)

    CONTOH 2.4. Daftar pemilih dalam suatu lomba disuatu kota yang mengukur kebenaran

    usia tiap orang sebanyak 3000. Diambil sampel sebanyak 300 nama secara SRS, dimana 51

    orang diketahui menunjukkan umur yang salah. Perkirakan total dari pemilih yang memiliki

    kesalahan dalam menggambarkan usia dan perkirakan standart error-nya.

    Dimana ;

    17.0,51,300,3000 1 pnnN

    Estimasi total dari pemilih yang melakukan kesalahan dalam menggambarkan usia mereka

    dapat dijelaskan oleh :

    510)17.0)(3000( 1 NpN

    (i) Jika sampel diambil dengan pengembalian (WR), perkiraan standart error-nya adalah

    2/1 )]1/([1

    npqNsN

    2/1]50/)83.0)(17.0[(3000

    3.159

    (ii) Jika sampel diambil tanpa pengembalian (WOR), perkiraan standart error-nya adalah :

    2/1 )]1/()1[(1

    npqfNsN

    2/1]50/)83.0)(17.0)(10.01[(3000

    1.151

    2.5. Kombinasi dari estimasi yang tidak bias

    Ada situasi dimana beberapa sampel dapat diperkirakan karena sampel-sampel

    tersebut diklasifikasikan menjadi 2 kombinasi. Jika ti (I = 1,2,,m) merupakan estimasi

    tidak bias dari parameter , dimana satu dan lainnya dianggap saling bebas, maka estimasi

    gabungannya adalah :

    m

    i

    i mtt1

    / (2.5.1)

  • juga adalah estimasi yang tidak bias dari . Varians dari t adalah :

    m

    i

    i mtvtV1

    2/)()( (2.5.2)

    dan estimasi varians-nya adalah :

    m

    i

    i mmtttv1

    2 )1(/)()( (2.5.3)

    Kita akan mempergunakannya dalam kasus-kasus sebagai berikut :

    (i) SRS dalam variabel (ii) SRS dalam kebijaksanaan.

    2.5.1 SRS dalam variable

    Apabila myyy ,...,, 21 adalah rata-rata sampel, dimana setiap variabel adalah saling

    bebas, dengan banyak sampel masing-masing adalah n1, n2,, nm . Perkiraan gabungan dari

    semua sampel tersebut adalah :

    (i) Estimasi m dengan rata-rata aritmatik

    m

    i

    i myy1

    /' (2.5.4)

    (ii) Estimasi m dengan rata-rata tertimbang

    m

    i

    ii nyny1

    /'' (2.5.5)

    dimana,

    m

    i

    inn1

    Jika sampel diambil dengan pengembalian

    Varians sampling dari 'y dan ''y adalah :

    m

    i

    i

    m

    i

    i nim

    myVyV1

    2

    2

    1

    2 //)()'(

    (2.5.6)

    Dan

  • n

    nyVnyVm

    i

    ii

    2

    1

    22 /)(.)''(

    (2.5.7)

    Estimator tidak bias dari )'(yV dan )''(yV berasal dari :

    m

    i

    i mmyyyv )1(/)'()'(2 (2.5.8)

    Dan

    in

    j

    ij

    m

    i

    nnyyyv )1(/)''()''( 2 (2.5.9)

    Hal ini akan menunjukkan bahwa perkiraan seperti pada (2.5.5) jauh lebih efisien jika

    dibandingkan dengan hubungan pada (2.5.4) dan dapat diuji dengan membandingkan variasi

    keduanya dalam satu kasus.

    Jika sampel diambil tanpa pengembalian

    Varians sampling dari 'y dan ''y adalah sebagai berikut :

    m

    i

    iii

    m

    i

    i nmSfmyVyV222 /)1(/)()'( (2.5.10)

    dan

    m

    i

    inNnn

    SyV 2

    2 11)''( (2.5.11)

    Estimasi tidak bias dari )'(yV dan )''(yV diperoleh dari :

    m

    i

    iii nmsfyv22 /)1()'( (2.5.12)

    dan

    m

    i

    iii nsfnyv22 /)1()''( (2.5.13)

    2.5.2. SRS dalam kebijaksanaan (attributes)

    Hasil yang diperoleh pada bagian sebelumnya dapat diterapkan kedalam SRS dengan

    attributes ini. Jika p1, p2,,pm adalah proporsi sampel sebanyak m dengan ukuran masing-

    masing sampel n1, n2, , nm , dengan asumsi bahwa masing-masing saling independent.

    Estimasi gabungan dari semua sampel dapat diberikan sebagai berikut :

  • (i) Estimasi m dengan rata-rata aritmatik

    m

    i

    i mpp / (2.5.14)

    (ii) Estimasi m dengan rata-rata tertimbang

    m

    i

    ii npnp / (2.5.15)

    Dimana;

    m

    i

    inn

    Jika sampel diambil dengan pengembalian

    Varians sampling dari p dan p adalah sebagai berikut :

    m

    i

    i

    m

    i

    i nmPPmpVpV22 /)1(/)()( (2.5.16)

    Dan

    nPPnpVnpVm

    i

    ii /)1(/)(.)(22 (2.5.17)

    Estimasi tidak bias dari )'( pV dan )''( pV diperoleh dari :

    m

    i

    i mmpppv )1(/)()'(2 (2.5.18)

    Dan

    m

    i

    iiii nnppnpv )1(/)1()''(2 (2.5.19)

    Estimator lainnya adalah :

    npppv /)1()''( (2.5.20)

    Jika sampel diambil dengan pengembalian

    Varians sampling dari 'p dan ''p adalah :

  • m

    i

    ii mNnPPnNpV2)1(/)1()()'( (2.5.21)

    Dan

    m

    i

    ii NnPPnNpV )1(/)1()()''( (2.5.22)

    Estimasi tidak bias dari )'( pV dan )''( pV diperoleh dari :

    m

    i

    i mmpppv )1(/)'()'(2 (2.5.23)

    Dan

    m

    i

    iiiii nNnppnnNpv )1(/)1()()''(22 (2.5.24)

    2.6. Batas Kepercayaan

    Setelah memperkirakan (estimasi) nilai parameter yang tidak diketahui, penting bagi

    kita untuk mengetahui atau mengukur kepercayaan dan tingkat ketelitian (kebenaran) dari

    perhitungan estimasi yang kita dapat dan untuk membuat beberapa batasan tertentu dengan

    memberikan tingkat kepercayaan / kebenarannya. Jika kita mengasumsikan bahwa estimator

    y berdistribusi normal terhadap rata-rata populasi Y , batas bawah dan batas atas untuk rata-

    rata populasi Y adalah :

    2/1

    )1,( ]/)1[(. nfstyY nL (2.6.1)

    Dan

    2/1

    )1,( ]/)1[(. nfstyY nU (2.6.2)

    Dimana t(,n-1) adalah nilai dari tabel student-t dengan (n-1) sebagai derajat bebas dan

    merupakan tingkat kesalahan atau peluang melakukan kesalahan dalam perhitungan. Sama

    halnya dengan batas kepercayaan dari total populasi dapat dituliskan sebagai berikut :

    2/1)1,( ]/)1[(.. nfsNtyNY nL (2.6.3)

    Dan

    2/1)1,( ]/)1[(.. nfsNtyNY nU (2.6.4)

  • CONTOH 2.5. Tanda tangan untuk sebuah permohonan dikumpulkan dalam 700 lembar.

    Setiap lembar diberi tempat sebanyak 50 tanda tangan, tapi para pemberi tanda tangan

    meletakkan tanda tangan mereka dengan tidak teratur sehingga banyaknya tanda tangan tiap

    lembar tidak dapat dipastikan jumlahnya. Dalam pengumpulan, terdapat 12 lembar yang

    mengalami gangguan atau hilang. Kemudian diambil sampel secara acak sebanyak 50 lembar

    dan jumlah tanda tangan per lembar dukumpul dan hasilnya adalah seperti tabel dibawah ini :

    Banyaknya Tanda

    tangan (yi)

    Banyaknya Lembaran

    (ni)

    52

    51

    46

    42

    40

    37

    32

    29

    27

    15

    14

    10

    8

    1

    2

    21

    8

    7

    2

    2

    1

    1

    2

    1

    1

    1

    Perkirakan total tanda tangan untuk permohonan tersebut dan perhitungkan batas

    kepercayaannya sebesar 95%.

    Yang kita ketahui,

    50,68812700 innN

    84820,1992 2 iiii ynyn

    Sehingga, perkiraan total tanda tangan adalah

    50/)1992)(688(. yNY

    410.27

    Dan

    )1/()( 22 nyyns ii

  • ]50/)1992(84820[49

    1 2

    55,10s

    Karena itu, selang kepercayaan dengan tingkat kepercayaan 95% adalah :

    184.13)55,10)(688)(96,1(27410 LY

    636.41)55,10)(688)(96,1(27410 UY

    2.7. Perkiraan Ukuran Sampel

    Dalam merencanakan survey sampel untuk memperkirakan parameter populasi, salah

    satu pertanyaan terpenting adalah bagaimana menentukan banyaknya sampel yang akan

    digunakan. Hal tersebut dilakukan dengan tingkat atau derajat ketelitian (Presisi) yang

    diperbolehkan dan dengan tingkat kepercayaan tertentu. Sebelum kita membahas mengenai

    perbedaan metode penarikan sampel yang digunakan, mari kita lihat pendekatan solusi secara

    umum pada masalah perkiraan ukuran atau banyaknya sampel yang digunakan.

    Apabila z merupakan jumlah kesalahan dari estimasi dan l(z) merupakan kerugian

    yang dibuat dalam pengestimasian tersebut. Untuk metode penarikan sampel yang digunakan,

    teori yang ada akan menyediakan bagi kita fungsi kepekatannya. Jadi, nilai harapan dari

    kehilangan/kerugian dari banyaknya sampel yang digunakan dapat dihtung dari :

    ][ )()( zn lEL (2.7.1)

    Dan apabila kita juga mempetimbangkan fungsi biaya untuk ukuran sampel n, dinotasikan

    sebagai berikut :

    cnaC n )( (2.7.2)

    Dimana a adalah biaya pendahuluan dan c merupakan biaya setiap unit dalam metode

    penarikan sampel tersebut.

    Hubungan kombinasi (2.7.1) dengan (2.7.2), kita mendapatkan total kerugian, yaitu :

    )()()( nn CLn (2.7.3)

    Dimana adalah jumlah tetap (konstan).

    Apabila dalam penarikan sampel dimaksudkan untuk meminimumkan kerugian,

    banyaknya n dipilih melalui rumus (2.7.3) yang diperkecil.

    Dengan menurunkan )(n dan mendapatkan n serta menyamakan 0/ n , nilai dari n

    yang paling optimum dapat ditentukan.

  • CONTOH 2.6 Jika fungsi kerugian terhadap kesalahan/error dalam estimasi proportional

    dengan Yy dan jika biaya total dalam survey adalah cnaC , tunjukkan bahwa dengan

    metode SRS, fpc diabaikan, ukuran n optimum adalah :

    ,2/ 3/2 ck dimana k adalah konstan.

    Disini Yyl z )(

    Atau Yykl z 1

    )(

    Dimana k1 juga konstan.

    Jadi,mengikuti

    nkYyEkL n /.211

    )(

    [dengan asumsi bahwa y terdistribusi )/,( nYN ]

    Karena itu,

    nkcnan /.2

    )( 1

    nkcna /.2

    Kemudian diturunkan dan disamakan 0/ n , kita peroleh :

    3/22/. ckn

    Dengan tindakan yang sama dan analisis dapat dipakai untuk beberapa metode penarikan

    sampel dimana fungsi kerugian adalah kebalikan dari proportional untuk n dan fungsi biaya

    juga merupakan fungsi dari n. pembahasan secara umum ditunjukkan oleh Yates(1960),

    Raiffa dan Schlaifer(1961), Chaudhary(1977), dan Chaudhary dan Singh(1979) yang

    membahas garis tentang metode berangkai. Untuk pembahasan yang diklasifikasikan atau

    dikelompokkan, nilai yang baik dari metode ini dibahas oleh Nordin(1944), Blythe(1945),

    Deming(1950) dan Tippett(1950).

    Sekarang mari kita menguraikan hasil dari SRS untuk karakteristik yang dapat diukur

    secara kuantitatif. Apabila marginal error (presisi) yang diperbolehkan dalam

    estimasi/perkiraan adalah , dan (1-) tingkat kepercayaan/ketelitian. Rata-rata sampel y

    diasumsikan terdistribusi normal dengan rata-rata populasi Y dan varians :

  • n

    S

    N

    nNyV

    2

    .)(

    )(

    Karena itu,

    2/12

    ),( .

    n

    S

    N

    nNt (2.7.4)

    Dimana t(, ) adalah nilai variasi bersama yang diberikan (1-), dimana ;

    222222 /1// NSttSn (2.7.5)

    (i) Jika fpc diabaikan,didapat

    2

    22

    0

    St

    n (2.7.6)

    (ii) Jika fpc tidak diabaikan, kita bias mendapatkan nilai n dengan meletakkan nilai dari n0 kedalam Eq. (2.7.5) dan kita peroleh :

    )/1/( 001 Nnnn (2.7.7)

    CONTOH 2.7. Sebuah studi tentang metode sampling dalam sebuah populasi mempunyai

    500 unit sampling. Nilai total yang didapat 49Y dan 6,442 S . Dalam SRS, berapa

    banyak unit sampel yang dapat dipilih untuk memperkirakan Y dengan maerginal error 10%

    dan koefisien kepercayaan 95%, ketika penarikan sampel dilakukan dengan (i) metode

    pengembalian, (ii) dengan metode tanpa pengembalian?

    (i) Sampling dengan pengembalian (WR). Dalam kasus ini, kita dapat mengabaikan fpc/kpt dan diperoleh :

    8136,7)9,4(

    6,44)96,1(2

    2

    2

    22

    0

    St

    n

    (ii) Sampling tanpa pengembalian (WOR). Dalam kasus ini, fpc tidak diabaikan dan diperoleh :

    8035,7/1 0

    0

    Nn

    nn

    Dengan cara yang sama, kita juga dapat membahas hasil ketika unit sampel diklasifikasikan /

    dikelompokkan berdasarkan karakteristik yang ada. Dengan dugaan yang sama, proporsi

    sampel p dapat diasumsikan berdistribusi normal dengan P dan varians (N-n)P(1-P)/n(N-1).

    Karena itu, nilai dari n sebelum diberikan, tingkat ketelitian dapat di estimasi dengan

    2/1

    ),( )]1(/)1()[( NnPPnNt (2.7.8)

    dimana t(, ) memiliki pengertian yang sama seperti yang diberikan dalam hubungan (2.7.4),

    dimana diberikan :

  • (i) Pengambilan sampel dengan pengembalian Dalam kasus ini kita dapat mengabaikan kpt, sehingga diperoleh :

    3850025,05,05,096,11 2220 PPtn

    (ii) Pengambilan sampel dengan tanpa pengembalian Dalam kasus ini, kpt tidak dapat diabaikan dan kita peroleh :

    352

    11 0

    01

    Nn

    nn

    KUMPULAN PERMASALAHAN

    2.1.Diketahui pada suatu daftar terdapat N pabrik dengan penomoran secara terurut, m

    pabrik sudah tidak beroperasi lagi dan n pabrik baru telah ditambah ke daftar

    pembuatan jumlah pabrik nmN Berikan prosedur sederhana untuk pemilihan satu pabrik dengan alokasi sama dari

    nmN pabrik, untuk menghindari penomoran ulang N pabrik pabrik dan tunjukkan bahwa prosedur yang Anda berikan menggunakan alokasi sama untuk

    pabrik pabrik yang baru.

    2.2.Dengan bantuan angka random, buatlah sampel acak, masing masing berukuran 5

    dengan mengikuti :

    (i) Populasi Cauchy :

    22

    1

    xxf dimana x

    8,3 cm dan 1,2 cm

    (ii) Populasi normal :

    22 2exp2

    1

    xxf dimana x

    8 dan 2

    (iii) Populasi Bivariate Normal, dimana rata rata dari 2 peubah x dan y aalah 68 cm dan 170 kg, standar deviasi dari x dan y adalah 3cm dan 7 kg dan koefisien

    korelasi p adalah :

    (i) + 1 (ii) dan (iii) 1

    2.3.Prosedur yang dilakukan telah menggunakan pemilihan sampel lahan untuk

    eksperimen crop-cutting kuantitas padi :

  • Sebaliknya, nomor setiap desa terpilih ditunjukkan dala 3 angka random yang

    nilainya lebih kecil daripada angka survey tertinggi. Angka angka random tersebut menggambarkan tiga lahan padi untuk eksperimen crop-cutting. Jika

    angka survey terpilih menunjukkan bahwa padi tidak tumbuh, maka pilih angka

    survey pertumbuhan padi selanjutnya di tempat lain.

    Uji bahwa metode di bawah akan memberikan kemungkinan yang sama termasuk

    pada sampel untuk keseluruhan angka survey pertumbuhan padi, diberikan sebagai

    berikut :

    (i) Nama desa Payagpur (ii) Total jumlah survey 299 (iii) Angka random 28, 189, 269 (iv) Jumlah survey pertumbuhan padi 39 - 88 dan 189 - 299

    Tunjukkan bahwa angka survey 39 memiliki kemungkinan 39/299 termasuk

    dalam sampel, angka survey 189 kemungkinannya 101/299, sementara angka

    survey selanjutnya hanya mempunyai kemungkinan 1/299 untuk masing masing angka.

    2.4. Suatu populasi terdiri dari N unit, nilai peubah dari satu unit diketahui menjadi yo.

    Suatu sampel acak WOR dilemparkan sehingga menjadi (N-1) unit. Tunjukkan bahwa

    perkiraan

    yNy 10 memiliki varians yang lebih kecil daripada Ny didasarkan

    pada sampel acak, WOR, jumlah n diambil dari populasi tersebut.

    2.5.

    (i) Diketahui pengambilan sampel acak sederhana (SRS). Apakah rata rata sampel konsisten dan unbiased estimator untuk rata rata populasi ? Tunjukkan varians rata rata sampel dan juga perkiraan varians unbiased. Apakah jumlah sampel dapat mewakili perkiraan rata rata populasi dengan diberikan suatu standar error?

    (ii) Jika 1n dari unit unit sampel adalah tipe A, tunjukkan estimasi proporsi yang

    unbiased dari unit unit tipe A dalam populasi and pengambilan sampel varians serta perkirakan jika ukuran sampel cukup besar dengan 95% tingkat keyakinan

    dari proporsi unit yang tidak diketahui tipe A dalam populasi.

    2.6.Diketahui v menghilangkan perbedaan unit unit yang terjadi dalam suatu sampel n unit unit terpilih dengan alokasi sama dengan pengembalian dari suatu populasi N

    unit unit. Perlihatkan bahwa estimator

    v

    i

    iv vyy adalah unbiased untuk rata

    rata populasi. Jelaskan suatu unbiased estimator varians dari estimator tersebut.

    2.7.Dari suatu sampel acak n unit unit, suatu bagian sampel acak, m unit unit dilemparkan tanpa pengembalian dan bertambah ke sampel asal. Perlihatkan bahwa

    rata rata pada (n+m) unit unit adalah suatu unbiased estimator dari populasi rata rata dan rasio varians tersebut memiliki rata rata mula mula n unit dengan

    perkiraan 2131 nmnm . Asumsikan bahwa populasi berukuran besar. 2.8.Diketahui nilai varians dari suatu pelemparan sampel acak sederhana dengan tanpa

    pengembalian dari suatu populasi terbatas.

    N bola bola terletak dalm sebuah container besar, dilemparkan secara rando dari suatu penambahan Mp merah dan Mq bola bola putih. Kemudian sampel n bola bola dilemparkan secara acak dari container sampel. Hal ini menujukkan bahwa selain

    n bola bola tersebut, r adalah merah. Carilah v(r) dimana N bola bola diletakkan ke container besar.

  • (i) dengan pengembalian (ii) dengan tanpa pengembalian

    2.9.Varians rata rata sampel pada SRS adalah :

    111 2

    NyNyNnyVN

    i

    i

    Penulisan unbiased estimator V(y) oleh v dengan catatan bahwa :

    N

    i

    i

    n

    i

    i yyn

    NE 22. 22 YvyE

    Sehingga

    n

    i

    i vyNyn

    NE

    NNnvE 22.

    1

    1.

    11

    2.10. Suatu produksi dalam kuintal untuk sejumlah padi yang tumbuh pada 200 desa pada tehsil, halaman 44.

    ( Gambar dalam pasangan indicator angka desa )

    (i) Pemilihan sampel acak sederhana dengan jumlah 20 dan 25 unit dan perkirakan rata rata lahan per luas diketahui standar errornya sebagai dasar terpilihnya unit.

    (ii) Buatlah 95% interval kepercayaan dan interpretasikan. (iii)Berapakah jumlah sampel yang diberikan dari estimasi rata rata lahan dengan 55

    standar error.

    (1) 20 (2) 21 (3) 32 (4) 41 (5) 55

    (6) 22 (7) 64 (8) 42 (9) 28 (10) 35

    (11) 25 (12) 25 (13) 24 (14) 32 (15) 75

    (16) 28 (17) 29 (18) 38 (19) 19 (20) 19

    (21) 16 (22) 28 (23) 30 (24) 29 (25) 29

    (26) 19 (27) 37 (28) 34 (29) 31 (30) 35

    (31) 29 (32) 19 (33) 27 (34) 42 (35) 39

    (36) 11 (37) 26 (38) 21 (39) 45 (40) 61

    (41) 16 (42) 29 (43) 32 (44)32 (45) 63

    (46) 30 (47) 21 (48) 35 (49) 28 (50) 18

    (51) 24 (52) 32 (53) 23 (54) 8 (55) 35

    (56) 27 (57) 35 (58) 25 (59) 29 (60) 29

    (61) 25 (62) 31 (63) 38 (64) 31 (65) 43

    (66) 21 (67) 36 (68) 30 (69) 37 (70) 47

    (71) 15 (72) 27 (78) 36 (79) 28 (80) 43

  • (81) 28 (82) 25 (83) 31 (84) 6 (85) 4

    (86) 22 (87) 24 (88) 39 (89) 71 (90) 44

    (91) 24 (92) 34 (93) 18 (94) 28 (95) 10

    (96) 70 (97) 20 (98) 32 (99) 42 (100) 47

    2.11. Bahan bahan untuk membangun 5000 sumur telah diberitakan selama tahun 1964 pada suatu wilayah sebagai bagian dari Grow-more-Food Campaign di India. Daftar

    penyelenggaraan yang diberitakan bersama dengan lokasi tujuan masing masing sumur sebenarnya membangun dan menggunakannya untuk tujuan irigasi. Sampel

    dimaksudkan untuk terpilih dalam SRS. Diketahui julah sampel untuk nilai p

    berkisar antara 0,5 sampai 0,9, jika dapat dimungkinkan MoE (batas kesalahan)

    adalah 10% dan tingkat kepercayaan 95%.

    2.12. Suatu data menunjukkan hubungan suatu jumlah laktat dari produksi susu (dalam kg) 250 sapi di suatu daerah peternakan.

    (i) Pilihlah sampel acak sederhana sebanyak 25. (ii) Perkirakan rata rata dengan menggunakan standar error. (iii)Buatlah perkiraan rata rata populasi dengan tingkat keyakinan 95%. 230 293 163 290 200 173 194 322 169 230

    297 151 248 271 259 214 167 207 240 286

    184 248 327 338 165 177 270 177 202 155

    155 293 190 172 150 319 151 118 213 114

    186 167 129 185 231 199 265 306 173 276

    291 231 205 220 246 239 186 299 233 208

    265 204 300 195 239 173 237 282 221 218

    197 215 213 290 146 232 305 184 149 267

    188 219 171 99 329 199 180 225 257 202

    189 207 792 327 201 300 206 199 299 153

    175 287 277 230 258 137 174 301 260 282

    211 212 284 214 283 139 223 212 207 224

    207 111 272 192 127 303 221 187 309 263

    203 176 233 239 176 218 193 243 236 275

    288 198 241 219 167 193 234 179 126 173

    279 178 275 260 191 174 235 338 242 238

    211 187 184 189 305 221 253 225 327 203

  • 195 158 156 185 170 271 160 188 165 218

    312 143 267 298 196 139 205 298 238 217

    145 201 313 230 185 166 147 223 271 133

    155 230 287 329 265 150 286 271 268 198

    214 231 163 335 198 270 187 174 163 201

    192 247 247 297 178 240 290 234 170 227

    230 353 170 159 236 181 230 240 212 242

    151 158 253 179 263 158 250 226 246 301

    2.13. Distribusi frekuensi dari 232 kota di beberapa negara dengan ukuran populasi dalam ribuan (000) adalah sebagai berikut :

    Ukuran kelas

    populasi

    Jumlah

    kota

    50 - 75 81

    75 - 100 45

    100 - 150 42

    150 - 200 14

    200 - 250 9

    250 - 300 5

    300 - 350 6

    350 - 400 5

    400 - 450 5

    450 - 500 2

    500 - 550 2

    550 - 600 3

    600 - 650 1

    650 - 700 1

    700 - 750 0

    750 - 800 1

    800 - 850 2

  • 850 - 900 1

    900 - 950 2

    950 - 1800 0

    1800 - 1850 1

    1850 - 1950 0

    1950 - 2000 1

    2000 - 2050 0

    2050 - 2100 1

    2100 - 3600 0

    3600 - 3650 1

    3650 - 7850 0

    7850 - 7900 1

    Hitunglah standar error dari perkiraan rata rata populasi, dimana :

    (i) Suatu sampel dari 50 kota dipilih secara SRS WOR, dan (ii) Dua kota terbesar pasti terdapat dalam survey dan hanya 48 kota dipilih dari

    230 kota dengan SRS WOR.

    2.14. Dalam sebuah survey pertanian, 36 sampel diambil secara SRS WOR dari 432 populasi yang terdapat di desa tersebut. Hubungan data dengan ukuran wilayah

    dicatat dalam data berikut :

    No. urut

    RT

    Ukuran luas

    lahan

    1 21,04

    2 12,59

    3 20,30

    4 16,16

    5 23,82

    6 1,79

    7 26,91

    8 7,41

    9 7,68

  • 10 66,55

    11 141,80

    12 28,12

    13 8,29

    14 7,27

    15 1,47

    16 1,12

    17 10,67

    18 5,94

    19 3,15

    20 4,84

    21 9,07

    22 3,69

    23 14,61

    24 1,10

    25 22,13

    26 1,68

    27 49,58

    28 1,68

    29 4,80

    30 12,72

    31 6,31

    32 14,18

    33 22,19

    34 5,50

    35 25,29

    36 20,99

  • Perkirakan dengan standar error proporsi wilayah 4321 ,,, PPPP dalam 4 wilayah kelas

    0 4,99; 5,00 9,99; 10,00 24,99 dan lebih dari 25.

    DAFTAR PUSTAKA

    Blyth, R. H., The economics of sample size applied to the scaling of saw logs. Bio, Bull, 1, 67-70, (1945).

    Chaudhary, F. S. Sequential approach to sample surveys, Ph. D. thesis, Meerut University,

    (1977).

    Chaudary, F. S. and D. Singh, Sequential estimation of population and sample sizes, (unpublished), (1979).

    Deming, W. E., Some theory of sampling, John Wiley and Sons, New York, (1950).

    L.C. A. R., Sample surveys for the estimation of yield of food crops, Bull, 72, New Delhi, (1951)

    Mathai, A. On selecting random numbers for large scale sampling, Sankhya, 13, 157 160. (1954).

    Nordin, J. A., Determining sample size, J. Amer. Statist.Assoc., 39, 497 506, (1944).

    Raiffa, H. and R. Schlaifer, Applied Statistical Decision Theory, Harvard Bussiness School,

    Boston, (1961).

    Tippett, L. H. C., Technological application of statistics, John Willey & Sons, New York,

    (19500.

    Yates, F. Sampling methods for cencuses and survey, Charles Griffin and Co., London,

    (1960).