pengukuran nilai pusat & dispersi - srava_chrisdes.staff...

40
DESKRIPSI DATA 1 Pengukuran Nilai Pusat & Dispersi untuk data tunggal / data tidak terdistribusi Srava Chrisdes Antoro, M.Si.

Upload: duongmien

Post on 08-Mar-2019

258 views

Category:

Documents


0 download

TRANSCRIPT

DESKRIPSI DATA

1

Pengukuran Nilai Pusat & Dispersi

untuk data tunggal / data tidak terdistribusi

Srava Chrisdes Antoro, M.Si.

2

2 cara numerik untuk mendeskripsikan variabel kuantitatif:

Measure of location: Mengukur pusat penyebaran data

Tujuan: menunjukan sesuatu dengan tepat tentang pusat penyebaran data

Meliputi: mean (rata-rata), median, modus

Measure of dispersion: Mengukur variasi dari penyebaran data.

Meliputi: Jangkauan, deviasi mean (simpangan rata-rata), variansi (ragam), deviasi standar (simpangan baku)

3

Mengapa measure

of location (penge-tahuan tentang

rata-rata) saja

tidak cukup?

Karena kita bisa terarah

pada pengam-

bilan kesimpu-lan yang

salah

Contoh:

Rata-rata gaji direktur di perusahaan makanan adalah 50jt/bulan, dan rata-rata dari gaji direktur di perusahaan asuransi

adalah 50jt/bulan. Dari hal ini, seolah-olah bisa diambil kesimpulan bahwa distribusi dari gaji direktur sama. Padahal interval

gaji direktur di perusahaan makanan adalah 40jt-60jt/bulan, sedangkan interval gaji direktur dari perusahaan asuransi adalah dengan range 30jt-70jt/bulan. Ternyata distribusi penyebaran tidak sama, maka

diperlukan measuere of dispersion.

Mean populasi merupakan suatu parameter.

Parameter adalah sebarang karakter yang bisa diukur dalam

populasi.

4

1. MEAN POPULASI

Jumlah nilai dalam populasiMean populasi

Banyak nilai dalam populasi

X

N

Contoh 1

Ada 42 swalayan/minimarket/supermarket di Kota

Depok. Jarak antar swalayan/minimarket tersebut

adalah sebagai berikut (dalam km):

a) Mengapa data tersebut disebut data populasi?

b) Tentukan mean dari jarak antara swalayan

tersebut!5

11 4 10 4 9 3 8

2 2 5 6 1 2 2

1 4 7 5 2 2 5

10 3 14 1 10 3 5

3 7 1 3 7 8 10

1 1 3 3 1 2 1

Jawab:

a) Data tersebut merupakan data populasi karena

mempertimbangkan semua

swalayan/minimarket/ supermarket yang ada

di Kota Depok.

b) Mean dari jarak antar swalayan tersebut

adalah:

6

11 4 10 ... 2 1 1924,57

42 42

Mean dari sampel merupakan suatu statistik.

Statistik adalah sebarang karakter yang diukur berdasarkan data

pada sampel.

7

2. MEAN SAMPEL

Jumlah nilai dalam sampelMean sampel

Banyak nilai dalam sampel

Xx

n

Contoh 2

Seseorang sedang melakukan penelitian tentang

lamanya seseorang berbicara menggunakan

telepon/HP pada suatu hari tertentu. 12 orang

diambil secara random dan diperoleh data sebagai

berikut (dalam menit).

Tentukan mean dari data di atas!

8

90 77 94 89 119 112

91 110 92 100 113 83

Jawab:

Mean dari lamanya seseorang berbicara

menggunakan telepon/ HP adalah

9

90 77 ... 83 117097,5

12 12x

Karakter dari mean (aritmetika)Setiap himpunan dari data interval dan data rasio memiliki mean.

Semua nilai diikutsertakan dalam perhitungan mean.

Mean dari suatu data populasi atau sampel adalah tunggal.

Jumlah deviasi dari setiap nilai dari mean adalah 0.

10( ) 0X x

Contoh 3

Nilai : 3, 8, 4.

11

Mean = (3+8+4)/3 = 15/3 = 5

Deviasi = (3-5) + (8-5) + (4-5) = -2 + 3 + (-1) = 0

12

Kelemahan Mean

Jika ada salah satu nilai dalam sampel ataupun populasi yang terlalu tinggi atau terlalu rendah dibanding dengan nilai mayoritas lainnya, maka mean tidak lagi menjadi rata-rata yang tepat untuk data.

CONTOH: Pendapatan tahunan dari perusahaan percetakan adalah 1M, 1,5M, 2M, dan 8M.

Mean = (1M + 1,5M + 2M + 8M)/4 = 3,125M

Mean pada contoh ini tentunya tidak mewakili data yang ada, karena nyaris semua pendapatan berada dalam interval 1M – 2M, hanya ada 1 data yang terlalu tinggi.

Weighted mean sering juga diartikan sebagai rata-rata

berbobot.

13

3. Weighted MEAN

1 1 2 2

1 2

( )...

...

n nw

n

wXw x w x w xX

w w w w

14

Contoh 4

Suatu restoran menjual suatu minuman dengan ukuran

kecil, medium dan besar, yang harga masing-masingnya

adalah $0.90, $1.25 dan $1.50. Sebanyak 3 ukuran kecil, 4

ukuran medium dan 3 ukuran besar terjual.

Tentukan rata-rata dari harga minuman yang terjual di

restoran tersebut!

15

Jawab:

Rata-rata (weighted mean) dari harga minuman yang terjual

di restoran tersebut adalah:

3 0,90 4 1,25 3 1,5 12,201,22

3 4 3 10wX

16

4. MEDIANWhy Median is

necessary ?

Contoh: Seseorang akan menginap di suatu kamar hotel.

Seorang agen mengatakan bahwa rata-rata harga kamar di

hotel tersebut adalah 1,1jt/malam. Sedangkan, budget dari

orang tersebut max 750rb/malam. Apakah orang tersebut

masih akan mencari penyewaan kamar di hotel tersebut?

Tapi setelah mengetahui detil harga kamar hotel di kawasan

tersebut, bisa jadi orang tersebut akan berubah pikiran.

Harga sewa kamar hotel tersebut adalah standard room

600rb, Superior room 650rb, Deluxe room 700rb, Suite

room 800rb, dan Presidential room 2,75jt.

Karakter dari Median

17

Merupakan nilai tengah dari data setelah diurutkan dari nilai terkecil hingga yang terbesar atau sebaliknya.

Tidak dipengaruhi oleh nilai-nilai ekstrem (nilai yang terlalu besar ataupun yang terlalu kecil).

Median dapat dihitung untuk data ordinal, data interval, dan data rasio.

Jika banyaknya data adalah ganjil, maka median terdapat pada data.

Jika banyaknya data adalah genap, maka median merupakan rata-rata dari 2 nilai di tengahnya. Dengan kata lain, median bisa jadi bukan merupakan suatu nilai pada data.

18

Contoh 5

Diketahui:

3 5 7 5 9 1 3 9 17 10

Tentukan median dari data tersebut.

19

Jawab:

Urutkan terlebih dahulu datanya dari yang terkecil hingga

terbesar.

1 3 3 5 5 7 9 9 10 17

Karena banyaknya data ada 10 (genap), maka mediannya

adalah rata-rata dari data ke-5 dan data ke-6, yaitu:

5 7 12median 6

2 2

20

5. MODUS

Karakter Modus:

- Dapat dihitung untuk semua ukuran data, yaitu data nominal,

data ordinal, data interval, dan data rasio.

- Nilai modus tidak dipengaruhi oleh nilai-nilai ekstrem,

misalnya nilai yang terlalu tinggi ataupun yang terlalu rendah

dari mayoritas nilai lainnya.

Kelemahan Modus:

- Kadang ada beberapa data, saat masing-masing

nilai muncul hanya 1 kali saja

- Ada beberapa data dengan modus lebih dari 1.

Nilai yang paling

sering muncul

21

Data FrekuensiFrekuensi

Kumulatif

1 8 8

2 7 15

3 7 22

4 3 25

5 4 29

6 1 30

7 3 33

8 2 35

9 1 36

10 4 40

11 1 41

14 1 42

TOTAL 42

Contoh 1 (tentang 42

swalayan di Kota Depok)

Menunjukkan frekuensi

terbanyak di antara nilai

lainnya, maka:

MODUS = 1.

MEDIAN terletak pada

data ke-21 dan data ke-

22, yaitu 3.

22

6. MEAN GEOMETRI

- Sangat berguna untuk menemukan rata-rata perubahan pada

persentase, rasio, indeks, dan rata-rata laju pertumbuhan

terhadap waktu.

- Mean geometri Mean aritmetika

Contoh 6

Asumsikan seseorang menerima kenaikan gaji sebesar 5%

pada tahun ini dan 15% pada tahun berikutnya. Tentukan

apakah rata-rata persentase kenaikan gajinya adalah 10%

(yang diperoleh dari (5%+15%)/2)?

23

Kenaikan gaji sebanyak 5% => gaji naik menjadi sebesar 1,05x.

Kenaikan gaji sebanyak 15% => gaji naik menjadi 1,15x.

Hasil tersebut menunjukkan rata-rata persentase kenaikan gaji

orang tersebut adalah 9,886%, BUKAN 10%.

21 2 1,05 1,15 1,2075 1,09886GM x x

Asumsikan pada mulanya gaji seseorang tersebut adalah sebesar 1jt/

bulan, maka

24

Gaji awal Kenaikan (%) Kenaikan (Rp)

Kenaikan gaji tahun ini 1.000.000,00 5% 50.000,00

Kenaikan gaji tahun depan 1.050.000,00 15% 157.500,00

207.500,00

Kenaikan gaji tahun ini 1.000.000,00 9,886% 98.860,00

Kenaikan gaji tahun depan 1.098.860,00 9,886% 108.633,30

207.493,30

Kenaikan gaji tahun ini 1.000.000,00 10% 100.000,00

Kenaikan gaji tahun depan 1.100.000,00 10% 110.000,00

210.000,00

1) Kenyataannya

2) Rata-rata persentase kenaikan gaji = 9,886%

3) Jika dianggap rata-rata persentase kenaikan gaji = 10%

TOTAL kenaikan gaji selama 2 tahun =

TOTAL kenaikan gaji selama 2 tahun =

TOTAL kenaikan gaji selama 2 tahun =

Lebih mendekati ke hasil yang sebenarnya

Contoh 7

Populasi di Las Vegas meningkat dari 258.295 jiwa

pada 1990 menjadi 607.876 jiwa pada tahun 2009,

atau terjadi kenaikan sebesar 349.581 jiwa atau

135,34% pada periode tersebut. Tentukan rata-rata

persentase laju pertumbuhan populasi per tahunnya

pada periode tersebut?

25

26

1990 – 2009 = 19 tahun, sehingga n = 19.

Artinya, rata-rata persentase laju pertumbuhan populasi per tahun

selama periode tersebut adalah 4,61%. Dengan kata lain, populasi

penduduk di Las Vegas meningkat dengan laju 4,61% per tahun dari

1990 ke 2009.

Jawab:

1) Karena mean, median, modus hanya membicarakan tentang pusat data, tapi tidak menceritakan tentang penyebaran data.

2) Jika nilai ukuran penyebaran data kecil, hal itu menunjukkan bahwa nilai-nilai pada data tidak terlalu jauh berbeda, yaitu hampir mendekati mean aritmetika, sehingga dalam hal ini nilai mean sangat dipertimbangkan untuk mewakili pusat data.

3) Jika nilai ukuran penyebaran data besar, maka nilai mean tidak bisa dipertimbangkan untuk mewakili pusat data.

4) Pengetahuan tentang penyebaran data berguna untuk membandingkan penyebaran dalam dua atau lebih distribusi.

5) Ukuran penyebaran data dapat digunakan untuk mengevaluasi apakah hasil pengukuran lokasi (mean, median, modus) benar-benar mewakili data/dapat dipertanggungjawabkan.

27

Mengapa perlu mempelajari

Dispersi/Penyebaran Data ?

28

1. RANGE (JANGKAUAN)hanya berdasarkan nilai terbesar atau nilai

terendah saja

Range = Nilai terbesar – Nilai terkecil

melibatkan semua nilai observasi pada

data

2. DEVIASI MEAN

X xMD

n

dengan:

nilai dari setiap observasi

mean aritmetika

banyaknya observasi pada sampel

X

x

n

a) Variansi Populasi

Proses menghitung variansi populasi:

- Mulai dengan menemukan nilai mean artimetika sehingga diperoleh

- Tentukan selisih setiap nilai X dengan mean sehingga diperoleh (X ),

kemudian kuadratkan nilai selisih tersebut sehingga diperoleh (X )2

- Jumlahkan semua kuadrat selisihnya sehingga diperoleh ∑(X )2

- Bagi hasil jumlah semua kuadrat selisih dengan banyaknya data dalam

populasi sehingga diperoleh 2.

29

3. VARIANSI & DEVIASI STANDAR

2

2( )X

N

Variansi populasi sangat sulit diinterpetasikan, karena

adanya kuadrat, tapi dapat disimpulkan bahwa jika nilai

variansi populasi makin kecil, maka nilai-nilai observasi pada

data dekat dengan pusat data (yaitu mean), sehingga nilai

observasi pada data tidak terlalu menyebar luas atau tidak

terlalu bervariasi.

Sedangkan, jika nilai observasi dalam populasi menyebar luas

dari mean, maka variansi populasi akan besar.

30

b) Deviasi Standar Populasi

c) Variansi Sampel

d) Deviasi Standar Sampel

31

2

2( )X

N

2

2( )

1

X xs

n

2

2( )

1

X xs s

n

32

2

2

dengan:

variansi populasi

deviasi standar populasi

variansi sampel

deviasi standar sampel

mean aritmetika dari populasi

mean aritmetika dari sampel

banyaknya observasi pada populasi

banyakny

s

s

x

N

n

a observasi pada sampel

nilai dari setiap observasiX

Deviasi standar biasanya digunakan untuk

membandingkan penyebaran dalam dua atau lebih

himpunan observasi.

Semakin kecil nilai deviasi standar, maka hal itu menunjukkan

makin dekatnya nilai-nilai observasi dengan mean-nya.

Sebaliknya, jika semakin besar nilai deviasi, maka hal itu

menunjukkan semakin bervariasinya nilai-nilai observasi.

33

Contoh 8

Upah rata-rata sejumlah sampel pegawai paruh

waktu di suatu perusahaan adalah:

$12, $20, $16, $18, $19

a. Hitunglah jangkauan dari data tersebut!

b. Berapakah deviasi mean dari sampel tersebut?

c. Hitunglah variansi dari sampel tersebut?

d. Berapakah deviasi standar dari sampel tersebut?

34

Jawab:

a. Jangkauan = 20 – 12 = 8

b. Hitung mean terlebih dahulu:

Deviasi meannya adalah:

35

12 20 16 18 19 8517

5 5x

12 17 20 17 16 17 18 17 19 17

5

5 3 1 1 2 122, 4

5 5

X xMD

n

36

2

2

2 2 2 2 2

( )

1

(12 17) (20 17) (16 17) (18 17) (19 17)

5 1

4010

4

X xs

n

2 10 3,16s s

c. Variansi sampelnya adalah:

d. Deviasi standar sampelnya adalah:

37

Carilah informasi mengenai bagaimana cara menentukan:

a. kuartil

b. desil

c. persentil

pada data tunggal/data tidak terdistribusi.

Tugas 1

38

Sepuluh pemuda yang tinggal di Ancol dipilih secara acak untuk

menilai rasa dari pizza sushi terbaru yang dilapisi tuna, nasi, dan

rumput laut pada skala 1 hingga 50. Berikut adalah penilaiannya.

34 39 40 46 33

31 34 14 15 45

Tugas 2

39

a) Hitunglah rata-rata (mean), median, dan modus dari data

tersebut.

b) Hitunglah simpangan rata-rata (deviasi mean) dari data

tersebut. Interpretasikan hasilnya dengan rata-rata (mean) yang

didapat pada poin (a).

c) Berapakah jangkauan (range) dari data tersebut?

d) Hitunglah variansi dan simpangan baku (deviasi standar) dari

data tersebut.

e) Tentukan kuartil pertama, kedua, dan ketiga dari data tersebut.

f) Tentukan desil ketiga dan ketujuh dari data tersebut.

g) Tentukan persentil ke-40 dari data tersebut.

40