nota isl 17

37
Statistik Perihalan 3.1 Ukuran Kecenderungan Memusat Satu jenis pengukuran yang digunakan untuk memerihalkan set data adalah ukuran kecenderungan memusat. Pengukuran kecenderungan memusat menghasilkan maklumat berkaitan dengan titik tengah pada satu kumpulan nombor. 3.1.1 Data Tidak Berkumpul Ditunjukkan didalam Jadual 3.1 adalah harga tawaran saham bagi 20 syarikat yang akan disenaraikan di Bursa Saham Kuala Lumpur pada tahun 2000. Bagai data ini, ukuran kecenderungan memusat boleh menghasilkan maklumat berkaitan dengan purata harga tawaran, titik tengah harga tawaran dan juga harga tawaran yang paling kerap ditawarkan. Ukuran kecenderungan memusat tidak menumpukan keatas pengembangan set data atau berapa jauh nilai daripada titik tengah. Ukuran kecenderungan memusat bagi data yang tidak berkumpul adalah min, mod, median, peratusan dan quantil. Jadual 3.1 Harga Saham bagi 20 Kaunter KLSE (RM) 14.25 19.00 11.00 28.00 24.00 23.00 43.25 19.00 27.00 25.00 15.00 7.00 34.22 15.50 15.00 22.00

Upload: lovemindylee

Post on 31-Dec-2015

95 views

Category:

Documents


5 download

DESCRIPTION

LITERASI NOMBOR

TRANSCRIPT

Page 1: Nota ISL 17

Statistik Perihalan

3.1 Ukuran Kecenderungan Memusat

Satu jenis pengukuran yang digunakan untuk memerihalkan set data adalah ukuran kecenderungan memusat. Pengukuran kecenderungan memusat menghasilkan maklumat berkaitan dengan titik tengah pada satu kumpulan nombor.

3.1.1 Data Tidak Berkumpul

Ditunjukkan didalam Jadual 3.1 adalah harga tawaran saham bagi 20 syarikat yang akan disenaraikan di Bursa Saham Kuala Lumpur pada tahun 2000. Bagai data ini, ukuran kecenderungan memusat boleh menghasilkan maklumat berkaitan dengan purata harga tawaran, titik tengah harga tawaran dan juga harga tawaran yang paling kerap ditawarkan. Ukuran kecenderungan memusat tidak menumpukan keatas pengembangan set data atau berapa jauh nilai daripada titik tengah. Ukuran kecenderungan memusat bagi data yang tidak berkumpul adalah min, mod, median, peratusan dan quantil.

Jadual 3.1Harga Saham bagi 20 Kaunter KLSE (RM)

14.25 19.00 11.00 28.0024.00 23.00 43.25 19.0027.00 25.00 15.00 7.0034.22 15.50 15.00 22.0019.00 19.00 27.00 21.00

Mod

Mod adalah nilai yang paling kerap ujud didalam set data. Bagi data yang ditunjukkan didalam Jadual 3.1, mod ialah RM19.00 kerana harga tawaran berlaku sebanyak 4 kali. Menyusun data didalam susunan yang menaik (menyusun dari nombor terkecil hingga terbesar) membantu kita menentukan mod.

Berikut adalah susunan nilai daripada Jadual 3.1.

Page 2: Nota ISL 17

Pengenalan kepada Statistik Ekonomi dan Perniagaan

7.00 11.00 14.25 15.00 15.00 15.50 19.00 19.00 19.00 19.0021.00 22.00 23.00 24.00 25.00 27.00 27.00 28.00 34.22 43.25

Penyusunan ini membuatkan kita dengan mudah untuk melihat RM19.00 adalah harga yang kerap berlaku.

Jika terdapat dua kumpulan angka yang kerap ujud didalam set data, ia mempunyai dua mod. Didalam kes seperti ini, ia dikatakan bi-model. Jika set data tidak sebenarnya bi-model, tetapi mengandungi dua nilai dimana lebih dominan daripada yang lain, sesetengah penyelidik mempunyai kebebasan dengan menunjukkan set data sebagai bi-model walaupun ia sebenarnya tidat terikat kepada mod. Data set dengan lebih daripada dua mod dipanggil sebagai berbilang-model.

Didalam dunia perniagaan, konsep mod biasanya digunakan didalam menentukan saiz. Sebagai contoh, pengilang baju mengeluarkan baju didalam empat saiz, S, M, L, dan XL. Setiap saiz adalah berpadanan dengan model badan manusia. Dengan pengurangan bilangan kepada beberapa model saiz, syarikat boleh mengurangkan jumlah kos pengeluaran dengan menghadkan kos penyediaan mesin dan bahan.

Mod adalah ukuran kecenderungan memusat sesuai bagi data nominal. Mod boleh digunakan untuk menentukan manakah kategori yang kerap terjadi.

Median

Median ialah titik tengah sesuatu kumpulan nombor yang disusun secara menaik. Jika bilangan data tersebut adalah ganjil, median ialah nombor yang ditengah. Jika bilangan data adalah genap, median ialah purata dua nombor yang terletak ditengah-tengah. Langkah berikut adalah digunakan untuk menentukan median.

LANGKAH 1: Susun data didalam susunan menaik.LANGKAH 2: Jika bilangan data adalah ganjil, carikan sebutan ditengah-

tengah didalam susunan tersebut. Ia adalah median.LANGKAH 3: Jika bilangan data adalah genap, kirakan purata dua angka

ditengah-tengah susunan tersebut. Purata ini adalah median.

Katakan ahli statistik hendak mencari median bagi kumpulan data berikut:

15 11 14 3 21 17 22 16 19 16 5 7 19 8 9 20 4

2

Page 3: Nota ISL 17

Statistik Perihalan

Susunan nombor didalam sebutan menaik:

3 4 5 7 8 9 11 14 15 16 16 17 19 19 20 21 22

Terdapat 17 sebutan (bilangan ganjil), oleh itu median terletak ditengah-tengah susunan tersebut, iaitu 15.

Jika nombor 22 dikeluarkan daripada senarai, terdapat hanya 16 sebutan (bilangan genap):

3 4 5 7 8 9 11 14 15 16 16 17 19 19 20 21

Sekarang kita mempunyai bilangan sebutan genap, median ditentukan dengan mengira purata dua nombor yang terletak ditengah-tengah susunan tersebut, 14 dan 15. Ini menghasilkan nilai median iaitu 14.5.

Satu cara lain untuk menentukan median ialah mencari sebutan

didalam susunan yang menaik. Sebagai contoh, jika set data mempunyai 77 sebutan, median adalah terletak pada sebutan yang ke 39, iaitu:

Formula ini amat berguna apabila melibatkan bilangan data yang besar. Median tidak dipengaruhi oleh magnitud nilai ekstrim. Ciri-ciri ini merpakan kelebihan disebabkan nilai terbesar atau terkecil tidak mempengaruhi median. Oleh sebab itu, median merupakan ukuran lokasi yang terbaik untuk digunakan didalam analisis pembolehubah seperti kos rumah, pendapatan dan usia. Sebagai contoh, broker perumahan mahu menentukan median, harga jualan 10 buah rumah yang disenaraikan seperti berikut:

67,000 91,000 95,000 105,000 116,000 122,000 148,000 167,000 189,000 5,250,000

Median harga rumah tersebut adalah purata dua sebutan ditengah-tengah, 116,000 dan 122,000 atau 119,000. Harga ini adalah munasabah mewakili harga kesemua rumah. Perhatikan harga rumah 5,250,000 tidak termasuk didalam analisis melainkan diambil kira sebagai satu daripada 10 rumah. Jika harga rumah yang ke 10 adalah 200,000, keputusannya masih lagi sama. Walau bagaimanapun, jika semua harga rumah dipuratakan, menghasilkan harga purata 10 rumah adalah RM635,000 dan lebih tinggi daripada harga 9 rumah yang pertama.

3

Page 4: Nota ISL 17

Pengenalan kepada Statistik Ekonomi dan Perniagaan

Kelemahan median ialah tidak semua maklumat daripada data digunakan. Iaitu, maklumat berkaitan dengan harga rumah termahal tidak diambilkira didalam pengiraan median. Paras pengeluaran data mestilah sekurang-kurangnya ordinal untuk median lebih bermakna.

Min

Min aritmatik adalah susunan sinonim dengan purata kumpulan nombor dan ia dikira dengan menjumlahkan semua nombor dan membahagikannya dengan bilangan nombor tersebut. Disebabkan min aritmatik digunakan dengan meluas, kebanyakan ahli statistik hanya menggunakan istilah min sahaja.

Min populasi ditandakan dengan huruf Greek mu (). Min sampel pula ditandakan dengan huruf Roman ( ). Formula bagi mengira min bagi populasi dan min sampel adalah sebagaimana berikut:

Min populasi:

Min sampel:

Huruf Greek sigma () biasanya digunakan oleh ahli matematik untuk menunjukkan jumlah semua nombor-nombor didalam kumpulan data. Disamping itu, N adalah bilangan nombor didalam populasi dan n adalah bilangan nombor didalam sampel. Algorithma untuk mengira min adalah dengan menjumlahkan nombor-nombor didalam populasi atau sampel dan kemudiannya membahagikannya dengan bilangan populasi atau sampel.

Secara amnya, definasi min adalah:

Walau bagaimanapun, untuk tujuan kursus ini

Menandakan

4

Page 5: Nota ISL 17

Statistik Perihalan

Min adalah sesuai digunakan untuk menganalisis data sekurang-kurangnya data bertaraf interval didalam pengukuran.

Contoh 1.1

Katakan syarikat mempunyai lima jabatan dengan bilangan pekerja 24, 13, 19, 26 dan 11 masing-masingnya. Min populasi adalah:

= 24 + 13 + 19 +26 + 11 = 93

Pengiraan min sampel adalah menggunakan algorithma yang sama bagi min populasi. Walau bagaimanapun adalah tidak sesuai untuk mengira min sampel untuk populasi atau min populasi untuk sampel. Oleh kerana kedua-dua min populasi dan sampel adalah penting didalam statistik, simbol yang berasingan adalah perlu untuk membezakan min populasi dan sampel.

Min adalah dipengaruhi oleh setiap nilai didalam data, yang merupakan kelebihannya. Ia juga merupakan kelemahannya, disebabkan nilai ekstrim yang terbesar atau terkecil boleh menyebabkan nilai min tertarik kearah nilai ekstrim.

Min amat biasa digunakan didalam mengukur lokasi disebabkan ia menggunakan setiap data dalam pengiraannya dan ia mempunyai kandungan matematik yang membuatkkannya menarik untuk digunakan didalam analisis statistik pentaabiran.

Peratusan

Peratusan adalah ukuran kecenderungan memusat yang membahagikan kumpulan data kepada 100 bahagian. Terdapat 99 peratusan, disebabkan ia mengambil 99 pembahagi untuk memisahkan data kepada 99 bahagian. Peratusan ke-n adalah nilai dimana sekurang-kurangnya n peratus data terletak di bawah nilai tersebut dan selebih-lebihnya (100 – n) peratus adalah di atas nilai

5

Page 6: Nota ISL 17

Pengenalan kepada Statistik Ekonomi dan Perniagaan

tersebut. Khususnya, 87 peratusan adalah nilai dimana sekurang-kurangnya 87% daripada data di bawah nilai tersebut dan tidak lebih daripada 13% di atas nilai. Peratusan adalah nilai “anak-tangga”, sebagaimana ditunjukkan didalam Rajah 3.1, disebabkan 87 peratusan dan 88 peratusan tetapi tiada peratusan di antaranya. Jika operator kilang mengambil ujian keselamatan 87.6% sebagai skor ujian keselamatan adalah di bawah skor pekerja, ia masih lagi mempunyai skor hanya pada 87 peratusan, walaupun lebih daripada 87% skor tersebut adalah terendah.

Rajah 3.1Peraturan Anak Tangga

Berikut adalah langkah-langkah didalam menentukan kedudukan peratusan:

Langkah 1: Susun nombor didalam kedudukan menaik.Langkah 2: Kirakan kedudukan peratusan i dengan:

dimana;P = peratusan yang dikehendakii = kedudukan peratusanN = bilangan nombor didalam set data.

Langkah 3: Tentukan lokasi samada melalui (a) atau (b)

a. Jika i adalaha nombor bulat, P peratusan adalah purata nilai pada kedudukan ke i dan nilai pada kedudukan (i + 1)

b. Jika i bukan nombor bulat, nilai P peratusan adalah bahagian nombor bulat (i + 1)

6

88 peratusan

87 peratusan

86 peratusan

Page 7: Nota ISL 17

Statistik Perihalan

Contoh 3.2.

Katakan kita hendak menentukan 80 peratusan daripada 1240 nombor.

P = 80, n = 1240

1. Kedudukan 80 peratusan

2. Disebabkan oleh I = 992 dan nombor bulat, ikut langkan 3(a). 80 peratusan adalah purata nombor 992 dan 993.

Contoh 3.3

Tentukan 30 peratusan bagi 8 nombor berikut:

14 12 19 23 5 13 28 17

Penyelesaian:

1. Susun dalam keadaan susunan menaik

5 12 13 14 17 19 23 28

2. Kirakan kedudukan peratusan dengan P = 30 dan n = 8.

3. Disebabkan i bukan nombor bulat, langkah 3(b) digunakan. Nilai i + 1 = 2.4 + 1 = 3.4. Nombor bulat 3.4 ialah 3. Oleh itu 30 peratusan adalah

7

Page 8: Nota ISL 17

Pengenalan kepada Statistik Ekonomi dan Perniagaan

dikedudukan pada nilai ke 3, dan nilai ketiga ialah 13. Oleh itu 13 adalah 30 peratusan. Perhatikan bahawa peratusan mungkin atau mungkin tidak satu daripada nilai data.

Sukuan

Sukuan adalah ukuran kecenderungan memusat yang membahagikan kumpulan data kepada empat sub-kumpulan atau bahagian. Terdapat tiga sukuan, ditandakan sebagai Q1, Q2 dan Q3. Sukuan pertama, memisahkan pertama, atau terendah, satu per empat daripada tiga suku teratas adalah sama dengan 25 peratus. Quartil kedua, Q2, memisahkan suku kedua data daripada suku ketiga. Q2 adalah terletak pada 50 peratusan, dan sama dengan media bagi data. Sukuan ketiga, Q3, membahagikan tiga suku pertama daripada sukuan terakhir dan adalah sama dengan nilai 75 peratusan. Tiga sukuan ini ditunjukkan didalam Rajah 3.2.

Katakan kita hendak menentukan nilai Q1, Q2 dan Q3 dari nombor berikut:

106 109 114 116 121 122 125 129

Nilai Q1 adalah diperolehi pada 25 peratusan, P25;

Bagi n = 8; I = (8) = 2.

Disebabkan I adalah nombor bulat, P25, adalah ditemui dengan mempuratakan sebutan kedua dan ketiga.

P25 = = 111.5

Nilai Q1 adalah P25 = 111.5. Perhatikan satu per empat, atau dua, bagi nilai (106 dan 109) adalah kurang daripada 111.5.

Nilai Q2 adalah sama dengan median. Oleh kerana bilangan yang genap, median adalah purata dua sebutan ditengah:

Q2 = median = = 118.5

8

Page 9: Nota ISL 17

Statistik Perihalan

Perhatikan bahawa sebenarnya separuh daripada sebutan adalah kurang daripada Q2 dan separuh lagi lebih besar daripada Q2.

Nilai Q3 ditentukan oleh P75, sebagaimana berikut:

I = (8) = 8

Disebabkan i adalah angka bulat, maka P75 adalah purata kedudukan ke 6 dan 7.

P75 = = 123.5

Nilai Q3 adalah P75 = 123.5. Perhatikah bahawa tiga suku atau 6 sebutan, daripada nilai adalah lebih kecil daripada 123.5 dan dua daripada nilai lebih besar daripada 123.5.

3.1.2 Data Berkumpulan

Tiga ukuran kecenderungan memusat akan dibincangkan bagi data berkumpulan iaitu min, median dan mod.

Min

Bagi data yang tidak terkumpul, min adalah dikira dengan menjumlahkan nilai didalam set data dan kemudiannya membahagikannya dengan bilangan data tersebut. Tetapi bagi data yang telah terkumpul, nilai yang khusus tidak diketahui. Apakah yang boleh digunakan untuk mewakili nilai data? Titik tengah bagi setiap jeda kelas adalah digunakan untuk mewakili semua nilai didalam jeda kelas tersebut. Titik tengah ini akan diwajarkan dengan kekerapan nilai didalam jeda kelas tersebut. Min bagi data terkumpul kemudiannya dikira dengan menjumlahkan hasil dharab titik tengah kelas dengan kekerapan kelas dan membahagiman jumlah tersebut dengan bilangan kekerapan. Formulanya adalah sebagaimana berikut:

9

Page 10: Nota ISL 17

Pengenalan kepada Statistik Ekonomi dan Perniagaan

dimana;i = bilangan jedaf = kekerapan kelasM = titik tengah kelasN = jumlah kekarap.

Contoh 3.4:

Jeda Kelas Kekerapan (fi) Titik Tengah (Mi)

fiMi

1 – 3 16 2 323 – 5 2 4 85 – 7 4 6 247 – 9 3 8 249 – 11 9 10 9011 - 13 6 12 72

f = N = 40 fM = 250

Min baga data yang terkumpul adalah 6.25. Perlu diingat bahawa setiap jeda kelas diwakili oleh nilai titik tengah kelas tersebut bukannya nilai sebenar. Oleh sebab itu, nilai min tersebut hanyalah nilai penghampiran sahaja.

Median

Nilai median bagi data tidak terkumpul adalah nilai yang terletak ditengah-tengah apabila data tersebut disusun secara menaik. Bagi data yang terkumpul, pengiraan median agak rumit dan menggunakan formula berikut:

10

Page 11: Nota ISL 17

Statistik Perihalan

dimana

L = had bawah jeda kelas mediancfp = jumlah terkumpul kekerapan sehingga kelas tersebut, tetapi tidak

melibatkan kekerapan median kelasFmed = kekerapan medianW = keluasan jedia kelas median (had atas kelas – had bawah kelas)N = jumlah bilangan kekerapan

Contoh 3.5:

1. Kirakan nilai yang merupakan kedudukan sebutan ditengah-tengah.

. Oleh itu median terletak dikedudukan ke 20. Persoalannya

dikelas manakah sebutan ke 20?2. Kirakan kekerapan terkumpul bagi setiap kelas.

Jeda Kelas Kekerapan (fi) Titik Tengah (Mi)1 – 3 16 23 – 5 2 45 – 7 4 67 – 9 3 89 – 11 9 1011 - 13 6 12

f = N = 40

Berdasarkan kepada kekerapan terkumpul, sebutan ke 20 terletak didalam kelas ke tiga kerana terdapat hanya 18 nilai sahaja dalam dua kelas pertama. Oleh itu nilai median terletak dimana-mana di antara 5 – 7 (kelas ke tiga). Jeda kelas yang mengandungi nilai median dirujukkan sebagai jeda kelas median.

3. Oleh kerana nilai ke 20 adalah di antara 5 dengan 7, nilai median adalah sekurang-kurangnya 5. Tetapi apakah nilai tersebut? Perbezaan di antara

kedudukan nilai median, = 20, dan kekerapan terkumpul sehingga itu,

11

Page 12: Nota ISL 17

Pengenalan kepada Statistik Ekonomi dan Perniagaan

tetapi tidak termasuk jeda kelas median, cfp = 18, memberitahu berapa banyak nilai sehingga jeda kelas median bagi nilai median terletak. Ini

bolehb ditentukan dengan menyelesaikan – cfp = 20 – 18 = 2. Nilai

median terletak dia nilai kedalam jeda kelas median. Walau bagaimanapun,

terdapat empat nilai didalam jeda kelas median (fmed). Nilai median adalah

jauh kedalam jeda, iaitu

4. Oleh itu, nilai median sekurang-kurangnya 5 – nilai L – dan separuh jauhnya daripada jeda median. Berapa jauhkah secara geometri disepanjang jeda median? Setiap jeda kelas adalah dua unit luas (W). Separuh daripada jarak ini memberitahu kita berapa jauh nilai median ke dalam jeda kelas.

5. Menambahkan jarak ini dengan had bawah jeda kelas median menghasilkan nilai median.

Perlu diingat bahawa nilai median ini juga merupakan nilai penghampiran. Andaian yang dibuat didalam pengiraan ini adalah nilai sebenar adalah jatuh secara seragam disepanjang jeda kelas median.

Mod

Mod bagi data terkumpul adalah titik tengah kelas mod. Kelas kod adalah jeda kelas yang mempunyai kekerapan yang tertinggi. Di dalam contoh di atas, kelas

12

Page 13: Nota ISL 17

Statistik Perihalan

mod adalah di antara 1 – 3 dengan bilangan kekerapan 16. Oleh itu titik tengah kelas mod ialah 2 dan mod ialah 2.

3.2 Ukuran Serakan

3.2.1 Data tidak terkumpul

Ukuran kecenderungan memusat menghasilkan maklumat berkaitan titik tertentu bagi set data. Walau bagaimanapun, penyelidik boleh menggunakan kumpulan alatan analisis lain untuk menerangkan set data. Alat ini ialah ukuran serakan yang menerangkan serakan atau pencaran set data. Menggunakan ukuran serakan bersama-sama ukuran kecenderungan memusat membuatkan pemerihalan numerik bagi data lebih lengkap lagi.

Sebagai contoh, sebuah syarikat yang mempunyai 25 jurujual dan median jualan tahunan bagi jurujual ini ialah RM1.2 juta. Adakah jurujual tersebut merupakan kejayaan atau tidak? Median memberikan maklumat berkaitan jualan individu ditengah-tengah, tetapi bagaimana dengan jurujual yang lain? Adakah mereka semua memperolehi RM1.2 juta jualan tahunan, atau adakah angka jualan mempunyai jeda yang luas dengan saorang jurujual menjual RM 5 juta setahun dan yang lain hanya menjual RM0.15 juta setahun? Ukuran serakan memberikan maklumat tambahan yang penting untuk menjawab persoalan ini.

Rajah 3.2 menunjukkan tiga taburan dimana min bagi setiap taburan adalah sama ( = 50), tetapi taburan ini mempunyai serakan yang berbeza. Pemerhatian terhadap taburan ini menunjukkan bahawa ukuran serakan adalah perlu sebagai pelengkap kepada nilai min didalam menerangkan data. Kaedah pengiraan ukuran serakan adalah berebza bagi data tidak berkumpul dan data berkumpul. Bahagian ini akan menumpukan kepada jenis ukuran serakan bagi data tidak berkumpul.

13

Page 14: Nota ISL 17

Pengenalan kepada Statistik Ekonomi dan Perniagaan

Rajah 3.2Tiga Taburan dengan Min Sampel yang Sama dan Serakan Berbeza

Jeda

Jeda adalah perbezaan di antara nilai terbesar dan nilai terkecil. Walaupun ia hanya merupakan nilai numerik tunggal, sesetengah penyelidik mendefinasikan jeda sebagai pasangan susunan nombor terkecil dan terbesar [terkecil, terbesar]. Ia merupakan ukuran serakan kasar, menerangkan jarak ke sempadan luar set data. Ia menggambarkan nilai ekstrim disebabkan ia dibina daripadanya. Kelebihan jeda ialah ianya mudah dikira. Satu penggunaan penting jeda ialah didalam penentuan kualiti, dimana jeda digunakan untuk membentuk carta kawalan. Kelemahan jeda ialah disebabkan ia dikira dengan nilaian yang terdapat nilai ekstrim bagi data maka ia dipengaruhi oleh nilai ekstrim tersebut dan oleh itu penggunaannya adalah untuk ukuran serakan adalah terhad.

Berdasarkan kepada Jadual 3.1, nilai terkecil ialah RM7.00 dan nilai terbesar ialah RM43.25. Nilai jeda dikira dari perbezaan di antara nilai terbesar dan nilai terkecil.

Jeda = Terbesar – Terkecil = 43.25 – 7.00 = RM36.25.

Sisihan Purata Mutlah (SPM)

Sisihan purata mutlak (SPM) adalah purata nilai mutlak bagi sisihan disekitar min bagi set nombor.

14

=50

Page 15: Nota ISL 17

Statistik Perihalan

Contoh 3.6:

Jika diberi set data 5, 9, 16, 17, dan 19, maka SPM dikira sebagaimana berikut:

X X - |X - |5 -8 +89 -4 +416 +3 +317 +4 +418 +5 +5

X = 65 (X -) = 0 |X - | = 24

Disebabkan ia dikira menggunakan nilai mutlak, SPM adalah kurang berguna didalam statistik berbanding dengan lain-lain ukuran serakan. Walau bagaimanapun, didalam bidang unjuran ia biasanya digunakan untuk mengukur ralat.

Varian

Disebabkan nilai mutlak tidak bersesuaian untuk pengiraan yang mudah, ahli-ahli matematik membentuk mekanisma alternatif untuk menyelesaikan jumlah sifar sisihan daripada min. Pendekatan ini menggunakan sisihan kuasa dua daripada min. Ukuran tersebut ialah varian dan merupakan ukuran penting bagi serakan.

Varian ialah purata sisihan kuasadua dari min bagi set nombor. Populasi varian ditandakan dengan huruf Greek, 2 dan formulanya:

15

Page 16: Nota ISL 17

Pengenalan kepada Statistik Ekonomi dan Perniagaan

Menggunakan set nombor di atas, varian dikira sebagaimana berikut:

X X - ( X - |)2

5 -8 649 -4 1616 +3 917 +4 1618 +5 25

X = 65 (X -) = 0 (X - )2 = 130

Jumlah sisihan kuasadua daripada min (X - )2 bagi set nombor dipanggil sebagai Jumlah Kuasadua X (SSX). Bagi data di atas jumlah kuasadua (SSX) adalah 130. Membahagikan SSX dengan bilangan data akan menghasilkan varian.

SSX = (X - )2 = 130

Varian =

Disebabkan varian adalah dikira daripada sisihan kuasadua, keputusan akhir adalah dinyatakan didalam sebutan unit pengukuran kuasadua. Ukuran statistik didalam unit kuasadua mempunyai masalah didalam tafsiran. Oleh yang demikian, apabila digunakan didalam ukuran pemerihalan, varian hanya dipertimbangkan sebagai pengiraan pertengahan didalam proses memperolehi sisihan piawai sampel.

Sisihan Piawai

Sisihan piawai adalah ukuran serakan yang popular. Didalam penggunaan sebagai entiti yang berasingan atau sebagai sebahagian analisis lain seperti pengiraan selang keyakinan dan juga didalam pengujian hipotesis.

Sisihan piawai ialah punca kuasadua varian. Sisihan piawai populasi ditandakan sebagai , dan dikira sebagaimana berikut:

16

Page 17: Nota ISL 17

Statistik Perihalan

Berdasarkan kepada contoh di atas, nilai sisihan piawai ialah

Makna Sisihan Piawai

Apakah sisihan piawai? Apakah maknanya? Dua cara menggunakan sishan piawai iaitu peraturan empirikal dan Teorem Chebyshev

Peraturan Empirikal

Peraturan empirikal adalah peraturan asas yang amat penting yang digunakan untuk menyatakan paras penghampiran nilai yang terletak disekitar sesuatu nombor sisihan piawai.

Peraturan empirikal menggunakan hanya tiga nombor sisihan piawai: 1, 2 dan 3. Keperluan data adalah bertaburan normal mengandungi beberapa toleran, dan peraturan empirikal secara amnya digunakan selagi taburan data mempunyai bentuk lonceng.

Peraturan Empirikal1

Jarak dari min Nilai di antara jarak 1 68% 2 95% 3 99%

Jika satu set data adalah bertaburan normal atau berbentuk lonceng, hampir 68% daripada nilai data adalah disekitar satu sisihan piawai min, 95% adalah disekitar dua sisihan piawai dan hampir 100% disekitar tiga sisihan piawai.

Sebagai contoh, katakan Kementerian Perdagangan dan hal Ehwal Pengguna menyatakan purata harga ayam di Malaysia ialah RM4.50 sekilogram. Katakan harga ayam disemua negeri adalah bertaburan normal dengan sisihan piawai RM0.10. Menurut peraturan empirikal, hampir 68% daripada harga sepatutnya jatuh disekitar 1, atau RM4.50 1(0.10). Hampir 68% daripada harga di antara RM4.40 dan RM4.60, sebagaimana ditunjukkan didalam

1 Berdasarkan kepada andaian taburan data adalah hampir bertaburan normal.

17

Page 18: Nota ISL 17

Pengenalan kepada Statistik Ekonomi dan Perniagaan

Rajah 3.5a. Hampir 95% sepatutnya jatuh disekitar 2 atau RM4.50 2(0.10) = RM4.50 0.20 atau di antara RM4.30 dan RM4.70, sebagaimana ditunjukkan didalam Rajah 3.5b.

Rajah 3.5Peraturan Empirikal bagi 1 dan 2 Harga Ayam.

Perhatikan, oleh kerana 68% daripada harga ayam terletak disekitar satu sisihan piawai daripada min, hampir 32% adalah terletak diluar jeda ini. Oleh kerana taburan normal adalah simetri, 32% boleh dipisahkan dimana setengah daripadanya terletak pada setia ekor taburan tersebut. Oleh itu, hampir 16% daripada harga ayam sepatutnya kurang daripada RM4.40 dan hampir 16% daripada harga sepatutnya lebih daripada RM4.60.

Teorem Chebyshev

Peraturan empirikal digunakan hanya apabila data diketahui hampir bertaburan normal. Apakah yang perlu dilakukan apabila data tidak bertaburan normal atau bentuk taburan tidak diketahui? Teorem Chebyshev digunakan untuk semua

18

1.34 1.42 1.50 1.26 1.42 1.58 =RM1.42 =RM1.42 =RM0.08 =RM0.08

Page 19: Nota ISL 17

Statistik Perihalan

taburan walaupun bentuk taburan data tidak diketahui atau tidak normal. Walaupun teorem Chebyshev secara teorinya boleh digunakan kepada data yang mempunyai taburan normal, peraturan empirikal lebih luas digunakan dan digemari apabila bersesuaian. Teorem Chebshev bukan peraturan umum sebagaimana peraturan empirikal, tetapi mempunyai formula tertentu dan oleh itu boleh digunakan dengan meluas. Teorem Chebyshev menyatakan semurang-

kurangnya nilai adalah terletak disekitar k sisihan piawai daripada

min bergantung kepada bentuk taburan.

Khususnya teorem Chebyshev menyatakan sekurang-kurangnya 75% daripada semua nilai adalah disekitar 2 daripada min bergantung kepada kentuk taburan disebabkan jika k = 2, maka

= = = 0.75

Rajah 3.6 menggambarkan secara grafik. Sebaliknya, peraturan empirikal menyatakan bahawa jika data adalah bertaburan normal, 95% daripada semua nilai adalah disekitar 2. Menurut teorem Chebysev, peratus nilai disekitar tiga sisihan piawai bagi min adalah sekirang-kurangnya 89%, sebaliknya 99.7% bagi peraturan empirikal. Disebabkan formula adalah digunakan untuk mengira kandungan didalam teorem Chebysev, sebarang nilai k > 1 boleh digunakan. Sebai contoh, jika k = 2.5, sekurang-kurangnya semua nilai adalah disekitar 2.5, disebabkan

19

Teorem Chebyshev:

Disekitar k sisihan piawai bagi min, k terletak sekurang-kurangnya

bahagian nilai dengan andaian k > 1.

Page 20: Nota ISL 17

Pengenalan kepada Statistik Ekonomi dan Perniagaan

= = 0.84

Rajah 3.6Penggunaan Teorem Chebysev bagi Dua Sisihan Piawai.

Sisihan Piawai Populasi dan Sampel

Varian sampel ditandakan sebagai s2 dan sisihan piawai sampel ialah s. Pengiraan varian dan sisihan piawai untuk sampel berbeza sedikit daripada pengiraan untuk populasi. Tujuan utama pengiraan varian dan sisihan piawan untuk sampel adalah untuk menganggar varian dan sisihan piawai untuk populasi. Menggunakan n – 1 sebagai pembahagi (denominator) bagi sampel berbanding N untuk populasi, menghasilkan penganggaran yang lebih baik untuk nilai populasi. Oleh itu, formula berikut boleh digunakan untuk mengira varian dan sisihan piawai untuk sampel.

20

Page 21: Nota ISL 17

Statistik Perihalan

Varian untuk sampel:

Sisihan piawai untuk sampel

Skor Z

Skor Z mewakili nombor nilai sisihan piawai di atas atau di bawah min bagi set nombor apabila data adalah bertaburan normal. Menggunakan skor Z membolehkan kita menterjemahkan nilai kasar jarak daripada min kepada unit sisihan piawai.

dan untuk sampel

Jika skor Z negatif, maka nilai kasar (X) adalah di bawah min dan sebaliknya.

Contoh 3.7

Bagi set data yang bertaburan normal dengan min adalah 50 dan sisihan piawai 10, tettukan skor Z bagi nilai 70 (X = 70).

Nilai X = 70 adalah 20 unit di atas min, oleh itu

21

Page 22: Nota ISL 17

Pengenalan kepada Statistik Ekonomi dan Perniagaan

Skor Z ini menunjukkan skor kasar 70 adalah dua sisihan piawai di atas min. Bagaimana skor Z ini ditafsirkan? Peraturan empirikal menyatakan bahawa 95% daripada semua nilai adalah disekitar dua sisihan piawai dari min jika data adalah hampir bertaburan normal. Rajah 3.7 menunjukkan disebabkan nilai 70 adalah dua sisihan piawai di atas min ( Z = 2.00), 95% daripada nilai adalah di

antara 70 dan 30, iaityu dua sisihan piawai di bawah min

. Oleh kerana 5% daripada nilai diluar jeda dua sisihan piawai daripada min dan bertaburan normal adalah simetriu, 2.5% adalah di bawah nilai 30. Oleh itu, 97.5% daripada nilai adalah di bawah 70. Disebabkan skor Z adalah bilangan sisihan piawai bagi nilai individu data daripada min, peraturan empirikal boleh dinyatakan semula didalam sebutan skor Z.

Di antara Z = -1.00 dan Z = +1.00 adalah hampir 68% daripada nilaiDi antara Z = -2.00 dan Z = +3.00 adalah hampir 95% daripada nilaiDi antara Z = -3.00 dan Z = +4.00 adalah hampir 99.5% daripada nilai

Rajah 3.7:Peratus Pecahan Skor Dua Sisihan Piawai daripada Min

Pengkali Variasi (CV)

Pengkali variasi adalah statistik dimana kadar sisihan piawai terhadap min dinyatakan sebagai peratus dan ditandakan sebagai CV.

22

95%

2 2

2.5% 2.5%

X=30 =50 X=70Z=-2.0 Z=0 Z=+2.0

Page 23: Nota ISL 17

Statistik Perihalan

dan bagi sampel

Pengkali variasi adalah perbandingan relatif sisihan piawai terhadap min. CV amat berguna didalam membandingkan sisihan piawai yang dikira daripada data dengan min yang berbeza.

Contoh 3.8:

Katakan harga saham A selama 5 minggu adalah 57, 68, 64, 71 dan 62. Untuk mengira CV bagi harga ini, pertamanya kirakan min dan sisihan piawai.

Sisihan piawai adalah 7.5% daripada min.

Pelabor-pelabor kewangan menggunakan CV atau sisihan piawai atau kedua-duanya untuk mengukur risiko. Bayangkan saham dengan harga yang tidak pernah berubah. Ia tidak mempunyai risiko kehilangan wang dari harga yang menurun disebabkan tiada variabiliti harga. Sebaliknya, katakan harga saham turun-naik dengan meluas. Pelabor yang membeli pada harga rendah dan

23

Page 24: Nota ISL 17

Pengenalan kepada Statistik Ekonomi dan Perniagaan

menjual pada harga yang tinggi akan membuat keuntungan yang besar. Walau bagaimanapun, jika harga jatuh daripada apa yang dia beli, terdapat potensi mengalami kerugian. Semankin besar variabiliti, semankin tinggi potensi untuk rugi. Oleh itu, pelabor akan menggunakan ukuran serakan seperti sisihan piawai atau pebgkali variasi untuk menentukan risiko sesuatu saham. Apakah CV memberitahu kita berkaitan risiko saham yang tidak dapat diberikan oleh sisihan piawai?

Katakan purata saham B disepanjang lima minggu adalah 12, 17, 8, 15 dan 13. Min saham B ialah 13.00 dengan sisihan piawai 3.03. CV bagi saham B ialah

Sisiham piawai bagi saham B ialah 23.3% daripada min.Dengan sisihan piawai sebagai ukuran risiko, saham A adalah lebih

berisiko disepanjang tempoh masa tersebut disebabkan ia mempunyai sisihan piawai yang besar. Walau bagaimanapun, purata harga saham A adalah kurang lima kali ganda saham B. Relatif terhadap jumlah yang dilaburkan didalam saham A, sisihan piawai sebanyak RM4.04 mungkin tidak menggambarkan risiko yang lebih berbanding sisihan piawai RM3.03 bagi saham B, dimana puratanya hanyalah RM13.00. Pengkali variasi menunjukkan risiko bagi saham didalam bentuk saiz sisihan piawai relatif terhadap saiz didalam min (didalam peratus).

Saham B mempunyai CV hampir tiga kali ganda CV saham A. Menggunakan CV sebagai ukuran risiko menunjukkan saham B lebih berisiko.

Pilihan samada untuk menggunakan CV atau sisihan piawai untuk membandingkan sisihan piswai yang berbilang adalah menurut citarasa sahaja. CV juga memberikan kaedah pilihan untuk mentafsirkan nilai sisihan piawai.

3.2.2 Data Terkumpul

Dua ukuran serakan bagi data terkumpul dibincangkan disini, iaitu varian dan sisihan piawai.

Untuk populasi, varian adalah

24

Page 25: Nota ISL 17

Statistik Perihalan

dan sisihan piawai

dimana:

f = kekerapanM = titik tengah kelasN = f atau jumlah kekerapan populasi = min kumpulan bagi populasi.

Untuk sampel, varian adalah:

dan sisihan piawai

dimana

f = kekerapanM = titik tengah kelasN = f, atau jumlah kekerapan sampel

= min kumpulan bagi sampel

25

Page 26: Nota ISL 17

Pengenalan kepada Statistik Ekonomi dan Perniagaan

Contoh 3.8:

Kelas Kekerapan M fM (M - ) (M-)2 F(M-)2

1-3 16 2 32 -4.25 18.063 289.0083-5 2 4 8 -2.25 5.063 10.1265-7 4 6 24 -0.25 0.063 0.2527-9 3 8 24 1.75 3.063 9.189

9-11 9 10 90 3.75 14.063 12.56711-13 6 12 72 5.75 35.063 198.378

f=40 fM=250 633.520

Sebagaimana dengan pengiraan min data terkumpul, titik tengah kelas adalah digunakan untuk mewakili semua nilai didalam jeda kelas. Ini mungkin bersesuaian atau tidak, bergantung kepada samada nilai purata adalah pada titik tengah. Jika situasi ini tidak ujud, maka varian dan sisihan piawai adalah hanya penghampiran. Disebabkan oleh data terkumpul hanya dikira tanpa mengetahui nilai data sebenar, terdapat hanya potensi bagi statistik yang dikira hanya sebagai penghampiran sahaja.

26