nota asas pengurusan data

29
BBR 23303 -Asas Pengurusan Data 1 Asas Data 1.1 Jenis –jenis Data Terdapat 2 jenis data yang perlu diketahui oleh pelajar. Data ini sering digunakan dalam proses kajian dalam menentukan permasalahan atau mengenal pasti sesuatu perkara. Data tersebut adalah : 1. Data Kualitatif 2. Data Kuantitatif 1.1.1 Data Kualitatif Data kualitatif diperoleh melalui cerapan data kajian melalui pendekatan kualitatif. Pendekatan kualitatif ialah prosedur penyelidikan yang menghasilkan data gambaran yang boleh diamati (Lexy, 2007), tradisi tertentu dalam ilmu pengetahuan sosial yang secara fundamental bergantung kepada pengamatan manusia dalam kawasannya sendiri dan berkait dengan orang-orang tersebut dalam bahasa dan peristilahannya (Kirk & Miller, 1986). Pendekatan kualitatif dalam penyelidikan ini adalah kajian kes, adalah suatu penyelidikan yang dilakukan terhadap suatu kesatuan sistem, sama ada yang berbentuk program mahupun kejadian yang terikat oleh tempat, waktu atau ikatan tertentu (Nana, 2005). Kajian kes dilaksanakan untuk menghimpun data, memperoleh makna, dan memperoleh pemahaman daripada suatu kes. Proses pengumpulan data berdasarkan Cresswell (1998) iaitu mengenalpasti tapak atau individu, mendapatkan akses dan membina rekod, persampelan bertujuan, mengumpul data, merekod maklumat, menyelesaikan isu-isu lapangan dan menyimpan data. Data Kualitatif merupakan data bukan angka (nonnumerical data) dan tidak boleh diukur melalui skala nombor. Nilai yang dinyatakan adalah melambangkan kategori dan bukanya mewakili nilai angka sebenar. [email protected] 1

Upload: maxwhere84

Post on 31-Dec-2015

145 views

Category:

Documents


3 download

DESCRIPTION

Nota

TRANSCRIPT

Page 1: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

1Asas Data

1.1 Jenis –jenis Data

Terdapat 2 jenis data yang perlu diketahui oleh pelajar. Data ini sering digunakan dalam proses kajian dalam menentukan permasalahan atau mengenal pasti sesuatu perkara. Data tersebut adalah :

1. Data Kualitatif2. Data Kuantitatif

1.1.1 Data Kualitatif

Data kualitatif diperoleh melalui cerapan data kajian melalui pendekatan kualitatif. Pendekatan kualitatif ialah prosedur penyelidikan yang menghasilkan data gambaran yang boleh diamati (Lexy, 2007), tradisi tertentu dalam ilmu pengetahuan sosial yang secara fundamental bergantung kepada pengamatan manusia dalam kawasannya sendiri dan berkait dengan orang-orang tersebut dalam bahasa dan peristilahannya (Kirk & Miller, 1986). Pendekatan kualitatif dalam penyelidikan ini adalah kajian kes, adalah suatu penyelidikan yang dilakukan terhadap suatu kesatuan sistem, sama ada yang berbentuk program mahupun kejadian yang terikat oleh tempat, waktu atau ikatan tertentu (Nana, 2005).

Kajian kes dilaksanakan untuk menghimpun data, memperoleh makna, dan memperoleh pemahaman daripada suatu kes. Proses pengumpulan data berdasarkan Cresswell (1998) iaitu mengenalpasti tapak atau individu, mendapatkan akses dan membina rekod, persampelan bertujuan, mengumpul data, merekod maklumat, menyelesaikan isu-isu lapangan dan menyimpan data.

Data Kualitatif merupakan data bukan angka (nonnumerical data) dan tidak boleh diukur melalui skala nombor. Nilai yang dinyatakan adalah melambangkan kategori dan bukanya mewakili nilai angka sebenar. Contoh data kualitatif adalah:-

[email protected] 1

Page 2: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

Nominal

Data yang boleh dikategorikan, mempunyai nama atau label tertentu seperti jantina, respon pelajar terhadap satu kajian: ya, tidak atau tidak pasti. Contoh :-

a. Saiz baju - 1-Small, 2-Medium, 3-Large.b. Jantina - 1-Lelaki, 2-Perempuan c. Jenama telefon - 1-Nokia, 2-Samsung, 3-Cokia, 4-Sony Erickson.

Ordinal

Data yang boleh disusun mengikut tertib tetapi perbezaan nilai data tidak dapat ditafsirkan atau ditentukan. Sebagai contoh, pengetahuan komputer pelajar dikelaskan kepada cemerlang, baik, sederhana atau lemah. Contoh:-

a. Pendapat - 1 - Sangat Setuju, 2 - Setuju, 3 - Kurang Setuju,4 - Tidak setuju, 5 - Sangat Setuju.

b. Tahap kebersihan - 1 - Sangat Bersih, 2 - Bersih,3 - Tidak Bersih, 4 - Sangat Tidak Bersih

Data di atas menunjukkan nilai yang tidak melambangkan sesuatu ukuran. Ia hanya mewakili kepada sesuatu kategori seperti nilai 1 mewakili kepada pelajar lelaki dan 2 pula mewakili pelajar perempuan. Tujuannya adalah memudahkan kelompokan dan pentadbiran data.

1.1.2 Data Kuantitatif

Data kuantitatif diperoleh melalui cerapan data kajian melalui pendekatan kuantitatif. Pendekatan kuantitatif ialah penyelidikan yang menekankan kepada fenomena-fenomena objektif dan dikawal melalui pengumpulan dan analisis data (Nana, 2005; Chua, 2006; Fraenkel, 2007). Suatu penyelidikan yang melibatkan pengukuran pemboleh ubah kajian dengan menggunakan alatan saintifik dan eksperimen. Penggunaan ujian statistik terhadap sesuatu kajian adalah sebagai usaha untuk menerangkan, menjelaskan atau mencari perhubungan antara pemboleh ubah-pemboleh ubah dalam suatu penyelidikan.

Data kuantitatif adalah merupakan data berbentuk bilangan atau ukuran berangka (numerical data) dan boleh diukur serta wujud dalam skala nombor. Data yang terhasil boleh dalam bentuk :-

[email protected] 2

Page 3: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

Deskrit

Data Deskrit merupakan data dengan nilai yang tepat dan boleh nyatakan dengan nombor yang negatif. Contoh :-

Bilangan anak dalam sesebuah keluarga – 5 orang.Bilangan tandan kelapa sawit – 3 tandan.Jumlah kelahiran bayi dalam tahun 2011 – 1200 orang

Selanjar.

Data selanjar pula mempunyai sukatan data berterusan dan boleh mengambil nilai-nilai dalam satu selang. Contoh :-

Berat pelajar – 55 kg, atau boleh dinyatakan sebagai,Berat pelajar adalah di antara 45 kg – 60 kg.Tinggi Pelajar – 160 cm – 170 cm.Halaju Kenderaan – 110 km/j – 120km/

2.1 Persembahan Data

Data akan lebih mudah difahami apabila ia dianalisis dan dipersembahkan dengan baik dan berkesan. Salah satu kaedah persembahan data adalah dengan menggunakan jadual, carta dan graf. Salah satu daripada mekanisma yang paling berkesan di dalam mempersembahkan data di dalam bentuk yang bermakna untuk pembuat keputusan ialah di dalam bentuk geraf. Melalui geraf dan carta, pembuat keputusan biasanya memperolehi gambaran keseluruhan bagi data dan mencapai beberapa rumusan yang amat berguna dengan hanya mengkaji carta atau geraf. Menukarkan data kepada geraf merupakan aktiviti yang kreatif dan berseni. Salah satu daripada penggunaan penting geraf di dalam statistik adalah untuk membantu penyelidik menentukan bentuk taburan. Lima bentuk geraf yang akan dibincangkan disini: (1) histogram, (2) poligon kekerapan, (3) orgif (4) carta pai dan (4) lakaran batang dan daun.

[email protected] 3

Page 4: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

Histogram

Histogram ialah jenis carta bar menegak untuk menerangkan taburan kekerapan. Pembinaannya melibatkan kita melabelkan paksi-X sebagai titik akhir kelas dan paksi Y adalah sebagai kekerapan. Rajah dibawah menunjukkan histogram bagi taburan kekerapan. Histogram merupakan alat yang berguna untuk membezakan di antara selang kelas. Dengan melihat secara imbas kepada histogram dapat menunjukkan kepada kita selang kelas yang memberikan jumlah kekerapan yang tertinggi. Rajah dibawah dengan nyata menunjukkan jeda kelas 1-di bawah 3 mempunyai kekerapan yang tertinggi (16). Histogram boleh menunjukkan kepada kita di mana peningkatan atau penurunan yang besar terjadi di antara kelas, seperti dari kelas 1-di bawah 3 kepada 3-di bawah 5, penurunan 14, dan daripada kelas 7-di bawah 9 kepada kelas 9-di bawah 11, peningkatan6.

Rajah 2.1 Histogram Taburan Kekerapan harga Saham

[email protected] 4

Page 5: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

Poligon Kekerapan

Poligon kekerapan merupakan graf di mana segmen garisan ‘menghubungi titik tengah’ antara taburan kekerapan. Pembinaan poligon kekerapan bermula, dengan menskalakan titik akhir kelas di sepanjang paksi-X dan nilai kekerapan di sepanjang paksi-Y. Titik adalah dilakarkan bagi nilai kekerapan pada titik tengah setiap selang kelas. Menghubungi titik tengah ini akan melengkapkan poligon. Rajah di bawah merupakan contoh poligon kekerapan taburan data. Maklumat yang diperoleh dari poligon kekerapan dan histogram adalah sama.

Rajah 2.2 Poligon Kekerapan Harga Saham

[email protected] 5

Page 6: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

Orgif

Orgif adalah poligon kekerapan terkumpul. Pembinaan orgif bermula dengan melabelkan paksi-X dengan titik akhir kelas dan paksi-Y dengan kekerapan terkumpul. Rajah 2.3 menunjukkan orgif bagi kekerapan terkumpul di dalam Jadual 2.3. Orgif amat berguna apabila pembuat keputusan mahu melihat jumlah disepanjang tempoh masa. Kecerunan yang curam bagi orgive boleh digunakan untuk menunjukkan peningkatan yang mendadak di dalam kekerapan. Di dalam Rajah di bawah menunjukkan kecerunan yang curam berlaku di dalam kelas 1-di bawah 3 dan kelas 9-di bawah 11.

Rajah 2.3 : Orgif Kekerapan Terkumpul Harga Saham

[email protected] 6

Page 7: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

Carta Pie

Carta pie merupakan bahagian data di mana kawasan keseluruhan pie mewakili 100% daripada data yang dikaji dan kepingan pie merupakan peratus pecahan sub-level. Sebagai contohnya, ia digunakan untuk mempersembahkan data perniagaan, terutamanya untuk menggambarkan beberapa perkara seperti kategori belanjawan, bahagian pasaran, dan pengagihan masa dan sumber. Jadual di bawah menunjukkan jumlah aduan yang diterima oleh perkhidmatan kereta api dan Rajah berikutnya menunjukkan cara pie yang dibentuk.

Jadual 2.4: Aduan oleh Pelanggan Keretapi

Komplen Bilangan Bahagian DarjahStesyen 28,000 0.40 144.0Keupayaan Keretapi 14,700 0.21 75.6Peralatan 10,500 0.15 50.4Personel 9,800 0.14 50.6Penjadualan 7,000 0.10 36.0Jumlah 70,000 1.00 360.00

Stesyen40.0%

Keupayaan Keretapi21.0%

Peralatan15.0%

Personel14.0%

Penjadualan10.0%

Rajah 2.4 : Carta Pie Komplen Pelanggan Keretapi

[email protected] 7

Page 8: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

Batang dan Daun

Cara lain untuk menyusun data mentah ke dalam kumpulan ialah melalui lakaran batang dan daun. Teknik ini adalah mudah dan memberikan pandangan unik bagi data. Lakaran batang dan daun merupakan pembinaan melalui pengasingan digit bagi setiap nombor data kepada dua kumpulan, batang dan daun. Digit yang terkiri sekali sebagai batang dan mengandungi nilai digit yang tertinggi. Digit yang paling kanan sekali merupakan daun dan mengandungi nilai yang rendah. Jika set data mempunyai dua digit, batang merupakan nilai di sebelah kiri dan daun adalah nilai di sebelah kanan. Sebagai contoh, jika 34 adalah satu nombor, batang adalah 3 dan daun adalah 4. Bagi nombor yang mempunyai lebih dari dua gigit, pembahagian batang dan daun adalah bergantung kepada cita rasa penyelidik.

Jadual di bawah mengandungi skor pemeriksaan polisi keselamatan kilang terhadap 35 orang pekerja. Lakaran batang dan daun ditunjukkan di dalam Jadual 2.6. Kebaikan taburan ini memberikan pembuat keputusan melihat sama ada skor terletak di kedudukan teratas atau terbawah dan menentukan serakan skor tersebut. Kebaikan kedua ialah nilai data mentah yang asal adalah dikekalkan.

Jadual 2.5 : Skor Pemeriksaan Keselamatan Kilang

86 77 91 60 5576 92 47 88 6723 59 72 75 8377 68 82 97 8981 75 74 39 6779 83 70 78 9168 49 56 94 81

Jadual 2.6 : Lakaran Batang dan daun Skor Pemeriksaan Keselamatan Kilang

Batang Daun2 33 94 7 95 5 6 96 0 7 7 8 87 0 2 4 5 5 6 7 7 8 98 1 1 2 3 3 6 8 99 1 1 2 4 7

[email protected] 8

Page 9: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

Latihan 1

Berikut ialah data yang mewakili kos bagi sampel 30 harga saham harian di KLSE.

6.67 2.75 5.47 4.65 3.32 2.09 1.83 10.94 1.93 6.897.20 2.78 3.34 7.80 3.20 3.21 3.55 3.53 3.64 4.955.42 8.64 4.84 4.10 915 3.45 5.11 1.97 2.84 4.15

Menggunakan ringgit sebagai batang dan sen sebagai daun, binakan lakaran batang dan daun bagi data tersebut.

Penyelesaian:

Batang Daun1 83,93,972 09,75,78,843 20,21,32,34,45,53,55,644 10,15,65,84,955 11,42,476 67,897 20,808 649 1510 94

Latihan 2

Kategori manakah yang menghuraikan di mana pekerja bekerja? (tandakan satu sahaja)Jabatan runcitGudangAkaunPersendirian

Jabatan / Lokasi FrekuensiJabatan runcit 67Gudang 62Akaun 15Persendirian 16

Jadual 2 : Bilangan Pekerja / Jabatan (Skala Nominal)

[email protected] 9

Page 10: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

Jabatan runcit Gudang Akaun Persendirian0

10

20

30

40

50

60

70

80

Frekuensi

Frekuensi

Rajah 12: Carta Bar Bagi Data Nominal Dalam Jadual 2

Jabatan runcit42%

Gudang39%

Akaun9%

Persendirian10%

Rajah 12.6: Carta Pai Bagi Data Nominal Dalam Jadual 2

[email protected] 10

Page 11: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

2Statistik Perihalan

2.1 Ukuran Kecenderungan Memusat

Satu jenis pengukuran yang digunakan untuk memerihalkan set data adalah ukuran kecenderungan memusat. Pengukuran kecenderungan memusat menghasilkan maklumat berkaitan dengan titik tengah pada satu kumpulan nombor.

2.1.1 Data Tidak Berkumpul

Ditunjukkan di dalam Jadual 3.1 adalah harga tawaran saham bagi 20 syarikat yang akan disenaraikan di Bursa Saham Kuala Lumpur pada tahun 2000. Bagi data ini, ukuran kecenderungan memusat boleh menghasilkan maklumat berkaitan dengan purata harga tawaran, titik tengah harga tawaran dan juga harga tawaran yang paling kerap ditawarkan. Ukuran kecenderungan memusat tidak menumpukan ke atas pengembangan set data atau berapa jauh nilai daripada titik tengah. Ukuran kecenderungan memusat bagi data yang tidak berkumpul adalah min, mod, median, peratusan dan quartile.

Jadual 3.1: Harga Saham bagi 20 Kaunter KLSE (RM)

14.25 19.00 11.00 28.0024.00 23.00 43.25 19.0027.00 25.00 15.00 7.0034.22 15.50 15.00 22.0019.00 19.00 27.00 21.00

[email protected] 11

Page 12: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

Mod

Mod adalah nilai yang paling kerap wujud di dalam set data. Bagi data yang ditunjukkan di dalam Jadual 3.1, mod ialah RM19.00 kerana harga tawaran berlaku sebanyak 4 kali. Menyusun data di dalam susunan yang menaik (menyusun dari nombor terkecil hingga terbesar) membantu kita menentukan mod. Berikut adalah susunan nilai daripada Jadual 3.1.

7.00 11.00 14.25 15.00 15.00 15.50 19.00 19.00 19.00 19.0021.00 22.00 23.00 24.00 25.00 27.00 27.00 28.00 34.22 43.25

Penyusunan ini membuatkan kita dengan mudah untuk melihat RM19.00 adalah harga yang kerap berlaku. Jika terdapat dua kumpulan angka yang kerap wujud di dalam set data, ia mempunyai dua mod. Di dalam kes seperti ini, ia dikatakan bi-model. Jika set data tidak sebenarnya bi-model, tetapi mengandungi dua nilai di mana lebih dominan daripada yang lain, sesetengah penyelidik mempunyai kebebasan dengan menunjukkan set data sebagai bi-model walaupun ia sebenarnya tidak terikat kepada mod. Data set dengan lebih daripada dua mod dipanggil sebagai berbilang-model.

Di dalam dunia perniagaan, konsep mod biasanya digunakan di dalam menentukan saiz. Sebagai contoh, pengilang baju mengeluarkan baju di dalam empat saiz, S, M, L, dan XL. Setiap saiz adalah berpadanan dengan model badan manusia. Dengan pengurangan bilangan kepada beberapa model saiz, syarikat boleh mengurangkan jumlah kos pengeluaran dengan menghadkan kos penyediaan mesin dan bahan.

Mod adalah ukuran kecenderungan memusat sesuai bagi data nominal. Mod boleh digunakan untuk menentukan manakah kategori yang kerap terjadi.

[email protected] 12

Page 13: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

Median

Median ialah titik tengah sesuatu kumpulan nombor yang disusun secara menaik. Jika bilangan data tersebut adalah ganjil, median ialah nombor yang di tengah. Jika bilangan data adalah genap, median ialah purata dua nombor yang terletak di tengah-tengah. Langkah berikut adalah digunakan untuk menentukan median.

Langkah 1: Susun data di dalam susunan menaik.Langkah 2: Jika bilangan data adalah ganjil, carikan sebutan di tengah-tengah di

dalam susunan tersebut. Ia adalah median.Langkah 3: Jika bilangan data adalah genap, kirakan purata dua angka di tengah-

tengah susunan tersebut. Purata ini adalah median.

Katakan ahli statistik hendak mencari median bagi kumpulan data berikut:

15

11 14 3 21 17 22 16 19 16 5 7 19 8 9 20 4

Susunan nombor di dalam sebutan menaik:

3 4 5 7 8 9 11

14 15

16 16

17 19

19 20

21 22

Terdapat 17 sebutan (bilangan ganjil), oleh itu median terletak di tengah-tengah susunan tersebut, iaitu 15. Jika nombor 22 dikeluarkan daripada senarai, terdapat hanya 16 sebutan (bilangan genap):

3 4 5 7 8 9 11 14 15 16 16 17 19 19 20 21

Sekarang kita mempunyai bilangan sebutan genap, median ditentukan dengan mengira purata dua nombor yang terletak di tengah-tengah susunan tersebut, 14 dan 15. Ini menghasilkan nilai median iaitu 14.5. Satu cara lain untuk menentukan median ialah

mencari sebutan n+1

2 di dalam susunan yang menaik. Sebagai contoh, jika set data mempunyai 77 sebutan, median adalah terletak pada sebutan yang ke 39, iaitu:

n + 12

=77 + 12

= 39

Formula ini amat berguna apabila melibatkan bilangan data yang besar. Median tidak dipengaruhi oleh magnitud nilai ekstrem. Ciri-ciri ini merupakan kelebihan

[email protected] 13

Page 14: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

disebabkan nilai terbesar atau terkecil tidak mempengaruhi median. Oleh sebab itu, median merupakan ukuran lokasi yang terbaik untuk digunakan di dalam analisis pembolehubah seperti kos rumah, pendapatan dan usia. Sebagai contoh, broker perumahan mahu menentukan median, harga jualan 10 buah rumah yang disenaraikan seperti berikut:

67,000 91,000 95,000 105,000 116,000 122,000 148,000 167,000 189,000 5,250,000

Median harga rumah tersebut adalah purata dua sebutan di tengah-tengah, 116,000 dan 122,000 atau 119,000. Harga ini adalah munasabah mewakili harga kesemua rumah. Perhatikan harga rumah 5,250,000 tidak termasuk di dalam analisis melainkan diambil kira sebagai satu daripada 10 rumah. Jika harga rumah yang ke 10 adalah 200,000, keputusannya masih lagi sama. Walau bagaimanapun, jika semua harga rumah dipuratakan, menghasilkan harga purata 10 rumah adalah RM635,000 dan lebih tinggi daripada harga 9 rumah yang pertama.

Kelemahan median ialah tidak semua maklumat daripada data digunakan. Iaitu, maklumat berkaitan dengan harga rumah termahal tidak diambil kira di dalam pengiraan median. Paras pengeluaran data mestilah sekurang-kurangnya ordinal untuk median lebih bermakna.

Min

Min aritmetik adalah susunan sinonim dengan purata kumpulan nombor dan ia dikira dengan menjumlahkan semua nombor dan membahagikannya dengan bilangan nombor tersebut. Disebabkan min aritmetik digunakan dengan meluas, kebanyakan ahli statistik hanya menggunakan istilah min sahaja.

Min populasi ditandakan dengan huruf Greek mu (). Min sampel pula

ditandakan dengan huruf Roman (X ). Formula bagi mengira min bagi populasi dan min sampel adalah sebagaimana berikut:

Min populasi:μ=

∑ X

N=

X 1+ X2+ X3+ .. .. .. . .. .. XN

N

Min sampel:X=

∑ X

n=

X1+ X2+ X3+.. . .. .. . .. . Xn

n

Huruf Greek sigma () biasanya digunakan oleh ahli matematik untuk menunjukkan jumlah semua nombor-nombor di dalam kumpulan data. Di samping itu,

[email protected] 14

Page 15: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

N adalah bilangan nombor di dalam populasi dan n adalah bilangan nombor di dalam sampel. Algoritma untuk mengira min adalah dengan menjumlahkan nombor-nombor di dalam populasi atau sampel dan kemudiannya membahagikannya dengan bilangan populasi atau sampel.

Secara amnya, definisi min adalah:

μ=∑i=1

N

X i

N

Walau bagaimanapun, untuk tujuan rujukan ini

∑ X Menandakan ∑i=1

N

X i

Min adalah sesuai digunakan untuk menganalisis data sekurang-kurangnya data bertaraf interval di dalam pengukuran.

Contoh 1.1

Katakan syarikat mempunyai lima jabatan dengan bilangan pekerja 24, 13, 19, 26 dan 11 masing-masingnya. Min populasi adalah:

∑ X = 24 + 13 + 19 +26 + 11 = 93

μ=∑ X

N=

935

= 18 .6

Pengiraan min sampel adalah menggunakan algoritma yang sama bagi min populasi. Walau bagaimanapun adalah tidak sesuai untuk mengira min sampel untuk populasi atau min populasi untuk sampel. Oleh kerana kedua-dua min populasi dan sampel adalah penting di dalam statistik, simbol yang berasingan adalah perlu untuk membezakan min populasi dan sampel.

Min adalah dipengaruhi oleh setiap nilai di dalam data, yang merupakan kelebihannya. Ia juga merupakan kelemahannya, disebabkan nilai ekstrem yang terbesar atau terkecil boleh menyebabkan nilai min tertarik ke arah nilai ekstrem.

[email protected] 15

Page 16: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

Min amat biasa digunakan di dalam mengukur lokasi disebabkan ia menggunakan setiap data dalam pengiraannya dan ia mempunyai kandungan matematik yang membuatkannya menarik untuk digunakan di dalam analisis statistik pentadbiran.

Peratusan

Peratusan adalah ukuran kecenderungan memusat yang membahagikan kumpulan data kepada 100 bahagian. Terdapat 99 peratusan, disebabkan ia mengambil 99 pembahagi untuk memisahkan data kepada 99 bahagian. Peratusan ke-n adalah nilai dimana sekurang-kurangnya n peratus data terletak di bawah nilai tersebut dan selebih-lebihnya (100 – n) peratus adalah di atas nilai tersebut. Khususnya, 87 peratusan adalah nilai dimana sekurang-kurangnya 87% daripada data di bawah nilai tersebut dan tidak lebih daripada 13% di atas nilai. Peratusan adalah nilai “anak-tangga”, sebagaimana ditunjukkan di dalam Rajah 3.1, disebabkan 87 peratusan dan 88 peratusan tetapi tiada peratusan di antaranya. Jika operator kilang mengambil ujian keselamatan 87.6% sebagai skor ujian keselamatan adalah di bawah skor pekerja, ia masih lagi mempunyai skor hanya pada 87 peratusan, walaupun lebih daripada 87% skor tersebut adalah terendah.

Rajah 3.1Peraturan Anak Tangga

Berikut adalah langkah-langkah di dalam menentukan kedudukan peratusan:

Langkah 1: Susun nombor di dalam kedudukan menaik.Langkah 2: Kirakan kedudukan peratusan i dengan:

i = P100

(n)

Di mana;P = peratusan yang dikehendakii = kedudukan peratusanN = bilangan nombor di dalam set data.

Langkah 3: Tentukan lokasi samada melalui (a) atau (b)

[email protected] 16

88 peratusan

87 peratusan86 peratusan

Page 17: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

a. Jika i adalah nombor bulat, P peratusan adalah purata nilai pada kedudukan ke i dan nilai pada kedudukan (i + 1)

b. Jika i bukan nombor bulat, nilai P peratusan adalah bahagian nombor bulat (i + 1)

Contoh 3.2.

Katakan kita hendak menentukan 80 peratusan daripada 1240 nombor.

P = 80, n = 1240

1. Kedudukan 80 peratusan

i =80100

(1240)= 992

2. Disebabkan oleh I = 992 dan nombor bulat, ikut langkan 3(a). 80 peratusan adalah purata nombor 992 dan 993.

P80=nombor 992 + nombor 993

2

= 992.5

Contoh 3.3

Tentukan 30 peratusan bagi 8 nombor berikut:

14 12 19 23 5 13 28 17

Penyelesaian:

1. Susun dalam keadaan susunan menaik

5 12 13 14 17 19 23 28

2. Kirakan kedudukan peratusan dengan P = 30 dan n = 8.

i =30100

(8)= 2 . 4

3. Disebabkan i bukan nombor bulat, langkah 3(b) digunakan. Nilai i + 1 = 2.4 + 1 = 3.4. Nombor bulat 3.4 ialah 3. Oleh itu 30 peratusan adalah di kedudukan pada nilai

[email protected] 17

Page 18: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

ke 3, dan nilai ketiga ialah 13. Oleh itu 13 adalah 30 peratusan. Perhatikan bahawa peratusan mungkin atau mungkin tidak satu daripada nilai data.

Sukuan

Sukuan adalah ukuran kecenderungan memusat yang membahagikan kumpulan data kepada empat sub-kumpulan atau bahagian. Terdapat tiga sukuan, ditandakan sebagai Q1, Q2 dan Q3. Sukuan pertama, memisahkan pertama, atau terendah, satu per empat daripada tiga suku teratas adalah sama dengan 25 peratus. Quartil kedua, Q2, memisahkan suku kedua data daripada suku ketiga. Q2 adalah terletak pada 50 peratusan, dan sama dengan media bagi data. Sukuan ketiga, Q3, membahagikan tiga suku pertama daripada sukuan terakhir dan adalah sama dengan nilai 75 peratusan. Tiga sukuan ini ditunjukkan di dalam Rajah 3.2.

Katakan kita hendak menentukan nilai Q1, Q2 dan Q3 dari nombor berikut:

106 109 114 116 121 122 125 129

Nilai Q1 adalah diperolehi pada 25 peratusan, P25;

Bagi n = 8; I =

25100 (8) = 2.

Disebabkan I adalah nombor bulat, P25, adalah ditemui dengan mempuratakan sebutan kedua dan ketiga.

P25 =

109 + 1142 = 111.5

Nilai Q1 adalah P25 = 111.5. Perhatikan satu per empat, atau dua, bagi nilai (106 dan 109) adalah kurang daripada 111.5.

Nilai Q2 adalah sama dengan median. Oleh kerana bilangan yang genap, median adalah purata dua sebutan ditengah:

Q2 = median =

116 + 1212 = 118.5

[email protected] 18

Page 19: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

Perhatikan bahawa sebenarnya separuh daripada sebutan adalah kurang daripada Q2 dan separuh lagi lebih besar daripada Q2.

Nilai Q3 ditentukan oleh P75, sebagaimana berikut:

I =

75100 (8) = 8

Disebabkan i adalah angka bulat, maka P75 adalah purata kedudukan ke 6 dan 7.

P75 =

122 + 1252 = 123.5

Nilai Q3 adalah P75 = 123.5. Perhatikan bahawa tiga suku atau 6 sebutan, daripada nilai adalah lebih kecil daripada 123.5 dan dua daripada nilai lebih besar daripada 123.5.

Data Berkumpulan

Tiga ukuran kecenderungan memusat akan dibincangkan bagi data berkumpulan iaitu min, median dan mod.

Min

Bagi data yang tidak terkumpul, min adalah dikira dengan menjumlahkan nilai di dalam set data dan kemudiannya membahagikannya dengan bilangan data tersebut. Tetapi bagi data yang telah terkumpul, nilai yang khusus tidak diketahui. Apakah yang boleh digunakan untuk mewakili nilai data? Titik tengah bagi setiap jeda kelas adalah digunakan untuk mewakili semua nilai di dalam jeda kelas tersebut. Titik tengah ini akan diwajarkan dengan kekerapan nilai di dalam jeda kelas tersebut. Min bagi data terkumpul kemudiannya dikira dengan menjumlahkan hasil dharab titik tengah kelas dengan kekerapan kelas dan membahagiman jumlah tersebut dengan bilangan kekerapan. Formulanya adalah sebagaimana berikut:

μkumpulan=∑ f i mi

∑ f i

=f 1 m1+ f 2 m2+.. . .. .. . . f i mi

f 1+ f 2+.. .+ fi

Di mana;i = bilangan jedaf = kekerapan kelasM = titik tengah kelas

[email protected] 19

Page 20: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

N = jumlah kekarap.

Contoh 3.4:

Jeda Kelas Kekerapan (fi) Titik Tengah (Mi)

fiMi

1 – 3 16 2 323 – 5 2 4 85 – 7 4 6 247 – 9 3 8 249 – 11 9 10 9011 - 13 6 12 72

f = N = 40 fM = 250

μ=∑ f i M i

∑ f i

=25040

= 6 . 25

Min bagi data yang terkumpul adalah 6.25. Perlu diingat bahawa setiap jeda kelas diwakili oleh nilai titik tengah kelas tersebut bukannya nilai sebenar. Oleh sebab itu, nilai min tersebut hanyalah nilai penghampiran sahaja.

Median

Nilai median bagi data tidak terkumpul adalah nilai yang terletak di tengah-tengah apabila data tersebut disusun secara menaik. Bagi data yang terkumpul, pengiraan median agak rumit dan menggunakan formula berikut:

Median = L +N2

- cf p

f med

(W )

Di mana

L = had bawah jeda kelas mediancfp = jumlah terkumpul kekerapan sehingga kelas tersebut, tetapi tidak

melibatkan kekerapan median kelasFmed = kekerapan medianW = keluasan jeda kelas median (had atas kelas – had bawah kelas)N = jumlah bilangan kekerapan

[email protected] 20

Page 21: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

Contoh 3.5:

1. Kirakan nilai N2 yang merupakan kedudukan sebutan di tengah-tengah.

N2= 40

2= 20 .

Oleh itu median terletak di kedudukan ke 20. Persoalannya di kelas manakah sebutan ke 20?

2. Kirakan kekerapan terkumpul bagi setiap kelas.

Jeda Kelas Kekerapan (fi) Titik Tengah (Mi)

1 – 3 16 23 – 5 2 45 – 7 4 67 – 9 3 89 – 11 9 1011 - 13 6 12

f = N = 40

Berdasarkan kepada kekerapan terkumpul, sebutan ke 20 terletak di dalam kelas ke tiga kerana terdapat hanya 18 nilai sahaja dalam dua kelas pertama. Oleh itu nilai median terletak di mana-mana di antara 5 – 7 (kelas ke tiga). Jeda kelas yang mengandungi nilai median dirujukkan sebagai jeda kelas median.

3. Oleh kerana nilai ke 20 adalah di antara 5 dengan 7, nilai median adalah sekurang-kurangnya 5. Tetapi apakah nilai tersebut? Perbezaan di antara kedudukan nilai

median, N2 = 20, dan kekerapan terkumpul sehingga itu, tetapi tidak termasuk jeda

kelas median, cfp = 18, memberitahu berapa banyak nilai sehingga jeda kelas

median bagi nilai median terletak. Ini boleh ditentukan dengan menyelesaikan N2 –

cfp = 20 – 18 = 2. Nilai median terletak dia nilai ke dalam jeda kelas median. Walau bagaimanapun, terdapat empat nilai di dalam jeda kelas median (fmed). Nilai

median adalah 24 jauh ke dalam jeda, iaitu

N2

- cf p

f med

=20 - 184

=24=1

2

4. Oleh itu, nilai median sekurang-kurangnya 5 – nilai L – dan separuh jauhnya daripada jeda median. Berapa jauhkah secara geometri di sepanjang jeda median? Setiap jeda kelas adalah dua unit luas (W). Separuh daripada jarak ini memberitahu kita berapa jauh nilai median ke dalam jeda kelas.

N2

- cf p

f med

(W )=402

- 18

4(2 )=2

4(2 )=1

2(2 )= 1

[email protected] 21

Page 22: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

5. Menambahkan jarak ini dengan had bawah jeda kelas median menghasilkan nilai median.

Median = L +N2

- cf p

f med

(W )= 5 +202

- 18

4(2)= 5 + 1

2(2 )= 5 + 1 = 6

Perlu diingat bahawa nilai median ini juga merupakan nilai penghampiran. Andaian yang dibuat di dalam pengiraan ini adalah nilai sebenar adalah jatuh secara seragam di sepanjang jeda kelas median.

Mod

Mod bagi data terkumpul adalah titik tengah kelas mod. Kelas kod adalah jeda kelas yang mempunyai kekerapan yang tertinggi. Di dalam contoh di atas, kelas mod adalah di antara 1 – 3 dengan bilangan kekerapan 16. Oleh itu titik tengah kelas mod ialah 2 dan mod ialah 2.

Contoh 3.8:

Kelas Kekerapan M fM (M - ) (M-)2 F(M-)2

1-3 16 2 32 -4.25 18.063 289.0083-5 2 4 8 -2.25 5.063 10.1265-7 4 6 24 -0.25 0.063 0.2527-9 3 8 24 1.75 3.063 9.189

9-11 9 10 90 3.75 14.063 12.56711-13 6 12 72 5.75 35.063 198.378

f=40 fM=250 633.520

μ=∑ fM

∑ f=

25040

= 6 . 25

σ 2=∑ f (M - μ )2

∑ f =633 .52

40 = 15. 838

σ=√σ2=√15 .838 = 3 . 980

[email protected] 22

Page 23: Nota Asas Pengurusan Data

BBR 23303 -Asas Pengurusan Data

[email protected] 23