kul 05 spss_eb

111
SPSS TATAP MUKA KE V COUNTING RESPONSES FOR COMBINATIONS OF VARIABLES 111-125 30-1-2009 dosen Prof. Dr. H. Soedito Adjisoedarmo

Upload: stmik-wu-purwokerto

Post on 07-Jul-2015

149 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Kul 05 spss_eb

SPSSTATAP MUKA KE V

COUNTING RESPONSES FOR COMBINATIONS

OF VARIABLES 111-125

30-1-2009

dosen Prof. Dr. H. Soedito Adjisoedarmo

Page 2: Kul 05 spss_eb

BAGAIMANA CARA ANDA DAPAT MENGKAJI HUBUNGAN ANTARA DUA ATAU LEBIH VARIABLES ?

MENGAPA FREKUENSI TABEL BELUM MEMADAI UNTUK MENJAWAB PERTANYAAN TSB ? APA YANG DIMAKSUD CROSSTABULATION(TABULASI SILANG) ?

COUNTING RESPONSES FORCOMBINATIONS OF VARIABLES

Page 3: Kul 05 spss_eb

Sebutkan jenis percentages yang dapat Anda hitung untuk crosstabulation,Dan bagaimana anda memilih Persentase tersebut ?

Apa yang dimaksud dependent variable ?Apa yang dimaksud independet variable?

Bagaimana kalau anda ingin mengamatiLebih dari dua variabel ?

Bagaiman cara anda menggunakanChart untuk menmenggambarkan Crosstabulation ?

Page 4: Kul 05 spss_eb

Prosedur mean dan explore yang disediakan spss, hanya berguna apabila mean dan standar deviasi merupakan mengukuran yang tepat untuk variabel yang dikaji.

Anda tidak dapat menggunakan prosedur mean dan explore untuk mengamati hubungan antara warna mobil yang dikenderai dan daerah, karena tidak bermakna anda mencari mean warna dan derah.

Page 5: Kul 05 spss_eb

Apabila anda ingin mengetahui hubungan antara dua variabel yang bernialai kecil atau catagorical variables, anda dapat menggunakan crosstabu lation, tabel yang berisi cacah/jumlah kominasi nilai dua variabel yang sering muncul.

ContohAnda dapat menghitung berapa wanita dan pria dalam kategori job satisfaction, atau anda dapat mengamati distribusi warna mobil pada suatu daerah.

Page 6: Kul 05 spss_eb

Akan digunakan crosstabulation untuk mengamati hubungan antara job satisfaction dengan total family income, diukur dengan four point scale.

Untuk pembahasan tetap digunakan file gss, dan dilab anda menggunakan file umpan balik.

Page 7: Kul 05 spss_eb
Page 8: Kul 05 spss_eb
Page 9: Kul 05 spss_eb
Page 10: Kul 05 spss_eb
Page 11: Kul 05 spss_eb
Page 12: Kul 05 spss_eb
Page 13: Kul 05 spss_eb

Pada gss, responden diminta untuk memilih rentangan nilai yang sesuai dengan famiy income-nya. Tersedia 21 kategori income mulai dari di bawah $1000 (kode 1) sampai $ 75,000 (kode 21).

Untuk mengamati hubungan antara income dengan job satis faction, digunakan 4 kategori income yang memiliki jumlah responden yang hampir sama

INCOME AND JOB SATISFACTION

Page 14: Kul 05 spss_eb

Digunakan income4, yang berisi data yang disusun dalam quartile katagori.

Pada fig. 7.1 terlihat frekuensi distribusi dari 4 kategori income, yang secara kasar 25% responden masuk dalam setiap kategori.

Page 15: Kul 05 spss_eb

GUNAKAN VARIABEL INCOME4

Page 16: Kul 05 spss_eb

GUNAKAN PROSEDUR FREQUENCY

Page 17: Kul 05 spss_eb
Page 18: Kul 05 spss_eb
Page 19: Kul 05 spss_eb

FIG 7.1 FREQUENCY TABEL FOR INCOME QUAERTILE UNTUK FULL-TIME EMPLOYEES)

Page 20: Kul 05 spss_eb

Untuk mengamati hubungan antera income dengan job satis fication, dihitung jumlah pada very satisfied, moderately satis fied, dan a little dissatis fied, serta very dissatisfied responden dana masing-masing kategori income.

Fig 7.2 menampilkan informasi tersebut.

Page 21: Kul 05 spss_eb
Page 22: Kul 05 spss_eb
Page 23: Kul 05 spss_eb

FIG 7.2 CROSSTABULATION OF JOB SATISFACTION BY INCOME

Page 24: Kul 05 spss_eb

Di kolom kanan bawah terdapat totals (174, 194, 156, 223 dan 747), sering disebut marginal totals, disebabkan kerna terletak di margin tabel.

Will the marginal totals that i get in a crosstabulation table always be the same as those i wpuld get from frequency tables for the variables individually ?

Page 25: Kul 05 spss_eb

Jawabnya tidak, kalau ada missing values, untuk salah satu dari dua variabel dalam crosstab tsb.

ContohPada tabel fig 7.2 hanya melibatkan data tanpa missing values, baik untuk income maupun job satisfaction.

Kalau menggunakan prosedur frequency untuk income, case dengan missing value disisihkan dari case valid.

Page 26: Kul 05 spss_eb

Statistics

Total Family Income in quartiles1500

0ValidMissing

N

Total Family Income in quartiles

585 39,0 39,0 39,0

300 20,0 20,0 59,0

230 15,3 15,3 74,3

385 25,7 25,7 100,0

1500 100,0 100,0

24,999 or

less

25,000 to

39,999

40,000 to

59,999

60,000 or

more

Total

Valid

Frequency Percent

Valid

Percent

Cumula

tive

Percent

Page 27: Kul 05 spss_eb

Statistics

Job or Housework1143

357ValidMissing

N

Job or Housework

491 32,7 43,0 43,0

472 31,5 41,3 84,3

127 8,5 11,1 95,4

53 3,5 4,6 100,0

1143 76,2 100,0

309 20,6

1 ,1

47 3,1

357 23,8

1500 100,0

Very satisfied

Mod satisfied

A littledissatisfied

Very dissatisfied

Total

Valid

NAP

DK

NA

Total

Missing

Total

Frequency PercentValid

Percent

Cumulative

Percent

Page 28: Kul 05 spss_eb

ER

Informasi yang dapat dibaca pada crosstab sebagai berikut.

53 respoden dg kategori income terendah menjawab, satisfied dengan pekerjaannya, 90 dari kategori kedua, 74 dari kategori ketiga dan 110 responden dari kategori gaji tertinggi, yang menjawab puas terhdap pekerjaanya.

Jumlah tersebut belum dapat digunakan untuk membandingkan

SKALA NOMINAL

Page 29: Kul 05 spss_eb

Untuk membandingkan anda harus menggunakan persentase.

Setelah diketahui persentasenya, hubungan antara job satisfac tion dan income dapat dijelas kan dengan benar.

Page 30: Kul 05 spss_eb
Page 31: Kul 05 spss_eb

SKALA PENGUKURANSKALA PENGUKURANYANG PERLU DIINGATYANG PERLU DIINGATWHEN ARE STATISTICS APPLICABLE ?WHEN ARE STATISTICS APPLICABLE ?

The data type fall into a sort of hierarchy so that any statistic or procedure that is applicable for the lowest type is also applicable for all higher type.The lowest type of data in the hierarchy is called Nominal data .

Page 32: Kul 05 spss_eb

Nominal data, is the type of data that we normally call categorical data. In this type of data the values merely substitutes for names of values.An example of nominal data would be Church. This variable could take on values such as (1) Lutheran , (2) Methodist, (3) Catholic, and (4) Jewish, etc.

Page 33: Kul 05 spss_eb

Alphanumeric data can also be described as nominal data. None of the statistics (mean, variance, range, sum, std err, kurtosis, minimum, std dev, skewness, sum) however Frequencies or Crosstabs are applicable.

Page 34: Kul 05 spss_eb

Bila anda menggunakan skala nomial, maka anda membuat partisi dalam suatu himpunan ke dalam kelompok-2 yg mutually exclusive (mewakili kajadian yang berbeda) dan collectively exhaustic (dapat menjelaskan semua kejadian yg terjadi dalam kelompok tersebut).

SKALA NOMINAL

Page 35: Kul 05 spss_eb

VARIABEL NOMINAL

Varibel yang ditetapkan berdasar atas proses penggolongan. Variabel nominal bersifat diskrit dan saling pilah (mutually exclusive) antara kategori yang satu dengan kategori yang lain.

Contoh: jenis kelamin, status perkawinan, dan jenis pekerjaan

Page 36: Kul 05 spss_eb

The next data types is The next data types is called Ordinal datacalled Ordinal data

Ordinal data

This type of data has a particular order to its values. For example a rating on FOOD at a restaurant with values good, fair, dan poor would be ordinal data. Another example of ordinal data would be an opinion survey with answers such as strongly agree, agree, neutral, disagree, strongly disagree.

Page 37: Kul 05 spss_eb

Ordinal data can be ranked from high to low which makes the statistics minimum, maximum, dan rangeminimum, maximum, dan range applicable.

Most statisticians agree that the other statistics and procedures such as mean, Pearson corr and regression should not be used with ordinal data.

Page 38: Kul 05 spss_eb

SKALA ORDINAL

Mencakup ciri-2 skala nominal ditambah satu yaitu urutan.Skala ordinal dapat dipakai jika postulat mengenai transitivitas dipenuhi. Postulat tsb menyatakan bahwa apabila a lebih besar dari b dan b lebih besar dari c, maka a lebih besar dari c (a>b>c).

Urutan yang dapat dipakai adalah :lebih dari……………….kurang dari…………….di atas ………………….di bawah……………….

Page 39: Kul 05 spss_eb

SKALA ORDINAL

Contoh skala pendapat, skala preferensi, Statistik yang dapat dipakai: median, persentil (seperseratusan) dan kuartil (seperempatan) menyatakan sebaran nya.Ukuran uji nyata secara statistik menggunakan metode non-para metrik (Steel & Torrie, 19--; hal 533)

Page 40: Kul 05 spss_eb

VARIABEL ORDINALVARIABEL ORDINAL

Variabel yang disusun atas jenjang dalam atribut tertentu. Jenjang tertinggi biasanya diberi angka 1, jenjang di bawah nya diberi angka 2, dan seterusnya.

Contoh: ranking hasil lomba

Page 41: Kul 05 spss_eb

INTERVAL DATAINTERVAL DATA

The third type of data is in interval level data. We frequently call this metric or continues data. In addition to having a order like ordinal data this type of data also as a fixed unit of measurement.

An example of an interval level variable would be temperature. This variable is interval since the distance between 30 and 1 degrees is the same as the distance between any other two consecutive degrees.

Page 42: Kul 05 spss_eb

INTERVAL DATA

All of the statistics including mean, standard deviation, standard error, variance, kurtosis and skewness are applicable for this kind of data,

The procedures Pearson Corr dan Regression are also applicable

Page 43: Kul 05 spss_eb

SKALA INTERVALSKALA INTERVAL

Skala interval memiliki keampuhan skala ordinal dan niminal masih ditambah lagi dengan mencakup kesamaan interval (jarak antara 1 dan 2, sama dengan jarak antara 2 dengan 3).

Waktu kalender merupakan contoh skala interval. Dapat juga untuk skala sikap. Ukuran sentralnya adalah rata-rata hitung. Prosedur statistik yang dapat dipakai antara lain: korelasi product moment, uji t, dan uji F .

Page 44: Kul 05 spss_eb

VARIABEL INTERVALVARIABEL INTERVAL

Variabel yang dihasilkan dari pengukuran, yang di dalam pengukuran itu dasumsikan terdapat satuan pengukuran yang sama .

Contoh: prestasi belajar, sikap terhadap……, penghasilan, dsb

Page 45: Kul 05 spss_eb

RATIO DATA

The forth and highest type of data in the hierarchy is called ratio data.

This type of data has all the properties of ordinal data but has added the additional property of having a zero point in its measurement scheme.

Page 46: Kul 05 spss_eb

SKALA RASIO

Memiliki semua keampuhan dari skala nominal, ordinal, dan interval, dan ditambah dengan memiliki titik nol.

Skala rasio mencerminkan jumlah yang sebenarnya dari dari suatu variabel.

Page 47: Kul 05 spss_eb

SKALA RASIO

Contoh: ukuran dimensi fisik seperti berat, tinggi, jarak dan lsb. Dalam penelitian bisnis banyak ditemui /digunakan skala rasio misalnya: nilai uang, jumlah pupulasi, jarak, jumlah waktu dalam periode waktu.

Semua prosedur teknik dapat diterapkan untuk skala rasio.

Page 48: Kul 05 spss_eb

VARIABEL RASIO

Variabel yang dalam kuantifi kasinya mempunyai nilai nol mutlak. Di dalam penelitian , terlebih-lebih dalam penelitian ilmu sosial, orang jarang menggunakan variabel rasio.

Page 49: Kul 05 spss_eb

Mode, Median dan Arithmetic Average

Mode, Median dan Arithmetic average merupakan pengukuran central tendency yang paling banyak dipakai.

Mode diperoleh dengan cara mendapat frekuensi yang paling sering muncul. Mode, karena tidak membutuhkan nilai variabel mempunyai makna, maka sering digunakan untuk skala nominal.

Page 50: Kul 05 spss_eb

Mode jarang dilaporkan sendi rian, biasanya dilengkapi dengan tabel frekuensi dan bar chart. Dengan menggunakan mode kesalahan mudah terjadi apabila digunakan untuk karakteristik variabel.

Mode hanya memberikan infor masi sedikit.

Page 51: Kul 05 spss_eb

Apabila anda merangkum suatu variabel yang nilainya dapat diurutkan dari yang kecil ke besar, median akan lebih berguna untuk mengukur central tendency.

Urutkan lebih dahulu nilai variabel, kemudian cari nilai yang di tengah.

Page 52: Kul 05 spss_eb

Kelemahan Median, ialah, tidak memanfaatkan seluruh informasi yang tersedia.

Misal, diperoleh nilai, 28, 29, 30, 31, dan 32 maka mediannya adalah 30. Untuk nilai 28, 29, 30, 98, dan 190 mendian juga 30. Jelas bahwa angka di atas dan di bawah median diabaikan. Angka 98 dan 190 tidak mempengaruhi nilai median.

Page 53: Kul 05 spss_eb

Ukuran central tendency yang paling sering digunakan adalah arithmetic mean, yang juga disebut sebagai average (rataan, x). Mean meng gunakan semua nilai nyata dari seluruh kasus.

Mean dihitung dengan menggunakan rumus

Mean = 28+29+30+98+190 = 75 5 (4.1)

Page 54: Kul 05 spss_eb

Can I use the mean for variables that have only two values ?

Banyak variabel, seperti yang menjawab pertanyaa ya/tidak atau setuju/tidak setuju, memiliki dua nilai. Biasanya dikodekan dengan 0 dan 1. Maka arithmetic average memberikan proporsi kasus dengan kode 1. Arithmetic mean=0,5 berarti 50% responden menjawab ya.

Page 55: Kul 05 spss_eb

Fig 4.1 berisi descriptive statistics dari prosedur Frequency, untuk variabel age dan education.Dapat diperiksa bahwa rataan umur responden GSS adalah 46,23 tahun, Median 43, lebih rendah dari mean. Lama mengikuti pendidikan mempunyai mean 13,04 dan median 12 tahun.

Comparing Mean dan Median

Page 56: Kul 05 spss_eb

Kedua variable tersebut memiliki mean lebih besar dari median. Menyebabnya adalah karena kedua variabel tersebut memiliki tail menuju ke nilai terbesar.Karena responden yang disertakan berumur 18 tahun ke atas, maka angka di bawah 18 tidak diperoleh, umur di atas 18 tahun tidak ada batasnya. Nilai yang tinggi menaikkan mean umur.

Page 57: Kul 05 spss_eb

Fig 4.1 Mean, Median and mode for age and education

Page 58: Kul 05 spss_eb

Apabila distribusi nilai benar-benar simetrik maka mean dan median sama nilainya.

Apabila distribusi nilai memiliki long tail (distribusinya disebut skwed) maka mean akan lebih besar dari median apabila tail menuju nilai yang lebih besar, dan sebaliknya.

Page 59: Kul 05 spss_eb

Apabila nilai data berbeda yang besar, maka mean bukan merupakan ukuran central tendency yang baik; disebabkan karena mean dipengaruhi oleh nilai ekstrim yang disebut outliers. Pada kasus demikian lebih baik dilengkapi dengan median, dan sebutkan nilai ekstrim tinggi dan rendah.

Page 60: Kul 05 spss_eb

Ukuran central tendency tidak memberikan informasi mengenai besar perbedaan antar nilai. Misal, mean dan median mempunyai nilai 50; datanya sbb., 50, 50, 50, 50, 50 dan 10, 20, 50, 80, 90. Terlihat bahwa distribusi/ sebaran angka tersebut sangat berbeda.Ukuran variability/keragaman akan memberikan informasi penyebaran angka.

Measures of Variability

Page 61: Kul 05 spss_eb

Range adalah ukuran paling sederhana untuk keragaman; yaitu perbedaan (selisih) antara nilai tertinggi dan terendah.

Range tidak ada manfaat dihitung untuk variabel nominal; karena nilai/kode untuk varibel nominal tidak dapat diartikan sebagai urutan besar ke kecil dan sebaliknya.

Range

Page 62: Kul 05 spss_eb

Pada fig 4.2 dapat diperiksa, variabel age memiliki minimal 18 th, maximum 89 dan range 71 (89-18).Nilai range menunjukkan besar kecilnya perbedaan antara nilai terkecil dan terbesar.

Ukuran keragaman yang lebih baik dari range adalah interquartile range.

Page 63: Kul 05 spss_eb

Fig 4.2 Descriptive statistics for age and education

Page 64: Kul 05 spss_eb

Interquartile range adalah jarak antera nilai 75th dan 25 th percentile. Nilai ini berbeda dengan range karena, tidak terpengaruh oleh nilai ekstrim.

Page 65: Kul 05 spss_eb

Ukuran keragamaan yang paling sering adalah variance. Variance berdasar kuadrat jarak antara nilai individu dan mean.

Variance dihitung dengan rumus sbb.

Variance and Standard Deviation

)1N(

)xx(Variance

2

−−

=∑

Eq 4.2

Page 66: Kul 05 spss_eb

5,026 Variance

)15(

2)75190.....(2)7528(Variance

=

−+−=

Contoh data : 28,29, 30, 98, dan 190mean = 75

Eq 4.3

Page 67: Kul 05 spss_eb

er

Kalau variance sama dengan 0, maka berarti data memiliki nilai yang sama, sehingga mean juga sama dengan nilai individu.

Makin besar nilai variance berarti data nilainya makin tersebar. Pada fig 4.2 variance untuk variabel age = 303,392 tahun; untuk variabel education = 9,452 tahun.

Akar variance = standard deviation

Page 68: Kul 05 spss_eb

Nilai standar deviation tergantung pada unit pengukuran untuk variabel tertentu. Misal, standard deviation untuk umur diukur dalam hari akan lebih besar dibanding kalau diukur dengan hari.

Coefficient of variation mengeks- presikan standard deviation sebagai persentase dari mean.

The Coefficient of Variation

Page 69: Kul 05 spss_eb

Coefficient of variation dihitung dengan rumus sbb.

Coefficient satandard dev.of variation = x 100

mean

CV = 100% kalau standard deviasi sama dengan mean

Eq 4.4

Page 70: Kul 05 spss_eb

CV untuk variabel umur = 37,68%;CV untuk variavel education = 23.54%.

Berdasar nilai mean maka umur lebih bervariasi dibandingkan dengan education.

Page 71: Kul 05 spss_eb

Anda dapat menentukan posisi suatu kasus pada distribusi nilai pengamatan dengan cara menghitung/menggunakan standard score atau z score, menggunakan rumus sbb.

Standar value - meanscore = standar deviation

Standard Score

Eq 4.5

Page 72: Kul 05 spss_eb

Standard score memberikan informasi berapa standard deviasi jarak kasus terhadap mean (di bawah atau di atas).

Kalau kasus memiliki standard score sama dengan 0, maka nilai kasus tersebut sama dengan mean.

Kalau Z score sama dengan 1, berarti, kasus, 1 standar deviasi di atas mean, dst.

Page 73: Kul 05 spss_eb

Untuk mendapatkan z score anda dapat menggunakan prosedur Descriptive, z score dapat disim pan

sebagai variabel baru.

Periksa fig 4.3 dan 4.4

Page 74: Kul 05 spss_eb

Fig 4.3 Descriptive statistics in the Viewer

Page 75: Kul 05 spss_eb

Fig 4.4 Data Editor with standar score saved as a new variable

Page 76: Kul 05 spss_eb

COMPARING GROUPS

How can you determine if the values of the summary statistics for a variable differ for subgroups of cases ?

1. Apa yang dimaksud subgrup kasus ?2. Apa yang dapat anda pelajari dari menghitung rangkuman statistik secara terpisah dari subgrup kasus tersebut ?

Page 77: Kul 05 spss_eb

3. Bagaimana cara anda dapat membuat grafik mean dari subgrup kasus tersebut ?

Telah dibahas penggunaan pro sedur Frequency dan Descriptive untuk menghitung rangkuman statistics untuk kasus yang telah dipelajari (GSS dan Umpan balik).

Page 78: Kul 05 spss_eb

Selain yang telah dibahas tersebut, sering dibutuhkan kemampuan kita untuk membandingkan rangkuman statistik untuk subgrup kasus yang berbeda.

Misal 1. Kita ingin membandingkan nilai ujian untuk klas A, B danK.2. Kita ingin membandingakan nilai mahasiswa putri dan putra.3. Kita ingin membandingkan nilai mahasiswa putri dan putra untuk klas A, B dan K. Dst

Page 79: Kul 05 spss_eb

Masalah tersebut tidak mudah untuk dijawab dengan menggunakan prosedur Frequency dan Descriptive.

Yang dapat membantu adalah prosedur Mean yang dapat diguna kan untuk menghitung rangkuman statistik subgrup.

Menggunakan prosedur Mean anda akan dapat membandingkan rataaan education, dan job satisfaction untuk subgrup yang berbeda.

Page 80: Kul 05 spss_eb

Misal untuk variabel Education, anda dapat membadingkan mean education (dalam tahun) dalam sub grup Very satified, Most satified, A little dissatified dan Very dissatisfied.

Selanjutnya dalam subgrup tersebut dapat dibandingkan mean untuk subsubgrup male dan female (periksa fig 5.1 dan 5.3).

Page 81: Kul 05 spss_eb
Page 82: Kul 05 spss_eb
Page 83: Kul 05 spss_eb
Page 84: Kul 05 spss_eb
Page 85: Kul 05 spss_eb
Page 86: Kul 05 spss_eb
Page 87: Kul 05 spss_eb

Fig 5.1 Pivoted Means output for education and job satisfaction

Page 88: Kul 05 spss_eb
Page 89: Kul 05 spss_eb
Page 90: Kul 05 spss_eb
Page 91: Kul 05 spss_eb

Fig 5.2 Bar chart of education by job satifaction

Page 92: Kul 05 spss_eb

Layers : Defining subgroups by more than one variable

Page 93: Kul 05 spss_eb
Page 94: Kul 05 spss_eb

Fig 5.3 Pivoted means output for job satisfaction and gender subgroups

Page 95: Kul 05 spss_eb
Page 96: Kul 05 spss_eb

COMPARING GROUPSMenggunakan Case selection

Menggunakan file gssMembandingkan mean education dalam kelompokJob satisfictionYang dilibatkan dalam analisis hanya full-time workers

Cara mengerjakan periksa caption berikut

Page 97: Kul 05 spss_eb

Memilih kasus - full-time workers---

Page 98: Kul 05 spss_eb

Gunakan select cases

Page 99: Kul 05 spss_eb

Dialog box Select cases--- pilih if condition

Page 100: Kul 05 spss_eb

Ketik syarat, wrkstat = 1 …. 1=Working fulltime

Page 101: Kul 05 spss_eb
Page 102: Kul 05 spss_eb

Kasus yang tidak memenuhi syarat di coret (/)

Page 103: Kul 05 spss_eb
Page 104: Kul 05 spss_eb
Page 105: Kul 05 spss_eb
Page 106: Kul 05 spss_eb
Page 107: Kul 05 spss_eb
Page 108: Kul 05 spss_eb
Page 109: Kul 05 spss_eb
Page 110: Kul 05 spss_eb
Page 111: Kul 05 spss_eb