1_statistik

Langkah awal sebelum Langkah awal sebelum menganalisis datamenganalisis data

Oleh :Rahmad Wijaya

Pokok Bahasan

•• Missing Value dan perlakuannyaMissing Value dan perlakuannya•• Kesalahan Entry DataKesalahan Entry Data•• Sebaran dan Smooting DataSebaran dan Smooting Data•• Efisiensi Sebaran DataEfisiensi Sebaran Data•• Deteksi Normalitas DataDeteksi Normalitas Data

Missing Value & Missing Value & perlakuannyaperlakuannya• Definisi Missing Value• Perlakuan terhadap missing value• Pairwise Deletion of Missing Data

vs. Mean Substitution.• Casewise vs. Pairwise Deletion of

Missing Data• Pengaturan missing value

Perlakuan terhadap Missing Value

• Mean Substitution of missing data (SPSS : Replace with mean)

• Pairwise deletion of missing data • Casewise (Listwise) deletion of

missing data

Pairwise Deletion of Missing Data vs. Mean Substitution

Keunggulan : mean subtitution hasilnyakonsisten secara internal.Kelemahan :Mean substitution menurunkan nilai varian.

Semakin banyak data yang hilang menjadikan skorrata-rata menjadi sempurna.Sebab penggantian data yang hilang tersebut dengan

data buatan, akan menciptakan nilai data menjadi“rata-rata”, sehingga mean substitution perludipertimbangkan terhadap perubahan nilai korelasi.

Casewise vs. Pairwise Deletion of Missing Data.

Casewise digunakan pada waktupenghitungan matrik korelasi, makaakan diperoleh matrik korelasi yang“benar”

Gunakan Pairwise jika data yanghilang kecil (< 10 %) dan missing datatersebar merata). Jangan digunakanpada permasalahan yang serius.

Pengaturan missing value• No missing values• Discrete missing values• Range of missing values• Range plus one discrete missing

values

SPSS Display

Kesalahan Entry DataKesalahan Entry DataPada data dengan range tertentu, kesalahan entry dapat diketahui dengan distribusi frekuensi. Contoh :

Sebaran dan Smooting DataSebaran dan Smooting DataSEBARAN DATA

•• Tujuan umumTujuan umum•• Fit of the Observed DistributionFit of the Observed Distribution•• Distribusi apa yang dipergunakan ?Distribusi apa yang dipergunakan ?

Smoothing (Outlier)• Gunakan scatterplot.• Outlier mempengaruhi nilai korelasi

dan garis regresi

• Pendekatan kuantitatif untuk Outliers

Efisiensi Sebaran DataEfisiensi Sebaran Data• Ukuran Pemusatan :

Rata-rata Hitung, Median, Modus• Dispersi :

Range, Deviasi Rata-rata,Varian, Deviasi Standar

• Skewness • Memilih rata-rata dalam distribusi

frekuensi

Ukuran Pemusatan : Rata-rata Hitung

Sifat Rata-rata Hitung :• Skala interval dan skala rasio saja• Semua nilai dimasukkan• Satu kelompok data hanya mempunyai satu

rata-rata hitung• Jumlah deviasi setiap nilai terhadap rata-rata

hitungnya selalu sama dengan nol.Kelemahan rata-rata hitung :• Dipengaruhi Nilai Ekstrem

Ukuran Pemusatan : Median dan Modus

Modus untuk menjelaskan data yang diukur dalam skala nominal dan ordinal. Berarti modus dapat dipergunakan untuk semua jenis skala data.

Keuntungan :• Tidak dipengaruhi nilaiKelemahan :• Seringkali data tidak memiliki modus.• Ada pula kelompok data yang memiliki lebih

dari satu modus.

Dispersi

Rata-rata hitung atau median, hanyamenunjukkan titik tengah data dan tidakmenunjukkan penyebaran data.Ukuran Dispersi antara lain :•Jarak (range)•Deviasi Rata-rata (average deviation)•Varian (Variance)•Deviasi Standar (Standard Deviation)

SkewnessDiukur dengan koefisien kecondongan Pearson(Pearson coefficient skewness).•Bila Sk >0, maka distribusi terkonsentrai kekanan (skewness positif)•Bila Sk <0, maka distribusi terkonsentrai ke kiri(skewness negatif)

Memilih rata-rata dalam distribusi frekuensi•Tingkat kemenjuluran yang sangat tinggi,jangan gunakan rata-rata hitung

•Dispersi yang besar (datanya menyebar),jangan memakai rata-rata hitung.

•Distribusi normal, pakailah rata-rata hitung.

DASAR PEMILIHAN NILAI SATISTIK :•Tidak Bias•Efisien•Konsisten

Deteksi Normalitas DataDeteksi Normalitas Data• Level Significant• Pentingnya Distribusi Normal• Apakah seluruh uji statistik

menggunakan distribusi normal ?

1_statistik

Documents