1_statistik
TRANSCRIPT
Pokok Bahasan
•• Missing Value dan perlakuannyaMissing Value dan perlakuannya•• Kesalahan Entry DataKesalahan Entry Data•• Sebaran dan Smooting DataSebaran dan Smooting Data•• Efisiensi Sebaran DataEfisiensi Sebaran Data•• Deteksi Normalitas DataDeteksi Normalitas Data
Missing Value & Missing Value & perlakuannyaperlakuannya• Definisi Missing Value• Perlakuan terhadap missing value• Pairwise Deletion of Missing Data
vs. Mean Substitution.• Casewise vs. Pairwise Deletion of
Missing Data• Pengaturan missing value
Perlakuan terhadap Missing Value
• Mean Substitution of missing data (SPSS : Replace with mean)
• Pairwise deletion of missing data • Casewise (Listwise) deletion of
missing data
Pairwise Deletion of Missing Data vs. Mean Substitution
Keunggulan : mean subtitution hasilnyakonsisten secara internal.Kelemahan :Mean substitution menurunkan nilai varian.
Semakin banyak data yang hilang menjadikan skorrata-rata menjadi sempurna.Sebab penggantian data yang hilang tersebut dengan
data buatan, akan menciptakan nilai data menjadi“rata-rata”, sehingga mean substitution perludipertimbangkan terhadap perubahan nilai korelasi.
Casewise vs. Pairwise Deletion of Missing Data.
Casewise digunakan pada waktupenghitungan matrik korelasi, makaakan diperoleh matrik korelasi yang“benar”
Gunakan Pairwise jika data yanghilang kecil (< 10 %) dan missing datatersebar merata). Jangan digunakanpada permasalahan yang serius.
Pengaturan missing value• No missing values• Discrete missing values• Range of missing values• Range plus one discrete missing
values
SPSS Display
Kesalahan Entry DataKesalahan Entry DataPada data dengan range tertentu, kesalahan entry dapat diketahui dengan distribusi frekuensi. Contoh :
Sebaran dan Smooting DataSebaran dan Smooting DataSEBARAN DATA
•• Tujuan umumTujuan umum•• Fit of the Observed DistributionFit of the Observed Distribution•• Distribusi apa yang dipergunakan ?Distribusi apa yang dipergunakan ?
Smoothing (Outlier)• Gunakan scatterplot.• Outlier mempengaruhi nilai korelasi
dan garis regresi
• Pendekatan kuantitatif untuk Outliers
Efisiensi Sebaran DataEfisiensi Sebaran Data• Ukuran Pemusatan :
Rata-rata Hitung, Median, Modus• Dispersi :
Range, Deviasi Rata-rata,Varian, Deviasi Standar
• Skewness • Memilih rata-rata dalam distribusi
frekuensi
Ukuran Pemusatan : Rata-rata Hitung
Sifat Rata-rata Hitung :• Skala interval dan skala rasio saja• Semua nilai dimasukkan• Satu kelompok data hanya mempunyai satu
rata-rata hitung• Jumlah deviasi setiap nilai terhadap rata-rata
hitungnya selalu sama dengan nol.Kelemahan rata-rata hitung :• Dipengaruhi Nilai Ekstrem
Ukuran Pemusatan : Median dan Modus
Modus untuk menjelaskan data yang diukur dalam skala nominal dan ordinal. Berarti modus dapat dipergunakan untuk semua jenis skala data.
Keuntungan :• Tidak dipengaruhi nilaiKelemahan :• Seringkali data tidak memiliki modus.• Ada pula kelompok data yang memiliki lebih
dari satu modus.
Dispersi
Rata-rata hitung atau median, hanyamenunjukkan titik tengah data dan tidakmenunjukkan penyebaran data.Ukuran Dispersi antara lain :•Jarak (range)•Deviasi Rata-rata (average deviation)•Varian (Variance)•Deviasi Standar (Standard Deviation)
SkewnessDiukur dengan koefisien kecondongan Pearson(Pearson coefficient skewness).•Bila Sk >0, maka distribusi terkonsentrai kekanan (skewness positif)•Bila Sk <0, maka distribusi terkonsentrai ke kiri(skewness negatif)
Memilih rata-rata dalam distribusi frekuensi•Tingkat kemenjuluran yang sangat tinggi,jangan gunakan rata-rata hitung
•Dispersi yang besar (datanya menyebar),jangan memakai rata-rata hitung.
•Distribusi normal, pakailah rata-rata hitung.
DASAR PEMILIHAN NILAI SATISTIK :•Tidak Bias•Efisien•Konsisten
Deteksi Normalitas DataDeteksi Normalitas Data• Level Significant• Pentingnya Distribusi Normal• Apakah seluruh uji statistik
menggunakan distribusi normal ?