regresi linear logistik 2015

Upload: adewahdini

Post on 05-Jan-2016

30 views

Category:

Documents


5 download

DESCRIPTION

REGRESI

TRANSCRIPT

  • REGRESI LINEAR DAN LOGISTIK

    Z U L A E L A

    PRODI STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

    CLINICAL EPIDEMIOLOGY & BIOSTATISTICS UNIT (CE&BU), FAK. KEDOKTERAN

    UNIVERSITAS GADJAH MADA

  • ANALISIS REGRESI

    Analisis Regresi Linear

    Analisis regresi merupakan metode analisis data yang memanfaatkan

    hubungan antara dua variabel atau lebih (Berat Badan dengan Umur; FEV1

    dengan Tinggi Badan; Berat Badan dengan Umur dan Asupan Gizi).

    Y=variabel dependen, tak bebas, tergantung, respon, outcome.

    X=variabel independen, bebas, tak tergantung, prediktor.

    Tujuan:

    Menyelidiki bentuk/pola hubungan antara Y dengan X.

    Mengestimasi/menduga mean atau rata-rata dari Y populasi berdasarkan

    X yang diberikan.

  • Case Summariesa

    15.00 20.00

    13.00 16.00

    9.00 12.00

    6.00 6.00

    6.00 10.00

    18.00 34.00

    16.00 25.00

    11.00 20.00

    6.00 8.00

    12.00 14.00

    18.00 30.00

    22.00 36.00

    7.00 9.00

    10.00 10.00

    10.00 15.00

    14.00 24.00

    20.00 30.00

    17 17

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    15

    16

    17

    NTotal

    berat badan umur

    Limited to f irst 100 cases.a.

    Scatter Plot

  • Coefficientsa

    3.025 .838 3.608 .003

    .507 .040 12.652 .000

    (Constant)

    umur

    Model

    1

    B Std. Error

    Unstandardized

    Coeff icients

    t Sig.

    Dependent Variable: berat badana.

    Berat Badan = 3.025 + 0.507 Umur

    Untuk seorang anak yang berumur 18 bulan, maka berat anak tersebut

    dapat diprediksi sebesar 12.151 kg

  • Analisis Korelasi

    Analisis korelasi merupakan metode analisis data yang

    mengukur derajat hubungan antara dua variabel random X dan Y

    melalui sebuah bilangan yang disebut koefisien korelasi r.

    ])(][)([ 2222 yynxxn

    yxxynr

    Kuadrat dari koefisien korelasi disebut koefisien determinasi yang

    merepresentasikan besarnya proporsi variasi dalam variabel y yang

    dijelaskan oleh variabel x dalam model. Dengan menggunakan pasangan

    data berat badan dan umur anak balita, diperoleh nilai koefisien korelasi

    sebesar 0.956 dan koefisien determinasi sebesar 0.914

  • Estimasi model regresi linear ganda dengan p variabel

    independen ditunjukkan dengan persamaan:

    Y = b0 + b1X1 + b2X2 + ..... + bpXp

    variabel dependen Y kontinu, sedangkan variabel-variabel

    independen X dapat kontinu atau kategorik.

    Model Regresi Linear Ganda

  • Seorang peneliti ingin mengetahui seberapa baik dia dapat

    memprediksi length of stay seorang pasien apabila diketahui

    variabel independennya number of previous admissions, age

    dan sex. Untuk itu telah dikumpulkan data untuk 15 pasien

    sbb:

  • ANOVAb

    2653.792 3 884.597 33.653 .000a

    289.141 11 26.286

    2942.933 14

    Regression

    Residual

    Total

    Model

    1

    Sum of

    Squares df Mean Square F Signif icance

    Predic tors: (constant) Sex, Number of Prev ious Admissions, Age...a.

    Dependent Variable: Length of stayb.

  • Coefficientsa

    16.186 7.175 2.256 .045

    -.859 1.435 -.083 -.598 .562

    .815 .164 .711 4.977 .000

    -10.360 4.421 -.362 -2.343 .039

    (Constant)

    Number of Prev ious

    Admissions

    Age

    Sex

    Model

    1

    B Std. Error

    Unstandardized

    Coeff icients

    Beta

    Standardized

    Coeff icients

    t Signif icance

    Dependent Variable: Length of staya.

  • Model Summary

    .950a .902 .875 5.12694

    Model

    1

    R R Square

    Adjusted

    R Square

    Std. Error of

    the Estimate

    Predic tors : (constant) Sex, Number of Prev ious

    Admissions, Age.. .

    a.

  • Regresi logistik digunakan untuk analisis dalam keadaan di

    mana variabel dependen Y terdiri atas dua hasil yang mungkin:

    dead/alive, disease/not disease, breast cancer/not breast

    cancer, immunized/not immunized.

    Regresi Logistik Ganda

  • Model regresi logistik ganda dengan p variabel independen dinyatakan

    dengan persamaan:

    atau Transformasi logit dinyatakan sebagai:

    yang merupakan fungsi linier.

    pp

    pp

    XXX

    XXX

    e

    eYP

    ......

    ......

    22110

    22110

    1)1(

    )......( 221101

    1)1(

    ppXXXeYP

    ppXXXYP

    YP

    .....]

    )1(1

    )1(ln[ 22110

  • Untuk variabel independen yang dikotomus, OR dinyatakan dengan:

    dengan interval konfidensi 95% nya adalah:

    Untuk variabel independen yang kontinu, OR dinyatakan:

    dengan interval konfidensi 95% untuk perubahan unit dari variabel

    independen adalah:

    )exp( iOR

    )]___tan.(96.1exp[ ii oferrordards

    ).exp( iOR

    )]___tan.(.96.1.exp[ ii oferrordards

  • Sebagai ilustrasi analisis regresi logistik ganda digunakan sebagian

    variabel dari data studi tentang low birth weight (berat badan lahir

    rendah). Tujuan dari studi ini adalah untuk mengidentifikasi faktor

    resiko yang berhubungan dengan kelahiran bayi yang low birth

    weight (berat < 2500 gram). Seratus delapan puluh sembilan ibu

    yang ikut penelitian, 130 melahirkan bayi normal, sedangkan 59

    melahirkan bayi dengan low birth weight.

    Empat faktor resiko yang diduga berpengaruh terhadap kelahiran

    bayi dengan low birth weight adalah:

    AGE: Age of the Mother in Years.

    LWT: Weight in Pounds at the Last Mentrual Period.

    RACE: Race (1 = White, 2 = Black, 3 = Other).

    FTV: Number of Physician Visits During the First Trimester.

  • Output Regresi Logistik Ganda: BBLR vs AGE, LWT, RACE & FTV

  • Dengan menggunakan koefisien regresi (dari tabel di atas),

    probabilitas akan terjadinya kelahiran bayi dengan low birth weight

    adalah

    Jika seorang ibu dengan karakteristik: AGE=30, LWT =140,

    RACE(1)=1, RACE(2)=0 & FTV (2), maka resiko akan melahirkan

    bayi dengan low birth weight sebesar P(Y=1)=0.3825=38.25%.

    Jika terdapat 10000 ibu dengan karakteristik seperti itu, maka

    3825 diantaranya akan melahirkan bayi dengan low birth weight.

    )049.)2(433.)1(004.1014.024.295.1(1

    1)1(

    FTVRACERACELWTAGEeYP

  • OR untuk RACE(1) = 2.729 (tabel output regresi logistik

    dengan 4 faktor resiko) menunjukkan bahwa race ibu yang

    black mempunyai resiko akan melahirkan bayi yang low birth

    weight 2.729 kali dibanding dengan race ibu yang white

    setelah mengontrol variabel AGE, LWT dan FTV dalam model.

    Interval konfidensi 95% untuk OR dari RACE(1) tidak memuat

    angka 1, hal ini menunjukkan bahwa RACE(1) itu

    berpengaruh terhadap resiko terjadinya kelahiran bayi yang

    low birth weight, di samping Weight in Pounds at the Last

    Mentrual Period.