penggunaan teori set kasar dalam perlombongan data

22
Penggunaan Teori Set Kasar dalam Perlombongan Data Noranisah Amerudin Pelajar Kerja Kursus dan Tesis Universiti Kebangsaan Malaysia [email protected] Dibentangkan oleh :

Upload: jatin

Post on 18-Jan-2016

74 views

Category:

Documents


1 download

DESCRIPTION

Penggunaan Teori Set Kasar dalam Perlombongan Data. Dibentangkan oleh :. Noranisah Amerudin Pelajar Kerja Kursus dan Tesis Universiti Kebangsaan Malaysia [email protected]. Isi Kandungan. Pengenalan Konsep asas Set Kasar Proses Penjanaan Petua. Pengenalan. Perlombongan data : - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Penggunaan Teori Set Kasar dalam

Perlombongan Data

Noranisah AmerudinPelajar Kerja Kursus dan Tesis

Universiti Kebangsaan Malaysia

[email protected]

Dibentangkan oleh :

Page 2: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Isi Kandungan

• Pengenalan

• Konsep asas Set Kasar

• Proses Penjanaan Petua

Page 3: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Pengenalan

Perlombongan data :

Mencari hubungan dan corak yang wujud dalam pangkalan data; yang tersembunyi di dalam jumlah data yang besar

Membuat ramalan

Page 4: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Teknik Perlombongan Data

Rangkaian Neural Evolutionary Programming Memory Based Reasoning Pohon Keputusan Algoritma Genetik Teori Set Kasar

Page 5: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Pengenalan (2)

Teori set kasar telah diperkenalkan oleh Zdzislaw Pawlak pada awal tahun 1980-an.

Matlamat utama teori ini :

menginduksi dan menggabungkan (synthesize) konsep penghampiran dengan data yang ada.

membina pengkelasan yang dapat mengkelaskan objek yang tidak dapat dilihat dengan jelas.

menjelaskan dan menerangkan ciri model data yang diperolehi.

Page 6: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Konsep asas dalam Set Kasar

Sistem maklumat & Jadual Keputusan Ketidakbolehbezaan (Indiscernibility)

Penghampiran Set (Set Approximation)

Pengurangan (Reducts and Core)

Petua Keputusan (Decision Rules)

Page 7: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Sistem Maklumat

Age LEMS

x1 16-30 50x2 16-30 0x3 31-45 1-25x4 31-45 1-25x5 46-60 26-49x6 16-30 26-49x7 46-60 26-49

• Sistem maklumat terdiri daripada sepasang (U, A)

• U adalah set terhingga objek yang tidak kosong.

• A adalah set terhingga atribut yang

tidak kosong dan diwakilkan sebagai bagi setiap

• dipanggil set nilai atribut a.

aVUa : .Aa

aV

Page 8: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Jadual Keputusan

Age LEMS Walk

x1 16-30 50 yes x2 16-30 0 no x3 31-45 1-25 nox4 31-45 1-25 yes

x5 46-60 26-49 nox6 16-30 26-49 yes

x7 46-60 26-49 no

• Jadual Keputusan :

• d adalah atribut keputusan dan

• A adalah atribut syarat.

}){,( dAUT

Ad

Page 9: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Isu di dalam Jadual Keputusan

Objek yang tidak mempunyai perbezaan yang nyata dipersembahkan beberapa kali.

Sesetengah atribut berlebihan dan tidak dikehendaki.

Page 10: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Ketidakbolehbezaan (Indiscernibility)

Age LEMS Walk

x1 16-30 50 yes x2 16-30 0 no x3 31-45 1-25 nox4 31-45 1-25 yes

x5 46-60 26-49 nox6 16-30 26-49 yes

x7 46-60 26-49 no

Subset tidak kosong bagi atribut syarat ialah {Age}, {Lems} dan {Age,Lems}.

IND({Age}) = {{x1,x2, x6}, {x3, x4}, {x5, x7}}

IND({Lems}) = {{x1}, {x2}, {x3, x4}, {x5, x6, x7}}

IND{(Age, Lems)} = {{x1}, {x2}, {x3,x4}, {x5, x7}, {x6}}

Page 11: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Penghampiran Set (Approximation Set)

A-lower approximation AX = {x1, x6}

A-boundary region BNA(X) = ĀX – AX = {x3, x4}

A-upper approximation ĀX = {x1, x3, x4, x6}

 

Page 12: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Penghampiran Set (2)

A-lower approximation AX = {x | [x]A X}A-upper approximation ĀX = {x | [x]A X 0}

Page 13: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Penghampiran Set (3)

• Jika kawasan sempadan tidak kosong, maka ia adalah kasar.

• Set kasar wujud apabila objek-objek berada di antara dua sempadan iaitu positif dan negatif.

Page 14: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Ketepatan Penghampiran (Accuracy Approximation)

• Setelah melakukan penghampiran, kita boleh mengira ketepatan penghampiran yang telah dibuat.

• Formula :

Di mana |X| mewakili kardinaliti X 0 Jika B(X) = 1 adalah tepat /crisp kepada B.

Jika B(X) < 1 adalah kasar /rough kepada B.

Page 15: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Pengurangan(Reducts)

• Selalunya terdiri daripada beberapa subset atribut yang lebih minima dan ini dikenali sebagai reducts.

• Dengan kata lain membuang data yang berulang atau bertindan.

• Tujuan utama adalah untuk mengetahui atribut mana yang boleh mewakili keseluruhan atribut untuk mewakili data-data dalam pangkalan data dan kebergantungan di antara atribut-atribut.

Page 16: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Pengurangan (2)

• T = (U,C,D) adalah tidak bergantung jika semua c C adalah diperlukan dalam T.

• Semua set atribut syarat diperlukan dalam T diwakili dengan CORE(C).

CORE (C) = RED (C)

di mana RED(C) adalah semua set atribut yang

dikurangkan daripada C.

Page 17: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Contoh Reducts & CORE (3)

U Headache Musclepain

Temp. Flu

U1 Yes Yes Normal NoU2 Yes Yes High YesU3 Yes Yes Very-high YesU4 No Yes Normal NoU5 No No High NoU6 No Yes Very-high Yes

U Muscle pain

Temp. Flu

U1,U4 Yes Normal No U2 Yes High Yes U3,U6 Yes Very-high Yes U5 No High No

U Headache Temp. Flu

U1 Yes Norlmal NoU2 Yes High YesU3 Yes Very-high YesU4 No Normal NoU5 No High NoU6 No Very-high Yes

Reduct1 = {Muscle-pain,Temp.}

Reduct2 = {Headache, Temp.}

CORE = {Headache,Temp} {MusclePain, Temp} = {Temp}

Page 18: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Petua Keputusan(Decision rules)

• Apabila reducts telah dijumpai, tugas membina petua-petua yang tepat daripada atribut keputusan daripada sistem maklumat boleh dilakukan.

• Petua keputusan dibuat dengan menggabungkan atribut-atribut reducts.

• Petua keputusan mengekstrak pengetahuan di mana boleh digunakan apabila mengkelaskan objek-objek baru dalam sistem maklumat.

Page 19: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Petua Keputusan(2)Jadual Kesetaraan (Equivalence Class)

Matrik Pembezaan (Discernibility Matrix)

Petua Keputusan yang dihasilkan

Page 20: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Proses Penjanaan Petua

Proses penjanaan rules menggunakan pendekatan Set Kasar

Page 21: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Matlamat

• Matlamat tesis saya seterusnya ;

– Menghasilkan sebuah cengkerang pakar (tool) yang dapat menentukan samada seseorang pesakit itu menghidapi penyakit Telinga, Hidung dan Tekak (ENT) atau tidak dengan menggunakan teknik set kasar.

Page 22: Penggunaan Teori Set Kasar dalam  Perlombongan Data

Sekian,

terima kasih….