silabus web mining

Upload: sitanjung

Post on 30-Oct-2015

55 views

Category:

Documents


1 download

TRANSCRIPT

  • FAKULTAS INFORMATIKA - IT TELKOM PROGRAM STUDI S1 TEKNIK

    INFORMATIKA Jl. Telekomunikasi no 1

    Gedung E dan F, Bandung 40257

    Dokumen Kontrol

    Kurikulum: 2012

    Revisi Ke:

    Disahkan:

    SILABUS MATA KULIAH

    I. IDENTITAS MATA KULIAH

    Nama Mata Kuliah : Web Mining

    Kode Mata Kuliah :

    SKS : 3 SKS

    Jenis : MK Wajib / MK Pilihan / Praktikum *)

    Jam pelaksanaan : Tatap muka di kelas = 4 jam per minggu

    Tutorial / responsi = 2 jam per minggu

    Kerja Lab / praktek = - jam per minggu

    .. = - jam per minggu

    Semester / Tingkat : Genap / 4

    Pre-requisite :

    Co-requisite :

    Bidang Kajian :

    II. DESKRIPSI SINGKAT MATA KULIAH

    Web mining merupakan proses automatic discovery dari pattern/pola data yang menarik dan

    bermanfaat yang berhubungan dengan usage, content, dan linkage structure dari sumber Web.

    Fokus dari mata kuliah Web mining adalah penerapan teknik dari machine learning, data mining,

    text mining dan basis data yang berhubungan dengan usage, content, dan linkage structure dari web

    resources.

    Penerapan teknik-teknik tersebut digunakan untuk mengekstrak knowledge dari web yang dapat

    digunakan untuk site menagement, automatic personalization, recommender system dan user

    profilling.

    III. KOMPETENSI LULUSAN YANG DIDUKUNG

  • CSG2D3 Basis Data Relasional Page 2

    IV. TUJUAN PEMBELAJARAN

    Pada akhir perkuliahan ini diharapkan mahasiswa memiliki pengetahuan tentang teknik-teknik web

    mining meliputi web structure mining, web content mining dan web usage mining serta aplikasi-

    aplikasi yang berkaitan dengan web mining.

    Secara spesifik tujuan pembelajaran dari Mata Kuliah ini adalah :

    a) Mahasiswa memahami konsep web mining

    b) Mahasiswa memahami konsep dan implementasi web structure, content dan usage mining

    c) Mahasiswa memahami teknik-teknik yang diterapkan di web mining

    d) Mahasiswa mampu mengimplementasikan teknik-teknik web mining

    e) Mahasiswa mampu mendesain prototype sistem di bidang web mining

    f) Mahasiswa mengetahui aplikasi-aplikasi web mining

    g) Mahasiswa mampu mengidentifikasi, memformulasikan dan menuliskan kembali

    jurnal/paper web mining

    V. ABET OUTCOMES

    a An ability to apply knowledge of computing and mathematics appropriate to the discipline (*)

    b An ability to analyze a problem, and identify and define the computing requirements

    appropriate to its solution (*)

    c An ability to design, implement, and evaluate a computer-based system, process, component, or

    program to meet desired needs (*)

    d An ability to function effectively on teams to accomplish a common goal

    e An understanding of professional, ethical, legal, security and social issues and responsibilities

    f An ability to communicate effectively with a range of audiences

    g An ability to analyze the local and global impact of computing on individuals, organizations, and

    society

    h Recognition of the need for and an ability to engage in continuing professional development

    i An ability to use current techniques, skills, and tools necessary for computing practice (*)

    j An ability to apply mathematical foundation, algorithmic principles and computer science theory

    in the modeling, and design of computer based system in a way that demonstrate

    comprehension of the trade off involved in design choices (*)

    k an ability to apply design and development principles in the constructions of software systems

    of varying complexity (*)

  • CSG2D3 Basis Data Relasional Page 3

  • CSG2D3 Basis Data Relasional Page 4

    VI. BAHAN KAJIAN, METODE PENYAMPAIAN & ASSESSMENT

    Pertemuan

    ke-

    Kompetensi yang

    diharapkan

    Bahan Kajian Sub bahan kajian Metode

    Pembelajaran

    Indikator Pencapaian Cara

    assessment

    Bobot

    Nilai

    1 Mahasiswa memahami

    konsep web mining

    Web Mining

    Introduction

    - Syllaby

    - Web Mining Definition

    - Brief History of Web

    Lecture

    Discussion

    Dapat memahami konsep

    web mining

    Project

    10%

    2 Mahasiswa memahami

    konsep web mining

    Explanation Web Mining

    Project

    - Introduction of Web Mining

    Application

    Lecture

    Discussion

    3 Mahasiswa memahami

    konsep web mining

    Review Web IR & Web

    Search

    - Natural Language Processing

    methods used for web information

    retrieval: lemmatization, part-of-

    speech tagging, disambiguation,

    shallow syntactic parsing etc.

    - Project Presentation

    Discussion

    Presentation

    4 Mahasiswa memahami

    konsep web mining

    Review Web IR & Web

    Search

    - Natural Language Processing

    methods used for web information

    retrieval: lemmatization, part-of-

    speech tagging, disambiguation,

    shallow syntactic parsing etc.

    - Project Presentation

    - Project Progress Report

    Lecture

    Discussion

    Presentation

    5 - Mahasiswa mengetahui

    aplikasi-aplikasi web

    mining

    - Mahasiswa mampu

    mengidentifikasi,

    memformulasikan dan

    menuliskan kembali

    jurnal/paper web mining

    Social Network Analysis - Global analysis of the Web

    Discussion

    Presentation - Mengetahui minimal 2

    aplikasi web mining

    - Dapat mengidentifikasi,

    memformulasikan dan

    menuliskan kembali

    jurnal/paper web

    mining

    Project

    10%

  • CSG2D3 Basis Data Relasional Page 5

    Pertemuan

    ke-

    Kompetensi yang

    diharapkan

    Bahan Kajian Sub bahan kajian Metode

    Pembelajaran

    Indikator Pencapaian Cara

    assessment

    Bobot

    Nilai

    6 - Mahasiswa mengetahui

    aplikasi-aplikasi web

    mining

    - Mahasiswa mampu

    mengidentifikasi,

    memformulasikan dan

    menuliskan kembali

    jurnal/paper web mining

    Social Network Analysis - social networks analysis

    Discussion

    Presentation

    7 - Mahasiswa mengetahui

    aplikasi-aplikasi web

    mining

    - Mahasiswa mampu

    mengidentifikasi,

    memformulasikan dan

    menuliskan kembali

    jurnal/paper web mining

    Social Network Analysis - Project Progress Report Discussion

    Presentation

    - Mengetahui minimal 2

    aplikasi web mining

    - Dapat mengidentifikasi,

    memformulasikan dan

    menuliskan kembali

    jurnal/paper web

    mining

    Project

    8 - Mahasiswa memahami

    teknik-teknik yang

    diterapkan di web mining

    - Mahasiswa mampu

    mengimplementasikan

    teknik

    - -teknik web mining

    Crawling the Web Review Crawling the web Lecture

    Discussion

    Presentation

    10%

    9 - Mahasiswa memahami

    teknik-teknik yang

    Crawling the Web Project Progress Report Lecture

    Discussion

    Dapat

    mengimplementasikan

    Project

  • CSG2D3 Basis Data Relasional Page 6

    Pertemuan

    ke-

    Kompetensi yang

    diharapkan

    Bahan Kajian Sub bahan kajian Metode

    Pembelajaran

    Indikator Pencapaian Cara

    assessment

    Bobot

    Nilai

    diterapkan di web mining

    - Mahasiswa mampu

    mengimplementasikan

    teknik-teknik web mining

    Presentation teknik web mining

    10

    - Mahasiswa memahami

    konsep dan implementasi

    web structure, content

    dan usage mining

    - Mahasiswa mampu

    mengimplementasikan

    teknik-teknik web mining

    - Mahasiswa mampu

    mendesain prototype

    sistem di bidang web

    mining

    Web Structure Mining - primary web browsing (crawling,

    spidering), link topology analysis,

    PageRank, HITS methods

    Lecture

    Discussion

    Presentation

    - Dapat memahami

    konsep dan

    implementasi web

    structure, content dan

    usage mining

    - Dapat

    mengimplementasikan

    teknik web mining

    - Dapat mendesain

    prototype sistem web

    mining

    Project

    UAS

    20%

    11 - Mahasiswa memahami

    konsep dan implementasi

    web structure, content

    dan usage minin

    - Mahasiswa mampu

    mengimplementasikan

    teknik-teknik web mining

    - Mahasiswa mampu

    mendesain prototype

    sistem di bidang web

    mining

    Web Structure Mining - primary web browsing (crawling,

    spidering), link topology analysis,

    PageRank, HITS methods

    - Project Progress Report

    Lecture

    Discussion

    Presentation

  • CSG2D3 Basis Data Relasional Page 7

    Pertemuan

    ke-

    Kompetensi yang

    diharapkan

    Bahan Kajian Sub bahan kajian Metode

    Pembelajaran

    Indikator Pencapaian Cara

    assessment

    Bobot

    Nilai

    12 - Mahasiswa memahami

    konsep dan implementasi

    web structure, content

    dan usage minin

    - Mahasiswa mampu

    mengimplementasikan

    teknik-teknik web mining

    - Mahasiswa mampu

    mendesain prototype

    sistem di bidang web

    mining

    Web Structure Mining - Project Progress Report Discussion

    Presentation

    13 - Mahasiswa memahami

    konsep dan implementasi

    web structure, content

    dan usage minin

    - Mahasiswa mampu

    mengimplementasikan

    teknik-teknik web mining

    - Mahasiswa mampu

    mendesain prototype

    sistem di bidang web

    mining

    Web Content Mining - document indexing and retrieval in

    the web environment - Boolean

    and vector retrieval models, latent

    semantic indexing (LSI), results

    ordering, meta-search.

    Lecture

    Discussion

    Presentation

    - Dapat memahami

    konsep dan

    implementasi web

    structure, content dan

    usage mining

    - Dapat

    mengimplementasikan

    teknik web mining

    Dapat mendesain

    prototype sistem web

    Project 20%

    14

    - Mahasiswa memahami

    konsep dan implementasi

    web structure, content

    dan usage minin

    - Mahasiswa mampu

    mengimplementasikan

    Web Content Mining - web documents categorization and

    clustering

    Lecture

    Discussion

    Presentation

    Project

  • CSG2D3 Basis Data Relasional Page 8

    Pertemuan

    ke-

    Kompetensi yang

    diharapkan

    Bahan Kajian Sub bahan kajian Metode

    Pembelajaran

    Indikator Pencapaian Cara

    assessment

    Bobot

    Nilai

    teknik-teknik web mining

    - Mahasiswa mampu

    mendesain prototype

    sistem di bidang web

    mining

    15

    - Mahasiswa memahami

    konsep dan implementasi

    web structure, content

    dan usage minin

    - Mahasiswa mampu

    mengimplementasikan

    teknik-teknik web mining

    - Mahasiswa mampu

    mendesain prototype

    sistem di bidang web

    mining

    Web Content Mining - web documents categorization and

    clustering part 2

    Lecture

    Discussion

    Presentation

    - Dapat memahami

    konsep dan

    implementasi web

    structure, content dan

    usage mining

    - Dapat

    mengimplementasikan

    teknik web mining

    - Dapat mendesain

    prototype sistem web

    16

    - Mahasiswa memahami

    konsep dan implementasi

    web structure, content

    dan usage minin

    - Mahasiswa mampu

    mengimplementasikan

    teknik-teknik web mining

    - Mahasiswa mampu

    mendesain prototype

    sistem di bidang web

    mining

    Web Content Mining - Project Progress Report Lecture

    Discussion

    Presentation

    17 - Mahasiswa mengetahui Opinion Mining & - Opinion Mining and Sentiment Discussion - Dapat memahami 10%

  • CSG2D3 Basis Data Relasional Page 9

    Pertemuan

    ke-

    Kompetensi yang

    diharapkan

    Bahan Kajian Sub bahan kajian Metode

    Pembelajaran

    Indikator Pencapaian Cara

    assessment

    Bobot

    Nilai

    aplikasi-aplikasi web

    mining

    - Mahasiswa mampu

    mengidentifikasi,

    memformulasikan dan

    menuliskan kembali

    jurnal/paper web mining

    Sentiment Analysis Analysis

    -

    Presentation konsep dan

    implementasi web

    structure, content dan

    usage mining

    - Dapat

    mengimplementasikan

    teknik web mining

    - Dapat mendesain

    prototype sistem web 18

    - Mahasiswa mengetahui

    aplikasi-aplikasi web

    mining

    - Mahasiswa mampu

    mengidentifikasi,

    memformulasikan dan

    menuliskan kembali

    jurnal/paper web mining

    Opinion Mining &

    Sentiment Analysis

    - Lexical based opinion mining

    Discussion

    Presentation

    19 - Mahasiswa mengetahui

    aplikasi-aplikasi web

    mining

    - Mahasiswa mampu

    mengidentifikasi,

    memformulasikan dan

    menuliskan kembali

    jurnal/paper web mining

    Opinion Mining &

    Sentiment Analysis

    - Model based opinion mining

    Discussion

    Presentation

    - Dapat memahami

    konsep dan

    implementasi web

    structure, content dan

    usage mining

    - Dapat

    mengimplementasikan

    teknik web mining

    - Dapat mendesain

    prototype sistem web

    Project

    UAS

    20 - Mahasiswa mengetahui

    aplikasi-aplikasi web

    mining

    - Mahasiswa mampu

    mengidentifikasi,

    Opinion Mining &

    Sentiment Analysis

    - Project Progress Report

    Discussion

    Presentation

  • CSG2D3 Basis Data Relasional Page 10

    Pertemuan

    ke-

    Kompetensi yang

    diharapkan

    Bahan Kajian Sub bahan kajian Metode

    Pembelajaran

    Indikator Pencapaian Cara

    assessment

    Bobot

    Nilai

    memformulasikan dan

    menuliskan kembali

    jurnal/paper web mining

    21

    - Mahasiswa memahami

    konsep dan implementasi

    web structure, content

    dan usage minin

    - Mahasiswa mampu

    mengimplementasikan

    teknik-teknik web mining

    - Mahasiswa mampu

    mendesain prototype

    sistem di bidang web

    mining

    Web Usage Mining - mining for user behavior on the

    web, internet marketing

    Discussion

    Presentation

    - Dapat memahami

    konsep dan

    implementasi web

    structure, content dan

    usage mining

    - Dapat

    mengimplementasikan

    teknik web mining

    - Dapat mendesain

    prototype sistem web

    Project

    UAS

    20%

    22

    - Mahasiswa memahami

    konsep dan implementasi

    web structure, content

    dan usage minin

    - Mahasiswa mampu

    mengimplementasikan

    teknik-teknik web mining

    - Mahasiswa mampu

    mendesain prototype

    sistem di bidang web

    mining

    Web Usage Mining - Data collection and sources of data

    - Data preparation for usage mining

    - Mining navigational patterns

    Discussion

    Presentation

    23

    - Mahasiswa memahami

    konsep dan implementasi

    web structure, content

    Web Usage Mining - Integrating e-commerce data

    - Leveraging site content and

    structure

    Discussion

    Presentation

  • CSG2D3 Basis Data Relasional Page 11

    Pertemuan

    ke-

    Kompetensi yang

    diharapkan

    Bahan Kajian Sub bahan kajian Metode

    Pembelajaran

    Indikator Pencapaian Cara

    assessment

    Bobot

    Nilai

    dan usage minin

    - Mahasiswa mampu

    mengimplementasikan

    teknik-teknik web mining

    - Mahasiswa mampu

    mendesain prototype

    sistem di bidang web

    mining

    - User tracking and profiling

    - E-Metrics: measuring success in e-

    commerce

    - Privacy issues

    24

    - Mahasiswa memahami

    konsep dan implementasi

    web structure, content

    dan usage minin

    - Mahasiswa mampu

    mengimplementasikan

    teknik-teknik web mining

    - Mahasiswa mampu

    mendesain prototype

    sistem di bidang web

    mining

    Web Usage Mining - Project Progress Report

    Discussion

    Presentation

    - Dapat memahami

    konsep dan

    implementasi web

    structure, content dan

    usage mining

    - Dapat

    mengimplementasikan

    teknik web mining

    - Dapat mendesain

    prototype sistem web

    Project

    25 - Mahasiswa mengetahui

    aplikasi-aplikasi web

    mining

    - Mahasiswa mampu

    mengidentifikasi,

    memformulasikan dan

    menuliskan kembali

    jurnal/paper web mining

    Web Mining Application - opinion mining vs. fact mining, web

    spam analysis, comparative

    shopping, etc.

    - Web information integration,

    mapping schemas usage

    - Web personalization and recommender systems

    - Web Mining and its relation to the

    Semantic Web: automatic semantic

    annotation, ontology learning,

    - Mengetahui aplikasi

    web mining

    Project

  • CSG2D3 Basis Data Relasional Page 12

    Pertemuan

    ke-

    Kompetensi yang

    diharapkan

    Bahan Kajian Sub bahan kajian Metode

    Pembelajaran

    Indikator Pencapaian Cara

    assessment

    Bobot

    Nilai

    Semantic Web search

    26 - Mahasiswa mengetahui

    aplikasi-aplikasi web

    mining

    - Mahasiswa mampu

    mengidentifikasi,

    memformulasikan dan

    menuliskan kembali

    jurnal/paper web mining

    Web Mining Application - opinion mining vs. fact mining, web

    spam analysis, comparative

    shopping, etc.

    - Web information integration,

    mapping schemas usage

    - Web personalization and recommender systems

    - Web Mining and its relation to the

    Semantic Web: automatic semantic

    annotation, ontology learning,

    Semantic Web search

    27-28 - Mahasiswa memahami

    teknik-teknik yang

    diterapkan di web mining

    - Mahasiswa mampu

    mengimplementasikan

    teknik-teknik web mining

    - Mahasiswa mampu

    mendesain prototype

    sistem di bidang web

    mining

    - Mahasiswa mampu

    mengidentifikasi,

    memformulasikan dan

    menuliskan kembali

    jurnal/paper web mining

    Final Project

    Presentation

    Discussion

    Presentation

    Dapat mempresentasikan

    hasil karya yang

    dihasilkan

    Project

  • CSG2D3 Basis Data Relasional Page 13

  • CSG2D3 Basis Data Relasional Page 14

    Topics & Reading

    1. Overview Web Data Mining and E-Business Analytics

    Reading:

    a. Chapters 1 and 2 of Berry and Linoff

    b. Data Mining on the Web - short article by Dan R. Greening, written for webtechniques.com.

    c. (Online Paper # 1) Web Mining: Information and Pattern Discovery on the World Wide

    Web, by Robert Cooley, Bamshad Mobasher, and Jaideep Srivastava, ICTAI 1997.

    2. Knowledge Discovery Process; Data Preparation for Mining

    Reading:

    a. Chapters 3 and 17 of Berry and Linoff

    b. Data Mining Overview

    c. (Online Paper # 9) Driving e-Commerce Profitability From Online and Offline Data, White

    paper form Torrent Systems.

    d. (Online Paper # 3) Web Usage Mining: Discovery and Applications of Usage Patterns from

    Web Data, by Jaideep Srivastava, et. al., SIGKDD Explorations, January 2000.

    3. Data Mining Techniques: Mining Association Rules and Sequential Patterns

    Reading:

    a. Chapter 2 of B. Liu's Book

    b. Chapter 9 of Berry and Linoff

    c. (Online Paper # 5) Web Usage Mining for Web Site Evaluation, by Myra Spiliopoulou,

    Communications of ACM, August 2000.

    d. (Online paper # 7) An Internet-enabled Knowledge Discovery Process, by Alex Buchner, et.

    al., MINEit Software Ltd., 1999.

    4. Data Mining Techniques: Classification & Prediction

    Reading:

    a. Chapter 3 of B. Liu's Book

    b. Chapter 6 of Berry and Linoff

    c. (Online paper # 33) Modeling Web Robot Navigation Patterns, by Pang-Ning Tan and Vipin

    Kumar, WebKDD Workshop at the ACM SIGKDD Conference, 2000.

    Note: An additional description of the ID3 and C4.5 algorithms can be found in the

    document "Building Classification Models: ID3 and C4.5" from the AI course at Temple

    university.

  • CSG2D3 Basis Data Relasional Page 15

    5. Data Mining Techniques: Clustering; Memory-Based Reasoning

    Reading:

    a. Chapter 4 of B. Liu's Book

    b. Chapters 11 and 8 of Berry and Linoff

    c. (Online Paper # 22) Text-Learning and Related Intelligent Agents: A Survey, by Dunja

    Mladenic, IEEE Intelligent Systems, July/August 1999.

    d. (Online Paper # 13) Clustering Users of Large Web Sites into Communities, by Georgios

    Paliouras, et. al., ICML 2000.

    6. Web Usage Mining: Data Preparation and Integration

    Reading:

    a. Chapter 12 of B. Liu's Book

    b. (Online Paper # 4) Data Preparation for Mining World Wide Web Browsing Patterns, by

    Robert Cooley, Bamshad Mobasher, and Jaideep Srivastava, Knowledge and Information

    Systems, Volume 1, No. 1, 1999.

    c. (Online paper # 32) Lessons and Challenges from Mining Retail E-Commerce Data, by Ron

    Kohavi, et al., Journal of Machine Learning, 2003.

    7. Web Usage Mining: E-Metrics and E-Commerce Data Analysis, Predictive Web Analytics

    Reading:

    a. Chapters 14 and 4 of Berry and Linoff

    b. (Online paper #10) E-Commerce Intelligence: Measuring, Analyzing, and Reporting on

    Merchandising Effectiveness of Online Stores, by Stephen Gomory, et. al., IBM T. J. Watson

    Research Center.

    c. (Online paper #11) E-Metrics Business Metrics For The New Economy, White Paper from

    NetGenesis.

    8. Web Personalization and Recommender Systems

    Reading:

    a. (Online paper # 14) Automatic Personalization Based on Web Usage Mining, by Bamshad

    Mobasher, Robert Cooley, and Jaideep Srivastava, Communications of ACM, August 2000.

    b. (Online paper # 28) Analysis of Recommendation Algorithms for E-Commerce, by Badrul

    Sarwar, et. al., ACM Electronic Commerce Conference, November 2000.

    c. (Online paper # 15) Integrating Web Usage and Content Mining for More Effective

    Personalization, by Bamshad Mobasher et. al., EC-Web 2000.

  • CSG2D3 Basis Data Relasional Page 16

    9. Data Mining for the Social Web; Social Network Analysis

    Reading:

    a. (Online Paper # 20) Text Mining: Finding Nuggets in Mountains of Textual Data, by Jochen

    Dorre, Peter Gerstl, and Roland Seiffert, KDD 1999.

    b. (Online Paper # 19) Data mining for hypertext: A tutorial survey, by Soumen Chakrabarti,

    SIGKDD Explorations, January 2000.

    c. (Online Paper # 25) Extracting Patterns and Relations from the World Wide Web, by Sergey

    Brin, Stanford University.

    VII. REFERENSI / SUMBER BAHAN UTAMA

    No Referensi / Sumber Bahan

    1 Overview Web Data Mining and E-Business Analytics

    Data Mining on the Web - short article by Dan R. Greening, written for webtechniques.com.

    2 Knowledge Discovery Process; Data Preparation for Mining

    3 Web Usage Mining: Data Preparation and Integration

    4 Web Usage Mining: E-Metrics and E-Commerce Data Analysis, Predictive Web Analytics

    5 Data Mining for the Social Web; Social Network Analysis

    6 Mining the Social Web, Russell, Matthew A.

    7 Social Network Data Analytics, Aggar wal, Charu C.

    8 Social Network Mining, Analysis and Research Trends : Techniques and Applications, Ting, I-Hsien

    9 Web Data Mining : Exploring Hyperlink, Contents and Usage Data, Bing Liu

    VIII. SKEMA PENILAIAN

    KOMPONEN PENILAIAN BOBOT/ PROSENTASE KETERANGAN

    Project 100

  • CSG2D3 Basis Data Relasional Page 17

    TUGAS PROJECT WEB MINING :

    Mahasiswa dapat memilih 1 dari 2 jenis tugas project :

    1. Research paper (Individual)

    2. Implementation project (Kelompok maksimal 2 orang)

    Setiap mahasiswa/kelompok harus mengajukan proposal project pada minggu kedua perkuliahan

    untuk disetujui.

    Proposal berisi :

    o Jenis project

    o Deskripsi project

    o Metodologi yang diajukan

    o Teknik/metode dan pendekatannya

    o Teknik implementasi

    o Resource yang digunakan

    o Jadwal

    Untuk research paper, proposal harus ditambahkan abstrak dan referensi yang digunakan dalam

    research paper.

    Untuk implementation project, proposal harus ditambahkan deskripsi secara detail, sampel data

    yang digunakan, permasalahan data mining yang akan diselesaikan, teknik/metode serta tools yang

    akan digunakan.

    Secara lebih detail penjelasan dari masing-masing jenis project adalah :

    Research paper Project research paper merupakan studi mendalam yang berupa penelusuran, analisis, survei

    ataupun evaluasi dari 1 atau lebih topik yang berhubungan dengan Web Mining. Research paper

    dapat menganalisis dan mengevaluasi teknik/metode spesifik dalam web mining pada 1 atau lebih

    area aplikasi yang diberikan pada deskripsi project.

    Tujuan dari research paper adalah menganalisis dan mengevaluasi secara lebih detail dan mendalam

    metode dalam lingkup web mining.

    Research paper akan dinilai berdasarkan :

    o thoroughness, mencakup issue/teknik yang relevan dengan related work/penelitian

    yang pernah dilakukan sebelumnya. Point penilaian : 0 4

    o soundness, mencakup justifikasi dari beberapa pernyataan yang disampaikan,

    ilustrasi/gambaran sistem, analisis secara detail dari teknik/metode yang digunakan

    serta keoriginalitasan analisis dan pemaparan yang dilakukan. Point penilaian : 0 4

    Catatan : bahwa research paper tidak hanya sekedar menggabungkan analisis dari

    beberapa paper melainkan terkandung analisis original yang dilakukan sendiri.

    o Progress report/presentasi, Point penilaian : 0 4

    o Dokumentasi , Point penilaian : 0 4

    Disarankan panjang untuk research paper = 15 20 halaman (single-spaced)

    Beberapa contoh topik untuk research paper :

    Aplikasi web usage mining (Ex : e-commerce, user profiling, Web personalization).

    Catatan : Paper harus mengandung konten dan sumber yang secara substansi berbeda

    dengan materi/reference paper yang telah disampaikan di kelas.

    Recommender Systems dan User Profiling

  • CSG2D3 Basis Data Relasional Page 18

    Studi perbandingan dari beberapa teknik/metode dalam data mining dan collaborative

    filtering untuk mengetahui user profiles dan memprediksi user behavior ke depannya. Studi

    yang dilakukan harus mencakup beberapa teknik dan pendekatan yang digunakan dalam

    recommender systems (mencakup collaborative filtering, content-based filtering, model-

    based approaches yang memanfaatkan data mining, dan hybrid systems).

    Web content mining/Text mining

    Studi dari beberapa teknik/metode untuk me-mining informasi dan pola seperti pada text

    ataupun Web documents. Paper harus mencakup analisis beberapa topik, antara lain aplikasi

    text mining pada Web, information extraction dan mining data records dari Web, concept

    discovery dari document collections, document categorization dan classification, dll.

    Web structure mining

    Studi dari beberapa teknik/metode untuk me-mining knowledge dari linkage structure di

    Web. Di antara beberapa topik, dapat pula dieksplorasi mengenai aplikasi structure mining

    pada information retrieval (example Google's Pagerank algorithm), algoritma berdasarkan

    pada Hubs and Authorities, serta automatic discovery dari Web communities.

    Web Data Warehousing

    Studi mendetail mengenai Web data warehouses dan datamarts, serta kegunaannya,

    dengan menggunakan beberapa teknik/metode dalam data mining baik untuk kepentingan

    SPPK maupun untuk membangun business intelligence dari Web data.

    Catatan: Fokus utamanya bukan hanya pada Data warehousing, akan tetapi pada

    kegunaannya dalam konteks Web dan data e-commerce, serta keterhubungannya dengan

    data mining atau data analysis.

    Struktur Research Papers secara keseluruhan diserahkan kepada mahasiswa, akan tetapi ada

    beberapa bagian yang wajib dicantumkan, yaitu :

    1. Abstraksi

    Berisi sinopsis/deskripsi singkat mengenai isi dari paper. Terdiri dari 200-300 kata

    2. Previous works

    Hasil riset-riset yang pernah dilakukan sebelumnya dan dirujuk pada paper ini

    3. Desain sistem

    Berisi desain sistem secara detail dari input proses - output

    4. Pengujian dan analisis

    Skenario uji dan hasil pengujian serta analisis terhadap hasil pengujian

    5. Kesimpulan

    Berisi kesimpulan dari research paper. Harus berisi kesimpulan yang bersifat original dan

    bukan mengutip dari reference paper.

    6. Referensi

    Berisi daftar referensi yang digunakan dalam reserach paper. Referensi diberi penomoran

    sesuai dengan aturan penulisan pada format IEEE.

    Disarankan untuk menyusun bagian/sub bagian sesuai dengan konten research paper dan

    memudahkan pembaca untuk memahami isi dari paper yang disampaikan.

  • CSG2D3 Basis Data Relasional Page 19

    IMPLEMENTATION PROJECT

    Implementation project mencakup implementasi dari teknik/metode data mining

    (mengkombinasikan dari beberapa teknik data mining) untuk menyelesaikan permasalahan spesifik

    dalam web mining, serta melakukan evaluasi terhadap pengujiannya .

    beberapa contoh spesifik dari implementation project :

    a. Mendesain, mengimplementasikan dan mengujikan teknik data mining untuk data set

    seperti data web usage, e-commerce atau data yang ada di UCI KDD Archive.

    b. Mendesain, mengimplementasikan dan mengujikan teknik data mining untuk preprocessing

    data web usage, mencakup user/session identification, path completion, automatic

    discovery and filtering of robot navigation, dan pageview identification.

    c. Mendesain dan mengimplementasikan datawarehouse untuk integrasi dan manajemen web

    usage, struktur, konten dan data e-commerce serta menganalisis data tersebut dengan

    query OLAP di datawarehouse untuk kemudian diolah dengan teknik data mining.

    d. Mengimplementasikan sistem untuk menganalisis keefektifan web site dengan

    membandingkan struktur site dengan navigational behaviour of user, menganalisis site dan

    user e-metric dan memprediksikan user behaviour untuk user individu atau segmen tertentu

    e. Mendesain dan mengimplementasikan recommender system berdasarkan usage mining,

    content filtering

    f. Mendesain dan mengimplementasikan automated classification tool yang menggunakan

    machine learning untuk mengidentifikasi dan mengklasifikasikan robot navigation sessions

    dari Web usage log files.

    g. Mendesain dan mengimplementasikan query language untuk meng-query rules/patterns

    yang didapatkan dari Web usage atau Web content data.

    h. Mendesain dan mengimplementasikan filtering agent untuk mail, news atau informasi web

    (agent yang dapat mengekstrak informasi mengenai topik/produk dari site-site tertentu).

    Desain dari filtering agent mencakup 1/lebih metode/teknik machinelearning dan data

    mining.

    Implementation project akan dievaluasi berdasarkan lingkup permasalahan yang dipilih, desain,

    correctness, dokumentasi dan hasil evaluasi/pengujian.

    Dokumentasi sistem minimal mencakup :

    o Executive summary dari project (mencakup problems, goals, metode dan kesimpulan)

    o Deskripsi/penjelasan detail sistem yang mencakup teknik/metode/algoritma yang digunakan

    Blok diagram/flowchart sistem secara detail dan penjelasannya

    Komponen-komponen yang diimplementasikan dalam sistem (code segment, modul,

    method, function, procedure dll)

    Interaksi antar komponen di atas

    Dataset yang digunakan

    o Pengujian sistem dengan sample data yang menjelaskan cara kerja sistem dari input, proses

    dan output

    o Complete source code (pastikan source code anda didokumentasikan dengan baik dan

    mudah dipahami)

    o Binary files (., executables, DLLs, Class files) atau komponen lain yang diperlukan untuk

    mengeksekusi program anda

    o Readme, yang berisi instruksi/panduan bagaimana compile, install atau menjalankan

    program anda

    o Project report/dokumentasi

    o Data training/testing untuk evaluasi sistem

    Implementation project akan dievaluasi berdasarkan :

  • CSG2D3 Basis Data Relasional Page 20

    o significance dari sebuah permasalahan/kasus, Point penilaian : 0 4

    o desain dan implementasi sistem, Point penilaian : 0 4

    o thoroughness (tingkat analisis terhadap data dan permalasahan yang diselesaikan),

    Point penilaian : 0 4

    o dokumentasi, Point penilaian : 0 4

    LEVEL PENILAIAN

    LEVEL/INDEKS INDIKATOR KOMPETENSI KETERANGAN *)

    A Masing-masing point penilaian > 3 Lulus/Tidak Lulus

    B 2 < point