bab 2 landasan teori menurut vercellis (2009, p7), pada ... · mentah atau deskripsi dasar dari...
TRANSCRIPT
7
BAB 2
LANDASAN TEORI
2.1. Teori Umum
2.1.1. Pengertian Data, Informasi dan Pengetahuan
Data
Menurut Vercellis (2009, p7), pada umumnya data
merepresentasikan kodifikasi terstruktur dari suatu entitas primer
tunggal, serta transaksi yang melibatkan dua atau lebih entitas utama.
Menurut Turban & Rainer (2009, p6), data adalah fakta
mentah atau deskripsi dasar dari benda, peristiwa, aktivitas dan
transaksi yang didapatkan, direkam, disimpan, diklasifikasi tetapi
belum terorganisir untuk menyampaikan suatu arti spesifik.
Sedangkan menurut Williams & Sawyer (2011, p25), data
terdiri dari fakta-fakta, dan gambaran mentah yang akan diproses
menjadi informasi. Data penting karena pengguna memerlukan data
untuk membuat informasi yang berguna.
Informasi
Menurut Vercellis(2009, p7), Informasi adalah suatu hasil
dari ekstraksi dan pemrosesan data menjadi sesuatu yang berarti bagi
yang menerimanya dalam domain tertentu.
Menurut Turban & Rainer (2009, p6), informasi adalah suatu
koleksi fakta (data) yang telah terorganisir dengan beberapa cara
sehingga memberikan suatu arti yang dipahami oleh penerima.Dan
menurut Williams & Sawyer (2011, p25), informasi merupakan data
yang telah di rangkum atau dimanipulasi dalam bentuk lain untuk
tujuan pengambilan keputusan.
8
Pengetahuan
Menurut Vercelis (2009, p7), Informasi diubah menjadi
pengetahuan bila digunakan untuk membuat keputusan dan
mengembangkan tindakan yang sesuai.
2.1.2. Pengertian Sistem
Menurut O’Brien & Marakas (2011, p26), sistem didefinisikan
sebagai sekumpulan komponen yang saling terkait, dengan batas yang
jelas, bekerja sama untuk mencapai suatu serangkaian tujuan umum
dengan menerima input dan menghasilkan output dalam proses
transformasi yang terorganisir.
Menurut William & Sawyer (2011, p492), sistem adalah
kumpulan dari komponen-komponen yang berhubungan yang saling
berinteraksi untuk melakukan suatu tugas untuk mencapai suatu
tujuan.
2.1.3. Pengertian Database
Menurut Connolly & Begg (2015, p63), database adalah
sekumpulan dari data logika yang saling berhubungan dan gambaran
dari data tersebut, dirancang untuk memenuhi kebutuhan informasi
sebuah organisasi.
Menurut Williams & Sawyer (2011, p164), database adalah
setiap koleksi data yang disimpan secara elektronik dalam sistem
komputer.
2.1.4. Pengertian Database Management System (DBMS)
Menurut Connolly & Begg (2015, p64), Database
Management System adalah sistem perangkat lunak yang
memungkinkan pengguna untuk mendefinisikan, membuat,
memelihara, dan mengontrol akses ke dalam database.
9
Komponen – kompenen DBMS Menurut Connolly & Begg (2015, 66)
yakni sebagai berikut :
• Hardware
• Software
• Data
• Procedures
• People
Gambar 2.1 – DBMS Environment
Sumber : Connolly & Begg (2015, p66)
2.1.5. Pengertian Data Warehouse
Menurut Connolly & Begg (2015, p123), Data Warehouse
adalah Sebuah data konsolidasi atau terintegrasi yang ada pada
perusahaan yang diambil dari sumber data operasional yang berbeda
dan berbagai alat untuk memudahkan akses pengguna sehingga
mendukung pengambilan keputusan.
Dikutip dari jurnal sepsugiarto (2011) Datawarehouse memilik
Banyak keuntungan yang tidak terlihat, salah satu keuntungannya
adalah para pembuat keputusan pada akhirnya dapat diperlengkapi
dengan pemecahan masalah pada setiap proses bisnis. Banyak
teknologi lain yang menjamin manajer untuk mengotomasikan proses
bisnis, namun khasanah data mendukung kemampuan untuk memberi
pengertian mengenai permasalahan yang mereka alami dan
menunjukkan beberapa kemungkinan perubahan. Data Warehouse
10
adalah alat bantu bagi para manajer dalam penyimpanan history data
yang dibutuhkan. Keuntungan utama dari data warehouse adalah
membantu dalam proses pengambilan keputusan. Keuntungan yang
lain adalah meliputi:
• mengatur keseluruhan hubungan/peluang pelanggan
• menciptakan nilai tambah bagi pelanggan
• membangun suatu empati dari organisasi
• secara cepat mengontrol berbagai perubahan dan
• peluang mengatur perspektif baik makro maupun mikro
• meningkatkan kemampuan manajerial.
Dan menurut Turban, Sharda, Delen, & King (2011, p52), data
warehouse adalah kumpulan data yang dihasilkan untukmendukung
pengambilan keputusan. danjuga merupakan tempat penyimpanan data
saat ini dan data historikal dari kepentingan manager di seluruh
organisasi.
Sedangkan Menurut Vercellis(2009, p45) seperti namanya, data
warehouse adalah repository utama untuk ketersediaan data, untuk
mengembangkan arsitektur business intelligence dan untuk mendukung
sistem pengambilan keputusan. Istilah Data Warehouse menunjukkan
seluruh rangkaian kegiatan yang saling terkait yang terlibat dalam
merancang, menerapkan dan menggunakan Data Warehouse. Hal ini
memungkinkan untuk mengidentifikasi tiga kategori utama data feeding
ke Data Warehouse yaitu; internal data, external data and personal data.
2.1.5.1. Kategori Utama Data Feeding
2.1.5.1.1. Internal Data
Menurut Vercellis (2009, p46), data internal
merupakan bagian terbesar dalam penyimpanan yang
disimpan di dalam database , disebut juga sebagai
system transaksional atau system operasional, yang
merupakan tulang punggung dari sebuah sistem
informasi perusahaan. Data internal diperoleh melalui
11
transaksi aplikasi yang secara rutin memimpin operasi
perusahaan, seperti administrasi, akuntansi, produksi
danlogistik. Kumpulan aplikasi perangkat lunak
transaksi ini disebut enterprise resource planning
(ERP).Data yang disimpan dalam sistem operasional
biasanya berurusan dengan entitas utama yang terlibat
dalam proses perusahaan, yaitu pelanggan, produk,
penjualan, karyawandan pemasok. Data ini biasanya
datang dari komponen yang berbeda dari sistem
informasi:
• Sistem back-office, yang mengumpulkan catatan
transaksi dasar seperti pesanan, faktur,
persediaan, produksi dan data logistik.
• Sistem front-office, yang berisi data yang berasal
dari kegiatan call-center, bantuan pelanggan,
pelaksanaan pemasaran.
• Sistem berbasis web, yang mengumpulkan
transaksi penjualan di situs web e-commerce,
kunjungan ke situs web, data yang tersedia pada
formulir yang diisi oleh pelanggan dan calon
pelanggan.
2.1.5.1.2. External Data
Menurut Vercellis (2009, p46), ada beberapa
sumber data eksternal yang dapat digunakan untuk
memperpanjang kekayaan informasi yang tersimpan
dalam database internal. Sebuah sumber yang
signifikan lebih lanjut dari data eksternal disediakan
oleh geographic information systems (GIS), yang
merupakan satu set aplikasi untuk memperoleh,
mengorganisir, menyimpan dan menyajikan data
teritorial.
12
2.1.5.1.3. Personal Data
Menurut Vercellis (2009, p46), dalam
kebanyakan kasus, pengambil keputusan
dengan menggunakan analisis business
intelligence juga mengandalkan informasi
dan penilaian pribadi yang tersimpan di
dalam lembar kerja atau database lokal yang
terletak dikomputer mereka. Pengambilan
informasi tersebut dan dengan integrasi data
terstruktur dari internal dan eksternal sumber
adalah salah satu tujuan dari sistem
manajemen pengetahuan.
2.1.5.2. Arsitektur Data Warehouse
Menurut Connoly & Begg (2015, p123), komponen
utama data warehouse, antara lain :
Gambar 2.2 – The typical architecture of data warehouse
Sumber : Connoly & Begg (2015, p124)
13
• Data Operasional
Data operasional adalah data yang dapat di
gunakan untuk mendukung proses bisnis.
• Operasional Data Store (ODS)
Operational data store adalah tempat
penyimpanan data operasional yang bersifat current
dan terintegrasi yang di gunakan untuk analisis.
Dengan kata lain, ODS mendukung proses transaksi
operasional maupun proses analisis. Dengan adanya
ODS maka pembangunan data warehouse menjadi
lebih mudah karena ODS dapat menyediakan data yang
telah di ekstrak dari sumber dan telah di bersihkan
sehingga proses pengintegrasian dan restrukturisasi
data untuk data warehouse menjadi lebih sederhana.
• Load Manager
Disebut juga komponen front end menangani
semua operasi yang berhubungan dengan fungsi extract
data (mengambil data) dan fungsi loading data
(menaruh data) ke dalam data warehouse.
• Warehouse Manager
Menangani semua operasi yang berhubungan
dengan management data dalam data warehouse.
Operasi-operasi yang di jalankan oleh warehouse
manager mencakup :
a. Analisis data untuk menjaga konsistensi
data.
b. Melakukan transformasi dan
penggabungan sumber data dari tempat
penyimpanan sementara ke dalam
tabel-tabel data warehouse.
c. Melakukan denormalisasi.
d. Melakukan agregasi.
14
e. Menyimpan (archive) dan back-up data.
• Query Manager
(Di sebut juga komponen backend) menangani
semuaoperasi yang berhubungan dengan management
permintaan user (user queries). Operasi yang di
jalankan oleh query manager meliputi kegiatan
mengarahkan permintaan ke tabel-tabel data yang tepat
dan melakukan penjadwalan eksekusi terhadap
permintaan.
• Detailed Data
Dalam data warehouse, area ini adalah tempat
penyimpanan semua detailed data dalam skema basis
data. Detailed data dibagi menjadi 2, yaitu current
detail data (tempat penyimpanan semua detailed data
yang bersifat current) dan old detailed data (tempat
penyimpanan semua detailed data yang bersifat old).
• Lightly and Hightly Summerized Data
Area ini adalah tempat penyimpanan sementara
data predefinisi yang teringkas secara light dan high
(predefined lightly and highly summarized) yang
dihasilkan oleh warehouse manager. Tujuan dari
ringkasan informasi ini adalah untuk mempercepat
tanggapan terhadap permintaan user. Ringkasan data di
update secara berkala seiring dengan bertambahnya
data dalam data warehouse.
• Archive / Backup Data
Dalam data warehouse, area ini digunakan
untuk menyimpan detailed data dan data yang telah
diringkas. Tujuannya adalah untuk penyimpanan
(archiving) dan backup.Data kemudian ditransfer ke
media penyimpanan seperti magnetic tape atau optical
disk.
15
• Metadata
Digunakan untuk menyimpan semua definisi
metadata (keterangan tentang data) yang digunakan
dalam seluruh proses warehouse. Metadata digunakan
untuk berbagai tujuan, antara lain :
a. Proses extracting dan loading
b. Proses warehouse management
c. Sebagian proses query management
• End-User Access Toolss End-user access tools
Adalah tools yang memanfaatkan kegunaan
dari data warehouse. Kegunaan data warehouse
tersebut, antara lain untuk pembuatan laporan, OLAP,
data mining dan proses informasi eksekutif.
2.1.5.3. Karakteristik Data Warehouse
Menurut Connoly & Begg (2015, p123). Karateristik pada
data warehouse yakni sebagai berikut :
• Subject Oriented
Sebagai gudang yang terorganisasi di sekitar
subjek utama seperti pelanggan, produk, dan penjualan
yang ada pada aplikasi area utama (faktur pelanggan,
stok kontrol, dan penjualan produk).Hal ini tercermin
dalam kebutuhan untuk menyimpan data pendukung
keputusan dari data yang berorientasi.
• Integrated
Karena sistem aplikasi yang luas bersamaan
datang dari sumber data dari organisasi yang
berbeda.Sumber data sering tidak konsisten,
menggunakan, misalnya, berbeda tipe data dan / atau
format.Sumber data yang terintegrasi harus dibuat
konsisten untuk menyajikan pandangan terpadu dari
data ke pengguna.
16
• Time Variant
Karena data yang ada pada warehouse tersebut
akurat dan hanya berlaku pada titik yang sama dalam
waktu lebih dari beberapa interval waktu
• Non Volatile
Karena data tidak di perbaharui secara real time
tetapi di refresh dari sistem operasional secara teratur.
Data baru selalu ditambahkan sebagai pelengkap ke
database, bukan pengganti.
2.1.5.4. Implementasi Data Warehouse
Menurut Vercellis (2009, p52), terdapat 3 cara dalam
mengimplementasi data warehouse;
1. Top-down
Metodologi top-down didasarkan pada desain
keseluruhan dari data warehouse, dan lebih sistematis.
akan tetapi, pengembangan akan berjalan lebih lama
dan risiko tidak sesuai jadwal akan lebih besar, karena
secara keseluruhan data warehouse sedang
dikembangkan.
2. Bottom-up
Metode bottom-up didasarkan pada
penggunaan prototipe dan oleh karena itu, ekstensi
sistem yang dibuat sesuai dengan langkah-demi-
langkah yang tersedia dalam skema. Pendekatan ini
biasanya lebih cepat, memberikan hasil yang lebih
nyata tetapi tidak memiliki visi keseluruhan dari
seluruh sistem yang akan dikembangkan.
3. Mixed
17
Metodologi mixed didasarkan pada desain
keseluruhan dari data warehouse, akan tetapi hasilnya
tetap menggunakan pendekatan prototyping, dan secara
berurutan diimplementasikan di setiap bagian dari
seluruh sistem. Pendekatan ini sangat praktis dan
biasanya lebih disukai, karena memungkinkan
menampilkan bagian-bagian kecil tetapi tetap
menampakan keseluruhan gambaran.
2.1.6. Extract, Transform, Loading Data (ETL)
Menurut Vercellis (2009, p53), ETL mengacu pada perangkat
lunak yang ditujukan untuk melakukan dengan cara otomatis tiga
fungsi utama : extraction, transformation, and loading data ke dalam
data warehouse.
• Extract
Selama tahap pertama, data diproses dari
sumber internal dan external. Perbedaan logis dapat
dibuat antara awal ekstraksi, dimana tersedia data yang
relatif terhadap semua periode masa lalu dimasukkan
kedalam data warehouse yang kosong, dan ekstraksi
tambahan berikutnya yang memperbarui data
warehouse menggunakan data baru yang menjadi
tersedia dari waktu ke waktu. Pemilihan data yang akan
diimpor didasarkan pada desain data warehouse.Yang
tergantung pada informasi yang dibutuhkan oleh
analisis business intelligence dan sistem pendukung
keputusan (DSS) yang beroperasi di domain aplikasi
tertentu.
• Transformation
18
Tujuan dari fase pembersihan dan transformasi
adalah meningkatkan kualitas data yang diambil dari
sumber yang berbeda, melalui koreksi inkonsistensi,
ketidakak uratan dan nilai-nilai yang hilang.
• Loading
Akhirnya, setelah diekstraksi dan diubah, data
dimuat ke dalam tabel data warehouse untuk membuat
mereka tersedia bagi analis dan aplikasi pendukung
pembuat keputusan.
Sedangkan menurut Kimbaln (2013, p19-20)
bahwa Ekstrak, transformasi, dan load (ETL) adalah
suatu system dari Data Warehouse atau business
inteligence yang terdiri dari area kerja, struktur data
yang dipakai, dan satu set proses. Sistem ETL
adalah segalanya antara hubungan operasional sistem
dan area presentasi dari data warehouse atau business
intelligence
2.1.7. Dimesionality Modeling
Menurut Connolly & Begg (2015, p1261), dimensional
modeling adalah teknik desain logis yang bertujuan untuk menyajikan
data standar, dalam bentuk intuitif yang memungkinkan untuk
mengakses kemampuan kinerja.
2.1.7.1. Star Schema
Menurut Connolly & Begg (2015, p1261), starschema
adalah model data dimensi yang memiliki tabel fakta di
tengah, dikelilingi oleh tabel dimensi denormalized. Skema
bintang mengeksploitasi karakteristik data faktual sehingga
facs dihasilkan oleh peristiwa yang terjadi di masa lalu, dan
tidak mungkin untuk berubah, terlepas dari bagaimana hari
dianalisis. Karena sebagian besar data dalam data warehouse
19
direpresentasikan sebagai fakta, tabel fakta bisa relatif sangat
besar untuk tabel dimensi.
Fakta yang paling berguna dalam tabel fakta numerik
dan aditif, karena aplikasi data warehouse hampir tidak pernah
mengakses catatan tunggal, mereka mengakses ratusan, ribuan,
atau bahkan jutaan catatan pada waktu dan yang paling
berguna untuk melakukan dengan begitu banyak catatan
adalah untuk agregat mereka.
Sedangkan menurut Vercellis (2009,p55), star schema
memiliki dua tipe tabel yaitu tabel fakta (fact table) dan tabel
dimensi (dimension table). fact table adalah tabel yang
umumnya mengandung sesuatu yang dapat diukur dan bersifat
historis, dan merupakan kumpulan foreign key dari primary
key yang terdapat pada masing-masing dimension table.
Tabel dimensi (dimension table) adalah table yang
berisikan kategori-kategori dengan ringkasan detil yang dapat
berupa laporan. Secara umum, dapat disebut dengan dimensi
yang terkait dengan entitas sekitarnya dalam proses organisasi.
Gambar 2.3 – Contoh Star Schema
Sumber : Vercellis (2009,p56)
2.1.7.2. Perbandingan Star Schema, Snowflake dan Starflake
20
Sebuah skema bintang dapat memiliki sejumlah tabel
dimensi. Cabang-cabang pada akhir dari link yang
menghubungkan tabel menunjukkan hubungan One-to-many
antara tabel fakta dan tabel dimensi masing-masing.
Gambar 2.4 – Contoh Star Schema
Sumber : Vercellis (2009,p56)
Snowflake terdiri dari satu tabel fakta yang
terhubung banyak ke tabel dimensi, yang dimana
dimensi tersebut dapat dihubungkan ke tabel dimensi
lain dengan relationship one-to-many. Tabel dalam
snowflake schema biasanya dinormalisasi ke bentuk
normal ketiga.
21
Gambar 2.5 – Contoh Snowflake
Sumber : Vercellis (2009,p56)
Sebuah starflake schema adalah kombinasi daristar
schema dan snowflake. Starflake schema adalah snowflake
schema di mana hanya beberapa tabel dimensi telah
denormalize.
Starflake schema bertujuan untuk memanfaatkan
keuntungan dari kedua star snowflake scheme. Hirarki dari
star schemas denormalized, sedangkan hierarki snowflake
schemas dinormalisasi.
Starflake schemas dinormalisasi untuk
menghilangkan redudansi dalam dimensi. Untuk
menormalkan skema, hirarki dimensi bersama
ditempatkan di Outriggers. Sebuah outriggers adalah tabel
dimensi atau entitas yang bergabung ketabel dimensi lain
dalam star schema
22
Gambar 2.6 – Contoh Starflake schema
Sumber : Vercellis (2009,p57)
2.1.8. Pengertian Data Mart
Menurut Connolly & Begg (2015, p347),Data Mart adalah
subset dari Data Warehouse yang mendukung kebutuhan dari
departemen tertentu atau fungsi bisnis. Isu-isu yang terkait dengan
data mart termasuk fungsi, ukuran, kinerja beban, akses pengguna
kedata dalam beberapa data mart, Internet /intranet akses,
administrasi, daninstalasi.
Menurut Vercellis(2009, p49),Data mart adalah sistem yang
mengumpulkan semua data yang dibutuhkan oleh perusahaan pada
departemen-departemen tertentu, seperti pemasaran atau logistik,
untuk bertujuan melakukan analisis business intelligence dan untuk
menjalankan aplikasi pendukung keputusan khusus untuk fungsi itu
sendiri.
Data mart juga dapat dianggap sebagai fungsional atau
departemen Data Warehouse dalam ukuran yang lebih kecil dan jenis
yang lebih spesifik dari pada keseluruhan Data Warehouse
perusahaan. Oleh karena itu, sebuah data mart berisi subset dari data
yang disimpan di data warehouse perusahaan, yang biasanya
terintegrasi dengan data yang lain pada perusahaan. Misalnya, data
23
mart pemasaran akan berisi data yang diambil dari pusatdata
warehouse, seperti informasi pelanggan dan transaksi penjualan, tetapi
juga terdapat data tambahan yang berkaitan dengan fungsi pemasaran,
seperti hasil pemasaran yang berjalan di masa lalu.
2.1.9. Meta Data
Menurut Vercellis (2009, p54), dalam mendokumentasikan data
yang terdapat dalam data warehouse, dianjurkan untuk membuat sebuah
struktur informasi spesifik yang dikenal sebagai metadata. Metadata
disebut juga deskripsi data. Metadata menunjukkan setiap atribut data
warehouse sumber asli dari datanya, yang berarti data tersebut dan
semua transformasi yang telah dilakukan. Dokumentasi yang
disediakan oleh metadata harus terus menerus up-to-date, dalam rangka
untuk mencerminkan perubahan dalamstruktur data warehouse. Dan
dokumentasi harus langsung dapat diakses oleh pengguna data
warehouse.
Berdasarkan teori diatas disimpulkan bahwa metadata
merupakan data mengenai data dimana metadata ini mengandung
informasi mengenai isi suatu data yang dipakai untuk keperluan
manajemen. Data itu nantinya dalam suatu basis data yang dapat
berbentuk nama ruas (field), panjang field, dan tipe fieldnya: integer,
character, date, dll.
2.1.10. Pengertian Data Mining
Menurut Connolly (2015, p 1316) Data mining adalah proses
penggalian informasi yang valid, yang sebelumnya tidak dikenal,
dipahami, dan ditindaklanjuti dari database besar dan
menggunakannya untuk membuat keputusan bisnis penting. Ada
empat kegiatan utama yang terkait dengan teknik data mining:
pemodelan prediktif, segmentasi basis data, analisa link, dan deteksi
deviasi.
24
1. Pemodelan prediktif
Pemodelan prediktif dapat digunakan untuk
menganalisis database yang sudah ada untuk menentukan
beberapa karakteristik penting (model) mengenai kumpulan
data. Model ini dikembangkan dengan menggunakan
pendekatan pembelajaran terawasi, yang memiliki dua fase:
pelatihan dan pengujian. Aplikasi pemodelan prediktif
meliputi manajemen pelanggan retensi, persetujuan kredit,
cross selling dan direct marketing.ada dua teknik yang terkait:
klasifikasi dan prediksi nilai.
2. Segmentasi basis data
Segmentasi basis data partisi database ke nomor tak
dikenal segmen atau cluster catatan serupa. Pendekatan ini
menggunakan pembelajaran tanpa pengawasan untuk
menemukan sub-populasi homogen dalam database untuk
meningkatkan akurasi dari profil.
3. Analisis link
Bertujuan untuk membangun link, asosiasi disebut,
antara catatan individu, atau set cattan, dalam database. Ada
tiga spesialisasi analisis link: asosiasi penemuan, pola
penemuan sekuensial, dan penemuan urutan waktu yang sama.
Asosiasi penemuan menemukan item yang menyiratkan
keberadaan barang-barang lainnya dalam acara yang sama.
Pola penemuan berurutan menemukan pola antara peristiwa
tersebut bahwa kehadiran satu set item diikuti oleh satu set
item dalam database peristiwa selama periode waktu.
Penemuan urutan waktu yang sama digunakan, misalnya,
dalam penemuan hubungan antara dua set data yang
bergantung waktu, dan didasarkan pada tingkat kesamaan
antara pola yang kedua seri waktu menunjukkan.
25
4. Deviasi deteksi
Deviasi deteksi sering menjadi sumber penemuan yang
benar karena mengidentifikasi outlier, yang mengungkapkan
penyimpangan dari beberapa harapan yang diketahui
sebelumnya dan norma. operasi ini dapat dilakukan dengan
menggunakan statistik dan teknik visualisasi atau sebagai
produk membeli dari data mining.
Menurut Vercellis (2009, p77) Kegiatan Data mining
merupakan proses berulang-ulang yang ditujukan untuk
menganalisis database atau data dalam jumlah yang besar,
dengan tujuan penggalian informasi dan pengetahuan yang
akurat agar dapat memberikan pengetahuan untuk para pekerja
dan dapat berguna untuk terlibat dalam pengambilan
keputusan dan pemecahan masalah.
Kegiatan Data mining dapat dibagi lagi menjadi dua
penyelidikan besar, sesuai dengan tujuan utama dari analisis
yaitu: interpretation dan prediction.
• Interpretation : Tujuan interpretasi adalah
untuk mengidentifikasi pola-pola yang teratur pada
data dan untuk mengekspresikan mereka melalui
aturan dan kriteria yang dapat dengan mudah
dipahami oleh para ahli dalam domain aplikasi. Aturan
yang dihasilkan harus asli dan non-trivial dalam rangka
untuk benar-benar meningkatkan tingkat pengetahuan
dan pemahaman tentang suatu sistem yang penting.
• Prediction : Tujuan dari prediksi adalah untuk
mengantisipasi nilai variable yang acak di masa depan
atau untuk memperkirakan kemungkinan kejadian yang
akan terjadi di masa depan.
26
Berikut adalah pengertian data mining yang dikutip
dari jurnal Eka Miranda (2008) Data mining adalah proses
analisis terhadap data dengan penekanan menemukan
informasi yang tersembunyi pada sejumlah besar data yang
disimpan ketika menjalankan bisnis perusahaan. Teknik data
mining merupakan implementasi yang khusus dengan
algoritma, yang digunakan pada operasi data mining.
Terdapat 6 teknik umum data mining, antara lain
sebagai berikut. Pertama, association. Digunakan untuk
mengenali kelakuan dari kejadian-kejadian khusus atau proses.
Link asosiasi muncul pada setiap kejadian. Kedua,
sequence.Mirip dengan asosiasi, namun menghubungkan
kejadian- kejadian sepanjang waktu dan menentukan
keterhubungan antar item untuk sepanjang waktu.Ketiga,
classification. Melihat pada kelakuan dan atribut dari
kelompok yang telah didefinisikan.Tool data mining dapat
memberikan klasifikasi pada data baru dengan memanipulasi
data yang ada, yang telah diklasifikasi dan dengan
menggunakan hasilnya untuk memberikan sejumlah
aturan.Aturan-aturan tersebut digunakan pada data-data baru
untuk diklasifikasi. Teknik ini menggunakan supervised
induction, yang memanfaatkan kumpulan pengujian dari
record yang terklasifikasi untuk menentukan kelas-kelas
tambahan. Keempat, cluster.Dapat digunakan untuk
menganalisis pengelompokan berbeda terhadap data.Mirip
dengan klasifikasi, namun pengelompokan belum
didefinisikan sebelum dijalankannya tool data mining.
Biasanya menggunakan metode neural network atau
statistik. Clustering membagi item menjadi kelompok-
kelompok berdasarkan yang ditemukan tool data mining.
Kelima, regression (forecasting). Menggunakan nilai dari data
yang diketahui untuk memperkirakan nilai di masa depan atau
27
kejadian masa depan berdasarkan kecenderungan sejarah dan
statistik. Keenam, time series (forecasting). Perbedaan dengan
regresi adalah bahwa time series hanya memperkirakan data
yang bergantung pada waktu.
2.1.11. Pengertian OLAP (Online Analitical Processing)
Menurut Connolly & Begg (2015, p1286) Online analytical
processing(OLAP) adalah sintesis dinamis, analisis, dan konsolidasi
volume besar data multidimensi. Aplikasi OLAP ditemukan di daerah
fungsional yang sangat beragam termasuk penganggaran, analisis
kinerja keuangan, analisis penjualan dan peramalan, analisis riset
pasar dan segmentasi pasar/pelanggan. Karakteristik utama dari
aplikasi OLAP mencakup pandangan multidimensi data, dan
dukungan untuk perhitungan yang rumit.
Sedangkan menurut Scheps (2008, p68) OLAP memiliki arti
sebagai sebuah konsep multidimensional data dengan melakukan
konseptualisasi data transaksional perusahaan. Selain memberikan
tampilan yang lebih ringkas, OLAP juga memberikan cara baru dalam
melihat data pada sistem business intelligence
Menurut (Turban, Sharda, Delen, & King, 2011, p77). Struktur
operasional utama dalam OLAP didasarkan pada konsep yang disebut
kubus (cube). Kubus (cube) didalam OLAP adalah struktur data
multidimensi (aktual atau virtual) yang memungkinkan analisis data
yang cepat. Juga dapat didefinisikan sebagai kemampuan dari
memanipulasi dan menganalisis data secara efisien dari berbagai
perspektif. Susunan data kedalam kubus bertujuan untuk mengatasi
keterbatasan database relational. Database relational tidak cocok
untuk analisis yang cepat dan dekat dari sejumlah besar data.
Sebaliknya, mereka lebih cocok untuk memanipulasi record
(menambahkan, menghapus, dan memperbarui data) yang
mewakili serangkaian transaksi.
28
2.1.12. Structured Query Language (SQL)
Menurut Connolly & Begg (2010, p184) SQL (Structured
Query Language) adalah contoh dari transform-oriented-language
atau bahasa yang didesain dengan menggunakan relasi untuk
mengubah input menjadi output yang diinginkan.
Sebuah database language dapat memungkinkan user untuk :
• Membuat hubungan struktur dan database.
• Melakukan operasi penyisipan (insert), perubahaan
(modification) dan penghapusan (deletion).
• Menampilkan query sederhana dan kompleks
2.1.12.1. Database Language
2.1.12.1.1. Data Definition Language
Menurut Connolly & Begg (2010, p92),
mendefiniskan data definition language (DDL) sebagai
bahasa yang memungkinkan database administratior
untuk menambahkan dan menanamkan entitas, atribut
dan hubungan yang dibutuhkan dalam aplikasi, terkait
dengan itegritas dan kendala keamanan aplikasi.
2.1.12.1.2. Data Manipulation Language
Menurut Connolly & Begg (2010, p92)
mendefiniskan bahwa Data Manipulation Language
(DML) sebagai bahasa yang menyediakan suatu fungsi
yang dapat memanipulasi data-data yang ada di dalam
database.
29
2.1.13. Pengertian Business Intelligence
Menurut Vercellis (2009, p3), Bussiness intelligence di
definisikan sebagai suatu kumpulan dari model matematika dan
metodologi analisis untuk mengeksploitasi ketersediaan data untuk
mendapatkan informasi dan pengetahuan yang berguna untuk
pembuatan keputusan yang kompleks.
Dan berikut ini merupakan kutipan dari jurnal Siswono (2013)
BI adalah teknologi baru untuk memahami masa lalu dan
memprediksi masa depan. Teknologi yang dimaksudkan disini adalah
teknologi yang mampu mengumpulkan, menyimpan, mengakses dan
menganalisis data untuk membantu para pengambil keputusan
menghasilkan keputusan yang lebih baik. Sebagai sebuah aplikasi,
maka BI meliputi aktivitas decision support systems, query dan
reporting, OLAP (OnLine Analytical Processing), analisis statistik,
peramalan dan data mining.
2.1.13.1. Keuntungan Business Intelligence
Menurut Vercelis (2009, p5), Tujuan utama dari
business intelliegence adalah untuk menyediakan pengetahuan
bagi pekerja dengan tools dan metodologi yang dapat
membantu mereka dalam mengambil keputusan secara efektif
dan tepat pada waktunya. Terdapat 2 keuntungan besar dalam
menggunakan business intelligence menurut vercellis yaitu :
• Effective decision
Business intelligence menerapkan
metode analisis yang ketat sehingga pengambil
keputusan dapat mengandalkan informasi dan
pengetahuan yang dapat diandalkan dalam
mengambil keputusan.Sebagai hasilnya,
manajer mampu membuat keputusan yang lebih
baik dan dapat menyusun strategi yang
30
memungkinkan tujuan mereka dicapai dengan
cara yang lebih efektif.
• Timely decision
Perusahaan beroperasi di lingkungan
ekonomi yang ditandai dengan tingkat
persaingan yang tinggi dan perkembangan yang
dinamis.Akibatnya, kemampuan untuk secara
cepat bereaksi terhadap tindakan pesaing dan
pasar kondisi-kondisi baru merupakan faktor
penting dalam keberhasilan atau bahkan
kelangsungan hidup perusahaan.
Gambar 2.7 Benefits of a business intelligence
system
Sumber : Vercellis (2009, p6)
Berikut adalah beberapa manfaat yang di ambil
dari jurnal Suparto Darudianto (2010) beberapa
manfaat yang bisa didapatkan apabila perusahaan
31
mengimplementasikan business intelligence adalah
sebagai berikut :
1. Pertama, meningkatkan nilai data dan
informasi organisasi. Melalui
pembangunan BI, seluruh data dan
informasi dapat diintegrasikan sedemikian
rupa sehingga menghasilkan pengambilan
keputusan yang lengkap
2. Kedua, memudahkan pemantauan kinerja
organisasi dengan menggunakan Key
Performance Indicator (KPI).
3. Meningkatkan nilai investasi teknologi
informasi yang sudah ada.
4. Menciptakan pegawai yang memiliki akses
informasi yang baik (well-informed
workers).
5. Kelima, meningkatkan efisiensi biaya. BI
dapat meningkatkan efisiensi karena
mempermudah seseorang dalam
melakukan pekerjaan, hemat waktu, dan
mudah pemanfaatannya. Waktu yang
dibutuhkan untuk mencari data dan
mendapatkan informasi yang dibutuhkan
semakin singkat dan cara untuk
mendapatkannya pun tidak memerlukan
pengetahuan (training) yang rumit.
32
2.1.13.2. Siklus Business Intelligence
Menurut Vercellis (2009, p12), Setiap analisis business
inteligence mengikuti jalannya sendiri sesuai dengan aplikasi
domain, sikap pribadi para pengambil keputusan dan
ketersediaan metodologi analitis. Namun, adalah mungkin
untuk mengidentifikasi jalur siklus ideal yang mencirikan
evolusi analisis business inteligence yang khas, seperti yang
ditunjukkan pada Gambar 2.8.
Gambar 2.8 – Cycle of a business intelligence analysis
• Analysis
Selama tahap analisis,perlu untuk
mengenali dengan baik dan akurat dalam
menguraikan masalah yang dihadapi. Para
pembuat keputusan kemudian harus membuat
representasi dari suatu kejadian untuk
dianalisis, dengan mengidentifikasi faktor kritis
yang dianggap sebagai yang paling relevan.
Ketersediaan metodologi business intelligence
dapat membantu dalam tahap ini, dengan
mengijinkan para pengambil keputusan untuk
secara cepat mengembangkan berbagai jalur
analisis.
33
• Insight
Pada tahapkedua memungkinkan
pengambil keputusan untuklebih baik danlebih
mendalam, dalam memahami masalah yang
dihadapi. Informasi yang diperoleh melalui
tahap analisis adalah kemudian berubah
menjadi suatu pengetahuan selama fase
wawasan. Disatu sisi, ekstraksi pengetahuan
dapat terjadi karena intuisi dari pembuat
keputusan dan oleh karena itu ini didasarkan
pada pengalaman pembuat keptusan dan
mungkin informasi tidak terstruktur yang
tersedia bagi mereka.
• Decision
Selama fase ketiga, pengetahuan yang
diperoleh sebagai hasil dari fase insght yang
diubah menjadi keputusan dan kemudian
menjadi tindakan. Ketersediaan metodologi
business inteligence memungkin kanan alisis
dan fase insight akan dieksekusi lebih cepat
sehingga keputusan yang lebih efektif dan tepat
waktu, dapat dibuat dan sesuai dengan prioritas
strategi organisasi yang dibutuhkan.
• Evaluation
Akhirnya, fase keempat dari siklus
business intelligence melibatkan pengukuran
kinerja dan evaluasi. Maka metric yang luas
harus dibuat yang tidak terbatas ke
eksklusifannya pada aspek keuangan, tetapi
juga memperhitungkan indicator kinerja utama
34
yang ditetapkan untuk departemen-departemen
yang berbeda pada perusahaan.
2.2. Teori Khusus
2.2.1. Entity Relationship Diagram (ERD)
Menurut Satzinger, Jackson dan Burd (2012, p90) entity-
relationship diagram adalah sebuah diagram yang terdiri dari entitas
(satu set hal) dan hubungan mereka
Gambar 2.9 Cardinality Symbol Of ERD Relationships
Sumber : Satzinger, Jackson dan Burd (2012, p91),
Introduction to Sytem Analysis and Design : An Agile Iterative
Approach
35
Gambar 2.10 Entity Relationship Diagram
Sumber : Satzinger, Jackson dan Burd (2012, p92),
Introduction to Sytem Analysis and Design : An Agile Iterative
Approach
2.2.2. Activity Diagram
Menurut Satzinger, Jackson dan Burd (2012, p55), activity
diagram adalah mendeskripsikan kegiatan user (atau sistem), orang
yang melakukan setiap kegiatan, dan aliran kegiatan yang berurutan
Gambar 2.11 Notasi Activity diagram
Sumber : Satzinger, Jackson dan Burd (2012, p56), Introduction to
Sytem Analysis and Design : An Agile Iterative Approach.
36
Gambar 2.12 Activity diagram
Sumber : Satzinger, Jackson dan Burd (2012,
p57), Introduction to Sytem Analysis and
Design : An Agile Iterative Approach
2.2.3. Use Case
2.2.3.1. Pengertian Use Case
Use case menurut Satzinger, Jackson and Burd (2012,
p63) adalah suatu kegiatan yang dilakukan oleh sebuah sistem,
biasanya dalam merespon permintaan user
2.2.3.2. Use Case Diagram
Use case diagram menurut Satzinger, Jackson and
Burd (2012, p72) adalah UML model yang digunakan untuk
37
mengambarkan use case dan hubungannya dengan actor atau
pengguna system.
Gambar 2.13Use Case Diagram
Sumber : Satzinger, Jackson dan Burd (2012, p77),
Introduction to Sytem Analysis and Design : An Agile
Iterative Approach
Menurut Satzinger, Jackson dan Burd (2012, p77)
<<includes>> relationship adalah suatu hubungan antara use
cases dimana satu use case memiliki hubungan atau kesamaan
termasuk dalam use case lainnya.
38
Gambar 2.14 Use Case Diagram<<includes>>
Sumber : Satzinger, Jackson dan Burd (2012, p78), Introduction to
Sytem Analysis and Design : An Agile Iterative Approach
2.2.3.3. Use Case Specification
Menurut Arlow & Neustadt (2005,p78),setelah
membuat use case diagram mulailah menjelaskan tiap use
case dengan membuat use case specification. Tidak ada
standarisasi UML, dalam penulisan use case specification.
Gambar 2.15 merupakan contoh use case specification.
39
Gambar 2.15 - ContohUse Case
Specification
(Sumber: Arlow& Neustadt,
2005, p78)
2.2.4. Forecasting
Heizer dan Render (2009:162), Peramalan (forecasting) adalah
seni dan ilmu untuk memperkirakan kejadian dimasa depan. Hal ini
dapat dikakukan dengan melibatkan pengambilan data masa lalu
dan menempatkannya kemasa akan datang dengan suatu bentuk
model matematis. Bila juga merupakan prediksi intuasi yang bersifat
subjektif. Atau bisa juga dengan menggunakan kombinasi model
matematis yang disesuaikan dengan pertimbangan yang baik dari
seorang manajer.
Menurut sellani, Robert J (2009) dalam Journal of the
International Academy for Case Studies. The Sales forecast is the
most important plan in an organization. For a manufacturing
company, the Sales forecast must be in sufficient detail for
Manufacturing to translate those requirements into physical products.
Therefore it is not sufficient for the Sales forecast to be equal to last
years' sales plus 10%.Manufacturing must know which products are
going to be obsolete, which will be increasing and decreasing in
sales, and which will require new manufacturing methods in
production.
40
2.2.5. Key Performance Indicator
Menurut Parmenter (2007 , p3), Key Performance Indicator
adalah suatu kegiatan yang berfokus pada aspek-aspek kinerja
organisasi yang paling penting untuk keberhasilan organisasi pada
masa ini dan masa depan
key performance indicator (KPI) adalah jenis pengukuran
kinerja dari suatu organisasi atau perusahaan, KPI dapat menilai atau
menjadi suatu ukuran keberhasilan dari suatu organisasi. kadang-
kadang keberhasilan didefinisikan pada saat suatu proses atau
kegiatan sedang berjalan untuk mencapai tujuan organisasi. Oleh
karena itu, memili KPI yang tepat bergantung pada pemahaman yang
baik tentang apa yang penting bagi organisasi, KPI sering tergantung
pada departemen pengukuran kinerja. misalnya KPI berguna untuk
keuangan akan berbeda dari KPI ditugaskan untuk penjualan. Karena
ada kebutuhan untuk memahami dengan baik apa yang penting untuk
organisasi, berbagai teknik untuk menilai kondisi bisnis pada saat ini,
dan kegiatan utama yang terkait dengan pemilihan indikator kinerja.
Penilaian ini sering mengarah pada identifikasi potensi perbaikan,
sehingga indikator kinerja secara rutin terkait dengan inisiatif
peningkatan kinerja. Sebuah cara yang sangat umum untuk memilih
KPI adalah dengan menerapkan kerangka manajemen seperti balanced
scorecard.
2.2.6. Product Positioning
Menurut Kotler dan Amstrong (2011, p49), Positioning adalah
tindakan mengatur produk untuk menempati tempat yang tepat, khas,
dan diinginkan. terhadap produk-produk pesaing dalam benak target
konsumen. Pemasar produk merencanakan posisi yang bisa
membedakan produk mereka dari merek pesaing dan memberi produk
keuntungan dalam target pasar perusahaan.
Adapun menurut Kotler (2012, p276), Positioning adalah
strategi perusahaan untuk merancang produk dan nilai pemasaran
41
yang tepat sehingga dapat tercipta sesuatu yang diingat oleh pangsa
pasar.
2.2.7. Penjualan
Menurut Kotler (2010, p528), Penjualan merupakan sebuah
proses dimana kebutuhan pembeli dan kebutuhan penjual terpenuhi,
melalui antar pertukaran informasi dan kepentingan. Konsep
penjualan juga dapat diartikan sebagai cara untuk mempengaruhi
konsumen untuk membeli produk yang ditawarkan.
Sedangkan menurut Mulyadi (2008, p160), Penjualan
memiliki peranan penting dalam perusahaan karena penjualan
merupakan sumber kelangsungan hidup suatu pembayaran.Semakin
besar jumlah penjualan semakin besar pula laba yang diperoleh.
Penjualan terjadi apabila pihak yang satu (penjual) menyerahkan hak
milik suatu barang, sedangkan pihak lain (pembeli) membayar barang
baik secara tunai maupun kredit sebagai imbalan dari perolehan hak
milik tersebut.
2.2.8. Pembelian
Menurut Mulyadi (2008, p316), Pembelian adalah suatu usaha
yang digunakan dalam perusahaan untuk pengadaan barang yang
diperlukan oleh perusahaan
2.2.9. Distribusi
Menurut Chopra (2010, p86) Distribusi adalah sebuah
kegiatan untuk memindahkan produk dari pihak supplier ke pihak
customer dalam suatu supply chain. Distribusi adalah sebuah kunci
dari keuntungan yang akan diperoleh perusahaan karena distribusi
sangat mempengaruhi biaya dari supply chain dan kebutuhan
customer, jaringan distribusi yang tepat dapat digunakan untuk
mencapai berbagai tujuan dari supply chain, dimulai dari biaya yang
rendah sampai yang tertinggi terhadap permintaan customer.
42
2.2.10. Dashboard
Menurut Rainer dan Cegielski (2011,p366), Digital
Dashboard biasanya disebut executive dashboard atau management
cockpit menyediakan akses informasi yang cepat dan tepat waktu, dan
akses langsung ke laporan manajemen.Digital Dashboard sangat
user-friendly dan didukung dengan grafik.Digital Dashboard
memperbolehkan manager untuk memeriksa laporan tertentu dan
laporan yang rinci.
Menurut Laudon dan Laudon (2010,p81), Digital Dashboard
merupakan dashboard yang menampilkan, pada satu layar, semua
hasil pengukuran yang penting untuk mengarahkan perusahaan, mirip
dengan kokpit pesawat atau dashboard mobil. Dashboard tersebut
menampilkan indikator-indikator kinerja kunci sebagai grafik dan
diagram dalam format browser web. Memberikan gambaran satu
halaman dari semua pengukuran penting yang diperlukan untuk
mengambil keputusan di tingkat eksekutif.
Menurut Person (2009,p108), Eksekutif, Manager, dan
Supervisor menggunakan dashboard untuk melacak strategi, operasi
dan taktik.Sebuah dashboard yang dirancang dengan baik dapat
membantu pengambilan keputusan yang baik dan cepat. Pada
kenyataannya survei menunjukan dua keuntungan utama dari
penerapan dashboard yaitu pengambilan keputusan dan pengurangan
pekerjaan administrasi untuk analisis dan penelitian.
Menurut Kusnami (2009,p88-p89), Dashboard adalah satu
kategori dari aplikasi business intelligence yang secara real time akan
memonitoring berbagai informasi yang dibutuhkan oleh suatu
organisasi atau perusahaan dengan berbagai macam format seperti
graphical gadgets, typically, gauges, charts, indicators, dan color-
coded maps yang memungkinkan mereka membuat keputusan pintar
secara cepat.
43
Menurut Oana dan Ogan (2012,p1), Dashboard adalah alat
diagnostik yang dirancang untuk mendukung manager yang sibuk
dengan sebuah gambaran singkatdari kinerja perusahaan.
2.2.11. Tableau Desktop
Tableau Desktop adalah sebuah software business
intelligenceyang dapat membantu menganalisi data statistik dengan
mudah agar dapat memberikan solusi yang lebih baik, lebih cepat dan
tepat dalam memberikan solusi-solusi dalam pemecahan masalah
bisnis perusahaan.Hal ini terbukti dari banyaknya pelanggan-
pelanggan yang menggunakan jasa Tableau.Dan juga tableu bekerja
sama dengan banyak perusahaan besar yang bergerak dalam 4 bidang
yaitu:
1. Alliance partners
2. OEM partners
3. Reseller partners
4. Technology partners
44