analisis statistik penggunaan pangkalan data komersil: kajian kes perpustakaan ukm
DESCRIPTION
Kertas Seminar Kebangsaan Perpustakaan Akademik - SKPA 2011. 5-7 Julai 2011. Hotel Riverview, Kota Bharu, Kelantan.TRANSCRIPT
ANALISIS STATISTIK PENGGUNAAN
PANGKALAN DATA KOMERSIL:
KAJIAN KES PERPUSTAKAAN UKM
Abu Bakar Maidin1, Hazmir Hj. Zainal1, Nor Hamsiah Ahmad Hosaini1, Shamsudin Ibrahim1, Sharifah Hashim2
1Perpustakaan Tun Seri Lanang2Pusat Teknologi Maklumat
Universiti Kebangsaan Malaysia
SEMINAR KEBANGSAAN PERPUSTAKAAN AKADEMIK
HOTEL RIVER VIEW
KOTA BHARU KELANTAN
6-7 JULAI 2011
PENYATAAN MASALAH
1. Jutaan ringgit dibelanjakan oleh UKM dan seluruh InstitusiPengajian Tinggi di Malaysia setiap tahun bagi melanggan PDK.
PERPUN melaporkan sekitar RM58 juta (2010).
2. Ia menuntut supaya perpustakaan melakukan kajian terperinci& memantau sama ada PDK digunakan secara optimum olehpenyelidik dan ahli akademik universiti.
3. Kaedah penilaian langganan PDK yang biasa dilakukan olehPerpustakaan adalah menganalisis statistik penggunaan di peringkatPDK, manakala analisis secara mikro tidak atau jarang dilakukan. (soalan Auditor SIRIM mengenai prosedur langgananPDK; apakah nilai statistik yang dianggap tinggi atau rendahpenggunaanya?)
OBJEKTIF KAJIAN
1. Menganalisis statistik penggunaan PDK berdasarkanformat pengumpulan data yang diperakui olehstandard antarabangsa
2. Menilai prestasi dan populariti e-jurnal berdasarkanstatistik muat turun teks penuh
3. Mengenalpasti adakah standard @ KPI statistikpenggunaan e-jurnal mengikut subjek bolehdibangunkan?
SENARIO STATISTIK PDK?
TUJUAN KAJIAN
1. Menilai tahap penggunaan e-jurnal teks penuh
berdasarkan format dan subjek yang seragam
2. Membangunkan KPI (standard) penggunaan e-jurnal
teks penuh sebagai penandaarasan dan
pengukuran prestasi
RASIONAL KAJIAN1. Kos langganan jurnal terus meningkat dari masa ke semasa
dan ini menuntut supaya Perpustakaan menjadi lebihselektif, kreatif dan inovatif dalam melanggan jurnalyang berprestij.
2. Justeru, Perpustakaan perlu melakukan analisis PDK secaramikro iaitu ke peringkat mengenalpasti e-jurnalberimpak tinggi berdasarkan statistik penggunaan.
RASIONAL KEPERLUAN ANALISIS PDK SECARA MIKRO
2.64
2.92
2.44
2.83
2.6
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3
2006 2007 2008 2009 2010
Har
ga lan
ggan
an -
Juta
(R
M)
Harga langganan ScienceDirect (2006-2010)
1. Harga langganan dalam USD atau RM juga berbeza setiap tahun
(faktor pertukaran mata wang asing, % kenaikan harga)
2. Kos langganan per judul. (Contoh : 2010 – RM1300)
RASIONAL KEPERLUAN ANALISIS PDK SECARA MIKRO
Jumlah Muat TurunTeks Penuh ScienceDirect
(Perpustakaan UKM 2006-2010)
577,197
735,248
928,774
1,198,054 1,200,694
0
200,000
400,000
600,000
800,000
1,000,000
1,200,000
1,400,000
2006 2007 2008 2009 2010
Kenaikan 2010 vs 2009 hanya 0.2%
Kenaikan 2006 vs 2010 ialah 108%
RASIONAL KEPERLUAN ANALISIS PDK SECARA MIKRO
4.58
3.98
2.642.36 2.17
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
2006 2007 2008 2009 2010
Kos Per Teks Penuh ScienceDirect
(2006-2010)
1. Adakah setiap teks penuh berharga RM2.17 (2010)?
2. Adakah semua e-jurnal digunakan secara ‘optimum’
(apakah e-jurnal yang mungkin hanya ‘menumpang’)
RASIONAL KEPERLUAN ANALISIS PDK SECARA MIKRO
2,982
23,289
40,675
46,942
10,155
7,754
10,674
5,743
0
5,000
10,000
15,000
20,000
25,000
30,000
35,000
40,000
45,000
50,000
2007 2008 2009 2010
Bil
. M
uat
Tu
run
Tek
s P
enu
h
Statistik Muat Turun Teks Penuh
Wiley Blackwell & EBSCO PsycArticles 2007-2010
Wiley
EBSCO Psyc.
1. Adakah memadai menilai langganan PDK berdasarkan kenaikan
atau penurunan ketara dalam statistik tahunan?
2. Bagaimanakah statistik Wiley pada 2007 boleh meningkat
dengan mendadak daripada 2,982 kepada 23,289 pada 2008 dan
40,675 pada 2009?
RASIONAL KEPERLUAN ANALISIS PDK SECARA MIKRO
SIGNIFIKAN KAJIAN
1. Membantu Perpustakaan menilai semula langganan e-
jurnal melalui proses pertukaran (swap title) atau
pembatalan judul
2. Membantu Perpustakaan merangka strategi promosi
e-jurnal yang rendah statistik muat turun teks
penuhnya.
3. Dapatan kajian juga boleh digunakan oleh penyelidik
yang berminat untuk meneruskan kajian
perbandingan secara akademik.
PERSOALAN KAJIAN
1. Apakah peratusan e-jurnal yang menyumbang
kepada majoriti muat turun jurnal teks penuh?
2. Adakah KPI (standard) bagi muat turun jurnal teks
penuh adalah sama mengikut subjek?
KAJIAN LITERASI
1. Statistik PDK sangat penting & boleh memberi input
kepada keputusan jawatankuasa perpustakaan bagi
memulakan, meneruskan atau membatalkan
langganan PDK (Tucker, 2009).
2. Peter T. Shepherd (2004), perpustakaan sentiasa
menghadapi masalah dalam mengumpulkan
statistik PDK daripada pembekal disebabkan oleh
format PDK yang berbeza.
3. Bollen et.al (2009) menegaskan, statistik penggunaan
adalah indikator paling kukuh bagi mengenalpasti
jurnal yang berprestij.
KAJIAN LITERASI…(samb.)
4. Analisis pareto dengan formula 80/20 ada menegaskan
bagaimana hanya sekitar 20% daripada keseluruhan
e-jurnal yang dilanggan oleh perpustakaan menyumbang
kepada 80% statistik penggunaan PDK. Nisonger
(2008) mendapati nisbah 80/20 ini tidak tepat dan
berbeza mengikut bidang perkara.
5. Berdasarkan kajian literasi, tiada sebarang standard
yang boleh digunakan bagi mengenalpasti apakah
jumlah statistik penggunaan muat turun teks penuh
yang dikatakan tinggi atau rendah. (how high is high
and how low is low)?
16
Survei
di peringkat
Kebangsaan
17
Survei
di peringkat
Penerbit Jurnal
18
Survei
di peringkat
antarabangsa
METODOLOGI KAJIAN 3 langkah utama;
(A) Pengumpulan statistik PDK
1. Mengikut kaedah yang seragam – COUNTER Journal Report 1(Jumlah muat turun teks penuhmengikut jurnal pada tahun 2010)
2. 12 PDK sebagai populasi kajian meliputi ; ACM Digital Library, Brill Online, EBSCO Academic Search Premier, EBSCO Business Source Complete, EBSCO Medical, Emerald, IEEE, JSTOR, OVID, ScienceDirect, Springer dan Wiley Blackwell. (popular dan meliputi semuasubjek)
3. Statistik dimuat turun mengikut format Microsoft Excel daripada akaun pentadbir setiap PDK.
CONTOH COUNTER JR1 – SCIENCEDIRECT 2010
METODOLOGI KAJIAN…(samb.) 3 langkah utama;
(B) Pengkelasan e-jurnal mengikut bidang Scopus
1. Analisis statistik tidak setara/tepat jika pengindeksanmengikut subjek yang sama tidak dilakukan (apple to apple comparison). Perbandingan mengikut subjek tidakrealistik.
2. Pengkelasan Scopus dipilih kerana ia merupakan indeks petikan jurnal ilmiah terbesar di dunia dan digunakan dalam penarafan universiti oleh KPT dan QS Top Universities.
3. Senarai e-jurnal dalam Microsoft Excel dipadankan dengan senarai e-jurnal dalam 12 PDK.
4. 4 subjek utama Scopus digunakan iaitu Life Sciences, Health Sciences, Physical Sciences dan Social Sciences.
METODOLOGI KAJIAN…(samb.)
3 langkah utama;
(A) Pengkelasan e-jurnal mengikut bidang Scopus
4. Pengkelasan subjek dalam Scopus bermaksud hanya e-
jurnal yang diindeks oleh Scopus akan dijadikan
sebagai sampel dalam kajian ini.
5. Senarai e-jurnal yang telah dikelaskan mengikut subjek
Scopus disusun mengikut bilangan muat turun yang
tertinggi hingga yang terendah (descending order,
Z-A)
METODOLOGI KAJIAN…(samb.)
3 langkah utama;
(C) Penarafan mengikut Quartile muat turun teks
penuh
1. Konsep Quartile (Q) digunakan oleh Thomson Reuters –
Journal Citation Reports dalam membuat penarafan jurnal
mengikut Impact Factor dan subjek.
2. Q bermaksud ¼ atau 0.25 daripada nilai keseluruhan.
Sebagai contoh; ¼ daripada 100 ialah 25 bagi setiap Q.
3. Jika setahun, ¼ = 3 bulan. Setiap 1 Q mempunyai 3 bulan
23
Quartile Q1 Q2 Q3 Q4
Liputan Jan-Mac Apr-Jun Jul-Sep Okt-Dis
METODOLOGI KAJIAN…(samb.)
3 langkah utama;
(C) Penarafan mengikut Quartile muat turun teks
penuh
4. Bagi JCR Impact Factor, Q diperolehi setelah jurnal
dalam bidang yang sama, disusun mengikut nilai Impact
Factor tertinggi hingga terendah (descending)
5. Dalam kajian ini, Q diperolehi setelah senarai judul
dalam setiap PDK dan subjek disusun mengikut jumlah
muat turun teks penuh tertinggi hingga terendah
(descending)
6. KPI e-jurnal ditetapkan bagi jumlah muat turun teks
penuh terkecil/terakhir dalam Q1
Jana statistik &
gabung senarai e
jurnal
Pengkelasan
subjek Scopus
Penarafan
mengikut
Quartile (Q) &
Penetapan KPI
RINGKASAN METODOLOGI KAJIAN
Statistik dikumpul daripada
sistem admin 12 PDK. Senarai
dalam format MS Excel
digabungkan (senarai induk)
4 subjek utama Scopus
digunakan untuk pengkelasan
subjek.
Senarai disusun mengikut
descending order (Z-A) &
dibahagi mengikut 4 Quartile.
Pemilihan KPI bagi jurnal
dalam Q1 terendah
25
Jumlah makalah
teks penuh dimuat
turun bagi 12 PDK
ini ialah 1,772,579
Pengkelasan
4 subjek utama
Scopus
melibatkan 16,871
e-jurnal
12 PDK
tersenarai
dalam column
PLATFORM
ANALISIS DATA
1. Menggunakan perisian Microsoft Excel, analisis data
secara deskriptif dilaporkan dalam peratusan.
2. Jumlah e-jurnal bagi 12 PDK adalah 16,871
(populasi) dengan 1,772,579 muat turun teks
direkodkan.
3. Dapatan kajian menunjukkan, e-jurnal yang berada
dalam Quartile 1 (top 25%) telah menyumbang lebih
89% daripada keseluruhan statistik muat turun teks
penuh ;
Life Sciences (92.7%), Health Sciences (89.6%), Physical
Sciences (93.8%) dan Social Sciences (91%).
BIL JUDUL
PDK
BIL.
E-JBIL. E-JURNAL DIINDEKS SCOPUS &
MUAT TURUN TEKS PENUH LIFE
SCIENCES
HEALTH
SCIENCES
PHYSICAL
SCIENCES
SOCIAL
SCIENCES
1 ACM-
DL
129 2 337 3 8 62 3,205 7 248
2 Brill
Online
6 - - - - - - 6 2,318
3 EBSCO
ASP
2,708 250 1,217 572 5,491 409 2,831 1,048 15,270
4 EBSCO
BSC
1,873 14 62 40 218 156 1,399 578 9,539
5 EBSCO
Med.
5,544 470 11,346 1,343 55,195 542 5,000 1,659 51,737
6 Emerald
FT
288 3 1,441 14 2,073 39 8,723 117 49,636
7 IEEE 415 6 31 9 372 263 23,591 14 952
8 JSTOR 290 7 3,215 8 1,417 35 9,883 222 63,942
9 OVID 447 55 3,267 383 39,459 7 100 24 630
10 Science
Direct
2,126 605 410,670 765 278,732 819 603,504 372 206,679
11 Springer
e-J
1,886 415 36,390 408 26,628 780 83,726 396 22,099
12 Wiley
Blackwell
1,159 330 13,108 428 29,064 269 5,948 315 7,362
Jumlah 16,871 2,157 480,747 3,973 438,649 3,381 744,705 4,758 430,412
KPI Life Sciences (Q1=129)Indikator Jumlah
Bilangan judul e-jurnal 2157
Jumlah Muat Turun Teks Penuh (U) 481,084
Bilangan Judul setiap Quartile (T/4=V) 539
Penarafan
(usage ranking)
Q1 Q2 Q3 Q4 Jumlah
Liputan judul (range)
setiap Quartile
1-
539
540-
1079
1080-
1618
1619-
2157
2157
Jumlah TYTD
setiap Quartile (Y)
446,021 30,039 4,155 869 481,084
Peratus mengikut Q
(Y/U x 100) = Z
92.7 6.2 0.9 0.2 100
Muat turun terendah
setiap Quartile
129 17 3 0
KPI * bilangan muat turun teks penuh bagi e-jurnal
terendah/terakhir dalam Q1 = 129
KPI Health Sciences (Q1=75)Indikator Jumlah
Bilangan judul e-jurnal 3973
Jumlah Muat Turun Teks Penuh (U) 483,657
Bilangan Judul setiap Quartile (T/4=V) 993
Penarafan
(usage ranking)
Q1 Q2 Q3 Q4 Jumlah
Liputan judul (range)
setiap Quartile
1-993 994-
1985
1986-
2978
2979-
3973
3973
Jumlah TYTD setiap
Quartile (Y)
393,067 36,185 7,640 1,765 438,657
Peratus mengikut Q
(Y/U x 100) = Z
89.6 8.3 1.7 0.4 100
Muat turun terendah
setiap Quartile
75 14 4 0
KPI * bilangan muat turun teks penuh bagi e-jurnal terendah/terakhir
dalam Q1 = 75
KPI Physical Sciences (Q1=104)Indikator Jumlah
Bilangan judul e-jurnal 3381
Jumlah Muat Turun Teks Penuh (U) 747,910
Bilangan Judul setiap Quartile (T/4=V) 845
Penarafan
(usage ranking)
Q1 Q2 Q3 Q4 Jumlah
Liputan judul (range)
setiap Quartile
1-845 846-
1690
1691-
2535
2536-
3381
3381
Jumlah TYTD setiap
Quartile (Y)
702,161 38,311 6,164 1,274 747,910
Peratus mengikut Q
(Y/U x 100) = Z
93.8 5.1 0.8 0.2 100
Muat turun terendah
setiap Quartile
104 14 3 0
KPI * bilangan muat turun teks penuh bagi e-jurnal terendah/terakhir
dalam Q1 = 104
KPI Social Sciences (Q1=48)Indikator Jumlah
Bilangan judul e-jurnal 4758
Jumlah Muat Turun Teks Penuh (U) 430,232
Bilangan Judul setiap Quartile (T/4=V) 1190
Penarafan
(usage ranking)
Q1 Q2 Q3 Q4 Jumlah
Liputan judul (range)
setiap Quartile
1-1190 1191-
2380
2381-
3570
3571-
4758
4758
Jumlah TYTD setiap
Quartile (Y)
391,611 28,492 8060 2069 430,232
Peratus mengikut Q
(Y/U x 100) = Z
91 6.6 1.9 0.5 100
Muat turun terendah
setiap Quartile
48 12 3 0
KPI * bilangan muat turun teks penuh bagi e-jurnal terendah/terakhir
dalam Q1 = 48
1. Dengan memilih statisitik terendah dalam Q1 sebagai
KPI, lebih 89% jurnal telah mencapai standard (KPI).
Manakala baki kurang 11% jurnal tidak mencapai KPI
yang disasarkan.
2. Secara tidak langsung, ia hampir menyamai analisis
pareto 80/20.
RUMUSAN
CONTOH APLIKASI E-JURNAL & KPI –
ANALISIS MIKRO E-Jurnal nuklear dalam PDK yang tidak mencapai KPI 4 bidang
utama Scopus
Bil PDK Judul Jurnal ISSN Bidang/
Subjek
Muat
Turun
KPI Jurang
1 Springer Atomic Energy 1063-
4258
Physical
Sciences
72 104 -32
2 Springer Journal of
Nuclear
Cardiology
1071-
3581
Health
Sciences
19 75 -56
3 Science
Direct
Atomic Data and
Nuclear Data
Tables
0092-
640X
Social
Sciences
21 48 -27
Q1 = Jurnal pada
kedudukan 1 bagi
Category Phyiscs,
Atomic, Molecular &
Chemical
Apakah yang
menyebabkan ia hanya
dimuat turun sebanyak
41 rekod pada 2010?
Jurnal ini diindeks dalam
LIFE SCIENCES &
PHYSCIAL SCIENCES
dalam Scopus
CONTOH APLIKASI E-JURNAL & KPI –
ANALISIS MIKRO
Kategori
FTE
Program Sains
Nuklear
Fakulti Sains &
Teknologi
Peratus
(%)
Ahli
Akademik
10 267 3.74
Pasca
Siswazah
24 1524 1.57
Pra Siswazah 127 3096 4.10
Berikut merupakan FTE 2010, Program Sains Nuklear, Pusat Pengajian Fizik
Gunaan, Fakulti Sains dan Teknologi, UKM.
Bilangan FTE Program Sains Nuklear yang kecil amat signifikan dengan
bilanganYTD jurnal bidang nuklear.
CONTOH APLIKASI E-JURNAL & KPI –
ANALISIS MIKRO
Senario dunia
ketika ini (krisis
nuklear di Jepun)
Statistik loji nuklear di dunia (2011)
FTE bidang
nuklear di
Malaysia masih
rendah
CONTOH APLIKASI E-JURNAL & KPI –
ANALISIS MIKRO
RUMUSAN…(samb)
1. KPI yang dibangunkan bersesuaian dengan senario
statisik penggunaan PDK di Perpustakaan UKM
2. Pengujian KPI menunjukkan subjek Social Sciences di
UKM mempunyai KPI yang rendah berbanding Life
Sciences, Physical Sciences dan Health Sciences.
3. Empat PDK berjaya melepasi KPI subjek masing-
masing iaitu Brill Online (100%), Emerald Fulltext
(96%), JSTOR (86%) dan ScienceDirect (92%).
4. KPI ini boleh diuji semula jika IPTA/S dapat
menghasilkan senarai induk statistik e-jurnal yang
dilanggan.
39
KESIMPULAN1. Penggunaan metodologi kajian berdasarkan konsep quartile dan
analisis pareto dalam kajian ini telah berjaya menghasilkan metrik baru dalam menilai prestasi e-jurnal berdasarkan statistik penggunaan.
2. Secara positif, Perpustakaan boleh mengerakkan aktiviti promosi dan penilaian semula langganan terhadap e-jurnal di bawah KPI.
3. Adalah diharapkan, kajian ini dapat dikembangkan oleh penyelidik dan ahli akademik yang berminat terutama pada metodologi pengumpulan data dan pengkelasan subjek.
4. Di antara kajian lanjutan yang boleh dilakukan termasuklah pengumpulan data log transaksi ezproxy. Kajian ini mungkin boleh mengemukakan penemuan yang berbeza dan tidak bias kepada sumber statistik penerbit atau pembekal semata-mata.
40
SEKIANTERIMA KASIH
41