search enjin bahsa
Post on 23-Feb-2018
246 Views
Preview:
TRANSCRIPT
-
7/24/2019 Search Enjin Bahsa
1/69
PengenalanEnjin Gelintar
PengenalanMaksud Enjin Gelintar
Tiga Jenis Enjin Gelintar Senibina Enjin Gelintar
Komponen Asas Enjin Gelintar
-
7/24/2019 Search Enjin Bahsa
2/69
2
Pengenalan Enjin Gelintar
2003 !"#bil $aman%eb
3 bil laman 'G( teksdimuat setiap)ari
*a+at ,,)ari
0M(&steks -.onne.tion.apable todo%nloading
-
7/24/2019 Search Enjin Bahsa
3/69
3
Pengenalan Enjin Gelintar
/o '1 - Alta ista)andle20 bil
ueriesper da+
-
7/24/2019 Search Enjin Bahsa
4/69
,
Apa itu enjin gelintar ?
Enjin gelintar iala) suatu program +ang digunakan untuk men.ari danmen.apai maklumat berdasarkan kepada sebutan gelintaran4search terms 5 +ang diberi ole) pengguna" 6a membenarkanpengguna menjelaja) pangkalan data +ang mengandungi teks terdiri
daripada berjuta7juta di laman %eb" Apabila perisian enjin gelintardapat padankan maklumat +ang di.ari 4)its58 ia akan menerangkandimana pautan maklumat terdapat dan seterusn+a pengguna akanterus menjelaja)"
search engine 77 4a .omputer program t)at retrie es do.uments or9iles or data 9rom a database or 9rom a .omputer net%ork 4espe.iall+9rom t)e internet55
-
7/24/2019 Search Enjin Bahsa
5/69
#
Query
String
IR System
Ranked
Documents
1. Page12. Page23. Page3
. .
Document
corpus
Web Spider
-
7/24/2019 Search Enjin Bahsa
6/69
!
Pengenalan Enjin Gelintar
-
7/24/2019 Search Enjin Bahsa
7/691
Pengenalan Enjin Gelintar
-
7/24/2019 Search Enjin Bahsa
8/69:
Pela+anGoogle
Pela+an;KM
-
7/24/2019 Search Enjin Bahsa
9/69'
How SE Works>ra%l entire 6ntranet>ompute t)e s)ortest )+perlink pat) 9rom a .ertainroot page to e er+ %eb page6nde? and .ompute metadata 9or t)e pages ;sing >)es)ire 66 =un a user uer+" Gat)er all t)e )its >reate a @dire.tor+ based on .ombining t)e s)ortest pat)s Spe.ial grap) algorit)m remo es redundant links and
internal nodes
-
7/24/2019 Search Enjin Bahsa
10/690
SE System Architecture
crawl theweb
storethe
documents
-
7/24/2019 Search Enjin Bahsa
11/69
SE System Architecture
crawl theweb
storethe
documents
create fleso
metadata
Cheshire II
-
7/24/2019 Search Enjin Bahsa
12/69
2
SE Metadata6n9ormation about %eb pages Title
$engt) 6nlinks Butlinks
S)ortest Pat)s 9rom a root )ome page
;sed to pro ide inno ati e sear.)inter9a.e
-
7/24/2019 Search Enjin Bahsa
13/69
3
SE System Architecture
crawl theweb
storethe
documents
create fleso
metadata
Cheshire II
-
7/24/2019 Search Enjin Bahsa
14/69
,
SE System Architecture
crawl theweb
create akeyword
index
storethe
documents
create fleso
metadata
Cheshire II
-
7/24/2019 Search Enjin Bahsa
15/69
#
Creating a eyword !nde"alled an Inverted Index Di.tionar+- a re.ord o9 all t)e tokens in t)e .olle.tion
and t)eir o erall 9re uen.+ Postings
-
7/24/2019 Search Enjin Bahsa
16/69
!
SE System Architecture
Cheshire II
user uery
-
7/24/2019 Search Enjin Bahsa
17/69
1
#esponding to the $ser %uery
;ser sear.)es on @pam samuelsonSear.) Engine looks up do.uments
inde?ed %it) one or bot) terms in itsin erted inde?Sear.) Engine looks up titles and s)ortest
pat)s in t)e metadata inde?;ser 6nter9a.e .ombines t)e in9ormationand presents t)e results as *TM$
-
7/24/2019 Search Enjin Bahsa
18/69
:
SE System Architecture
Cheshire II
user uery
-
7/24/2019 Search Enjin Bahsa
19/69
'
SE System Architecture
Cheshire II
server
accesses thedatabases
-
7/24/2019 Search Enjin Bahsa
20/69
20
SE System Architecture
Cheshire II
results shownto user
-
7/24/2019 Search Enjin Bahsa
21/69
2
SE System Architecture
Cheshire II
results shownto user
server
accesses thedatabases
user uery
-
7/24/2019 Search Enjin Bahsa
22/69
22
What hasn&t 'een e"plained here?
*o% do.uments are ranked*o% ueries are 9ormed
*o% s)ortest pat)s are .omputed*o% t)e s+stem is built among ot)er t)ingsF T)is is just an introdu.tionF Mu.) more later"
-
7/24/2019 Search Enjin Bahsa
23/69
23
Dua kaeda) mendapatkan maklumat +ang menarikKueri >arian berasaskan ke+%ord - EG jana kueri kepada indeks
katakun.i dan pulangkan dokumen terpangkat
Sesuai untuk pengguna +ang mempun+ai matlamat jelasGelintar /a igasi melalui set jalinan 4link5 seperti )ieraki bagi mendapatkan
topik sasaran
Pengguna pili) link +ang ia rasakan akan memba%a kepadadokumen +ang rele an"
Sesuai bagi pengguna +ang tidak dapatkan men+atakan matlamatdengan jelas melalui kombinasi katakun.i berasaskan boolean
Kaedah padanan berdasarkan katakunci memulangkan banyak hasilyang kurang berkualiti Bahasa Tabie (NL) lebih baik
Pengenalan Enjin Gelintar
-
7/24/2019 Search Enjin Bahsa
24/69
2,
Masalah 'erkaitan katakunci
Kemungkinan tidak men.apai dokumen +ang rele an bilamana terdapat term sinonim
@restaurant s" @.a9
Aku8 sa+a8 patik8 )amba
Kemungkinan .apai dokumen +ang tidak berkaitan bilamanaterdapat term +ang ada kesamaran 4ambiguous5
@bat 4baseball s" mammal5 @Apple 4.ompan+ s" 9ruit5 @bit 4unit o9 data s" a.t o9 eating5 Perang 4perbuatan s %arna5
-
7/24/2019 Search Enjin Bahsa
25/69
2#
" Heb .ra%lers2" Heb portals3" Meta7Sear.) engines
Pengenalan Enjin Gelintar
Terdapat 3 bentuk enjin gelintar
-
7/24/2019 Search Enjin Bahsa
26/69
2!
Enjin Gelintar
" Heb >ra%lersDikenali juga - robots8 spiders8 %orms8 %alkers8 %anderer Jelaja)i internet bagi mendapat laman kepada indeksMula dengan satu alamat %eb +ang dikenalpasti dan muat turunlaman tersebut" 4berdasarkan ;=$ kaeda) .t) breat)79irstsear.)56ndeks semua perkataan dan 9rasa dan )ubungan perkataanPengguna akan buat .arian berdasarkan indeks tersebut>onto) - Alta ista8 E?.ite8 Google8 *otbot8 $+.os 8 /ort)en $ig)t
-
7/24/2019 Search Enjin Bahsa
27/69
21
Alirankerja bagi %eb .ra%lers
-
7/24/2019 Search Enjin Bahsa
28/69
2:
Alta ista mempun+ai spider bernama S.ooter +angmengedari 4 traverse 5 HHH dan ;senet me%sgroup"Pengindeksan iala) berdasarkan teks penu) dokumentersebut6nde? di dalam pangkalan data Alta ista diupdatekansekurang7kurangn+a sekali se)ari"S.ooter mela%at laman %eb berdasarkan kekerapanlaman %eb tersebut diupdatekan" $aman +ang statikuntuk beberapa bulan akan lebi) kurang dila%ati"
We' Crawlers ( Alta)ista
-
7/24/2019 Search Enjin Bahsa
29/69
2'
Alta ista men+okong operasi penu) (oolean8 phrase 8 dancase-sensistive searches "
Alta ista memangkat dokumen berdasarkan kerele anan8
memberikan pemberat +ang lebi) tinggi pada dokumen+ang mengandungi sebutan uer+ pada baris pertamadokumen"*asil uer+ termasukla) tajuk8 abstrak +ang ringkas8 saiC8dan tarik) terak)ir dimodi9ikasi"
We' Crawlers ( Alta)ista
-
7/24/2019 Search Enjin Bahsa
30/69
30
E?.ite juga mempun+ai spider dan pengindeks 4 indexer 5untuk teks penu) sesuatu dokumen"Spider )an+a men.apai maklumat dalam bentuk dokumen%eb dan ;senet ne%sgroup"Pengguna bole) )antar ;=$ untuk pengindeksan"Pengindeks meng)asilkan sebutan indeks dan ringkasandokumen"
E?.ite men+okong pengoperasi (oolean A/D" B=8 dan/BT8 dan ekspresi uer+ (oolean"
We' Crawlers ( E"cite
-
7/24/2019 Search Enjin Bahsa
31/69
3
*ot(ot men.apai dan mengindeks dokumen denganmenggunakan robot bernama Slurp "Slurp mengeluarkan semua ;=$ daripada do.ument +angdi.apai dan meletakkann+a di dalam struktur data berjadual8+ang menunjukkan setiap ;=$ kepada >P; +ang berbeCaberdasarkan kriteria seperti bilaka) masa terkini )osdiakses"*ot(ot men+okong penggelintaran berasakan .ase7sensiti edan operasi (oolean"*ot(ot memberikan tarik) terak)ir sesuatu laman %ebdiupdate dan abstrak ringkas mengandungi beberapa barispertama sesuatu dokumen"
We' Crawlers ( Hot*ot
-
7/24/2019 Search Enjin Bahsa
32/69
32
Enjin gelintar +ang men.apai dokumen dalam bentuk*TM$ dan PD
-
7/24/2019 Search Enjin Bahsa
33/69
33
6n9oSeek memangkat outputn+a8 mengira =S denganmemberikan pemberat +ang lebi) untuk dokumen +angkata sebutan uer+ terdapat pada a%alan dokumen
tersebut"6a memberi ringkasan pendek8 marka) kerele anan8 dansaiC dokumen"
We' Crawlers ( !n+oSeek
-
7/24/2019 Search Enjin Bahsa
34/69
3,
$+.os mempun+ai robot +ang menggunakan )euristikuntuk berjalan dalam %eb dan membina indeks +angbole) digelintari";ntuk setiap dokumen +ang diindeks8 robot akanmen+impan maklumat tentang @ outgoing links 4anchortext atau link tags 5 dalam susunan 4 queue 5 dan memili);=$ daripa susunan" Satu .onto) )euristik umpaman+amengara) robot untuk memili) ;=$ +ang menunjukkanlaman %eb pela+an 4 server 5"
We' Crawlers ( ,ycos
-
7/24/2019 Search Enjin Bahsa
35/69
3#
$+.os mengindeks tajuk8 headings 8 dan subheadings untuk dokumen *TM$8
-
7/24/2019 Search Enjin Bahsa
36/69
3!
BpenTe?t mempun+ai robot +ang mela+ari laman %ebdengan memili) satu7satu ;=$ daripada sekumpulan;=$8 men.apai dokumen dari ;=$ tersebut8 danmengindeks dokumen tersebut"6a juga mengeluarkan semual ;=$ daripada dokumen+ang di.apai dan meletakkann+a di kumpulan ;=$ 4;=$pool5"Pengguna bole) meng)antar ;=$ untuk diindeks"
We' Crawlers ( -pen.e"t
-
7/24/2019 Search Enjin Bahsa
37/69
31
BpenTe?t mengindeks teks penu) sesuatu dokumen*TM$ dan berterusan mengupadate indeksn+a"Pengindeks 4 indexer 5 akan meng)asilkan 00 perkataan
pertama sesuatu dokumen sebagai ringkasan pendek"6a men+okong sepenu)n+a pengoperasi (oolean"
We' Crawlers ( -pen.e"t
-
7/24/2019 Search Enjin Bahsa
38/69
3:
Enjin gelintar daripada kumpulan ini men+usun katalogatau direktori subjek bagi laman %eb +ang bole) di
gunakan ole) pengguna"
We' Crawlers ( /irektori0 atalog
-
7/24/2019 Search Enjin Bahsa
39/69
3'
a)oo se.ara semi7otomatik mengorganisasikan subjeklaman %eb"Link ke beberapa sumber dikumpul dalam 2 .ara- 4i5daripada pengguna +ang meng)antar laman %eb untukdiindeks 4ii5 daripads robot +ang men.apai link barudaripada laman %eb terkemuka seperti NCSA/GNN s!hat s Ne" #age "
a)oo mengindeks Heb8 ;senet ne%s8 dan alamat e7mel"
Butput daripada uer+ iala) senarai dokumen dankategori +ang diberikan ole) a)oo8 berserta beberapabaris pertama dokumen"
We' Crawlers ( 1ahoo
-
7/24/2019 Search Enjin Bahsa
40/69
,0
Enjin Gelintar
2" Portals
L $aman +abg diorganisasi maklumat mengikut topik bagi memuda)pengguna mena igasi dan mendapatkan maklumat +ang di.ari
L Juga dikenali %eb direktoriL Keban+akan portal merupakan @)uman maintained
L >arian keban+akan berdasarkan ringkasan 4summaries5 atau tajukbukan pada kandungan
-
7/24/2019 Search Enjin Bahsa
41/69
,
Alirankerja portal
-
7/24/2019 Search Enjin Bahsa
42/69
,2
3" Meta7Sear.) Engines
L Merupakan site +ang mengambil kueri 4katakun.i ataukueri /$5 dan )antar ian+a ke ban+ak enjin gelintar danpulangkan )asil kepada pengguna"
L Tiga kaeda) gelintarani" Senarai penu) enjin gelintarii" Penggelintaran se.ara jujukan 4se uential5iii"Penggelintaran se.ara concurrent
Enjin Gelintar
-
7/24/2019 Search Enjin Bahsa
43/69
,3
Aliran kerja meta7sear.) engines
-
7/24/2019 Search Enjin Bahsa
44/69
,,
Pem'ahagian Sistem Enjin Gelintar
Enjin elintar
Enjin elintar bagitujuan !mum
( eneral"purp#se$earch Engine)
Enjin elintar bagi%#main Tertentu(%#main $peci&ic$earch Engine)
'#kus pada jenisd#kumen tertentu
'#kus pada t#piktertentu
-
7/24/2019 Search Enjin Bahsa
45/69
,#
Pela+anGoogle
>ra%ling t)e %eb
(uilding an inde?
=anking
Ser ing sear.) result
;ser inter9a.e anddesign
Google in9rastru.ture
akan dibincang semasa tut#rial
-
7/24/2019 Search Enjin Bahsa
46/69
,!
klien
Enjin kueri pemangkatan
Modul *impunan Analisis
=epositori laman
6ndeks-kemuda)an
struktur teksModul Ka%alan $elaba)
H H H
$elaba)Modul6ndeks
Maklumbalas pengguna
kuerikeputusan
$enibina Enjin arian ( rasu et*al +,,-)
-
7/24/2019 Search Enjin Bahsa
47/69
,1
klien
Enjin kueripemangkatan
Modul *impunan Analisis
=epositori laman
6ndeks-kemuda)an
struktur teksModul Ka%alan
$elaba)
H H H
$elaba)Modul6ndeks
Maklumbalas pengguna
kuerikeputusan
$enibina Enjin arian ( rasu et*al +,,-)
-
7/24/2019 Search Enjin Bahsa
48/69
,:
Modul Ka%alan $elaba)
H H H
$elaba)
Sumber dari HHH dimuat turun ole) lelaba)4agen5
Akti iti penjelaja)an dika%al ole) Modul Ka%alan$elaba) 4MK$5
MK$ tentu ;=$ akan dila%at dan beri ;=$ kepadalelaba)
Tugas lelaba) sebenarn+a ditentu ole)pembangun
!R"# http#$$%%%.mo&.com.my
'(it&e)# Search *ngine'+,D-)' 1)We&come to Search*ngine Page/////////../////////../////////.
-
7/24/2019 Search Enjin Bahsa
49/69
,'
klien
Enjin kueripemangkatan
Modul *impunan Analisis
=epositori laman
6ndeks-kemuda)an
struktur teksModul Ka%alan
$elaba)
H H H
$elaba)Modul6ndeks
Maklumbalas pengguna
kuerikeputusan
.#dul Indeks Modul 6ndeks berperanan mendapatkan
semua perkataan dalam laman %eb +angdimuat turun ole) lelaba)
Merekod ;=$ bagi perkataan berkaitan4;=$ )alaman berkaitan5
-
7/24/2019 Search Enjin Bahsa
50/69
#0
klien
Enjin kueripemangkatan
Modul *impunan Analisis
=epositori laman
6ndeks-kemuda)an
struktur teksModul Ka%alan
$elaba)
H H H
$elaba)Modul6ndeks
Maklumbalas pengguna
kuerikeputusan
-
7/24/2019 Search Enjin Bahsa
51/69
#
klien
Enjin kueripemangkatan
Modul *impunan Analisis
=epositori laman
6ndeks-kemuda)an
struktur teksModul Ka%alan
$elaba)
H H H
$elaba)Modul6ndeks
Maklumbalas pengguna
kuerikeputusan
.#dul Kueri
Terima kueri daripengguna dan .ari
maklumat dari indeksdan kadang2 darirepositori laman
-
7/24/2019 Search Enjin Bahsa
52/69
#2
klien
Enjin kueripemangkatan
Modul *impunan Analisis
=epositori laman
6ndeks-kemuda)an
struktur teksModul Ka%alan
$elaba)
H H H
$elaba)Modul6ndeks
Maklumbalas pengguna
kuerikeputusan
.#dul /emangkatan Men+usun keputusanberdasar enjin kueri kepadamaklumat paling )ampirdengan pengguna"
-
7/24/2019 Search Enjin Bahsa
53/69
#3
Enjin Gelintar
Empat komponen Asas
Pangkalan data rujukan kepada laman %eb =obot pengindeksan +ang mejelaja) HHH Antaramuka
Membole)kan pengguna untuk )antar kueri
Memaparkan )asil +ang diperole)i
Sistem >apaian Maklumat
-
7/24/2019 Search Enjin Bahsa
54/69
#,
angkalan /ata Pangkalan data iala) koleksi maklumat +ang terindeks +angdikumpul ole) robot" =obot akan merekodkan semua maklumat+ang diindekskan dalam pangkalan data +ang mungkinmerangkumi alamat laman %eb8 tajuk8 header 8 sebutan8 saiC
atau mungkin keseluru)an teks"Pangkalan data bole) men+impan se)ingga berjuta maklumatdalam laman %eb" Sesetenga) enjin gelintar mempun+ai lebi)daripada satu pangkalan data"
Enjin gelintar berbeCa dari segi kekerapan dan metod dalammengemaskini pangkalan data"
-
7/24/2019 Search Enjin Bahsa
55/69
##
#o'ot
Juga dipanggil @ "eb "anderers 8 @"eb cra"lers 8 dan @spider =obot +ang menjejaki laman menerusi )iperlink untuk men.ari8mengumpul8 mengindeks8 dan memeriksa dokumen dan dimasukkanke dalam pangkalan data
Merekod data +ang dijumpai Perkataan pada laman %eb Metadata Atribut ALT pada IMG tags
Program ini berinteraksi berdasarkan *+perTe?t Trans9er Proto.ol4*TTP5 untuk men.apai dokumen daripada pela+an7pela+an 4 servers 5=obot E?.lusion Proto.ol
)ttp-&&%%%"robotst?t"org&%.&e?.lusion")tml
-
7/24/2019 Search Enjin Bahsa
56/69
#!
#o'ots E"clusion
Sometimes people 9ind t)e+ )a e been inde?ed b+ an inde?ingrobot8 or t)at a resour.e dis.o er+ robot )as isited part o9 a sitet)at 9or some reason s)ouldn t be isited b+ robots" 6nre.ognition o9 t)is problem8 man+ Heb =obots o99er 9a.ilities 9or
Heb site administrators and .ontent pro iders to limit %)at t)erobot does" T)is is a.)ie ed t)roug) t%o me.)anisms-
The 0#b#ts Exclusi#n /r#t#c#l A Heb site administrator .an indi.ate %)i.) parts o9 t)e sites)ould not be istsed b+ a robot8 b+ pro iding a spe.iall+9ormatted 9ile on t)eir site8 in )ttp-&&"""&robots"t?t"
The 0#b#ts .ET tag A Heb aut)or .an indi.ate i9 a page ma+ or ma+ not be inde?ed8or anal+sed 9or links8 t)roug) t)e use o9 a spe.ial *TM$ METAtag"
-
7/24/2019 Search Enjin Bahsa
57/69
#1
#o'ot =obot akan sentiasa meneliti internet8 se.ara otomatik akanmenjejaki dokumen baru atau +ang diupdate dan men+ingkirkandokumen +ang bertindi)8 +ang tidak akti9 atau +ang tela)dimansu)kan"
Strategi +ang dilakukan ole) robot ketika @berjalan dalam HHHmenentukan kuantiti dan kualiti maklumat +ang di.apai untukpangkalan data"
-
7/24/2019 Search Enjin Bahsa
58/69
#:
Antaramuka Enjin Gelintar
Meng)impun input dari penggunaMemaparkan keputusan dari sistem 6=
Kebiasaan dalam bentuk pangkatan
6nput Keperluan pengguna
;ngkapan penggelintaran8 )ad penggelintaran (entuk @Presentation
-
7/24/2019 Search Enjin Bahsa
59/69
#'
Butput
Keputusan & )asil Des.riptions
>lusters
Antaramuka Enjin Gelintar
-
7/24/2019 Search Enjin Bahsa
60/69
!0
Pemadanan .erm Gelintaran
>uba mendapatkan padanan pada pangkalan dataDua kaeda) utama
Gelintar menggunakan katakun.i
Padanan satu term8 menggunakan @.osine
Gelintar berasaskan konsep 4.on.ept7based5 Menilai gugusan perkataan 4.lusters o9 %ords5 >uba tentukan maksud kueri dan dapatkan rekod
berdasarkan maksud tersebut"
-
7/24/2019 Search Enjin Bahsa
61/69
!
Asas Ciri2ciri !#
Bperator (oolean
A/D8 B=8 /BT8 groupingE?tended operators
/EA=8 ADJA>E/T 4N5 Analisa $eksikalPembuangan kata)enti>antasan
PengindeksanMaklumbalas berkaitan
-
7/24/2019 Search Enjin Bahsa
62/69
!2
Pemangkatan -utput
Keban+akan SE memangkat senarai menggunakan peraturan - Perkataan a%al lebi) penting Tajuk sangat penting
Kekerapan keujudan term Perkataan tak kerap ujud kadang2 lebi) penting Tarik) penguba)suaian
Google berbeCa- Kaeda) Page=ank TM berdasarkan kepada kemas)uran4popularit+5
http://www.google.com/technology/index.htmlhttp://www.google.com/technology/index.html -
7/24/2019 Search Enjin Bahsa
63/69
!3
Sistem Capaian Maklumat
PengumpulanDokumenPengindeksan
Pen.arianPengurusanDokumen danKueri
-
7/24/2019 Search Enjin Bahsa
64/69
!,
er'e3aan enjin gelintar untuk internetdan sistem capaian maklumat
a) /emangkatan #utput (ranking #utput)
Kaeda) memberati sebutan +ang unik"
Enjin gelintar sentiasa memeriksa 4keep tra.k5 bilangankekerapan sebutan dalam setiap laman %eb8 dankedudukan sebutan dalam dokumen juga dipertimbangkan
dalam proses pemangkatan"
-
7/24/2019 Search Enjin Bahsa
65/69
!#
b) Keluasan pangkalan data
Pangkalan data internet terdiri daripada pelbagai sumbermaklumat 4.t)" )ttp8 9tp8 gop)er dll5 +ang biasan+aditerbitkan tanpa sebarang pengadilan8 tapisan" Ble) itumaklumat +ang di.apai tidak dijamin kualitin+a"
Sebalikn+a8 dokumen +ang terkandung di dalampangkalan data se.ara on-line 4on-line database 58 >D7=BM adala) lebi) tinggi kualitin+a dan lebi) tersusun"
-
7/24/2019 Search Enjin Bahsa
66/69
!!
c) .edan yang diindeksKeban+akan maklumat +ang disimpan di dalam on-linedatabase dan >D7=BM diindeks berdasarkan kepada setperbenda)aran kata 4 controlled vocabularies 5 atauthesauri " Medan +ang diindeks seperti subjek8 katakun.i8penulis8 tajuk atau organisasi ditentu atau dipili) ole)manusia"
Sebalikn+a8 dokumen %eb dilokasikan dan diindekskanole) robot tanpa sebarang keterlibatan daripada manusia"Medan +ang diindekskan mengandungi elemen +angberbeCa termasuk juga- ;=$8 title8header 8 tarik) dan saiC"
Setiap robot mempun+ai strategi tersendiri dalampengindeksan"
-
7/24/2019 Search Enjin Bahsa
67/69
!1
d) Teknik /enggelintaran
>apaian maklumat dalam internet iala) berdasarkan gra9ikdan penunjuk tetikus8 berbeCa dengan sistem .apaianmaklumat biasa +ang berorientasi teknik uer+"
Penggelintaran dalam laman %eb melibatkan pen+usuranmelalui penunjuk 4 link 5 antara )iperteks +angmenggalakkan bro"sing tetapi bole) menimbulkankekeliruan"
Pengoperasi untuk menaksirkan uer+ atau sintaks jugaberbeCa"
-
7/24/2019 Search Enjin Bahsa
68/69
!:
e) ntaramuka dan /ilihan 1utputEnjin gelintar untuk internet mena%arkan berbagaiantaramuka" >onto)- Alta ista mena%arkan 2
antaramuka- penggelintaran muda) atau uer+ lanjutan"
-
7/24/2019 Search Enjin Bahsa
69/69
$istem .aklumatKlasikal Enjin elintar 2eb
Kelajuan Masa tindakbalas +ang interakti9
Pre.ision 4Kejituan5 Kejituan )asil +ang dipaparkan padalaman pertama
=e.all 4panggil semula5 Dapat seban+ak mungkin laman ka+amaklumat8 .alled aut)orit+ dan )ubpages
Perbandingan pengukuran pen.apaian diantara sistem maklumatklasikal dan enjin gelintar %eb
er'e3aan enjin gelintar untuk internetdan sistem capaian maklumat 4sam'56
top related