Mesin pencari web (web search engine) adalah program komputer yang dirancang untuk melakukan
pencarian atas berkas-berkas yang tersimpan dalam layanan www, ftp, publikasi
milis, ataupun news group dalam sebuah ataupun sejumlah komputer peladen dalam
suatu jaringan. Search engine merupakan perangkat
pencari informasi dari dokumen-dokumen yang tersedia. Hasil pencarian umumnya
ditampilkan dalam bentuk daftar yang seringkali diurutkan menurut tingkat
akurasi ataupun rasio pengunjung atas suatu berkas yang disebut sebagai hits. Informasi yang menjadi
target pencarian bisa terdapat dalam berbagai macam jenis berkas seperti
halaman situs web, gambar, ataupun jenis-jenis
berkas lainnya. Beberapa mesin pencari juga diketahui melakukan pengumpulan
informasi atas data yang tersimpan dalam suatu basisdata ataupun direktori web.
Sebagian besar
mesin pencari dijalankan oleh perusahaan swasta yang menggunakan algoritma
kepemilikan danbasisdata tertutup, di antaranya yang paling
populer adalah Google (MSN Search dan Yahoo!). Telah ada beberapa upaya
menciptakan mesin pencari dengan sumber terbuka (open source), contohnya adalah Htdig, Nutch, Egothor
Sejarah
Saat awal perkembangan internet, Tim Berners-Lee membuat sebuah situs web yang
berisikan daftar situs web yang ada di internet melalui peladen web CERN.
Sejarah yang mencatat sejak tahun 1992 masih ada hingga kini. Dengan
semakin banyaknya situs web yang aktif membuat daftar ini tidak lagi
memungkinkan untuk dikelola oleh manusia. Utilitas pencari yang pertama kali
digunakan untuk melakukan pencarian di internet adalah Archie yang berasal dari kata "archive"
tanpa menggunakan huruf "v". Archie
dibuat tahun 1990 oleh Alan Emtage, Bill Heelan dan J. Peter Deutsch, saat itu
adalah mahasiswa ilmu komputer Universitas McGill, Amerika Serikat. Cara kerja program
tersebut adalah mengunduh daftar direktori serta berkas yang terdapat pada
layanan ftp publik (anonim) kemudian memuatnya ke
dalam basisdata yang memungkinkan pencarian.
Mesin pencari
lainnya seperti Aliweb,
muncul di 1993 dan masih berjalan hingga saat ini. Salah satu mesin pencari
pertama yang sekarang berkembang menjadi usaha komersial yang cukup besar
adalah Lycos,
yang dimulai di Carnegie
Mellon University sebagai
proyek riset pada tahun 1994.
Segera setelah
itu, banyak mesin pencari yang bermunculan dan bersaing memperebutkan popularitas.
Termasuk di antaranya adalah WebCrawler, Hotbot, Excite, Infoseek, Inktomi,
dan AltaVista.
Masing-masing bersaing dengan menambahkan layakan-layanan tambahan seperti yang
dilakukan oleh Yahoo.
Tahun 2002
Yahoo! mengakuisisi Inktomi,
setahun kemudian mengakuisisi AlltheWeb dan Altavista kemudian meluncurkan mesin pencari
sendiri yang didasarkan pada teknologi gabungan dari mesin-mesin pencari yang
telah diakuisisinya serta memberikan layanan yang mengutamakan pencarian Web
daripada layanan-layanan lainnya.
Di bulan desember
2003, Orase menerbitkan versi pertama dari
teknologi pencari waktu-riilnya. Mesin ini memiliki banyak fungsi baru dan
tingkat unjuk kerja yang jauh lebih baik.
Mesin pencari
juga dikenal sebagai target investasi internet yang
terjadi pada akhir tahun 1990-an.
Beberapa perusahaan mesin pencari yang masuk ke dalam pasar saham diketahui
mencatat keuntungan besar. Sebagian lagi sama sekali menonaktifkan layanan
mesin pencari, dan hanya memasarkannya pada edisi-edisi enterprise saja, contoh Northern Light sebelumnya diketahui merupakan salah
satu perintis layanan mesin pencari di internet.
Buku Osmar R.
Zaïane From Resource Discovery to Knowledge Discovery on the
Internet menjelaskan
secara rinci sejarah teknologi mesin pencari sebelum munculnya Google. Mesin-mesin
pencari lainnya mencakup a9.com, AlltheWeb, Ask
Jeeves, Clusty, Gigablast, Teoma, Wisenut, GoHook, Kartoo,
dan Vivisimo.
Cara Kerja Mesin
Pencari
Mesin pencari web bekerja dengan cara menyimpan
informasi tentang banyak halaman web, yang diambil langsung dari
WWW. Halaman-halaman ini diambil dengan web
crawler — browser web otomatis yang mengikuti setiap
pranala/link yang dilihatnya. Isi setiap halaman lalu dianalisis untuk
menentukan cara indeks-nya (misalnya, kata-kata diambil dari judul, subjudul,
atau field khusus yang disebut meta
tag). Data tentang halaman web disimpan dalam sebuah databaseindeks untuk digunakan
dalam pencarian selanjutnya. Sebagian mesin pencari, seperti Google, menyimpan seluruh atau sebagian halaman
sumber (yang disebut cache)
maupun informasi tentang halaman web itu sendiri.
Selain halaman web, Mesin pencari juga menyimpan
dan memberikan informasi hasil pencarian berupa pranala yang merujuk pada file,
seperti file
audio, file
video, gambar, foto dan sebagainya, serta informasi tentang
seseorang, suatu produk, layanan, dan informasi beragam lainnya yang semakin
terus berkembang sesuai dengan perkembangan teknologi informasi.
Ketika seseorang
mengunjungi mesin pencari dan memasukkan query,
biasanya dengan memasukkan kata kunci, mesin mencari indeks dan
memberikan daftar halaman web yang paling sesuai dengan kriterianya, biasanya
disertai ringkasan singkat mengenai judul dokumen dan kadang-kadang sebagian
teksnya.
Ada jenis mesin
pencari lain: mesin pencari real-time,
seperti Orase. Mesin seperti ini tidak menggunakan
indeks. Informasi yang diperlukan mesin tersebut hanya dikumpulkan jika ada
pencarian baru. Jika dibandingkan dengan sistem berbasis indeks yang digunakan
mesin-mesin seperti Google, sistem real-time ini unggul dalam beberapa hal:
informasi selalu mutakhir, (hampir) tak ada pranala mati, dan lebih sedikit
sumber daya sistem yang diperlukan. (Google menggunakan hampir 100.000
komputer, Orase hanya satu.) Tetapi, ada juga kelemahannya: pencarian lebih
lama rampungnya.
Manfaat mesin pencari bergantung pada relevansi hasil-hasil yang diberikannya.
Meskipun mungkin ada jutaan halaman web yang mengandung suatu kata atau frasa,
sebagian halaman mungkin lebih relevan, populer, atau autoritatif daripada yang
lain. Kebanyakan mesin pencari menggunakan berbagai metode untuk menentukan peringkat hasil pencarian agar mampu memberikan
hasil "terbaik" lebih dahulu. Cara mesin menentukan halaman mana yang
paling sesuai, dan urutan halaman-halaman itu diperlihatkan, sangat bervariasi.
Metode-metode nya juga berubah seiring waktu dengan berubahnya penggunaan
internet dan berevolusinya teknik-teknik baru.
Sebagian besar
mesin pencari web adalah usaha komersial yang didukung pemasukan iklan dan karenanya sebagian menjalankan
praktik kontroversial, yaitu membolehkan pengiklan membayar agar halaman mereka
diberi peringkat lebih tinggi dalam hasil pencarian.
Proses Pencarian
Melakukan pencarian dokumen yang dimuat pada suatu
situs bisa begitu mudah dan kelihatannya mungkin sulit juga. apalagi mengingat
begitu menyebarnya informasi di mana-mana, bahkan University of Calofornia
menyebutkan saat ini telah terdapat lebih dari 50 miliar halaman web di internet, meskipun tidak ada ada satupun
yang benar-benar tahu jumlah persisnya.
kesulitan yang
mungkin terjadi adalah karena WWW tersebut tidak terdata dalam bentuk yang
terstandardisasi isinya. tidak sama halnya dengan katalog yang ada di
perpustakaan, yang memiliki standardisasi secara mendunia berdasarkan subjek
dari judul buku, meskipun jumlahnya juga tidak sedikit.
Dalam pencarian
di web, pengguna selalu memperkirakan kata apa
yang di kira-kira terdapat pada halaman yang ingin anda temukan. atau kira-kira
apa subjek yang dipilih oleh seseorang untuk mengelola halaman situs yang
mereka kelola, topik apa saja kira-kira yang di bahas.
Jika pengguna
melakukan apa yang dikenal dengan pencarian pada halaman web, sebenarnya
tidaklah melakukan pencarian. tidak mungkin melakukan pencarian di WWWsecara
langsung.
Pada web benar-benar
terdiri dari banyak sekali halaman web yang ingin disimpan dari berbagai server
diseluruh dunia. Komputer pengguna
tidak langsung melakukan pencarian kepada seluruh komputer tersebut secara
langsung.
Apa yang mungkin
pengguna lakukan hanyalah melalui komputer untuk mengakses satu atau lebih
perantara yang disebut dengan alat bantu pencarian yang ada saat ini. Melakukan
pencarian pada alat bantu itu tadi ke database yang dimiliki. database tersebut
mengkoleksi situs-situs yang ditemukan dan simpan.
alat bantu
pencarian ini menyediakan hasil pencarian dalam bentuk hypertext link dengan URL menuju halaman lainnya.
ketika anda klik link ini, dan menuju ke alamat tersebut maka dokumen, gambar,
suara dan banyak lagi bentuk lainnya yang ada pada server tersebut disediakan, sesuai dengan
informasi yang terdapat di dalamnya. layanan ini bisa menjangkau ke manapun di
seluruh dunia.
Tidak mungkin
seseorang untuk melakukan pencarian ke seluruh komputer yang terhubung internet
ini, atau bahkan alat bantu pencarian yang mengklaim bahwa melakukannya, tidak
benar
Prinsip Umum
Dari Mesin Pencari
Sistem kinerja mesin ini ada beberapa hal yang
perlu di perhatikan terutama keterkaitannya dengan masalah arsitekrut dan
mekanismenya.
Spider
Merupakan
program yang men-download halaman-halaman yang mereka temukan, mirip dengan
browser. Perbedannya adalah bahwa browser menapilkan secara langsung informasi
yang ada (baik tekas, gambar, dll). Untuk kepentingan manusia yang
menggunakannya pada saat itu, sedangkan spider tidak melakukan untuk
menampilkan dalam bentuk yang terlihat seperti itu, karena kepentingannya
adalah untuk mesin, bukan untuk manusia, spider pun dijalankan oleh mesin
secara otomatis. Kepentingannya adalah untuk mengambil halaman-halaman yang
dikunjunginya untuk disimpan kedalam database yang dimiliki oleh search engine.
Crawler
Merupakan
program yang dimiliki search engine untuk melacak dan menemukan link yang
terdapat dari setiap halaman yang ditemuinya. Tugasnya adalah untuk menentukan
spoder harus pergi kemana dan mengevaluasi link berdasarkan alamat yang ditentukan
dari awal. Crawler mengikuti link dan mencoba menemukan dokumen yang belum
dikenal oleh search engine.
Indexer
Komponen ini
melakukan aktivitas untuk menguraikan masing-masing halaman dan meneliti
berbagai unsur, seperti teks, headers, struktur atau fitur dari gaya penulisan,
tagHTML khusus, dll.
Database
Merupakan tempat
standar untuk menyimpan data-data dari halaman yang telah dikunjungi,
di-download dan sudah dianalisis. kadang kala disebut juga dengan index dari
suatu search engine.
Result Engine
Mesin yang
melakukan penggolongan dan penentuan peringkat dari hasil pencarian pada search
engine. Mesin ini menentukan halaman mana yang menemui kriteria terbaik dari
hasil pencarian berdasarkan permintaan penggunanya, dan bagaimana bentuk
penampulan yang akan ditampilkan.
Proses ini
dilaksanakan berdasarkan algoritma perangkingan yang dimiliki oleh search
engine tersebut, mengikuti kaidah perangkingan hakaman yang dipergunakan oleh
mereka adalah hak mereka, para peneliti mempelajari sifat-sifat yang mereka
gunakan, terutama untuk meningkatkan pencarian yang dihasilkan oleh serach
engine tersebut.
Web Server
Merupakan
komponen yang melayani permintaan dan memberikan respon balik dari permintaan
tersebut. Web Server ini biasanya menghasilkan informasi atau dokumen dalam format HTML. Pada halaman
tersebut tersedia layanan untuk mengisikan kata kunci pencarian yang diinginkan
oleh usernya. Web Server ini juga bertanggung jawab dalam menyampaikan hasil
pencarian yang dikirimkan kepada komputer yang meminta informasi.
Sumber :
https://id.wikipedia.org/wiki/Mesin_pencari_web
Tidak ada komentar:
Posting Komentar