Aplikasi Algoritma DFS dan BFS di Dalam Search Engine Lokal
Aplikasi Algoritma DFS dan BFS di Dalam Search Engine Lokal - Mesin pencari atau search engine adalah kakas yang sangat berguna untuk mencari informasi yang dibutuhkan di dalam sekumpulan data yang tidak berstruktur seperti data di dalam internet atau data di dalam struktur direktori (folder). Contoh mesin pencari yang terkenal adalah Google, yang digunakan untuk mencari data di internet (Gambar 1).
Pada Tugas Besar II kali ini anda diminta membuat aplikasi search engine lokal mirip seperti Google, namun tidak sepenuhnya sama seperti Google. Mesin pencari yang anda akan buat hanya digunakan untuk mencari dokumen di dalam direktori Windows yang mengandung kata, frase kata, atau penggalan kalimat yang diinginkan dengan menggunakan fungsi string matching yang sudah tersedia di dalam bahasa pemrogaman (dalam hal ini Bahasa C#). Anda tidak perlu lagi membuat program string matching (belum diajarkan di dalam kuliah).
Dokumen-dokumen tersebut tersebar pada berbagai folder (directory) di dalam sebuah direktori. Pengguna ingin mencari dokumen yang mengandung string tertentu. String tersebut bisa berupa kata, frase kata, atau penggalan kalimat. Dengan mesin pencari yang anda buat, seluruh dokumen yang relevan (teks/doc) di dalam folder dibuka lalu string yang dicari dicocokkan dengan teks di dalam berkas. Selanjutnya, semua dokumen yang mengandung string yang dicari ditampilkan daftarnya di layar yang terdiri sejumlah kalimat yang mengandung string yang dicari. Setiap penggalan kalimat yang ditampilkan mengandung hyperlink sehingga dengan mengklik kalimat tersebut isi di dalam berkas ditampilkan di layar dalam sebuah window. Mirip dengan pencarian di dalam Google, jika pengguna mengetikkan query ‘himpunan’ di dalam antarmuka search engine, maka maka mesin pencari menampilkan semua dokumen yang mengandung string ‘himpunan’, kira-kira contoh hasilnya sebagai berikut:
Dengan meng-klik pranala yang terdapat pada judul, maka aplikasi membuka dokumen tersebut dan menampilkan isinya di layar.
Inti dari search engine adalah program explorer (atau crawler). Perhatikan bahwa direktori terdiri dari sekumpulan folder, dan setiap folder dapat memiliki sub-folder lagi atau dokumen (Gambar 2). Struktur direktori sama dengan struktur pohon.
Gambar 2. Contoh sebuah direktori
Bagaimana cara explorer melakukan penjelajahan?
Program explorer menjelajah seluruh folder dengan menggunakan algoritma DFS/BFS (Gambar 3), menemukan dokumen (yang merupakan daun dari pohon), lalu mencocokkan query dengan dengan isi dokumen.
Spesifikasi program :
Program explorer adalah inti dari mesin pencari. Di dalam explorer terdapat implementasi algoritma DFS/BFS dan pencocokan string dengan menggunakan Bahasa C#.
2. Program explorer melakukan pencocokan string pada setiap dokumen yang terdapat di dalam folder. Seluruh dokumen yang mengandung query yang cocok ditampilkan daftarnya di halaman antarmuka. Misalnya jika query yang dimasukkan pengguna adalah “merapi”, maka luaran yang dihasilkan adalah seluruh dokumen yang mengandung kata “merapi” dan beberapa kalimat di dalam dokumen yang mengandung kata “merapi”, seperti pada contoh berikut:
Gunung Merapi meletus pada Jumat Dinihari
… penduduk di sekitar Merapi….letusan di puncak Merapi ….
Jalan-jalan ke Gunung Merapi
... liburan banyak yang jalan-jalan ke Kaliurang di kaki Merapi …
Mbah Maridjan, Juru Kunci Merapi
... diangkat oleh raja sebagai penunggu Merapi … dekat Sleman, gunung Merapi..
Antara Keraton, Merapi, dan Laut Kidul
… orang Jawa percaya antara Merapi dan Laut Kidul ….
3. Pohon ruang status (state space tree) dibangun selama pencarian.
4. Dokumen yang dicari minimal dokumen text dan word saja. Dokumen text adalah semua dokumen yang berekstensi .txt, .html, .htm, .c, .pas, .java, dan lain-lain. Dokumen word adalah dokumen berekstensi .doc dan .docx.
5. Pengguna dapat mengklik pranala pada judul tulisan yang terdapat di dalam hasil pencarian, kemudian aplikasi yang bersesuaian membuka dokumen tersebut.
6. Tampilkan progress bar selama proses pencarian untuk memperlihatkan kemajuan pencarian kepada pengguna.
7. Beri nama aplikasi search engine anda ini dengan nama yang menarik
8. Bonus (nilai 10): Membuat video aplikasi dan diunggah ke Youtube
Data Uji
Data uji yang digunakan adalah sekumpulan dokumen teks dan word (dapat anda cari sendiri sendiri dari media daring (online)). Dokumen dapat berbahasa Indonesia atau Inggris. Untuk dokumen teks paling sedikit ada 50 dokumen yang dapat diambil dari media daring, kode program, dan lain-lain.
Lain – lain :
Isi laporan :
Cover : Cover laporan ada foto anggota kelompok (foto bertiga). Foto ini menggantikan logo “gajah” ganesha.
Bab 1: Deskripsi masalah (dapat meng-copy paste file tugas ini)
Bab 2: Dasar teori
Bab 3 : Analisis Pemecahan Masalah. Langkah-langkah pemecahan masalah ada di sini beserta contoh ilustrasi.
Bab 4 : Implementasi dan pengujian. Bab ini berisi:
Bab 5 : Kesimpulan dan saran (hasil yang dicapai, saran pengembangan).
Tuliskan juga referensi (buku, web), yang dipakai/diacu di dalam Daftar Referensi.
Keterangan Laporan :
Penilaian :
Sekian Artikel Aplikasi Algoritma DFS dan BFS di Dalam Search Engine Lokal.
Gambar 1 : Contoh antarmuka Google |
Dokumen-dokumen tersebut tersebar pada berbagai folder (directory) di dalam sebuah direktori. Pengguna ingin mencari dokumen yang mengandung string tertentu. String tersebut bisa berupa kata, frase kata, atau penggalan kalimat. Dengan mesin pencari yang anda buat, seluruh dokumen yang relevan (teks/doc) di dalam folder dibuka lalu string yang dicari dicocokkan dengan teks di dalam berkas. Selanjutnya, semua dokumen yang mengandung string yang dicari ditampilkan daftarnya di layar yang terdiri sejumlah kalimat yang mengandung string yang dicari. Setiap penggalan kalimat yang ditampilkan mengandung hyperlink sehingga dengan mengklik kalimat tersebut isi di dalam berkas ditampilkan di layar dalam sebuah window. Mirip dengan pencarian di dalam Google, jika pengguna mengetikkan query ‘himpunan’ di dalam antarmuka search engine, maka maka mesin pencari menampilkan semua dokumen yang mengandung string ‘himpunan’, kira-kira contoh hasilnya sebagai berikut:
Teori himpunan di dalam matematika
Himpunan Mahasiswa Kos Kuliah
...terbagi menjadi dua himpunan yang berukuran n/2
Perhimpunan Islam Tionghoa Indonesia (PITI)
Dengan meng-klik pranala yang terdapat pada judul, maka aplikasi membuka dokumen tersebut dan menampilkan isinya di layar.
Inti dari search engine adalah program explorer (atau crawler). Perhatikan bahwa direktori terdiri dari sekumpulan folder, dan setiap folder dapat memiliki sub-folder lagi atau dokumen (Gambar 2). Struktur direktori sama dengan struktur pohon.
Bagaimana cara explorer melakukan penjelajahan?
Program explorer menjelajah seluruh folder dengan menggunakan algoritma DFS/BFS (Gambar 3), menemukan dokumen (yang merupakan daun dari pohon), lalu mencocokkan query dengan dengan isi dokumen.
Gambar 3 : Prinsip BFS dan DFS dalam penjelajahan direktori |
1. Program search engine yang anda buat terdiri dari dua bagian: Program query dan explorer. Program query adalah berupa antarmuka pengguna-komputer, program query dibuat berbasis web (web-base). Tampilan antarmuka pengguna-komputer kira-kira seperti Gambar 4 di bawah ini:
Gambar 4 : Antarmuka program query |
- Path : pengguna dapat menspesifikan path yang menyatakan folder tertentu (misalnya D:/Dataku/Laporan) atau disk drive (D:/, F:/, G:/)
- Algoritma traversal : pengguna dapat memilih algoritma DFS/BFS.
- Perihal : keterangan tentang program dan pembuatnya
Program explorer adalah inti dari mesin pencari. Di dalam explorer terdapat implementasi algoritma DFS/BFS dan pencocokan string dengan menggunakan Bahasa C#.
2. Program explorer melakukan pencocokan string pada setiap dokumen yang terdapat di dalam folder. Seluruh dokumen yang mengandung query yang cocok ditampilkan daftarnya di halaman antarmuka. Misalnya jika query yang dimasukkan pengguna adalah “merapi”, maka luaran yang dihasilkan adalah seluruh dokumen yang mengandung kata “merapi” dan beberapa kalimat di dalam dokumen yang mengandung kata “merapi”, seperti pada contoh berikut:
Gunung Merapi meletus pada Jumat Dinihari
… penduduk di sekitar Merapi….letusan di puncak Merapi ….
Jalan-jalan ke Gunung Merapi
... liburan banyak yang jalan-jalan ke Kaliurang di kaki Merapi …
Mbah Maridjan, Juru Kunci Merapi
... diangkat oleh raja sebagai penunggu Merapi … dekat Sleman, gunung Merapi..
Antara Keraton, Merapi, dan Laut Kidul
… orang Jawa percaya antara Merapi dan Laut Kidul ….
3. Pohon ruang status (state space tree) dibangun selama pencarian.
4. Dokumen yang dicari minimal dokumen text dan word saja. Dokumen text adalah semua dokumen yang berekstensi .txt, .html, .htm, .c, .pas, .java, dan lain-lain. Dokumen word adalah dokumen berekstensi .doc dan .docx.
5. Pengguna dapat mengklik pranala pada judul tulisan yang terdapat di dalam hasil pencarian, kemudian aplikasi yang bersesuaian membuka dokumen tersebut.
6. Tampilkan progress bar selama proses pencarian untuk memperlihatkan kemajuan pencarian kepada pengguna.
8. Bonus (nilai 10): Membuat video aplikasi dan diunggah ke Youtube
Contoh video tubes tahun lalu: https://www.youtube.com/watch?v=j-GCBJA76YU dan https://www.youtube.com/watch?v=mrJxvm1LDKg
Data Uji
Data uji yang digunakan adalah sekumpulan dokumen teks dan word (dapat anda cari sendiri sendiri dari media daring (online)). Dokumen dapat berbahasa Indonesia atau Inggris. Untuk dokumen teks paling sedikit ada 50 dokumen yang dapat diambil dari media daring, kode program, dan lain-lain.
Lain – lain :
- Anda dapat menambahkan feature-feature lain yang menunjang program yang anda buat (unsur kreatifitas diperbolehkan/dianjurkan).
- Anda dapat menambahkan pencarian berdasarkan nama file.
- Tipe dokumen minimal adakah teks dan doc, namun anda dapat menambahkan tipe lan seperti spreadsheet, pdf, dan lain-lain.
- Program explorer menggunakan Bahasa C#.
- Program query berbasis web dan dapat dikembangkan dengan salah satu kakas pemrograman web (PHP, JSP (Java Server Pages), JavaScript, dll).
- Tugas dikerjakan per kelompok dengan jumlah anggota maksimal 3 orang dan tidak sama dengan anggota kelompok sebelumnya.
- Program harus modular dan mengandung komentar yang jelas.
- Mahasiswa harus membuat program sendiri, tetapi belajar dari contoh-contoh program serupa yang sudah ada tidak dilarang (tidak boleh mengkopi source code dari program orang lain).
- Pengumpulan paling lambat adalah tanggal 30 Maret 2015 pukul 7.30. Asisten akan menunggu di lab IRK untuk pengumpulan. Keterlambatan akan mengurangi nilai.
- Program disimpan di dalam folder StrAlgo2-xxxxx. Lima digit terakhir adalah NIM anggota terkecil. Didalam folder tersebut terdapat tiga folder bin, src dan doc yang masing-masing berisi :
a. Folder bin berisi executable file (exe)
b. Folder src berisi source code dari program
c. Folder test berisi data uji.
d. Folder doc berisi dokumentasi program dan readme
Folder ini disimpan dalam bentuk CD untuk dikumpulkan bersama berkas laporan dimasukan kedalam amplop coklat. - Semua pertanyaan menyangkut tugas ini harus dikomunikasikan melalui milis agar dapat dicermati oleh semua peserta kuliah IF2211 (milis IF2211@students.if.itb.ac.id).
- Demo program akan dilaksanakan pada tanggal yang dimumkan oleh asisten. Peserta mengisi jadwal demo yang disediakan pada saat pengumpulan tugas.
- Tiap anggota harus memahami proses pembuatan program, karena akan ada pertanyaan-pertanyaan yang harus dijawab per individu.
- Pada saat demo, asisten akan memanggil per kelompok sesuai jadwal yang telah diisi sebelumnya. Kelompok yang tidak berkepentingan dilarang masuk. Demo dilakukan di Lab IRK.
Isi laporan :
Cover : Cover laporan ada foto anggota kelompok (foto bertiga). Foto ini menggantikan logo “gajah” ganesha.
Bab 1: Deskripsi masalah (dapat meng-copy paste file tugas ini)
Bab 2: Dasar teori
Bab 3 : Analisis Pemecahan Masalah. Langkah-langkah pemecahan masalah ada di sini beserta contoh ilustrasi.
Bab 4 : Implementasi dan pengujian. Bab ini berisi:
- Spesifikasi teknis program, termasuk di dalamnya struktur data atau kelas objek yang didefinisikan, fungsi dan prosedur (header fungsi dan prosedur saja, tidak perlu source code), antarmuka, dan lain-lain yang dianggap perlu.
- Eksperimen/pengujian dengan contoh-contoh query.
- Analisis hasil pengujian (DFS dan BFS), misalnya waktu pencarian, jumlah simpul yang dikunjungi, dsb
Bab 5 : Kesimpulan dan saran (hasil yang dicapai, saran pengembangan).
Tuliskan juga referensi (buku, web), yang dipakai/diacu di dalam Daftar Referensi.
Keterangan Laporan :
- Laporan ditulis dalam bahasa Indonesia yang baik dan benar, tidak perlu panjang tetapi tepat sasaran dan jelas.
- Laporan tidak perlu memakai cover mika dan dijilid. Cukup dibuat agar laporan tidak akan tercecer bila dibaca.
- Laporan boleh menggunakan kertas rius, boleh bolak-balik, boleh dalam satu halaman kertas terdapat dua halaman tulisan asalkan masih terbaca.
- Identitas per halaman harus jelas (misalnya : halaman, kode kuliah).
Penilaian :
- Kebenaran program (40%) : program mampu berjalan sesuai dengan spesifikasi yang diberikan.
- Demo – pemahaman Anda dalam pembuatan program (30%)
- Laporan (20%)
- Interface, feature-feature program, dan unsur kreativitas (10%)
Sekian Artikel Aplikasi Algoritma DFS dan BFS di Dalam Search Engine Lokal.
ini yang aku cari-cari. makasih ya
BalasHapus