TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARAB

  • M. Ali Fauzi Institut Teknologi Sepuluh Nopember
  • Agus Arifin Institut Teknologi Sepuluh Nopember
  • Anny Yuniarti Institut Teknologi Sepuluh Nopember

Abstract

Information Retrieval berdasarkan query tertentu sudah jamak ditemukan pada sistem komputer saat ini. Salah satu metode yang populer digunakan adalah perangkingan dokumen menggunakan space vector model berbasis pada nilai term weighting TF.IDF. Pada penelitian ini, terdapat beberapa buku berbahasa Arab yang memiliki puluhan bahkan ratusan halaman. Masing-masing halaman dari buku tersebut adalah sebuah dokumen yang akan diranking berdasarkan query dari pengguna. TF.IDF hanya melakukan pembobotan berbasis pada dokumen tanpa memperhatikan indeks buku dan kelas yang merupakan induk dokumen tersebut sehingga kinerjanya kurang maksimal jika diimplementasikan pada kasus ini. Oleh karena itu, diusulkan metode baru term weighting yang berbasis pada indeks buku dan kelas. Metode ini memperhatikan frekuensi kemunculan term pada keseluruhan buku dan kelas. Metode yang disebut inverse class frequency (ICF) dan inverse book frequency (IBF) ini digabungkan dengan metode sebelumnya sehingga menjadi TF.IDF.ICF.IBF. Pengujian metode ini menggunakan dataset dari beberapa e-book berbahasa arab. Hasil penelitian menunjukkan bahwa metode yang diajukan terbukti dapat diaplikasikan pada perangkingan dokumen berbahasa arab dan memiliki performa yang lebih bagus dibanding metode sebelumnya dengan nilai F-Measure 75%, precision 76%, dan recall mencapai 74%.

Downloads

Download data is not yet available.
Published
2015-11-27
How to Cite
FAUZI, M. Ali; ARIFIN, Agus; YUNIARTI, Anny. TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARAB. Lontar Komputer : Jurnal Ilmiah Teknologi Informasi, [S.l.], nov. 2015. ISSN 2541-5832. Available at: <https://ojs.unud.ac.id/index.php/lontar/article/view/16698>. Date accessed: 28 mar. 2024.
Section
Articles

Keywords

Perankingan Dokumen, Term Weighting, IBF, Indeks Buku, Indeks Kelas