PERINGKASAN TEKS OTOMATIS UNTUK DOKUMEN BAHASA BALI BERBASIS METODE EKTRAKTIF
PERINGKASAN TEKS OTOMATIS UNTUK DOKUMEN BAHASA BALI BERBASIS METODE EKTRAKTIF
Abstract
Membaca menjadi salah satu kegiatan wajib yang dilakukan oleh manusia dalam memperoleh informasi, baik membaca buku, majalah maupun tulisan digital. Perkembangan teknologi internet menyebabkan perkembangan jumlah dokumen digital di internet semakin meningkat. Masalah terjadi ketika dokumen yang dibaca sangat panjang dan sangat banyak sehingga akan membutuhkan waktu yang sangat lama untuk mendapatkan informasi dan memahami isi dari dokumen tersebut. Salah satu cara untuk mendapatkan informasi dan memahami suatu dokumen secara cepat yaitu dengan membaca ringkasannya. Cara untuk mendapatkan ringkasan dokumen secara cepat yaitu dengan meringkasnya secara otomatis dengan menggunakan aplikasi peringkasan otomatis.
Peringkasan teks otomatis (Automatic Text Summarization) merupakan proses menghasilkan atau mengekstraksi sebuah teks yang berasal dari satu atau banyak teks dimana didalamnya terdapat informasi penting dari teks sumber, dan teks hasil tersebut tidak lebih panjang dari setengah teks sumber secara otomatis. Berbagai penelitian telah dilakukan dalam hal peringkasan otomatis untuk bebagai bahasa namun pada penelitian-penelitian sebelumnya belum pernah ada peringkasan otomatis untuk dokumen/tulisan berbahasa Bali yang sudah sangat banyak dijumpai di internet. Merujuk dari fakta tersebut sehingga pada saat ini merupakan momentum yang tepat untuk mengembangkan sistem peringkasan otomatis untuk dokumen berbahasa Bali yang tentunya memiliki karakteristik berbeda dengan kebanyakan bahasa lainnya.
Metode yang digunakan dalam peringkasan teks ini adalah metode ekstraktif yaitu mengekstraksi kalimat-kalimat ringkasan berdasarkan skor fitur-fitur penting dari kalimat yang dimiliki. Pada penelitian ini, fitur-fitur yang digunakan adalah Keyword positif (f1), Kemiripan Antar-Kalimat (f2) dan Kemiripan Kalimat dengan Judul dokumen (f3). Percobaan dilakukan terhadap kumpulan artikel Bahasa Bali yang diperoleh dari berbagai sumber. Dari hasil evaluasi nilai rata-rata ROUGE-1 yang terbaik adalah 0.52 dengan kombinasi bobot fitur f1 = 0.3, bobot f2 = 0.5 dan bobot f3 = 0.2. Terlihat fitur f2 adalah fitur yang memberikan pengaruh yang dominan dalam peringkasan dokumen Bahasa Bali