PERINGKASAN KUMPULAN BERITA SECARA OTOMATIS MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE

Filza Setiadi, Esmeralda C Djamal, Ridwan Ilyas

Abstract


Berita merupakan suatu informasi yang menceritakan tentang berbagai peristiwa dan kejadian yang hangat, dimana akan berdampak pada penyedia-penyedia berita untuk mengeluarkan berita yang terhangat. Karena hal tersebut banyak ditemukan berita yang sama informasinya dengan judul yang berbeda-beda. Diperlukan metode untuk mengumpulkan informasi ke dalam ringkasan sederhana. Ringkasan berita adalah merupakan teknik untuk mengambil isi yang paling penting dari sumber informasi yang kemudian menyajikannya kembali dalam bentuk yang lebih ringkas. Untuk memecahkan masalah tersebut dapat menggunakan metode maximum marginal relevance. MMR merupakan salah satu metode ekstraksi ringkasan (extractive summary) yang digunakan untuk meringkas dokumen tunggal atau multi dokumen. MMR meringkas dokumen dengan menghitung kesamaan (similarity) antara bagian teks. Pada pengumpulan dan pengambilan data menggunakan teknik web scraping dari portal berita. Tahapan pada teknik web scraping yaitu, mengambil link berita dan disimpan pada sistem, selanjutnya mengambil konten-konten yang diperlukan. Dimana konten yang di ambil adalah konten yang penting, seperti judul berita, isi berita, lokasi berita, serta waktu terbit berita. Pada ekstraksi data terdapat pemecahan kalimat untuk menghilangkan tanda baca dan dipecah lagi menjadi banyak suku kata, pembobotan TF-ISF, consine similaryti, dan pembobotan MMR dalam meringkas suatu kalimat dengan menunjukan frequensi kemunculan kalimat yang yang mendekatkan kata di kaliamat dengan kata kunci.

Keywords


Berita; Consine Similaryti; Mmr; Penyedia Berita; Tf-Isf

Full Text:

PDF

References


A. Indriani, “Maximum Marginal Relevance Untuk Peringkasan Teks,” pp. 29–34, 2014.

B. S. Pratiwi and M. A. Bijaksana, “Implementasi Word Sense Disambiguation Dengan

Metode Maximal Marginal Relevance Pada Peringkasan Teks Implementation of

Word Sense Disambiguation Using Maximal,” vol. 4, no. 1, pp. 1152–1157, 2017.

B. Wang, B. Liu, C. Sun, X. Wang, and B. Li, “Multi-email Summarization,” Work, pp. 417–

, 2009.

E. B. Setiawan and A. T. Hartanto, “Implementasi Metode Maximum Marginal Relevance

(MMR) dan Algoritma Steiner Tree untuk Menentukan Storyline Dokumen Berita,”

vol. VIII, no. 1, pp. 23–31, 2016.

I. Lukmana, D. Swanjaya, A. Kurniawardhani, A. Z. Arifin, and D. Purwitasari, “Sentence

Clustering Improved Using Topic Words,” pp. 1–8.

J. Goldstein and J. Carbonell, “Summarization:(1) using MMR for diversity-based reranking

and (2) evaluating summaries,” Proc. a Work. held, no. 1, pp. 181–195, 1998.

L. Marlinda, H. Rianto, M. Informatika, A. Bina, and S. Informatika, “Pembelajaran Bahasa

Indonesia Berbasis Web,” pp. 2–4, 2013.

M. Mustaqhfiri, Z. Abidin, and R. Kusumawati, “Peringkasan Teks Otomatis Berita

Berbahasa Indonesia Menggunakan Metode Maximum Marginal Relevance,” Matics,

R. Intan and A. Defeng, “Hard : Subject-Based Search Engine Menggunakan Tf-Idf Dan

Jaccard ’ S Coefficient,” J. Tek. Ind., vol. 8, no. 1, pp. 61–72, 2006.

S. Irawan, Hermawan, and Samsuryadi, “Studi Awal Peringkasan Dokumen Bahasa

Indonesia Menggunakan Metode Latent Semantik Analysis dan Maximum Marginal

Relevance,” vol. 2, no. 1, pp. 235–239, 2016.

V. Rentoumi, G. Giannakopoulos, V. Karkaletsis, and G. A. Vouros, “Sentiment Analysis of

Figurative Language using a Word Sense Disambiguation Approach,” Int. Conf.

RANLP, no. September, pp. 370–375, 2009.

W. E. Waliprana and K. Kunci, “Update Summarization Untuk Kumpulan Dokumen Berbahasa Indonesia,” J. Cybermatika, pp. 6–10, 2009


Refbacks

  • There are currently no refbacks.