PERINGKASAN TEKS OTOMATIS BERITA BERDASARKAN KLASIFIKASI KALIMAT MENGGUNAKAN SUPPORT VECTOR MACHINE

Pandu Gumi Somantri, Agus Komarudin, Ridwan Ilyas

Abstract


Berita merupakan informasi mengenai sesuatu yang sedang terjadi meliputi peristiwa apa yang terjadi (what), siapa yang terlibat dalam peristiwa (who), kapan (when) dan dimana (where) peristiwa terjadi, serta kenapa (why) dan bagaimana (how) peristiwa dapat terjadi. Ringkasan berita idealnya menjelaskan tentang 5W1H, hal ini diperlukan agar membantu pembaca untuk mendapatkan informasi utama pada sebuah berita secara efektif dan efisien. Penelitian ini membangun sistem peringkasan teks otomatis menggunakan Support Vector Machine (SVM) dengan luaran tujuh kelas yaitu apa, kapan, dimana, siapa, kenapa, bagaimana dan other. Fitur-fitur kalimat yang digunakan dalam pembelajaran classifier adalah posisi kalimat dalam paragraf, posisi kalimat keseluruhan, adanya data numerik, tanda koma terbaik, panjang kalimat dan kata kunci. Proses klasifikasi dilakukan menggunakan SVM dengan mencari hyperplane terbaik untuk memisahkan dua kelas.

Keywords


berita online; peringkasan teks; Support Vector Machine (SVM); text mining

Full Text:

PDF

References


Alguliev, R., & Aliguliyev, R. (2009). Evolutionary Algorithm for Extractive Text

Summarization. Intelligent Information Management, 1, 128-138.

Aristoteles, Herdiyani, Y., Ridha, A., & Adisantoso, J. (2012). Text Feature Weighting for

Summarization of Documents in Bahasa Indonesia Using Genetic Algotihm. IJCSI

International Journalof Computer Science Issues, 9(3), 1-6.

Ilyas, R., & Umbara, F. (2016). Peringkasan Otomatis dengan Ekstraksi Informasi untuk

Dokumen Ter-cluster. Prosiding Annual Research Seminar , 2(1), 405-408.

Indrawan, R., Djamal, E. C., & Ilyas, R. (2017). Identifikasi Neuropsikologis terhadap Video

Iklan secara Real Time menggunakan Fast Fourier Transform dan Support Vector

Machine. Seminar Nasional Aplikasi Teknologi Informasi (SNATI).

Indriani, A. (2014). Maximum Marginal Relevance untuk Peringkasan Teks Otomatis

Sinopsis Buku Berbahasa Indonesia. Seminar Nasional Teknologi Informasi dan

Multimedia(29-34).

Indriyanto, R., Fauzi, M. A., & Muflikhah, L. (2017). Peringkasan Teks Otomatis pada

Artikel Berita Kesehatan Menggunakan K-Nearest Neighbor Berbasis Fitur Statistik.

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, 1(11), 1198-1203.

Jezek, K., & Steinberger, J. (2008). Automatic Text Summarization (The state of the art 2007

and new challenges). Proceedings of Znalosti, 1-12.

Lee, J. H., Park, S., Ahn, C. M., & Kim, D. (2009). Automatic Generic Document

Summarization Based On Non-Negative Matrix Factorization. Information Processing

and Management 45, 20-34.

Nugraha, M. A., Khodra, M. L., & Trilaksono, B. R. (2013). Peringkasan Otomatis Berita

Online Bahasa Indonesia pada Timeline Twitter. Konferensi Nasional Sistem

Informasi, 14-16.

Radev, D. R., McKeown, K., & Hovy, E. (2002). Introduction to the Special Issue on

Summarization. Computational Linguistics, 28(4), 399-408.


Refbacks

  • There are currently no refbacks.