KLASIFIKASI TOPIK SOAL UN BHS.INDONESIA DENGAN PENDEKATAN STEMMING PORTER KBBI DAN NAÏVE BAYES

A.Yudi Permana, Arif Siswandi

Sari

Penelitian ini dimaksudkan untuk mencari nilai akurasi klasifikasi topik soal UN bahasa indonesia yang terdiri dari 12 kategori topik soal UN bahasa indonesia. Metode penelitian yang digunakan adalah dengan tahapan awal Preprocessing pada soal UN bahasa indonesia dengan jumlah data sampel sebanyak 500 soal, dengan model data training 350 soal dan data testing 150 soal. Tahapan awal preprocessing dilakukan proses Case Folding, Stopword Removal dan menerapkan algoritma Stemming porter KBBI, kemudian dilakuakan tahapan klasifikasi dengan pendekatan algoritma naive bayes. Dari hasil penelitian stemming porter KBBI menghasilkan nilai akurasi data training 93,71% sedangkan data testing dengan akurasi 86%. Stemming porter KBBI mempengaruhi hasil dari nilai akurasi klasifikasi topik soal UN dengan ketepatan kata dasar pada proses stemmingnya.

Teks Lengkap:

PDF

Referensi

Frakes, W. (1992), Stemming algorithms, in W. Frakes & R. Baeza-Yates, eds, ‘Information Retrieval: Data Structures and Algorithms’,Prentice-Hall, chapter 8, pp. 131{160.

Agusta, Ledy. 2009. Perbandingan algoritma stemming Porter dengan Algoritma Nazief & Adriani untuk stemming dokumen teks bahasa indonesia. konferensi nasional sistem dan informatika. KNS&I09-036.Gender issues accros the life cycle (pp. 107-123). New York:Springer.

Hamzah Amir (2012). Klasifikasi teks dengan naïve bayes classifier (NBC) untuk mengelompokkan teks berita dan abstract akademis, Seminar Nasional Aplikasi Sains & Teknologi (SNAST).

Arifin,A.Z.&Setiono,A.N.(2002),Classification of Event News Documents in Indonesian Language Using Single Pass Clustering Algorithm, in ‘Proceedings of the Seminar on Intelligent Technology and its Applications (SITIA)’, Teknik Elektro, Sepuluh Nopember Institut of Technology, Surabaya, Indonesia.

Joko Samodra, S. S. (2009). Klasifikasi dokumen teks berbahasa Indonesia dengan menggunakan Naive Bayes. Seminar nasional electrical, informatics, and it's education.

Dian Novitasari (2016). Perbandingan Algoritma Stemming Porter Dengan arifin Setiono Untuk Menentukan Tingkat Ketepatan Kata Dasar.

Zhang A Wen (2010). comparative study of TFIDF, LSI and multi-words for text classification,School of Knowledge Science, Japan Advanced Institute of Science and Technology, 1-1 Ashahidai, Nomi, Ishikawa 923-1292, Japan.

Refbacks

  • Saat ini tidak ada refbacks.