Abstract:
Platform media sosial seperti Twitter memudahkan para pengguna untuk berbagi dan
menerima informasi penting selama bencana dan keadaan darurat. Informasi dari saksi mata dapat
berguna bagi lembaga penegak hukum dan organisasi kemanusiaan. Pesan bencana di Twitter juga
dapat digunakan sebagai informasi yang digunakan untuk mengetahui situasi yang sedang
berlangsung. Pada beberapa riset yang telah dilakukan oleh peneliti, tweet bencana gempa dibagi
menjadi tiga kategori yaitu eyewitness, non-eyewitness, dan don’t know. Sedangkan ekstraksi fitur
yang digunakan pada riset-riset tersebut adalah bag-of-words yang menghasilkan keluaran berupa
data berdimensi tinggi.
Tujuan penelitian ini adalah memanfaatkan ekstraksi fitur berbasis lexicon untuk
menghasilkan data berdimensi rendah. Namun belum pernah ada pemanfaatan Lexicon Based
untuk klasifikasi multiclass pada kasus klasifikasi pesan bencana alam. Fitur yang dihasilkan oleh
Lexicon based jauh lebih sedikit yaitu 2-15 fitur. Penelitian ini dibagi menjadi dua tahap, yaitu
tahap pertama dilakukan tanpa penggabungan kamus Lexicon dan tahap kedua dilakukan dengan
menggabungkan kamus Lexicon. Akurasi tertinggi dihasilkan oleh kombinasi Barasa
SentiwordNet, Bing Liu, NRC, AFINN, dan Lexicon Heeryon Cho menggunakan klasifikasi
Support Vector Machine dengan akurasi sebesar 64,13% dengan jumlah fitur sebanyak 15 fitur.
Kata kunci: Lexicon based, Support Vector Machine, Klasifikasi, Text Mining, Twitter, Bencana
Alam