dc.creator |
Budiman, Irwan |
|
dc.creator |
Faisal, M Reza |
|
dc.creator |
Nugrahadi, Dodon T |
|
dc.date.accessioned |
2020-06-29T07:59:46Z |
|
dc.date.available |
2020-06-29T07:59:46Z |
|
dc.identifier |
http://eprints.ulm.ac.id/9775/1/abstrak_-_Unila_Feature_Extraction_in_Text_Classification-id-ver43.pdf |
|
dc.identifier |
Budiman, Irwan and Faisal, M Reza and Nugrahadi, Dodon T Studi Ekstraksi Fitur Berbasis Vektor Word2Vec pada Pembentukan Fitur Berdimensi Rendah. Ilmu Komputer Unila Publishing Network. |
|
dc.identifier.uri |
https://repo-dosen.ulm.ac.id//handle/123456789/16796 |
|
dc.description |
Abstract — Klasifikasi teks adalah salah satu metode untuk mengelola dan mencari informasi penting yang terdapat pada
format tekstual yang tidak terstruktur. Ekstraksi fitur merupakan proses penting pada klasifikasi teks untuk mengubah
format tekstual yang tidak terstruktur menjadi terstruktur sehingga dapat diproses oleh algoritma machine learning untuk
mengklasifikasikan ke class yang telah ditentukan. Salah satu teknik ekstraksi fitur yang umum digunakan adalah vector
space representation. Teknik ini mudah digunakan tetapi berpotensi menghasilkan data dengan dimensi banyak yang
berakibat kepada peningkatan waktu komputasi bahkan tidak dapat diproses karena limitasi perangkat keras. Pada riset
ini kami melakukan studi terhadap teknik ekstraksi fitur yang mampu menghasilkan data berdimensi sedikit. Ekstraksi
fitur yang digunakan memanfaatkan vektor word2vec untuk mengontrol jumlah fitur yang dihasilkan. Pada riset ini kami
membandingkan beberapa model yang dihasilkan sendiri dengan jumlah fitur yang bervariasi dan model yang telah
disedikan oleh Google. Hal ini dilakukan untuk mengetahui jumlah fitur yang dapat menghasilkan kinerja klasifikasi
terbaik. Hasilnya didapat nilai kinerja tertinggi akurasi yaitu 0.877 dengan jumlah fitur adalah 300 dari model yang
dihasilkan sendiri.
Keywords: word2vec, klasifikasi teks, machine learning, ekstraksi fitur, n-gram |
|
dc.format |
text |
|
dc.relation |
https://jurnal.fmipa.unila.ac.id/komputasi/article/view/2517 |
|
dc.relation |
http://eprints.ulm.ac.id/9775/ |
|
dc.subject |
T Technology (General) |
|
dc.title |
Studi Ekstraksi Fitur Berbasis Vektor Word2Vec pada Pembentukan Fitur Berdimensi Rendah |
|
dc.type |
Article |
|
dc.type |
PeerReviewed |
|