Repo Dosen ULM

Studi Ekstraksi Fitur Berbasis Vektor Word2Vec pada Pembentukan Fitur Berdimensi Rendah

Show simple item record

dc.creator Budiman, Irwan
dc.creator Faisal, M Reza
dc.creator Nugrahadi, Dodon T
dc.date.accessioned 2020-06-29T07:59:46Z
dc.date.available 2020-06-29T07:59:46Z
dc.identifier http://eprints.ulm.ac.id/9775/1/abstrak_-_Unila_Feature_Extraction_in_Text_Classification-id-ver43.pdf
dc.identifier Budiman, Irwan and Faisal, M Reza and Nugrahadi, Dodon T Studi Ekstraksi Fitur Berbasis Vektor Word2Vec pada Pembentukan Fitur Berdimensi Rendah. Ilmu Komputer Unila Publishing Network.
dc.identifier.uri https://repo-dosen.ulm.ac.id//handle/123456789/16796
dc.description Abstract — Klasifikasi teks adalah salah satu metode untuk mengelola dan mencari informasi penting yang terdapat pada format tekstual yang tidak terstruktur. Ekstraksi fitur merupakan proses penting pada klasifikasi teks untuk mengubah format tekstual yang tidak terstruktur menjadi terstruktur sehingga dapat diproses oleh algoritma machine learning untuk mengklasifikasikan ke class yang telah ditentukan. Salah satu teknik ekstraksi fitur yang umum digunakan adalah vector space representation. Teknik ini mudah digunakan tetapi berpotensi menghasilkan data dengan dimensi banyak yang berakibat kepada peningkatan waktu komputasi bahkan tidak dapat diproses karena limitasi perangkat keras. Pada riset ini kami melakukan studi terhadap teknik ekstraksi fitur yang mampu menghasilkan data berdimensi sedikit. Ekstraksi fitur yang digunakan memanfaatkan vektor word2vec untuk mengontrol jumlah fitur yang dihasilkan. Pada riset ini kami membandingkan beberapa model yang dihasilkan sendiri dengan jumlah fitur yang bervariasi dan model yang telah disedikan oleh Google. Hal ini dilakukan untuk mengetahui jumlah fitur yang dapat menghasilkan kinerja klasifikasi terbaik. Hasilnya didapat nilai kinerja tertinggi akurasi yaitu 0.877 dengan jumlah fitur adalah 300 dari model yang dihasilkan sendiri. Keywords: word2vec, klasifikasi teks, machine learning, ekstraksi fitur, n-gram
dc.format text
dc.relation https://jurnal.fmipa.unila.ac.id/komputasi/article/view/2517
dc.relation http://eprints.ulm.ac.id/9775/
dc.subject T Technology (General)
dc.title Studi Ekstraksi Fitur Berbasis Vektor Word2Vec pada Pembentukan Fitur Berdimensi Rendah
dc.type Article
dc.type PeerReviewed


Files in this item

Files Size Format View

There are no files associated with this item.

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Browse

My Account