Mulyani, Sekar (2024) RANCANG BANGUN MODEL DEEP LEARNING BAHASA INDONESIA BERBASIS INDOBERTWEET UNTUK KLASIFIKASI RATING BERDASARKAN ULASAN E-COMMERCE. Other thesis, Universitas Amikom Purwokerto.
Text
COVER.pdf
Download (618kB)
COVER.pdf
Download (618kB)
Text
DAFTAR ISI.pdf
Download (480kB)
DAFTAR ISI.pdf
Download (480kB)
Text
ABSTRAK.pdf
Download (446kB)
ABSTRAK.pdf
Download (446kB)
Image
BAB I.pdf
Restricted to Registered users only
Download (518kB)
BAB I.pdf
Restricted to Registered users only
Download (518kB)
Image
BAB II.pdf
Restricted to Registered users only
Download (941kB)
BAB II.pdf
Restricted to Registered users only
Download (941kB)
Image
BAB III.pdf
Restricted to Registered users only
Download (613kB)
BAB III.pdf
Restricted to Registered users only
Download (613kB)
Image
BAB IV.pdf
Restricted to Registered users only
Download (2MB)
BAB IV.pdf
Restricted to Registered users only
Download (2MB)
Image
BAB V.pdf
Restricted to Registered users only
Download (449kB)
BAB V.pdf
Restricted to Registered users only
Download (449kB)
Image
DAFTAR PUSTAKA.pdf
Restricted to Registered users only
Download (575kB)
DAFTAR PUSTAKA.pdf
Restricted to Registered users only
Download (575kB)
Text
LAMPIRAN.pdf
Restricted to Repository staff only
Download (1MB)
LAMPIRAN.pdf
Restricted to Repository staff only
Download (1MB)
Abstract
Penelitian ini bertujuan untuk mengurangi subyektivitas dalam ulasan pelanggan pada platform e-commerce dengan memanfaatkan model pemrosesan bahasa alami natural language processing (NLP) seperti BERT, khususnya IndoBERTweet yang dilatih dalam Bahasa Indonesia. Ulasan pelanggan sering kali bersifat subjektif, mengandung emoji, slang, dan singkatan yang sulit diinterpretasi secara objektif. Subyektivitas ini dapat memengaruhi keputusan pembelian dan membingungkan calon pembeli. Model NLP ini digunakan untuk mengklasifikasikan rating dan ulasan pelanggan (bintang 1-5) untuk mengurangi subyektivitas dalam ulasan tersebut. Dataset yang digunakan pada penelitian ini berjumlah 137.844. Dataset telah dibagi menjadi 3 bagian menjadi dataset test sebanyak 3447, dataset pelatihan sebanyak 124316, dan dataset validasi sebanayak 10080 yang bersumber dari rating ulasan produk kecantikan Tokopedia dan Shopee. Hasil klastering menggunakan tokenizer IndoBERTweet yang telah dihilangkan kata sambungnya menunjukkan bahwa ulasan terdiri dari 6 kelas, dengan 1 kelas yang tersebar melintasi klaster lain. Hal tersebut menunjukkan bahwa adanya subyektivitas dan ambiguitas. Model BERT yang dihasilkan dari penelitian ini dapat meningkatkan klasifikasi sentimen menjadi 5 kelas, dengan kinerja model untuk iterasi training ke 6 menunjukkan F1 score sebesar 0.535799, ROC AUC sebesar 0.704911, dan akurasi sebesar 0.504167. Model BERT ini diunggah ke platform Hugging Face untuk memungkinkan inferensi langsung melalui API, sehingga dapat digunakan secara praktis. Berdasarkan hasil yang diperoleh dari penelitian ini disarankan untuk penelitian selanjutnya meningkatkan kualitas dataset agar meningkatkan akurasi model secara keseluruhan. Selain itu model ini dapat di implementasikan sebagai model pembobotan rekomendasi produk dan model ini juga dapat dimanfaatkan sebagai pertimbangan algoritma untuk memunculkan produk yang dicari di halaman pertama.
Item Type: | Thesis (Other) |
---|---|
Additional Information: | Dosen Pembimbing: Luzi Dwi Oktaviana, S.Kom., M.MSI., dan Retno Waluyo, S,Kom., M.MSI. |
Uncontrolled Keywords: | Kata kunci: subyektivitas ulasan produk, klasifikasi sentimen, deep learning, bert, gpt2, tokopedia, shopee |
Subjects: | H Social Sciences > HF Commerce T Technology > T Technology (General) |
Divisions: | Fakultas Ilmu Komputer > Sistem Informasi |
Depositing User: | UPT Perpustakaan Pusat Universitas Amikom Purwokerto |
Date Deposited: | 11 Feb 2011 23:47 |
Last Modified: | 11 Feb 2011 23:47 |
URI: | https://eprints.amikompurwokerto.ac.id/id/eprint/2175 |