RANCANG BANGUN MODEL DEEP LEARNING BAHASA INDONESIA BERBASIS INDOBERTWEET UNTUK KLASIFIKASI RATING BERDASARKAN ULASAN E-COMMERCE

Mulyani, Sekar (2024) RANCANG BANGUN MODEL DEEP LEARNING BAHASA INDONESIA BERBASIS INDOBERTWEET UNTUK KLASIFIKASI RATING BERDASARKAN ULASAN E-COMMERCE. Other thesis, Universitas Amikom Purwokerto.

[thumbnail of COVER.pdf] Text
COVER.pdf

Download (618kB)
[thumbnail of DAFTAR ISI.pdf] Text
DAFTAR ISI.pdf

Download (480kB)
[thumbnail of ABSTRAK.pdf] Text
ABSTRAK.pdf

Download (446kB)
[thumbnail of BAB I.pdf] Image
BAB I.pdf
Restricted to Registered users only

Download (518kB)
[thumbnail of BAB II.pdf] Image
BAB II.pdf
Restricted to Registered users only

Download (941kB)
[thumbnail of BAB III.pdf] Image
BAB III.pdf
Restricted to Registered users only

Download (613kB)
[thumbnail of BAB IV.pdf] Image
BAB IV.pdf
Restricted to Registered users only

Download (2MB)
[thumbnail of BAB V.pdf] Image
BAB V.pdf
Restricted to Registered users only

Download (449kB)
[thumbnail of DAFTAR PUSTAKA.pdf] Image
DAFTAR PUSTAKA.pdf
Restricted to Registered users only

Download (575kB)
[thumbnail of LAMPIRAN.pdf] Text
LAMPIRAN.pdf
Restricted to Repository staff only

Download (1MB)

Abstract

Penelitian ini bertujuan untuk mengurangi subyektivitas dalam ulasan pelanggan pada platform e-commerce dengan memanfaatkan model pemrosesan bahasa alami natural language processing (NLP) seperti BERT, khususnya IndoBERTweet yang dilatih dalam Bahasa Indonesia. Ulasan pelanggan sering kali bersifat subjektif, mengandung emoji, slang, dan singkatan yang sulit diinterpretasi secara objektif. Subyektivitas ini dapat memengaruhi keputusan pembelian dan membingungkan calon pembeli. Model NLP ini digunakan untuk mengklasifikasikan rating dan ulasan pelanggan (bintang 1-5) untuk mengurangi subyektivitas dalam ulasan tersebut. Dataset yang digunakan pada penelitian ini berjumlah 137.844. Dataset telah dibagi menjadi 3 bagian menjadi dataset test sebanyak 3447, dataset pelatihan sebanyak 124316, dan dataset validasi sebanayak 10080 yang bersumber dari rating ulasan produk kecantikan Tokopedia dan Shopee. Hasil klastering menggunakan tokenizer IndoBERTweet yang telah dihilangkan kata sambungnya menunjukkan bahwa ulasan terdiri dari 6 kelas, dengan 1 kelas yang tersebar melintasi klaster lain. Hal tersebut menunjukkan bahwa adanya subyektivitas dan ambiguitas. Model BERT yang dihasilkan dari penelitian ini dapat meningkatkan klasifikasi sentimen menjadi 5 kelas, dengan kinerja model untuk iterasi training ke 6 menunjukkan F1 score sebesar 0.535799, ROC AUC sebesar 0.704911, dan akurasi sebesar 0.504167. Model BERT ini diunggah ke platform Hugging Face untuk memungkinkan inferensi langsung melalui API, sehingga dapat digunakan secara praktis. Berdasarkan hasil yang diperoleh dari penelitian ini disarankan untuk penelitian selanjutnya meningkatkan kualitas dataset agar meningkatkan akurasi model secara keseluruhan. Selain itu model ini dapat di implementasikan sebagai model pembobotan rekomendasi produk dan model ini juga dapat dimanfaatkan sebagai pertimbangan algoritma untuk memunculkan produk yang dicari di halaman pertama.
Item Type: Thesis (Other)
Additional Information: Dosen Pembimbing: Luzi Dwi Oktaviana, S.Kom., M.MSI., dan Retno Waluyo, S,Kom., M.MSI.
Uncontrolled Keywords: Kata kunci: subyektivitas ulasan produk, klasifikasi sentimen, deep learning, bert, gpt2, tokopedia, shopee
Subjects: H Social Sciences > HF Commerce
T Technology > T Technology (General)
Divisions: Fakultas Ilmu Komputer > Sistem Informasi
Depositing User: UPT Perpustakaan Pusat Universitas Amikom Purwokerto
Date Deposited: 11 Feb 2011 23:47
Last Modified: 11 Feb 2011 23:47
URI: https://eprints.amikompurwokerto.ac.id/id/eprint/2175

Actions (login required)

View Item
View Item