PENERAPAN TEKNIK OVERSAMPLING PADA ANALISIS SENTIMEN ISU HAK CIPTA DI INDONESIA MENGGUNAKAN ALGORITMA RANDOM FOREST

Ghanim, Nadif Nasar (2025) PENERAPAN TEKNIK OVERSAMPLING PADA ANALISIS SENTIMEN ISU HAK CIPTA DI INDONESIA MENGGUNAKAN ALGORITMA RANDOM FOREST. Other thesis, Universitas Amikom Purwokerto.

[thumbnail of COVER.pdf] Text
COVER.pdf

Download (602kB)
[thumbnail of DAFTAR ISI.pdf] Text
DAFTAR ISI.pdf

Download (408kB)
[thumbnail of ABSTRAK.pdf] Text
ABSTRAK.pdf

Download (372kB)
[thumbnail of BAB I.pdf] Image
BAB I.pdf
Restricted to Registered users only

Download (530kB)
[thumbnail of BAB II.pdf] Image
BAB II.pdf
Restricted to Registered users only

Download (506kB)
[thumbnail of BAB III.pdf] Image
BAB III.pdf
Restricted to Registered users only

Download (514kB)
[thumbnail of BAB IV.pdf] Image
BAB IV.pdf
Restricted to Registered users only

Download (942kB)
[thumbnail of BAB V.pdf] Image
BAB V.pdf
Restricted to Registered users only

Download (446kB)
[thumbnail of DAFTAR PUSTAKA.pdf] Image
DAFTAR PUSTAKA.pdf
Restricted to Registered users only

Download (524kB)
[thumbnail of LAMPIRAN.pdf] Text
LAMPIRAN.pdf
Restricted to Repository staff only

Download (866kB)

Abstract

Penelitian berjudul Penerapan Teknik Analisis Sentimen Isu Hak Cipta di Indonesia Menggunakan Algoritma random forest bertujuan untuk menganalisis dan mengklasifikasikan sentimen masyarakat Indonesia terkait isu hak cipta dengan membatasi variabel pada sentimen positif, negatif, dan netral. Data diperoleh dari 8.727 komentar di berbagai video Youtube melalui teknik Scraping. Proses pelabelan otomatis dilakukan terlebih dahulu menggunakan model DistilBERT multilingual yang menghasilkan distribusi sentimen negatif sebesar 55,77%, positif 42,57%, dan netral 1,66%. Setelah itu, data teks diproses melalui tahapan case folding, data cleaning, tokenisasi, stopword removal, dan stemming menggunakan Sastrawi stemmer. Untuk mengatasi masalah ketidakseimbangan data, digunakan teknik Synthetic Minority Oversampling Technique (SMOTE) sehingga performa model random forest tetap solid, dengan hasil prediksi benar 4.343 untuk kelas negatif dan 3.239 untuk kelas positif. Penelitian ini juga menghasilkan aplikasi web interaktif berbasis Streamlit yang mampu melakukan prediksi sentimen secara langsung dan menyediakan visualisasi data. Dengan demikian, penelitian ini memberikan kontribusi berupa pipeline analisis sentimen yang komprehensif, menggabungkan labeling berbasis transformer dengan ensemble learning, serta framework yang dapat digunakan kembali untuk isu serupa.
Item Type: Thesis (Other)
Additional Information: Dosen Pembimbing: Luzi Dwi Oktaviana, S.Kom., M.MSI., dan Dani Arifudin, M.Kom.
Uncontrolled Keywords: Kata kunci: analisis sentimen, hak cipta, random forest, komentar Youtube, Indonesia.
Subjects: T Technology > T Technology (General)
Divisions: Fakultas Ilmu Komputer > Teknologi Informasi
Depositing User: UPT Perpustakaan Pusat Universitas Amikom Purwokerto
Date Deposited: 20 Oct 2025 07:26
Last Modified: 20 Oct 2025 07:26
URI: https://eprints.amikompurwokerto.ac.id/id/eprint/3058

Actions (login required)

View Item
View Item