KLASIFIKASI UJARAN KEBENCIAN (HATE SPEECH) PADA KOMENTAR MEDIA SOSIAL TIKTOK MENGGUNAKAN NAÏVE BAYES DAN PEMBOBOTAN TF-IDF

Utami, Putri Febi (2026) KLASIFIKASI UJARAN KEBENCIAN (HATE SPEECH) PADA KOMENTAR MEDIA SOSIAL TIKTOK MENGGUNAKAN NAÏVE BAYES DAN PEMBOBOTAN TF-IDF. Other thesis, Universitas Amikom Purwokerto.

Text
COVER.pdf
Download (584kB)

Text
DAFTAR ISI.pdf
Download (536kB)

Text
ABSTRAK.pdf
Download (519kB)

Image
BAB I.pdf
Restricted to Registered users only
Download (532kB)

Image
BAB II.pdf
Restricted to Registered users only
Download (787kB)

Image
BAB III.pdf
Restricted to Registered users only
Download (709kB)

Image
BAB IV.pdf
Restricted to Registered users only
Download (1MB)

Image
BAB V.pdf
Restricted to Registered users only
Download (458kB)

Image
DAFTAR PUSTAKA.pdf
Restricted to Registered users only
Download (586kB)

Text
LAMPIRAN.pdf
Restricted to Repository staff only
Download (1MB)

Abstract

Penelitian ini berfokus pada klasifikasi ujaran kebencian (hate speech) pada komentar TikTok berbahasa Indonesia. Platform TikTok sebagai media sosial dengan intensitas interaksi tinggi menghasilkan volume komentar yang besar dengan karakteristik bahasa yang beragam, termasuk penggunaan bahasa formal dan non-formal. Variasi linguistik tersebut menimbulkan tantangan dalam proses moderasi konten, khususnya dalam mengidentifikasi ujaran kebencian secara otomatis. Oleh karena itu, penelitian ini diarahkan untuk membangun model klasifikasi teks yang mampu mengenali pola ujaran kebencian pada komentar dengan karakteristik bahasa non-standar. Algoritma Multinomial Naïve Bayes digunakan sebagai metode klasifikasi karena kemampuannya dalam memodelkan distribusi kata pada data teks, sementara pembobotan fitur dilakukan menggunakan Term Frequency–Inverse Document Frequency (TF-IDF) untuk meningkatkan representasi numerik teks. Dataset penelitian merupakan data sekunder yang diperoleh melalui penggabungan dataset publik dan komentar TikTok hasil scraping dengan total awal sebanyak 5.698 komentar. Data yang dikumpulkan merepresentasikan komentar pengguna secara umum dengan variasi bahasa formal dan non-formal. Untuk meningkatkan kualitas data, dilakukan tahapan prapemrosesan yang meliputi pembersihan teks, tokenisasi, normalisasi, penghapusan stopword, dan stemming. Setelah preprocessing, diperoleh 4.542 komentar yang layak digunakan dalam proses pemodelan. Pelabelan data dilakukan menggunakan pendekatan keyword-based labeling untuk mengidentifikasi komentar yang mengandung ujaran kebencian. Dataset kemudian dibagi menggunakan rasio 80:20 menjadi data latih dan data uji. Evaluasi model dilakukan menggunakan metrik akurasi, presisi, recall, dan F1-score. Hasil eksperimen menunjukkan bahwa model Multinomial Naïve Bayes dengan pembobotan TF-IDF mampu mengklasifikasikan ujaran kebencian dengan performa yang tinggi. Akurasi model mencapai 93% sebelum optimasi parameter dan meningkat menjadi 95% setelah dilakukan hyperparameter tuning dengan nilai alpha sebesar 0,5. Hasil confusion matrix menunjukkan tingkat kesalahan klasifikasi yang relatif rendah, meskipun distribusi kelas pada dataset masih menunjukkan ketidakseimbangan. Temuan penelitian ini mengindikasikan bahwa pendekatan Multinomial Naïve Bayes efektif dalam mengenali pola linguistik ujaran kebencian pada komentar TikTok berbahasa Indonesia, termasuk pada teks dengan karakteristik bahasa non-formal.

Item Type:	Thesis (Other)
Additional Information:	Dosen Pembimbing: Dwi Krisbiantoro, M.Kom., dan Andi Dwi Riyanto, M.Kom.
Uncontrolled Keywords:	Kata Kunci: Ujaran kebencian, TikTok, Multinomial Naive Bayes, TF-IDF, klasifikasi teks.
Subjects:	T Technology > T Technology (General)
Divisions:	Fakultas Ilmu Komputer > Informatika
Depositing User:	UPT Perpustakaan Pusat Universitas Amikom Purwokerto
Date Deposited:	27 Apr 2026 07:10
Last Modified:	27 Apr 2026 07:10
URI:	https://eprints.amikompurwokerto.ac.id/id/eprint/3349

Actions (login required)

: View Item