INTEGRASI LSA DAN INDOBERT UNTUK INFORMATION RETRIEVAL PADA TEKS TAFSIR AL-QUR’AN

Sofa, Nur (2025) INTEGRASI LSA DAN INDOBERT UNTUK INFORMATION RETRIEVAL PADA TEKS TAFSIR AL-QUR’AN. Masters thesis, Universitas Amikom Purwokerto.

[thumbnail of Cover .pdf] Text
Cover .pdf

Download (298kB)
[thumbnail of DAFTAR ISI .pdf] Text
DAFTAR ISI .pdf

Download (145kB)
[thumbnail of ABSTRAK .pdf] Text
ABSTRAK .pdf

Download (192kB)
[thumbnail of BAB I .pdf] Image
BAB I .pdf
Restricted to Registered users only

Download (219kB)
[thumbnail of BAB II .pdf] Image
BAB II .pdf
Restricted to Registered users only

Download (280kB)
[thumbnail of BAB III.pdf] Image
BAB III.pdf
Restricted to Registered users only

Download (355kB)
[thumbnail of BAB IV .pdf] Image
BAB IV .pdf
Restricted to Registered users only

Download (374kB)
[thumbnail of BAB V.pdf] Image
BAB V.pdf
Restricted to Registered users only

Download (187kB)
[thumbnail of DAFTAR PUSTAKA .pdf] Image
DAFTAR PUSTAKA .pdf
Restricted to Registered users only

Download (193kB)
[thumbnail of LAMPIRAN .pdf] Text
LAMPIRAN .pdf
Restricted to Repository staff only

Download (331kB)

Abstract

Penelitian ini bertujuan untuk mengevaluasi efektivitas pendekatan representasi topikal, semantik, dan hybrid dalam sistem pencarian tafsir Al-Qur’an berbahasa Indonesia. Pendekatan yang dibandingkan meliputi TF-IDF + LSA, IndoBERT, serta kombinasi keduanya melalui penggabungan skor (score fusion). Korpus yang digunakan terdiri dari 13.934 entri tafsir yang diperoleh dari berbagai sumber terpercaya. Evaluasi dilakukan menggunakan desain Cranfield-style yang mencakup 50 query, penetapan relevansi otomatis, dan pengukuran kinerja menggunakan metrik precision@10, recall@10, dan Mean Average Precision (MAP). Hasil penelitian menunjukkan bahwa model berbasis TF-IDF + LSA menghasilkan performa paling rendah (precision@10 sebesar 0.1333 dan MAP sebesar 0.0784). Sementara itu, pendekatan IndoBERT memberikan peningkatan performa signifikan (precision@10 sebesar 0.5000 dan MAP sebesar 0.3758). Pendekatan hybrid dengan bobot α = 0.9 menghasilkan kinerja terbaik dengan nilai precision@10 sebesar 0.8000 dan MAP sebesar 0.4706. Nilai MAP yang identik dengan recall@10 menunjukkan konsistensi hasil relevansi dalam peringkat dokumen teratas. Kesimpulan dari penelitian ini adalah bahwa pendekatan hybrid retrieval mampu mengintegrasikan keunggulan representasi semantik dan topikal secara efektif. Metode ini tidak hanya meningkatkan relevansi hasil pencarian, tetapi juga memberikan kontribusi terhadap pengembangan sistem IR dalam domain teks keagamaan berbahasa Indonesia.
Item Type: Thesis (Masters)
Additional Information: Dosen Pembimbing: Dr. Fandy Setyo Utomo, S.Kom., M.Cs., dan Dr. Rujianto Eko Saputro, M.Kom.
Uncontrolled Keywords: Kata kunci: Information retrieval, LSA, IndoBERT, hybrid retrieval, tafsir Al-Qur’an
Subjects: T Technology > T Technology (General)
Divisions: S2 ILMU KOMPUTER
Depositing User: UPT Perpustakaan Pusat Universitas Amikom Purwokerto
Date Deposited: 22 Jul 2025 01:51
Last Modified: 22 Jul 2025 01:51
URI: https://eprints.amikompurwokerto.ac.id/id/eprint/2830

Actions (login required)

View Item
View Item